新增支持批量上传啦!
有点激动,这个东西搞了好几天~
从上传判定、任务排队、打包下载,都是一堆坑...大坑。
上线先看看,有问题再修。
文本框合并似乎可以用LLM大模型来..
但是成本有点高,试了下一整个文件用Gemini 3.1flash要接近7毛钱了,而且速度也不稳定,有的几秒就能搞定,有时候要几百秒,很不稳定,用户体验极差...
文件上传限制提升到35M&异常PDF错误提示修正
30M不够用咯,改成35M应该就好多了~
坏PDF 会明确告诉用户“文件本身有问题”,而不是“稍后重试”
更新随笔
灰灰同学关于 2pptx 的更新、想法、碎碎念,还有做着做着冒出来的一些小折腾。
有点激动,这个东西搞了好几天~
从上传判定、任务排队、打包下载,都是一堆坑...大坑。
上线先看看,有问题再修。
但是成本有点高,试了下一整个文件用Gemini 3.1flash要接近7毛钱了,而且速度也不稳定,有的几秒就能搞定,有时候要几百秒,很不稳定,用户体验极差...
30M不够用咯,改成35M应该就好多了~
坏PDF 会明确告诉用户“文件本身有问题”,而不是“稍后重试”
日志里经常看到轮询出现超时的问题,然后codex原话“所以这不是“纯网络掉线”。网络可能偶尔抖,但主病灶是 SQLite 写锁/读写并发不够扛。”
我:???
codex解释了一番balabala
我:那你直接开始干活改吧
今天群里有用户突然说上传不上去了,我自己本地环境测试都正常,不知道为什么,拉了一下数据报表,发现有4~5名同学貌似就是传不上去。我现在也没有加对应埋点,现在把这些补齐了,后面再遇到再排查吧。
应群里同学的反馈,有些页面在工作台里不想一个个删除文字框,所以新增了全部不识别的按钮~
本来以为可能没什么大事情,结果牵扯到并发、排队、结果页、下载、取件码...等等一堆事情,一个个解决叭~看能不能尽快搞上线~
今天同事有说首页UIUX比较丑,似乎确实挺丑的还很单调..晚点让ai帮忙修一波上线!
上传上限从10个到50个;
有同学指出转的PPTX尺寸会比原来PDF大,找到问题后修了;
下载文件名不再是一串数字字母代码了,而是文件名-2pptx.com.pptx,更清晰啦;
更新随笔和主要功能没什么交集..就想记录一下叭。也许未来回头看也能有不错的感慨。
我就说怎么好几天群里没有新人,原来是过期了.,..
今天做了个新分支,尝试用AI的力量去字,结果嘛...不是很好,而且成本也挺高的,不太适合全自动化,也许未来能放到工作台?
这几天研究隔壁PALAMA的杰作,看到他们的方案真的很棒,尝试两个分支去试自动 inpaint 优化..可惜全自动模式一直效果很差很差...
看谷歌里好几个页面都没有收录...哎,重新整理下叭
有同学群里说首页文件上传需要选2次..现在修复啦~
鹅厂的服务器到期咯,现在换了个价格便宜一半,只要20块一个月诶~线上环境也顺手收拾了一遍。地区识别、代理设置和 nginx 那些细节也一起理了,属于做完以后我自己先松一口气的更新。
有个同学做了一个很好的站,纯靠前端就可以调整好PDF的一些布局,羡慕~
有同学群里反馈转的pptx变模糊了,实际确实是我为了妥协做的压缩,现在支持高质量导出咯~
另外我也发现有些同学只想去掉右下角水印,现在也新增了这个功能,其他都不会改只去水印。
OCR识别的文字都是一行一行文字框,挺多是一整个大段落被拆散,有什么办法可以全自动合并呢...
排队等待这件事,最怕的不是慢,而是完全没数,现在至少不用再让人盯着页面纯靠猜咯。。
(这样算更新?)
开始伸手要钱了,赛博乞丐开始乞讨...爸爸妈妈们给点叭~不然流量费太贵惹。。
复合预览层、编辑流程、模式切换、引导弹窗,这些都在这天前后补齐了。属于一边修边用,一边用一边继续嫌弃,然后再继续修..无限循环
比如交互和状态细节:进度提示、资源释放、界面节奏、哪里该自动保存...持续折腾吧
工作台这块终于做完了,现在可以自由选择识别框,不再担心不该识别去除的地方给去除了~
有同学反馈20M太小了,所以这次上传上限提到了 30MB~希望我的服务器不会崩
这个遮罩确实不好选,mask覆盖也是..ocr有时候还不太准,不知道能不能调整好嘞?
本来通过lang然后借鉴了其他页面还是走zh这种,希望能有收录叭。
疯狂跟阈值、过滤和对齐较劲。想把字框抓得准一点,又不想把背景抹得太凶,最后只能老老实实一项一项试...也算是找到一个平衡点了吧。
上线做了一大堆SEO应该有的内容,比如反馈面板、页脚、FAQ、favicon、支持邮箱、分析埋点...该有的好像都有了,感觉看上去像个样子...
把上传、转换、双语首页、反馈入口和基础 SEO都补齐了,目标是做全球SEO承接全球流量!
希望我的小破电脑可以顶住...