更新随笔

更新随笔

灰灰同学关于 2pptx 的更新、想法、碎碎念,还有做着做着冒出来的一些小折腾。

更新

新增支持批量上传啦!

有点激动,这个东西搞了好几天~

从上传判定、任务排队、打包下载,都是一堆坑...大坑。

上线先看看,有问题再修。

想法

文本框合并似乎可以用LLM大模型来..

但是成本有点高,试了下一整个文件用Gemini 3.1flash要接近7毛钱了,而且速度也不稳定,有的几秒就能搞定,有时候要几百秒,很不稳定,用户体验极差...

更新

文件上传限制提升到35M&异常PDF错误提示修正

30M不够用咯,改成35M应该就好多了~

坏PDF 会明确告诉用户“文件本身有问题”,而不是“稍后重试”

碎碎念

怎么数据库也有坑啊

日志里经常看到轮询出现超时的问题,然后codex原话“所以这不是“纯网络掉线”。网络可能偶尔抖,但主病灶是 SQLite 写锁/读写并发不够扛。”

我:???

codex解释了一番balabala

我:那你直接开始干活改吧

小折腾

又加了几个网页埋点

今天群里有用户突然说上传不上去了,我自己本地环境测试都正常,不知道为什么,拉了一下数据报表,发现有4~5名同学貌似就是传不上去。我现在也没有加对应埋点,现在把这些补齐了,后面再遇到再排查吧。

更新

新增校对工作台本页不识别按钮

应群里同学的反馈,有些页面在工作台里不想一个个删除文字框,所以新增了全部不识别的按钮~

碎碎念

批量上传好难做喔

本来以为可能没什么大事情,结果牵扯到并发、排队、结果页、下载、取件码...等等一堆事情,一个个解决叭~看能不能尽快搞上线~

碎碎念

首页有那么难看嘛

今天同事有说首页UIUX比较丑,似乎确实挺丑的还很单调..晚点让ai帮忙修一波上线!

更新

单用户上传上限提升&修复PPTX尺寸过大&下载PPT文件名和原文件一致&新增更新随笔

上传上限从10个到50个;

有同学指出转的PPTX尺寸会比原来PDF大,找到问题后修了;

下载文件名不再是一串数字字母代码了,而是文件名-2pptx.com.pptx,更清晰啦;

更新随笔和主要功能没什么交集..就想记录一下叭。也许未来回头看也能有不错的感慨。

碎碎念

群二维码竟然过期了!

我就说怎么好几天群里没有新人,原来是过期了.,..

想法

GPT-IMAGE-2太强了!

今天做了个新分支,尝试用AI的力量去字,结果嘛...不是很好,而且成本也挺高的,不太适合全自动化,也许未来能放到工作台?

想法

参考同行大佬的palama

这几天研究隔壁PALAMA的杰作,看到他们的方案真的很棒,尝试两个分支去试自动 inpaint 优化..可惜全自动模式一直效果很差很差...

想法

seo优化怎么办呢

看谷歌里好几个页面都没有收录...哎,重新整理下叭

更新

首页上传文件重复bug

有同学群里说首页文件上传需要选2次..现在修复啦~

碎碎念

换了服务器,主要还是想省点钱

鹅厂的服务器到期咯,现在换了个价格便宜一半,只要20块一个月诶~线上环境也顺手收拾了一遍。地区识别、代理设置和 nginx 那些细节也一起理了,属于做完以后我自己先松一口气的更新。

小折腾

结果页塞进了一个“更多工具”入口

有个同学做了一个很好的站,纯靠前端就可以调整好PDF的一些布局,羡慕~

更新

新增高质量导出&仅去notebooklm水印模式

有同学群里反馈转的pptx变模糊了,实际确实是我为了妥协做的压缩,现在支持高质量导出咯~

另外我也发现有些同学只想去掉右下角水印,现在也新增了这个功能,其他都不会改只去水印。

想法

段落合并尝试

OCR识别的文字都是一行一行文字框,挺多是一整个大段落被拆散,有什么办法可以全自动合并呢...

更新

结果页新增排队等待估算

排队等待这件事,最怕的不是慢,而是完全没数,现在至少不用再让人盯着页面纯靠猜咯。。

更新

上线中文打赏码!

(这样算更新?)

开始伸手要钱了,赛博乞丐开始乞讨...爸爸妈妈们给点叭~不然流量费太贵惹。。

更新

工作台应该算是优化完成了

复合预览层、编辑流程、模式切换、引导弹窗,这些都在这天前后补齐了。属于一边修边用,一边用一边继续嫌弃,然后再继续修..无限循环

碎碎念

工作台还有好多优化地方

比如交互和状态细节:进度提示、资源释放、界面节奏、哪里该自动保存...持续折腾吧

更新

新增手动工作台

工作台这块终于做完了,现在可以自由选择识别框,不再担心不该识别去除的地方给去除了~

更新

上传提高30M!

有同学反馈20M太小了,所以这次上传上限提到了 30MB~希望我的服务器不会崩

小折腾

水印遮罩和OCR输入格式优化尝试

这个遮罩确实不好选,mask覆盖也是..ocr有时候还不太准,不知道能不能调整好嘞?

更新

博客和双语SEO再次优化

本来通过lang然后借鉴了其他页面还是走zh这种,希望能有收录叭。

更新

调整优化识别效果

疯狂跟阈值、过滤和对齐较劲。想把字框抓得准一点,又不想把背景抹得太凶,最后只能老老实实一项一项试...也算是找到一个平衡点了吧。

碎碎念

seo内容补齐也好麻烦

上线做了一大堆SEO应该有的内容,比如反馈面板、页脚、FAQ、favicon、支持邮箱、分析埋点...该有的好像都有了,感觉看上去像个样子...

更新

2pptx正式上线啦~

把上传、转换、双语首页、反馈入口和基础 SEO都补齐了,目标是做全球SEO承接全球流量!

希望我的小破电脑可以顶住...