为了更便捷的手抄字幕, 我搞了一个新玩具(更新 0.0.6-beta)

NoobNeo · 发表于 2020-7-25 22:21:24

目前项目提供的是基础工具 (类似扳手/榔头之类), 需要根据视频来打造一套高级工具(类似自行车/汽车之类), 最终达到提取字幕的目的.

如果没有入门计算机视觉, 参考模块说明或 OpenCv 文档, 也能提取成功, 但过程就很折磨人,,ԾㅂԾ,,
如果有一定基础, 就能愉快玩耍了, 还可以自己写模块来解决特定场景, 部分功能要求更高就搁浅, 只在个人的小圈子内使用过.

对于部分使用者而言确实有方便, 但远没有达到"便捷"的程度, 所以我考虑使用 TensorFlow 来辅助, 至于能不能成功? 不知道. 我甚至没有把握能否完成, 因为个人事务比较多, 最近更新也慢了, 再加上最早也是因为 TensorFlow 的问题才转用 Tesseract-ocr 的解决方案, 对于重回 TensorFlow 也是考虑甚久啊.

cedar · 发表于 2020-7-26 04:08:47

NoobNeo 发表于 2020-7-25 21:30
字幕颜色与背景色贴近的时候, 优先考虑形态学/自适应/全局这些模块.
至于你说的双边/均值/高斯/中值滤 ...

能否说具体一点? 比如有没有什么现成的例子?
我大致能明白各种滤镜的含义, 应该不完全是小白, 如果有例子的话我想应该能听懂..
我提取的字幕是白底黑框的, 背景图不算很复杂只是个树影斑驳的CG画作, 恰好字幕有一部分落在了树影里, 所以一部分背景是白色的..我转灰度图之后用邻域尺寸很小的自适应二值化处理一下就基本成功滤掉了背景..包括文字的黑框..最终只剩下白色底的文字..所以我感觉去除边框的过程并不需要用到滤波?
(处理前 & 处理后)
如果文字和背景对比度高的话, 直接利用颜色过滤不就可以了么, 为什么还要滤波? 而且这个滤波的结果是文字变糊了..这样真的可以去掉边框么..我不知道该怎么做..

岁月留声 · 发表于 2020-7-30 11:38:29

本帖最后由岁月留声于 2020-8-27 10:05 编辑

支持一下，希望减少重复合轴的工作

cedar · 发表于 2020-7-30 22:17:41

本帖最后由 cedar 于 2020-8-3 02:01 编辑

cedar 发表于 2020-7-26 04:08
能否说具体一点? 比如有没有什么现成的例子?
我大致能明白各种滤镜的含义, 应该不完全是小白, 如果有例子 ...

总算搞懂了..原来滤波的作用就是让字变糊, 字够糊就与背景融为一体了, 这样就能把字滤掉只剩背景, 然后滤波前后的图像相减就可以了..一个流程是1色彩空间转到HSV 2中值滤波调大参数让字消失 3再把1和2相减, 再转换色彩空间成灰度图最后加个邻域很小的自适应二值化就可以了..有时候滤波不管用, 就用形态学勾边再相减..
然而必须做成白底黑字的要求还是太苛刻了..有些中间结果直接输出, 腾讯的识别率还更高些..

或者如果能让判断字幕是否改变所用的图像与实际识别所用的图片不同就好了..

1928530784 · 发表于 2020-8-10 14:54:30

本帖最后由 1928530784 于 2020-8-10 18:15 编辑

有没有快速选择删除标记？
还有想问下能不能加个功能，就是可以批量识别然后自动保存COCR文件

ehehe066 · 发表于 2020-8-14 21:22:59

请问如果字幕太长的话如何分段导出png呢？
还有想请问为什么我用ps无法打开导出的png图片文件，用MediaInfo看png其实是是bitmap文件格式的。

小吉炖蘑菇 · 发表于 2020-11-16 18:53:55

本帖最后由小吉炖蘑菇于 2020-11-16 20:15 编辑

导出图片的时候只有非中文目录才能导出。虽然不是什么大问题。但我还以为是软件有问题呢，折腾半天=====================================
（文件也不能带中文）

NoobNeo · 发表于 2020-11-16 21:41:22

1928530784 发表于 2020-8-10 14:54
有没有快速选择删除标记？
还有想问下能不能加个功能，就是可以批量识别然后自动保存COCR文件
...

删除操作目前只能通过鼠标左击, 批量选中通过左/右机实现, 具体的可以在项目文档内找到.批量处理视频和 COCR 文件批量 OCR 都可以在 "批处理" 窗口中完成.
由于目前是单线程执行批处理, 建议多开几个程序, 然后每个程序内放几个文件, 借此实现多线程

NoobNeo · 发表于 2020-11-16 21:43:31

ehehe066 发表于 2020-8-14 21:22
请问如果字幕太长的话如何分段导出png呢？
还有想请问为什么我用ps无法打开导出的png图片文件，用MediaInfo ...

暂不支持分页导出, PS 无法读取问题已修复(0.0.5-beta)

NoobNeo · 发表于 2020-11-16 21:46:46

小吉炖蘑菇发表于 2020-11-16 18:53
导出图片的时候只有非中文目录才能导出。虽然不是什么大问题。但我还以为是软件有问题呢，折腾半天======== ...

这是因为调用了 OpenCV 中只支持 ASCII编码的方法造成的, 后续会替换相关方法

		自动登录	找回密码
密码			立即注册

为了更便捷的手抄字幕, 我搞了一个新玩具(更新 0.0.6-beta)

浏览过的版块