菜鸟999 发表于 2025-11-29 19:34:32

内嵌字幕视频(硬字幕)提取转外挂字幕软件VideOCR

有谁知道这个软件,菜鸟式软件,挺好用的,vcd那种低分辨率模糊不清的字幕也能提取。


默认参数可能会丢失视频中连接比较紧的和只有1个字的字幕,我试了一下,把跳帧数设置成0,把ssim参数设置成95以上就可以了。
还可以同时提取视频中两个任意区域字幕合并成一个。
https://github.com/timminator/VideOCR/releases



FansCooler 发表于 2025-11-29 21:35:38

之前折腾着用过vse,不过提取出来质量很差,错误率高,后面就没再接触这类工具了

菜鸟999 发表于 2025-11-29 22:08:38

本帖最后由 菜鸟999 于 2025-11-29 22:14 编辑

FansCooler 发表于 2025-11-29 21:35
之前折腾着用过vse,不过提取出来质量很差,错误率高,后面就没再接触这类工具了
...

这个质量还可以,ocr引擎使用的是百度的PaddleOCR最新版。


这个PaddleOCR我下载百度官方版识别图文文本质量不是太好,有不少错字。
反而这个VideOCR自带的ocr引擎识别图片字幕反而很不错,哪怕VCD这种字幕比较模糊的视频提取出来的错字也不多,就是这种模糊字幕视频提出来有几个地方出现重复
还可以提取视频中任意的一个时间段的字幕,时间轴和视频相同。

rgnnzswwjrnhhh 发表于 2025-11-30 00:30:13

vse、videocr用的都是paddleocr,但是前者是v3,版本很老了,所以识别的错误率不理想。
paddleocr从v4还是v5开始,识别的错误率下降了一些。

nyaru 发表于 2025-11-30 01:14:12

本帖最后由 nyaru 于 2025-11-30 02:17 编辑

已编辑。。

op200 发表于 2025-11-30 01:30:45

nyaru 发表于 2025-11-30 01:14
PaddleOCR V5要比4和3好多了,看到v3感觉可以直接无视,或者去提要求可以切换版本 ...

PaddleOCR 最新的 release 才 v3.3.2 ,哪来的 4 和 5 ¿


nyaru 发表于 2025-11-30 02:16:33

op200 发表于 2025-11-30 01:30
PaddleOCR 最新的 release 才 v3.3.2 ,哪来的 4 和 5 ¿

说错了。看了下包含了v3和v5模型

晃晃无事 发表于 2025-12-1 14:27:51

简单地用了几次,用了最新模型准确率倒没啥大问题,支持双区域字幕提取确实是个亮点,不然一个字幕提取两遍确实效率就降低了。但是显卡占用率没提上去,我这边一直低于50%的占用,也不支持批量字幕提取。

菜鸟999 发表于 2025-12-9 17:14:59

晃晃无事 发表于 2025-12-1 14:27
简单地用了几次,用了最新模型准确率倒没啥大问题,支持双区域字幕提取确实是个亮点,不然一个字幕提取两遍 ...

你去跟做这个软件的作者提提建议,我不会外文不然就我就去提了
页: [1]
查看完整版本: 内嵌字幕视频(硬字幕)提取转外挂字幕软件VideOCR