找回密码
 立即注册
查看: 1355|回复: 10

【字幕提取工具】望言OCR,作者来发个介绍帖,也欢迎反馈使用建议

1

主题

0

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
8906
nhjydywd 发表于 2025-12-23 15:03:51 | 显示全部楼层 |阅读模式
大家好,我是硬字幕提取工具《望言OCR》的作者。

这个工具主要用来提取视频里的硬字幕,做字幕相关工作,或者喜欢抄字幕的朋友应该会用得上。

preview-main.png


主要功能:从视频画面中提取烧录的硬字幕,输出成 SRT / ASS / TXT;支持 PGS/SUP、IDX/SUB 等图形字幕识别;100+ 语言支持,中日韩英都可以。

速度方面,用 M 系列 Mac 或 N 卡的话会比较快,45分钟的视频大概1-2分钟能跑完。普通电脑会慢一些,但也比手扒快很多。

支持批量处理,可以把整季视频拖进去挂机跑,适合一次处理一季的情况。

preview-batch.png

中文识别准确率还可以,大部分情况不需要太多手动修改。软件里有内置编辑器,可以边看视频边改字幕,改完直接导出。


下载地址:
Windows:https://pan.baidu.com/s/1muf9eM9BtGFKKtMCQpZ6WQ?pwd=w2ei
Mac:https://apps.apple.com/cn/app/id6738074717
官网:https://www.subocr.cn
文档:https://www.subocr.cn/doc
新用户有 7 天免费体验,可以先试试效果。

工具还在持续更新中,如果使用中遇到问题或者有功能建议,欢迎在帖子里回复,我会尽量改进。谢谢大家。

温馨提示:提取的字幕仅供个人学习/工作使用,请勿用于可能侵犯他人权益的行为。

回复

使用道具 举报

2

主题

15

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
3876
newyorker 发表于 2025-12-23 22:21:24 | 显示全部楼层
日文呢,对中日双语字幕的效果怎么样?
回复

使用道具 举报

2

主题

23

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
3940
菜鸟999 发表于 2025-12-24 02:47:15 | 显示全部楼层
本帖最后由 菜鸟999 于 2025-12-24 02:52 编辑

收费的?
那还是用开源免费的VideOCR吧,集成PaddleOCR 3.2,PaddleOCR 3.2支持什么语音VideOCR就支持提取什么语言
回复

使用道具 举报

0

主题

53

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
5852
nyaru 发表于 2025-12-24 06:33:21 来自手机 | 显示全部楼层
吃相难看
回复

使用道具 举报

3

主题

8

回帖

48

VC币

中级会员

Rank: 3Rank: 3

积分
10770
shinichi2050 发表于 2025-12-24 16:08:27 | 显示全部楼层
本帖最后由 shinichi2050 于 2025-12-24 16:10 编辑

免费的一点都不好用,收费的还不如用开源的软件。
回复

使用道具 举报

0

主题

8

回帖

256

VC币

中级会员

Rank: 3Rank: 3

积分
5768
IcyW1zard 发表于 2025-12-25 01:08:55 | 显示全部楼层
      用了一下,批量操作比较方便,优点是快,但我设置成50帧每秒大概也要四五分钟一集。望言v2在不少场景下被PaddleOCR吊打,,我用的高达00第一季做的测试,OP ED的识别可以用惨不忍睹来形容,一句话只能识别一个字或半个字是很常见的。好在也有PaddleOCR的选项给我一句一句去纠正。。同屏识别上下两句时,时轴非常差,不如VideOCR。
      不过总的来讲能提高初步识别的效率。
      双语识别有点灾难了,用高达ZZ做的测试,两个框选范围标的很死了,但每一句话都能多上下两个空白行变成四行,加一些杂七杂八部首偏旁,修正搞得我恼火。。
      我是觉得想法不错但简单的字幕你能做开源也能做,复杂的字幕你自己的模型还不如开源的模型,目前想做一个收费软件还不太撑得住。。
回复

使用道具 举报

35

主题

140

回帖

260

VC币

星辰大海

爱の探求者

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
401240

崭露头角活跃达人

waecy 发表于 2025-12-27 00:16:11 | 显示全部楼层
建议免费版的加上检测空格功能,最实用就这个
「ANCG美好,在于代入角色用心感受,感悟,理解不同世界和与众不同的生存方式。
当了解这段话时,这将成汝之宝藏。」
回复

使用道具 举报

35

主题

140

回帖

260

VC币

星辰大海

爱の探求者

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
401240

崭露头角活跃达人

waecy 发表于 2025-12-27 00:18:14 | 显示全部楼层
菜鸟999 发表于 2025-12-24 02:47
收费的?
那还是用开源免费的VideOCR吧,集成PaddleOCR 3.2,PaddleOCR 3.2支持什么语音VideOCR就支持提取 ...

已亲测, VideOCR若能提高速度就好了,目前是根据CPU一张张生图,几十分钟生成字幕,且不支持检测空格,会连在一起, 部分时轴生成还不如楼主发那个免费版,虽然也不支持检测空格,但时轴基本生成挺准
「ANCG美好,在于代入角色用心感受,感悟,理解不同世界和与众不同的生存方式。
当了解这段话时,这将成汝之宝藏。」
回复

使用道具 举报

2

主题

23

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
3940
菜鸟999 发表于 2025-12-27 00:40:37 | 显示全部楼层
本帖最后由 菜鸟999 于 2025-12-27 00:43 编辑
waecy 发表于 2025-12-27 00:18
已亲测, VideOCR若能提高速度就好了,目前是根据CPU一张张生图,几十分钟生成字幕,且不支持检测空格,会连在 ...

使用gpu版本吧,cpu版本实在有点慢,可以勾选高精度试试。


搜了下望言免费版本很久前从1.3版本后就已经停更了,以后可能都是收费的
回复

使用道具 举报

35

主题

140

回帖

260

VC币

星辰大海

爱の探求者

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
401240

崭露头角活跃达人

waecy 发表于 2025-12-27 01:46:28 | 显示全部楼层
菜鸟999 发表于 2025-12-27 00:40
使用gpu版本吧,cpu版本实在有点慢,可以勾选高精度试试。



这倒提醒我了,先前用「videocr-cli-GPU-v1.3.2-CUDA-11.8」是选高精度生成挺慢的
下载最新「videocr-cli-GPU-v1.3.2-CUDA-12.9」试试


PS: 啥时候能用AI模型可以一键识别内嵌字幕.生成SRT就好了 如同whisper模型,把视频音频转字幕


「ANCG美好,在于代入角色用心感受,感悟,理解不同世界和与众不同的生存方式。
当了解这段话时,这将成汝之宝藏。」
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表