找回密码
 立即注册
楼主: yuefeima

【Videosubfinder +百度ocr接口】提取硬字幕,彻底解放生产力

1

主题

25

回帖

0

VC币

荣誉会员

Rank: 14Rank: 14Rank: 14Rank: 14

积分
98869
yuefeima  楼主| 发表于 2020-12-7 16:12:47 | 显示全部楼层
hhbluestar 发表于 2020-12-7 15:58
我一部都没识别完啊.......

你是不是截图有问题,你要不加我qq,我给你看看(1156333484)
回复

使用道具 举报

0

主题

41

回帖

0

VC币

新手上路

Rank: 1

积分
235
MichaelLv 发表于 2020-12-8 11:39:00 | 显示全部楼层
tsMuxer提取SUP,IdxSubOcr进行ocr识别,当然前提是要先装一个MODI的OCR接口(office的OCR模块包),供第三方软件的OCR功能调用,据我所知专业字幕组都是这么操作的!百度的那个OCR识别率差远了!
以前还要用java的一个小程序来将SUP进行转化,现在不用这么麻烦了!
回复

使用道具 举报

0

主题

17

回帖

0

VC币

新手上路

Rank: 1

积分
189
hhbluestar 发表于 2020-12-8 13:13:17 | 显示全部楼层
yuefeima 发表于 2020-12-7 16:12
你是不是截图有问题,你要不加我qq,我给你看看(1156333484)

截图没问题,截图了525张图.。然后额度500 》。。。。不过,软件不错了,谢了,小哥。
回复

使用道具 举报

1

主题

25

回帖

0

VC币

荣誉会员

Rank: 14Rank: 14Rank: 14Rank: 14

积分
98869
yuefeima  楼主| 发表于 2020-12-8 14:19:51 | 显示全部楼层
hhbluestar 发表于 2020-12-8 13:13
截图没问题,截图了525张图.。然后额度500 》。。。。不过,软件不错了,谢了,小哥。
...

500次不止识别500张图片啊,它是用叠图的方式叠的,按理来说至少可以识别5000张图片
回复

使用道具 举报

1

主题

25

回帖

0

VC币

荣誉会员

Rank: 14Rank: 14Rank: 14Rank: 14

积分
98869
yuefeima  楼主| 发表于 2020-12-8 14:21:59 | 显示全部楼层
MichaelLv 发表于 2020-12-8 11:39
tsMuxer提取SUP,IdxSubOcr进行ocr识别,当然前提是要先装一个MODI的OCR接口(office的OCR模块包),供第三 ...

你可能用的是百度的标准识别模式,实际使用中,百度的高精度识别比起IdxSubOcr准确率好上不少
回复

使用道具 举报

0

主题

17

回帖

0

VC币

新手上路

Rank: 1

积分
189
hhbluestar 发表于 2020-12-8 16:00:59 | 显示全部楼层
yuefeima 发表于 2020-12-8 14:19
500次不止识别500张图片啊,它是用叠图的方式叠的,按理来说至少可以识别5000张图片
...

问题是我的就是样啊,还有26张没识别。提示额度用完....
回复

使用道具 举报

1

主题

25

回帖

0

VC币

荣誉会员

Rank: 14Rank: 14Rank: 14Rank: 14

积分
98869
yuefeima  楼主| 发表于 2020-12-8 16:18:27 | 显示全部楼层
hhbluestar 发表于 2020-12-8 16:00
问题是我的就是样啊,还有26张没识别。提示额度用完....

所以我怀疑是你截图是不是截得太高了,或者参数设置中stack_num = 0,你是不是设置为了stack_num = 1?
回复

使用道具 举报

0

主题

41

回帖

0

VC币

新手上路

Rank: 1

积分
235
MichaelLv 发表于 2020-12-8 19:59:58 | 显示全部楼层
yuefeima 发表于 2020-12-8 14:21
你可能用的是百度的标准识别模式,实际使用中,百度的高精度识别比起IdxSubOcr准确率好上不少
...

但是你这个软件能直接对sup字幕文件进行OCR识别吗?如果是一张一张的截图识别,那除非是满屏的特效字幕,才有应用价值啊!
其实字幕组一般都是对英文字幕进行OCR识别,然后再进行翻译,这样比听译的效率要高许多。
回复

使用道具 举报

1

主题

25

回帖

0

VC币

荣誉会员

Rank: 14Rank: 14Rank: 14Rank: 14

积分
98869
yuefeima  楼主| 发表于 2020-12-8 20:26:55 | 显示全部楼层
MichaelLv 发表于 2020-12-8 19:59
但是你这个软件能直接对sup字幕文件进行OCR识别吗?如果是一张一张的截图识别,那除非是满屏的特效字幕, ...

把sup字幕转成图片识别不就好了,我这个是提取硬字幕,顺带也可以识别sup字幕,我还做了个专门识别sup字幕的,只是没发布而已,原理都是一样的。
回复

使用道具 举报

0

主题

17

回帖

0

VC币

新手上路

Rank: 1

积分
189
hhbluestar 发表于 2020-12-9 09:04:39 | 显示全部楼层
本帖最后由 hhbluestar 于 2020-12-9 09:12 编辑
yuefeima 发表于 2020-12-8 16:18
所以我怀疑是你截图是不是截得太高了,或者参数设置中stack_num = 0,你是不是设置为了stack_num = 1?
...

参数没动,文字识别高度刚好。今天识别另一视频 没问题 1000多张图片都OK,这就有点迷了..
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表