找回密码
 立即注册
楼主: NoobNeo

为了更便捷的手抄字幕, 我搞了一个新玩具(更新 0.0.6-beta)

21

主题

327

回帖

87

VC币

白金会员

Rank: 12Rank: 12Rank: 12

积分
51811
wudihongjing 发表于 2020-1-4 02:48:19 | 显示全部楼层
工具帖不应该被置顶吗?
回复

使用道具 举报

15

主题

125

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
3627
amiemie666 发表于 2020-1-11 09:14:03 | 显示全部楼层
强大的大佬~赞~如果能遇到强大的队友协同作战,就完美了~
回复

使用道具 举报

14

主题

80

回帖

1949

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
477288
NoobNeo  楼主| 发表于 2020-1-16 20:06:21 | 显示全部楼层

第二次的错误和第一次的肯定不相同, 你没有贴出来, 新版本近期更新, 届时再试试
声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
已获许可的字幕组: DHR動研字幕組, TUcaptions
以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
最佳途径: Telegram @noobneo
回复

使用道具 举报

14

主题

80

回帖

1949

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
477288
NoobNeo  楼主| 发表于 2020-1-16 20:11:49 | 显示全部楼层
瞬间抛锚 发表于 2019-12-20 16:31
楼主你好,我发现即使帧间隔调成1帧,截取的时间轴还是不如esrXP的精确,不知道该怎么解决?

如图:

COCR 的时间轴是由 FFMpeg 直接返回的, 粗看了下 Aegisub 的源码, 不懂 C/C++语言, 盲猜? Aegisub 的时间码和 FFMpeg 不太一样导致的.暂时没有太大问题, 除非手抄的字幕是要匹配内嵌版的, 以后着手解决吧


声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
已获许可的字幕组: DHR動研字幕組, TUcaptions
以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
最佳途径: Telegram @noobneo
回复

使用道具 举报

0

主题

2

回帖

0

VC币

注册会员

Rank: 2

积分
577
Duang 发表于 2020-1-17 11:31:04 | 显示全部楼层
本帖最后由 Duang 于 2020-1-17 15:44 编辑

我有个想法,用无字幕视频和有字幕视频作差,然后提取差异较大画面的区间作为手抄字幕的时间点。
sub.mp4_20200117_154057.683.jpg
回复

使用道具 举报

14

主题

80

回帖

1949

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
477288
NoobNeo  楼主| 发表于 2020-1-20 11:19:08 | 显示全部楼层
Duang 发表于 2020-1-17 11:31
我有个想法,用无字幕视频和有字幕视频作差,然后提取差异较大画面的区间作为手抄字幕的时间点。 ...

用这种方法来找时间轴的话有一个缺陷, opencv 是使用 ffmpeg 作为视频支持的, 从视频里比对图像, 就涉及到帧, 所以又回到了 帧 所在时间位置的问题
声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
已获许可的字幕组: DHR動研字幕組, TUcaptions
以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
最佳途径: Telegram @noobneo
回复

使用道具 举报

0

主题

2

回帖

0

VC币

注册会员

Rank: 2

积分
577
Duang 发表于 2020-1-20 19:12:42 | 显示全部楼层
本帖最后由 Duang 于 2020-1-20 19:23 编辑
NoobNeo 发表于 2020-1-20 11:19
用这种方法来找时间轴的话有一个缺陷, opencv 是使用 ffmpeg 作为视频支持的, 从视频里比对图像, 就涉及 ...

作差就是为了方便提取时间位置 https://paste.ubuntu.com/p/zGJ4BnNpfW/
不过这方法也挺麻烦的,如果两个开始视频时间不同还得手动调时间,而且有的视频中间丢帧到后面就对不齐了,不过这方法提取出来的时间精度还可以,提取出来的画面间隔基本上都是字幕,很少有非字幕的画面
回复

使用道具 举报

14

主题

80

回帖

1949

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
477288
NoobNeo  楼主| 发表于 2020-1-20 20:19:13 | 显示全部楼层
本帖最后由 NoobNeo 于 2020-1-20 20:20 编辑
Duang 发表于 2020-1-20 19:12
作差就是为了方便提取时间位置 https://paste.ubuntu.com/p/zGJ4BnNpfW/
不过这方法也挺麻烦的,如果两个 ...

我以为你是考虑帧转时间的精度问题,理解偏差。做差取帧的方法,如你所说,要两个视频,且帧率,总帧数和时长要相同,不然会造成严重的偏差,另外视频比例也是不稳定因素,如果比例不吻合,字幕区域就匹配不上,做差也就没有意义了
声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
已获许可的字幕组: DHR動研字幕組, TUcaptions
以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
最佳途径: Telegram @noobneo
回复

使用道具 举报

5

主题

62

回帖

106

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
270692
Yukarubih 发表于 2020-1-30 09:22:43 | 显示全部楼层
捕获.PNG

做了2集战国 Collection,发现一直出现“中后期时轴不完全对应OCR之后的文本”!有几行时轴多出来(缺几行ocr该有的文本),不过我就是用这个工具提取时间轴的,倒是不影响!只是大大没出现这个问题吗?
回复

使用道具 举报

14

主题

80

回帖

1949

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
477288
NoobNeo  楼主| 发表于 2020-1-30 10:03:40 | 显示全部楼层
Yukarubih 发表于 2020-1-30 09:22
做了2集战国 Collection,发现一直出现“中后期时轴不完全对应OCR之后的文本”!有几行时轴多出来(缺几 ...

是 Tesseract-ocr 没有识别出文本, 直接跳过了, 导致文本和时间轴错位. 我是在 'Caption OCR Tool' 中完成 OCR 错误修正后, 再导出 ass 字幕的.
我是这样进行手抄的, 仅供参考:
  • 先批处理全季字幕;
  • 对每个 cocr 文件进行合并 + OCR;
  • 把全季 OCR 结果分别复制到 文本编辑工具 (例如: Notepad++), 利用 文本编辑工具的 "查找和替换" 把所有明显错误的地方 (多余的标点, 空格, 明显错字之类的) 都去除;
  • 把替换后的内容复制回 'Caption OCR Tool' 的编辑框内, 再逐行修正, 文本编辑工具 中剩余集数同步替换修正, 这样越往后, 修正速度越快

声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
已获许可的字幕组: DHR動研字幕組, TUcaptions
以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
最佳途径: Telegram @noobneo
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表