用 Subtitle Edit 提取硬字幕教程
软件: Subtitle Edit 4.0.14https://github.com/SubtitleEdit/subtitleedit/releases硬字幕(PGS 是一种图像(或图形)字幕格式,它的全称是 Presentation Graphics Stream。)与基于文本的字幕(如 SRT 或 ASS/SSA)不同,PGS 字幕是以图片的形式存储每一行文字的。这意味着它们是预先渲染好的图形,而不是可编辑的纯文本。
需要使用特定的 OCR(光学字符识别)工具将其转换为文本格式(如 SRT 或 ASS)
0、打开软件Subtitle Edit
1、设置语言 Options / Chooese Language、设置网络代理 Options/ Networking/ Proxy address (首次使用时候需要下载OCR工具和语言模型)
2、打开视频文件并选择需要提取的硬字幕
3、选择OCR方法,这里选择Tesseract 5.5.0,(首次使用会自动下载OCR工具,下载完成后选择语言字典,选择需要使用的语言,简体中文 Chi-sim)
选择语言,去掉斜体和音符(Music symbol)
4、点击 “Start OCR” 开始提取,等待提取完成
5、人工修正错误、校验字幕(粗略扫描一下那些奇怪文字)
6、确定
7、在调整前先保存一份备份 (重要!!!)避免软件崩溃
8、工具/合并内容相同行
9、保存
页:
[1]