找回密码
 立即注册
查看: 2479|回复: 7

又一个硬字幕提取器

  • TA的每日心情
    郁闷
    2022-3-3 10:00
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    2

    主题

    12

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    2079
    Chrysoberyl 发表于 2022-2-3 10:28:19 | 显示全部楼层 |阅读模式
    本帖最后由 Chrysoberyl 于 2022-2-3 23:48 编辑

    最近从某论坛看到一个新的硬字幕提取器,采用了AI模型,无需第三方API,直接本地识别。试用了一下感觉速度和正确率都不错,最大的问题是快速模式丢字幕,特别是那种两三个字的字幕,很容易丢,需要后期校对;如果用精确模式又慢到令人发指。折腾了一下命令行,似乎参数改了没发现有什么区别,可能是姿势不对没有生效(
    个人测试是300-400条字幕里会丢10-20条,当然和字幕长度也有关系。错字不多,校对时很轻松,找漏掉的字幕很痛苦。
    Github指路:video-subtitle-extractor (https://github.com/YaoFANGUK/video-subtitle-extractor)

    视频教程(https://www.bilibili.com/video/bv11L4y1Y7Tj)
    此项目有GUI傻瓜版,感觉很有前途,可以插个眼,解决丢字幕的问题之后就相当完美了。总之多一个工具还是不错的,推荐给大家。


    回复

    使用道具 举报

  • TA的每日心情
    开心
    2024-2-18 15:35
  • 签到天数: 407 天

    [LV.9]以坛为家II

    19

    主题

    230

    回帖

    453

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    100072

    崭露头角新人登场活跃达人

    skylimiter 发表于 2022-2-3 11:56:37 | 显示全部楼层
    本帖最后由 skylimiter 于 2022-2-3 13:01 编辑

    哇 居然不用第三方api
    体积上面也才300多MB
    晚些试试看

    ===编辑1
    精准模式真的很慢
    但是挂着让他跑
    就跑了接近一小时

    ===编辑2
    有看到srt档
    但还显示处理中...
    已经处理十分多钟了
    偶尔手抄、偶尔渣翻、无限當咕咕乃常态
    回复 支持 0 反对 1

    使用道具 举报

  • TA的每日心情

    2022-3-18 15:43
  • 签到天数: 18 天

    [LV.4]偶尔看看III

    0

    主题

    2

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    2345
    hdg007 发表于 2022-2-3 13:53:19 | 显示全部楼层
    能识别繁体字吗,大兄弟
    回复 支持 0 反对 1

    使用道具 举报

  • TA的每日心情
    郁闷
    2022-3-3 10:00
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    2

    主题

    12

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    2079
    Chrysoberyl  楼主| 发表于 2022-2-3 23:48:11 | 显示全部楼层
    hdg007 发表于 2022-2-3 13:53
    能识别繁体字吗,大兄弟

    可以的摘自Github项目页:
    • 多语言:支持中文/英文、繁体中文、日语、韩语、法语、德语、俄语、西班牙语、葡萄牙语、意大利语字幕的提取

    回复 支持 0 反对 1

    使用道具 举报

  • TA的每日心情
    开心
    2023-5-2 08:07
  • 签到天数: 16 天

    [LV.4]偶尔看看III

    0

    主题

    5

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    2806
    echoli08 发表于 2022-2-4 08:12:04 | 显示全部楼层
    能識別繁體的話...
    找天來試試重新提取一下秀逗泰山的字幕...
    回复 支持 0 反对 1

    使用道具 举报

  • TA的每日心情
    开心
    2024-2-18 15:35
  • 签到天数: 407 天

    [LV.9]以坛为家II

    19

    主题

    230

    回帖

    453

    VC币

    荣誉会员

    Rank: 14Rank: 14Rank: 14Rank: 14

    积分
    100072

    崭露头角新人登场活跃达人

    skylimiter 发表于 2022-2-4 13:54:58 | 显示全部楼层
    整体来说简体繁体使用精准模式

    精准識别度很高

    但是相对的 花费时间挺长,也是目前我认为的缺点。
    可能闲暇时会挂着让他跑,正式使用时我可能不考虑使用这款...

    后面人工校对,基本上轻松很多,还是有漏,段落重复,时间轴错误的状况

    我环境是win11 打开exe过程以及执行过程中挺卡顿的。。。。不知道是不是个例?
    偶尔手抄、偶尔渣翻、无限當咕咕乃常态
    回复 支持 0 反对 1

    使用道具 举报

  • TA的每日心情
    郁闷
    2022-3-3 10:00
  • 签到天数: 10 天

    [LV.3]偶尔看看II

    2

    主题

    12

    回帖

    0

    VC币

    中级会员

    Rank: 3Rank: 3

    积分
    2079
    Chrysoberyl  楼主| 发表于 2022-2-4 13:59:26 | 显示全部楼层
    skylimiter 发表于 2022-2-4 13:54
    整体来说简体繁体使用精准模式

    精准識别度很高

    如果确定要人工精校的话,不如直接用快速模式,23分的片子也就几分钟的事,省下的时间足够人工看一遍校对了。
    如果加上一些奇技淫巧的话,甚至可以进一步降低漏字幕的情况,比如一边校对一边看Aegisub里的音轨,比如如果两条字幕之间明显有人声部分可以直接检查一下,覆盖不全的可以看看是不是时间轴有点问题之类。个人体验是加上这些技巧之后20分钟,300-400条字幕的片子大概可以控制在丢10条字幕左右。

    点评

    这技巧我来试试hhhh 谢谢lz  发表于 2022-2-4 14:14
    回复 支持 0 反对 1

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表