找回密码
 立即注册
楼主: NoobNeo

为了更便捷的手抄字幕, 我搞了一个新玩具(更新 0.0.6-beta)

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    476888
    NoobNeo  楼主| 发表于 2020-7-25 21:30:17 | 显示全部楼层
    cedar 发表于 2020-7-22 00:25
    请问, 背景也存在白色而且与字幕有重叠的情况下, 该怎么调整滤镜才能单独提取出白底黑框的字幕部分? 求给个 ...

    字幕颜色与背景色贴近的时候, 优先考虑 形态学/自适应/全局 这些模块.
    至于你说的 双边/均值/高斯/中值滤波 模块, 这些都是用来处理文字区域, 使用这些模块, 至少需要两组或以上的二值化图像, 配合 形态学/算术运算 模块来达到分离文本和非文本区域; 或者在文字和背景对比度高的环境下, 利用这些模块, 把文字边框滤除, 再搭配 HSV/HLS 提取文字.

    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    476888
    NoobNeo  楼主| 发表于 2020-7-25 22:21:24 | 显示全部楼层
    目前项目提供的是基础工具 (类似扳手/榔头之类), 需要根据视频来打造一套高级工具(类似自行车/汽车之类), 最终达到提取字幕的目的.

    如果没有入门计算机视觉, 参考模块说明或 OpenCv 文档, 也能提取成功, 但过程就很折磨人,,ԾㅂԾ,,
    如果有一定基础, 就能愉快玩耍了, 还可以自己写模块来解决特定场景, 部分功能要求更高就搁浅, 只在个人的小圈子内使用过.

    对于部分使用者而言确实有方便, 但远没有达到"便捷"的程度, 所以我考虑使用 TensorFlow 来辅助, 至于能不能成功? 不知道. 我甚至没有把握能否完成, 因为个人事务比较多, 最近更新也慢了, 再加上最早也是因为 TensorFlow 的问题才转用 Tesseract-ocr 的解决方案, 对于重回 TensorFlow 也是考虑甚久啊.
    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2024-2-20 09:00
  • 签到天数: 497 天

    [LV.9]以坛为家II

    6

    主题

    37

    回帖

    7

    VC币

    白金会员

    Rank: 12Rank: 12Rank: 12

    积分
    71914
    cedar 发表于 2020-7-26 04:08:47 | 显示全部楼层
    NoobNeo 发表于 2020-7-25 21:30
    字幕颜色与背景色贴近的时候, 优先考虑 形态学/自适应/全局 这些模块.
    至于你说的 双边/均值/高斯/中值滤 ...

    能否说具体一点? 比如有没有什么现成的例子?
    我大致能明白各种滤镜的含义, 应该不完全是小白, 如果有例子的话我想应该能听懂..
    我提取的字幕是白底黑框的, 背景图不算很复杂 只是个树影斑驳的CG画作, 恰好字幕有一部分落在了树影里, 所以一部分背景是白色的..我转灰度图之后用邻域尺寸很小的自适应二值化处理一下就基本成功滤掉了背景..包括文字的黑框..最终只剩下白色底的文字..所以我感觉去除边框的过程并不需要用到滤波?
    (处理前 & 处理后)
    如果文字和背景对比度高的话, 直接利用颜色过滤不就可以了么, 为什么还要滤波? 而且这个滤波的结果是文字变糊了..这样真的可以去掉边框么..我不知道该怎么做..
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    慵懒
    2021-3-13 13:55
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    1

    主题

    24

    回帖

    0

    VC币

    注册会员

    Rank: 2

    积分
    1166
    岁月留声 发表于 2020-7-30 11:38:29 | 显示全部楼层
    本帖最后由 岁月留声 于 2020-8-27 10:05 编辑

    支持一下,希望减少重复合轴的工作
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2024-2-20 09:00
  • 签到天数: 497 天

    [LV.9]以坛为家II

    6

    主题

    37

    回帖

    7

    VC币

    白金会员

    Rank: 12Rank: 12Rank: 12

    积分
    71914
    cedar 发表于 2020-7-30 22:17:41 | 显示全部楼层
    本帖最后由 cedar 于 2020-8-3 02:01 编辑
    cedar 发表于 2020-7-26 04:08
    能否说具体一点? 比如有没有什么现成的例子?
    我大致能明白各种滤镜的含义, 应该不完全是小白, 如果有例子 ...

    总算搞懂了..原来滤波的作用就是让字变糊, 字够糊就与背景融为一体了, 这样就能把字滤掉 只剩背景, 然后滤波前后的图像相减就可以了..一个流程是1色彩空间转到HSV 2中值滤波调大参数让字消失 3再把1和2相减, 再转换色彩空间成灰度图 最后加个邻域很小的自适应二值化就可以了..有时候滤波不管用, 就用形态学勾边再相减..
    然而必须做成白底黑字的要求还是太苛刻了..有些中间结果直接输出, 腾讯的识别率还更高些..

    或者如果能让判断字幕是否改变所用的图像与实际识别所用的图片不同就好了..

    回复 支持 反对

    使用道具 举报

    该用户从未签到

    1

    主题

    5

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    48
    1928530784 发表于 2020-8-10 14:54:30 | 显示全部楼层
    本帖最后由 1928530784 于 2020-8-10 18:15 编辑

    有没有快速选择删除标记?
    还有想问下能不能加个功能,就是可以批量识别然后自动保存COCR文件
    回复 支持 反对

    使用道具 举报

    该用户从未签到

    0

    主题

    1

    回帖

    0

    VC币

    新手上路

    Rank: 1

    积分
    32
    ehehe066 发表于 2020-8-14 21:22:59 | 显示全部楼层
    请问如果字幕太长的话如何分段导出png呢?
    还有想请问为什么我用ps无法打开导出的png图片文件,用MediaInfo看png其实是是bitmap文件格式的。
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2024-2-19 19:29
  • 签到天数: 913 天

    [LV.10]以坛为家III

    20

    主题

    136

    回帖

    319

    VC币

    至尊会员

    Rank: 16Rank: 16Rank: 16Rank: 16

    积分
    290203
    小吉炖蘑菇 发表于 2020-11-16 18:53:55 | 显示全部楼层
    本帖最后由 小吉炖蘑菇 于 2020-11-16 20:15 编辑

    导出图片的时候只有非中文目录才能导出。虽然不是什么大问题。但我还以为是软件有问题呢,折腾半天=====================================
    (文件也不能带中文)
    本地动漫存储交流群213690137
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    476888
    NoobNeo  楼主| 发表于 2020-11-16 21:41:22 | 显示全部楼层
    1928530784 发表于 2020-8-10 14:54
    有没有快速选择删除标记?
    还有想问下能不能加个功能,就是可以批量识别然后自动保存COCR文件
    ...

    删除操作目前只能通过鼠标左击, 批量选中通过左/右机实现, 具体的可以在项目文档内找到.批量处理视频和 COCR 文件批量 OCR 都可以在 "批处理" 窗口中完成.
    由于目前是单线程执行批处理, 建议多开几个程序, 然后每个程序内放几个文件, 借此实现多线程
    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复 支持 反对

    使用道具 举报

  • TA的每日心情
    开心
    2019-4-4 17:54
  • 签到天数: 2 天

    [LV.1]初来乍到

    14

    主题

    80

    回帖

    1949

    VC币

    星辰大海

    Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

    积分
    476888
    NoobNeo  楼主| 发表于 2020-11-16 21:43:31 | 显示全部楼层
    ehehe066 发表于 2020-8-14 21:22
    请问如果字幕太长的话如何分段导出png呢?
    还有想请问为什么我用ps无法打开导出的png图片文件,用MediaInfo ...

    暂不支持分页导出, PS 无法读取问题已修复(0.0.5-beta)
    声明: 本人所有手抄字幕都采用 进行许可(特殊标注除外)
    已获许可的字幕组: DHR動研字幕組, TUcaptions
    以往字幕有问题的, 请与我联系, 论坛不一定有时间上.
    最佳途径: Telegram @noobneo
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    快速回复 返回顶部 返回列表