找回密码
 立即注册
查看: 20220|回复: 48

Freyja: 使用深度学习的视频硬字幕提取工具,更加方便的手抄字幕(21/01/11 更新,减少资源占用)

15

主题

41

回帖

40

VC币

至尊会员

Rank: 16Rank: 16Rank: 16Rank: 16

积分
284315

小有所成崭露头角BD!

arition 发表于 2020-11-28 20:18:12 | 显示全部楼层 |阅读模式
本帖最后由 arition 于 2021-1-11 18:41 编辑

Freyja 是使用 PyTorch,Nodejs 和 Electron 编写的视频硬字幕提取工具,可以帮助手抄字幕用户更加方便的从视频中提取字幕。
只需要简单的选择提取范围,工具就可以自动识别范围中的文字,无需传统手抄字幕软件复杂的调参操作。

目前仍然在 beta 测试中。基本功能都是可用的,但是可能会遇到 bug 或者随机崩溃等问题。如果你碰到了任何问题,请带上 log.log 文件在 Github issues (https://github.com/freyjaSubOCR/freyja-sub-ocr-electron/issues) 中报告。目前OCR只能识别一些常见的字幕组的字幕样式,如果遇到OCR识别准确率很差的情况,请提供一个可以让我下载视频的方法(链接,种子等)让我调试。





更新日志

2021/01/11 V0.4.0

新版使用了更新后的OCRV3模型。新的OCRV3模型相比旧的OCR模型来说运行速度更快,也更加准确。新模型使用的GPU内存较少,所以默认的批次大小从8个变更为32个。在Surface book 2笔记本上(i7-8650U,GTX 1060 Max-Q),新版本处理一段24分钟的视频只需要10分钟。
新版不需要以前的对象检测模型,也统一了CPU和GPU模型。
新的模型需要框选更准确的字幕边界,否则准确度会很差。
下一个版本主要会优化视频解码和播放。

系统要求

Freyja 需要 8GB 的内存。强烈推荐使用带 Nvidia 显卡的电脑,否则过程会非常缓慢。

使用

如果你使用的是 Windows,安装Visual C++ Redist 2019。如果你使用的是 MacOS 或 Linux ,确保已安装ffmpeg。
https://github.com/freyjaSubOCR/freyja-sub-ocr-electron/releases下载最新版本的Freyja并将其解压缩。
https://github.com/freyjaSubOCR/freyja-sub-ocr-model-zoo/releases中下载对应模型的所有txt和torchscript文件,并将这些文件放入<程序根目录>/models/文件夹。
运行freyja.exe。如果有 Nvidia 显卡,请启用Enable CUDA选项,否则禁用该选项。

已知的问题

视频播放很慢

目前的视频播放实现不是很可靠,会占用比较多的内存并且会有播放卡顿。在正式版推出之前会有新的视频播放实现。

无法使用 MacOS 和 Linux 版本

当前,底层的torch-js包存在一些问题。下一个测试版本预计会修复这个问题。

常见问题

视频播放没有声音。

目前视频播放器没有播放声音功能。

无法播放视频。

这个视频可能是vfr(可变帧率)视频,当前视频播放器不支持播放这类视频。一个比较简单的解决方法是使用ffmpeg进行转码,来把视频转换为恒定帧率视频:ffmpeg -i video.mkv video_transcoded.mkv。

无法使用GPU模型。

确认你有 Nvidia 的显卡。如果确实有 Nvidia 的显卡,请尝试更新驱动程序。

程序提示 "pyTorch backend crashed"。

检查一下 log.log 中的最后一条错误信息。

如果log中有 CUDA out of memory 的提示,说明显存不足。可以通过降低 batch size 来减少显存使用。如果降低 batch size 不起作用,说明你的显存太小,请换用CPU模型。
如果log显示其他错误,请尝试改变视频裁剪的大小然后重试。

碎碎念

这个项目本来是上学期图像识别课程的final project。当时只有非常简陋的代码,不过识别效果不错,所以用了暑假的时间写了一个正经的UI。暑假结束的时候其实已经基本写完了,不过开学了以后又忙了起来导致拖到现在才发布。接下来的计划主要是换掉这个写的非常烂的视频播放方法,换成最近新提出的模型,以及修bug。


评分

参与人数 12活跃度 +201814 收起 理由
OO永恒 + 40 很给力!
BXV + 3840 很给力!
Seekladoom + 69633 机械飞升!
AkiZZZ + 400 很给力!
kyriakos + 800 很给力!
靈停考人 + 1600 很给力!
Ranpo + 800
那只猫 + 800 很给力!
菜姬 + 25600 赞一个!
NF-GL + 32767 很给力!
kysdm + 32767 很给力!
千恋万花 + 32767 很给力!

查看全部评分

回复

使用道具 举报

10

主题

10

回帖

208

VC币

中级会员

Rank: 3Rank: 3

积分
6502
小往422 发表于 2020-11-28 22:00:46 | 显示全部楼层

确实好慢
回复

使用道具 举报

2

主题

52

回帖

0

VC币

中级会员

Rank: 3Rank: 3

积分
5831
shiro 发表于 2020-11-28 22:50:16 | 显示全部楼层
太强了了吧。。。膜拜大佬
回复

使用道具 举报

12

主题

305

回帖

53

VC币

中级会员

Rank: 3Rank: 3

积分
19972
Beatrice-Raws 发表于 2020-11-29 02:19:17 | 显示全部楼层
回复

使用道具 举报

12

主题

305

回帖

53

VC币

中级会员

Rank: 3Rank: 3

积分
19972
Beatrice-Raws 发表于 2020-11-29 02:22:25 | 显示全部楼层
mpv开源是不是可以直接将视频播放换成mpv核心
回复

使用道具 举报

53

主题

152

回帖

6009

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
444444

崭露头角

KarlZeo 发表于 2020-11-29 09:36:49 | 显示全部楼层
Beatrice-Raws 发表于 2020-11-29 02:22
mpv开源是不是可以直接将视频播放换成mpv核心

mpv也是基于ffmpeg的,本质上没有任何区别.
回复

使用道具 举报

26

主题

397

回帖

455

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
394374

新人登场崭露头角渐入佳境活跃达人

橙兜酱 发表于 2020-11-29 12:45:20 | 显示全部楼层
这个软件是不是能治疗我的懒癌晚期,先下载看看先另外有没有什么交流群鸭~这样子更方便交流 11.png


动画年鉴-统计表 (notion.so)
动画年鉴网盘目录 (xido.workers.dev)

欢迎参观,如果想一起收集整理的话可以在统计表主页找我联系方式~
回复

使用道具 举报

26

主题

397

回帖

455

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
394374

新人登场崭露头角渐入佳境活跃达人

橙兜酱 发表于 2020-11-29 13:04:36 | 显示全部楼层
好家伙直接报错了
1.png

log.zip

1.41 KB, 下载次数: 221

动画年鉴-统计表 (notion.so)
动画年鉴网盘目录 (xido.workers.dev)

欢迎参观,如果想一起收集整理的话可以在统计表主页找我联系方式~
回复

使用道具 举报

18

主题

80

回帖

523

VC币

荣誉会员

Rank: 14Rank: 14Rank: 14Rank: 14

积分
87435

崭露头角新人登场渐入佳境

hungry小浩纸 发表于 2020-11-29 13:58:44 | 显示全部楼层
还没到能使用的阶段吧,几乎每个步骤都是bug
试了几次都是闪退
回复

使用道具 举报

1

主题

169

回帖

24

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
589047
pyyii1987 发表于 2020-11-29 14:42:05 | 显示全部楼层
又一个新工具,大佬们真的给力
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表