找回密码
 立即注册
查看: 11068|回复: 44

如何使用 Ai 辅助啃生肉

5

主题

10

回帖

16

VC币

中级会员

Rank: 3Rank: 3

积分
5514
yww 发表于 2023-7-2 16:10:28 | 显示全部楼层 |阅读模式
本帖最后由 yww 于 2023-7-15 17:50 编辑

声明:以下内容只适用于和我一样的菜鸟,不适合专业字幕组
--更新--
找到了可以全文翻译的ai, 见下文
下面正文
相比有很多同学和我一样,日语无力,但是从pt/bt 下载的很多资源,除了正片能在互联网上找到字幕之外,像是某些特典,广播剧,评论音轨都是难以找到字幕的。
往往辛辛苦下载的资源到手只能吃灰。

但是现在时2023年了,AI 遍地开花,我们何尝不试试用现代科技帮我门解决生肉的难题。
准备工作
WhisperDesktop: github.com/Const-me/Whisper
CharGPT/翻译软件 Chatgpt没有账号也可以试试 Chatgpt 代理
操作系统我使用的 Win10
另外,你必须要准备一张显卡并安装好驱动(显存越大越好,我使用的Tesla P4, 8gb 足够了)
正式开始
首先介绍一下 WhisperDesktop, 这个项目是基于 Whisper.cpp 编写的一个Windows客户端,用来实现语音转文本的听写能力,解决了我们听不懂的问题,客户端的详细说明可以参考github 页面上描述。
使用方法如下, 首先我们需要在release 页面下载最新的客户端,地址: github.com/Const-me/Whisper/releases

找到资源(Assert)中的 WhisperDesktop.zip 下载即可。
第一次运行的时候,需要下载一个模型用来识别语言,下载链接: huggingface.co/ggerganov/whisper.cpp(原链接失效了,感谢评论区的同学指正)
这一步根据你显存的大小选择, 选能支持的最大模型就可以.

下载好之后,在 Model Path 中,选择下载好,Model Implementation 选择GPU,点击进入下一步。

上面的语言,根据音频的自身的语言选择即可,Translate 不要勾选(勾选了会自动翻译成英语)
Transcribe File 选择音频或者视频文件(如果发现不支持,可以先使用FFMpeg 转换成mp3 等文件再试。
Output Format 中选择输出格式,我们是做字幕,所以选择Subrip Subtitle(srt)
Place that File to input folder 勾上之后,会自动将生成的srt 放在视频文件同目录下,你也可以不勾选,自己选择输出位置
一切就绪之后,选择Transcribe 开始听写,听写花费的时间和音频长度成正比

听写的字幕软件,时间轴可能不一定完全准确,可以用你喜欢的字幕软件调整时间轴,比如Aegisub,虽然听不懂,但是也可以用断句的时间大概蒙出来。
当然,你也可以直接凑合用。
有了字幕文件之后,那么有两个选择, 第一个是直接给Google Translate 机翻,新建一个word 文件,将字幕贴进去,翻译,再拷贝回来就可以了。
这种方式速度快,勉强也能看懂。不过既然是2023年,我们也有更好的解决方案。
你可以使用 Chatgpt 或者 Chatgpt 代理,其他类似Chatgpt 的工具也可以。
然后给他说
我接下来会输入一个字幕文件,你将它翻译成中文后输出给我,明白了回复OK.
他会回复一个好的。
然后你把字幕文件贴进去,太长了可能需要分段一下。
接着就等他给你翻译,你甚至可以要求他给你翻译的同时保留原文,这样就是双语字幕了。
可能需要稍微调整一下格式。

效果:


--分割线--
所有工具都不是我开发的,单纯只是一个搬运工,能帮到大家很开心。
AI幻听问题,我也遇到了过,有时候换一个模型就没有,很奇怪,我也不太懂原因。

--全文翻译AI--
找到了一个可以全文翻译的ai, 链接:claude.ai, 需要科学上网,大陆以及香港地区不可使用。
可以直接上传txt文件。
效果如下



评分

参与人数 4活跃度 +3200 收起 理由
1362513713 + 800 大恩不言谢
For.Infi + 800
AexLink + 800 很给力!
Bets + 800

查看全部评分

回复

使用道具 举报

8

主题

82

回帖

0

VC币

高级会员

Rank: 4

积分
27650
与中酱 发表于 2023-7-2 23:12:26 | 显示全部楼层
虽然嫌麻烦(代理这个对我来说有点难),但是我大受震撼,给大佬点赞了。
确实这解决了不少痛点,尤其很多以前VCB都附带了评论音轨
回复

使用道具 举报

25

主题

324

回帖

1056

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
407461
Lambholl 发表于 2023-7-2 23:49:43 | 显示全部楼层
600:00:14,000
回复

使用道具 举报

5

主题

10

回帖

16

VC币

中级会员

Rank: 3Rank: 3

积分
5514
yww  楼主| 发表于 2023-7-3 21:30:39 | 显示全部楼层

格式自己稍微调整一下即可
回复

使用道具 举报

5

主题

10

回帖

16

VC币

中级会员

Rank: 3Rank: 3

积分
5514
yww  楼主| 发表于 2023-7-3 21:32:18 | 显示全部楼层
与中酱 发表于 2023-7-2 23:12
虽然嫌麻烦(代理这个对我来说有点难),但是我大受震撼,给大佬点赞了。
确实这解决了不少痛点,尤其很多 ...

有很多代理网站,不需要注册,google 搜索 chatgpt 代理即可,可能需要科学网络才能访问就是了
回复

使用道具 举报

8

主题

82

回帖

0

VC币

高级会员

Rank: 4

积分
27650
与中酱 发表于 2023-7-4 23:37:45 | 显示全部楼层
yww 发表于 2023-7-3 21:32
有很多代理网站,不需要注册,google 搜索 chatgpt 代理即可,可能需要科学网络才能访问就是了 ...

是的,关键就是在于这个科学上网,实在是我个人的一个痛点啊,没这个能力,现在需要下VCB种子都是让肉身在外的同学帮我下。

梯子对我来说有点小贵了,使用频率太低了,我万年才有一次访问需求,直接找同学完事
但是楼主的这项技术真的!真的!真的好棒,毕竟有些评论音轨都比正片都有意思,啃不动的有Ai辅助翻译可太香了

回复

使用道具 举报

47

主题

2781

回帖

2020

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
432683

崭露头角活跃达人CD!BD!坚持不懈灌水之王日积月累

孤雨独火 发表于 2023-7-5 00:49:16 | 显示全部楼层
本帖最后由 孤雨独火 于 2023-7-5 00:51 编辑
与中酱 发表于 2023-7-4 23:37
是的,关键就是在于这个科学上网,实在是我个人的一个痛点啊,没这个能力,现在需要下VCB种子都是让肉身 ...

你都有磁链了为什么还要人带种子???


Snipaste_2023-07-04_17-51-08.jpg

这串数字对应磁链的hash
回复

使用道具 举报

0

主题

21

回帖

0

VC币

高级会员

Rank: 4

积分
22978
1362513713 发表于 2023-7-5 04:44:12 | 显示全部楼层
截图中识别语音的模型链接404了,贴上新的链接:huggingface.co/ggerganov/whisper.cpp
不用谢我
微信截图_20230705044017.png
回复

使用道具 举报

4

主题

25

回帖

8

VC币

中级会员

Rank: 3Rank: 3

积分
4703
默沨 发表于 2023-7-5 10:23:45 | 显示全部楼层
本帖最后由 默沨 于 2023-7-5 10:42 编辑

试了试这准确性完全ok

这东西似乎也能用来生成歌词,输出带时间戳的文本可以直接用,试了下foobar2000可以直接识别,musicbee得改下格式

感觉我的cd有救了
回复

使用道具 举报

0

主题

21

回帖

0

VC币

高级会员

Rank: 4

积分
22978
1362513713 发表于 2023-7-5 11:54:02 | 显示全部楼层
默沨 发表于 2023-7-5 10:23
试了试这准确性完全ok

这东西似乎也能用来生成歌词,输出带时间戳的文本可以直接用,试了下foobar2000可以 ...

srt泛用性挺高的,甚至能导进pr里
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表