找回密码
 立即注册
查看: 2052|回复: 3

【自动翻译相关】Python 自然语言处理相关库

184

主题

414

回帖

585

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
551478

崭露头角活跃达人新人登场

Seekladoom 发表于 2021-1-12 08:56:12 | 显示全部楼层 |阅读模式
本帖最后由 Seekladoom 于 2021-1-12 13:33 编辑

​首先成神之日第4话(1分28秒开始)截图镇帖:
Screenshot_20210112-131732.png

Screenshot_20210112-131746.png
:有兴趣的朋友可以持续关注这块,看看以后现实世界中真正完美的“兴梠-浅间模型算法”到底是下面github开源项目的哪个NLP,抑或是别的地方的NLP库。

为了解决字幕组翻译和校对人手短缺(越来越多的人扛不住三次元爆炸)的问题,这里我把github上的Python 自然语言处理相关库搬运过来了。

英文链接:
https://github.com/vinta/awesome-python#natural-language-processing
Screenshot_20210112-084729.png
中文链接:
https://github.com/jobbole/awesome-python-cn
Screenshot_20210112-084751.png

常年看日本动画字幕的观众和字幕组朋友们应该都知道,像一些对话比较简单的【日常番】,对话的词汇量和文法也就那么多,翻译得多了以后,再做类似的片子可以很快就想到这片子该怎么翻译。【少数有大量梗】的日常番,也可以把【比较简单的对白部分】和【较为复杂的梗部分】分开,来精准把握一部番的翻译质量,目前我看到的做得好的校对几乎都有这种习惯。其他类型的日本动画也可以根据相应的风格和场景(包括各种细化的地方)以此类推。

实操过程中个人建议配合【思维导图】把握各个组成部分的【难易度】,这样管理出来的效率和质量也会高得多,做到又快又好。

一个对动画组来说真正耐用的中文字体应该具备哪些条件?
https://bbs.acgrip.com/forum.php?mod=viewthread&tid=5310

使用思源字体在Aegisub中制作字幕时的一些常见问题
https://bbs.acgrip.com/forum.php?mod=viewthread&tid=3805
回复

使用道具 举报

184

主题

414

回帖

585

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
551478

崭露头角活跃达人新人登场

Seekladoom  楼主| 发表于 2021-1-12 09:01:08 | 显示全部楼层
另外,这圈子其实已经有一个现成的适合作为训练库的资源了,也就是——U2字幕库:
链接:https://pan.baidu.com/s/1Gtwo6_8T7qthu93u7NZuug
提取码:9oa5
一个对动画组来说真正耐用的中文字体应该具备哪些条件?
https://bbs.acgrip.com/forum.php?mod=viewthread&tid=5310

使用思源字体在Aegisub中制作字幕时的一些常见问题
https://bbs.acgrip.com/forum.php?mod=viewthread&tid=3805
回复

使用道具 举报

26

主题

397

回帖

455

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
394374

新人登场崭露头角渐入佳境活跃达人

橙兜酱 发表于 2021-1-14 13:09:40 | 显示全部楼层
Seekladoom 发表于 2021-1-12 09:01
另外,这圈子其实已经有一个现成的适合作为训练库的资源了,也就是——U2字幕库:
链接:https://pan.baidu. ...

U2的字幕全部扒下来了??

动画年鉴-统计表 (notion.so)
动画年鉴网盘目录 (xido.workers.dev)

欢迎参观,如果想一起收集整理的话可以在统计表主页找我联系方式~
回复

使用道具 举报

184

主题

414

回帖

585

VC币

星辰大海

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

积分
551478

崭露头角活跃达人新人登场

Seekladoom  楼主| 发表于 2021-1-14 13:55:23 | 显示全部楼层
橙兜酱 发表于 2021-1-14 13:09
U2的字幕全部扒下来了??

不是全部,是早几年别的老哥整理的,时间的话应该是持续到2014年。
一个对动画组来说真正耐用的中文字体应该具备哪些条件?
https://bbs.acgrip.com/forum.php?mod=viewthread&tid=5310

使用思源字体在Aegisub中制作字幕时的一些常见问题
https://bbs.acgrip.com/forum.php?mod=viewthread&tid=3805
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表