如何分离同一个音轨中重叠的两种人声呢

insuaaaaa 发表于 2025-12-2 15:16:43

对于在同一个音轨中有两个人一起说话（一般声音是一大一小）再加上背景音的情况往往很难听清声音小的那个人声但是有些字幕组能做出第二个人的字幕是如何做到的呢

cocue 发表于 2025-12-2 20:33:51

可以分啊，现在ai大模型至少是能分了，效果另说
只不过分离会损失部分信息，原轨听不出来，你指望分离后能听出来？ai大模型是打不过我们大脑的大模型的

smzase 发表于 2025-12-2 21:15:38

其实就跟你听中文一样听日语啊，除非是只能听清几个字的，那种只能靠理解补全

insuaaaaa 发表于 2025-12-2 22:14:43

cocue 发表于 2025-12-2 20:33
可以分啊，现在ai大模型至少是能分了，效果另说
只不过分离会损失部分信息，原轨听不出来，你指望分离后能 ...

最好的办法就是硬听吗{:4_91:}
这个问题问gemini和claude 推荐用BS-Roformer或者HTDemucs_ft 不过效果不好

rp88 发表于 2025-12-2 22:14:48

猜测也可能翻译人员看过原作漫画小说之类的套的原词

页: [1]

苏伯泰特论坛（2026.04.01）'s Archiver

如何分离同一个音轨中重叠的两种人声呢