如何分离同一个音轨中重叠的两种人声呢
对于在同一个音轨中有两个人一起说话(一般声音是一大一小)再加上背景音的情况 往往很难听清声音小的那个人声 但是有些字幕组能做出第二个人的字幕 是如何做到的呢 可以分啊,现在ai大模型至少是能分了,效果另说只不过分离会损失部分信息,原轨听不出来,你指望分离后能听出来?ai大模型是打不过我们大脑的大模型的 其实就跟你听中文一样听日语啊,除非是只能听清几个字的,那种只能靠理解补全 cocue 发表于 2025-12-2 20:33
可以分啊,现在ai大模型至少是能分了,效果另说
只不过分离会损失部分信息,原轨听不出来,你指望分离后能 ...
最好的办法就是硬听吗{:4_91:}
这个问题问gemini和claude 推荐用BS-Roformer或者HTDemucs_ft 不过效果不好
猜测也可能翻译人员看过原作漫画小说之类的套的原词
页:
[1]