因为我自己曾经精调过 邻人似银河、CHINO Birthday Party 这两个字幕,所以深有体会。一般字幕组做字幕调轴,只看和波形有没有对齐,而不太关注在银幕上实际感受到的显示延迟,能比声音提前个0.1秒就已经非常难得了,大部分都用声音波形同步的方法调轴的,而人听到声音的那一刻,或者有意识地预判到下一句台词即将说出的那一刻,下意识看向底部时,虽然声音的波形是对齐的,但由于视觉上的延迟,字幕的那一帧在人眼里属于是“刚刚开始渲染,还没有清晰显示出来”的模糊状态,所以声音出来的那一刻并不能看清楚字幕,人眼至少要再往后延迟个3~5帧,等字幕稳定下来后才能开始看清并开始“扫描读取”,所以在人的感受上,与声音对齐的调轴方法,实际感受上却是字幕比声音要延迟一些的。