監(jiān)聽(tīng)延遲(到底能有多低?)
作者:Joe Albano
編譯:3asic
很多人都知道監(jiān)聽(tīng)延遲是大多數(shù)制作人在面對(duì)的問(wèn)題,但是你知道它的原理嗎?那就來(lái)看 Joe Albano 為大家詳細(xì)解釋吧。
最新最尖端的計(jì)算機(jī)高速輸入輸出接口 Thunderbolt(雷電)和 USB3 使得超低延遲變成了可能,設(shè)備制造商也在抓緊應(yīng)用以獲得自己的產(chǎn)品優(yōu)勢(shì)。但不像一些精通數(shù)字音頻宿主的技術(shù)人員,一般的制作人和錄音工程師大多都對(duì)延遲只有一些基本認(rèn)知。當(dāng)然他們知道在大多數(shù)情況下,擁有低延遲是一件“好事”,但他們不一定知道有多低比較合適,或者這些延遲的區(qū)別在實(shí)際應(yīng)用上具有什么影響。下面是一些我們?cè)诖_定數(shù)字音頻宿主環(huán)境下合適的延遲設(shè)置時(shí),需要注意的一些事項(xiàng)。
延遲
讓我們老生常談一下:監(jiān)聽(tīng)延遲是在數(shù)字音頻經(jīng)過(guò)計(jì)算機(jī)(數(shù)字音頻宿主)處理時(shí)不可避免會(huì)出現(xiàn)的現(xiàn)象。技術(shù)上來(lái)說(shuō),延遲的意思是“等待時(shí)間”,是音頻在任何數(shù)字音頻設(shè)備經(jīng)過(guò)錄制、處理、回放的過(guò)程中處理信息所產(chǎn)生的時(shí)間。延遲是不可避免的,但延遲的時(shí)間可以小到人耳完全無(wú)法分辨,不過(guò)有的時(shí)候也會(huì)大到讓音樂(lè)人在戴著耳機(jī)時(shí)感受到明顯的“回聲“效果。不過(guò)這樣的延遲在簡(jiǎn)單的回放中(比如在沒(méi)有人實(shí)時(shí)錄制、表演,或者進(jìn)行縮混時(shí)),一般完全不會(huì)讓人察覺(jué)。但是在實(shí)時(shí)錄制過(guò)程中,樂(lè)手或是歌手在耳機(jī)里實(shí)時(shí)監(jiān)聽(tīng)數(shù)字音頻宿主中返回的信號(hào)時(shí),過(guò)大的延遲時(shí)間是會(huì)被人輕易注意到的,同時(shí)也可能會(huì)引發(fā)各式各樣的問(wèn)題。
有一些技術(shù)上的原因會(huì)導(dǎo)致音頻的延遲。音頻接口中的“模擬-數(shù)字”或是“數(shù)字-模擬”轉(zhuǎn)換器會(huì)產(chǎn)生一些很小量的延遲,但這樣的延遲基本只會(huì)有一毫秒左右,在總體的延遲中完全可以被忽略。大部分音頻延遲主要是因?yàn)閿?shù)字音頻信號(hào)在錄制和回放的時(shí)候,數(shù)據(jù)從緩慢的機(jī)械硬盤(pán)到內(nèi)存之間的交換過(guò)程。
內(nèi)存緩沖
內(nèi)存緩沖是為了保證數(shù)據(jù)交換時(shí)的可靠性,不會(huì)因?yàn)樽x取/寫(xiě)入速度不均而導(dǎo)致無(wú)法同步造成的“噼啪”聲。這是需要在數(shù)字音頻宿主中的音頻設(shè)置中確定的數(shù)值——內(nèi)存緩沖的大小,以數(shù)字采樣的數(shù)量為單位。
宿主緩沖設(shè)定
較大的緩沖值會(huì)讓計(jì)算機(jī)工作的更加得心應(yīng)手,處理音頻的時(shí)候會(huì)更加可靠,不會(huì)出現(xiàn)“噼啪”聲,但會(huì)產(chǎn)生時(shí)長(zhǎng)可觀的音頻延遲,因?yàn)樾枰趦?nèi)存中緩沖、處理的音頻采樣數(shù)量較大。較小的緩沖值會(huì)減小這種惱人的延遲,但是每一臺(tái)計(jì)算機(jī)都有它的極限,超過(guò)這個(gè)信號(hào)處理能力的極限,“噼啪”聲或是更嚴(yán)重的故障聲就會(huì)出現(xiàn)。這樣的問(wèn)題有時(shí)是可以被重現(xiàn)的,但有時(shí)卻是間歇性出現(xiàn)(讓找到性能瓶頸的過(guò)程變得更加艱難),但它就代表計(jì)算機(jī)達(dá)到了它的處理性能極限。更快的接口速度一般是穩(wěn)定性能下音頻延遲的瓶頸所在,但是如果計(jì)算機(jī)中某一個(gè)部分的性能不夠好(比如 5400 轉(zhuǎn)的機(jī)械硬盤(pán),或是沒(méi)有什么剩余空間的硬盤(pán)),那這也會(huì)成為音頻延遲的決定性因素。
自然的,音樂(lè)是時(shí)間的藝術(shù),沒(méi)有人希望在錄制最好表演的時(shí)候出現(xiàn)過(guò)大的音頻延遲,影響樂(lè)手的發(fā)揮,所以至少在錄音過(guò)程中,把延遲設(shè)定為可能的最小值是非常重要的。當(dāng)然某些時(shí)候我們有另外的解決方案,比如零延遲的模擬監(jiān)聽(tīng)回放方案,但是由于現(xiàn)在數(shù)字音頻技術(shù)的廣泛應(yīng)用,我假設(shè)幾乎所有的錄音都是經(jīng)過(guò)數(shù)字音頻宿主的,所以延遲設(shè)定是整套系統(tǒng)中非常重要的部分。
多大才是過(guò)大?
人類(lèi)并不能很明顯的區(qū)分非常小的延遲。一般來(lái)說(shuō),小于 10 - 12 毫秒的延遲一般不會(huì)被人所察覺(jué)。如果表演者在監(jiān)聽(tīng)自己的聲音時(shí)出現(xiàn) 10 - 12 毫秒以下的延遲,那么一般來(lái)說(shuō)這樣的延遲會(huì)下意識(shí)的被人腦忽略成接收信息時(shí)產(chǎn)生的延遲,他們也會(huì)在下意識(shí)中適應(yīng)這樣的延遲,在和其他部分的配合中也會(huì)處于良好的同步狀態(tài)。
讓我們?cè)僬f(shuō)得深入一些,聲學(xué)上來(lái)說(shuō),在樂(lè)手齊聚一室進(jìn)行演奏的時(shí)候,總會(huì)有一些由于聲速而產(chǎn)生的延遲會(huì)出現(xiàn),樂(lè)手自身也會(huì)下意識(shí)的適應(yīng)著這樣的環(huán)境。聲波在空氣中傳輸?shù)乃俣却蟾旁诿亢撩?1 英尺左右。所以如果兩個(gè)樂(lè)手在房間中相距 8 英尺的距離,那么樂(lè)手 A 聽(tīng)到樂(lè)手 B 演奏的內(nèi)容的時(shí)間,是樂(lè)手 B 實(shí)際演奏時(shí)間的 8 毫秒之后,反之亦然,當(dāng)然他們都能很好的進(jìn)行演奏。幸運(yùn)的是,我們的聽(tīng)覺(jué)并不會(huì)受到如此之短的延遲的影響。我們?nèi)祟?lèi)本身就是不完美的,而我們已經(jīng)習(xí)慣了接收信息時(shí)的延遲時(shí)間,在音樂(lè)的角度上來(lái)說(shuō),這樣的延遲時(shí)間并不影響作為樂(lè)手演奏時(shí)律動(dòng)的準(zhǔn)確性。
你的感受不一定相同
不過(guò),就算我們把延遲的水平降低到 10 - 12 毫秒的水平,有一些音樂(lè)人可能會(huì)比一般人更加敏感一些,這也取決于他們演奏樂(lè)器的不同。打擊樂(lè)手,比如鼓手,可能對(duì)這樣短的延遲更加敏感一些,因?yàn)榇驌魳?lè)器具有非常明確短小的起音時(shí)間。在工作室中,我有接觸過(guò)一些鼓手,能感受到僅為 6 - 8 毫秒的延遲,而其他樂(lè)手基本都完全不會(huì)感受到。我發(fā)現(xiàn)這其實(shí)也是因?yàn)樗麄円餐瑫r(shí)聽(tīng)到了這些樂(lè)器的聲學(xué)原聲的緣故——為他們更換更好的隔音耳機(jī),同時(shí)增加他們的監(jiān)聽(tīng)音量,可以很好的解決問(wèn)題。這讓他們可以下意識(shí)的習(xí)慣自己擊打鼓棒的時(shí)間與實(shí)際聽(tīng)到鼓聲時(shí)間之間的微小延時(shí)。
但是大部分情況下,正常的延時(shí)時(shí)間應(yīng)該沒(méi)有任何問(wèn)題:大多數(shù)時(shí)候 8 - 12 毫秒的延時(shí)都行得通,同時(shí)這也不需要設(shè)置成最低的緩沖值,讓大多數(shù)計(jì)算機(jī)都可以很好的平衡處理能力和延遲之間的選擇。但如果你明確的需要更低的延遲,那你可能需要知道你計(jì)算機(jī)能安全達(dá)到的最低緩沖區(qū)數(shù)值設(shè)定,也就是你計(jì)算機(jī)能夠可靠的處理數(shù)字音頻的極限。這需要你在真正的錄音工作之前就提前做好準(zhǔn)備,所以在最初設(shè)置你的數(shù)字音頻工作環(huán)境的時(shí)候,就需要做好這樣的測(cè)試。
最低能有多低
所以我們提到的緩沖區(qū)大小和延遲時(shí)間之間究竟有沒(méi)有什么關(guān)聯(lián)呢?這時(shí)候我們就要提到采樣率了:下面的一張表格是在 44.1k 采樣率下常用的緩沖區(qū)大小數(shù)值和延遲時(shí)間的對(duì)比。
在 44.1k 采樣率下的緩沖區(qū)與延遲時(shí)間的對(duì)比
需要注意的是,緩沖區(qū)有兩個(gè),一個(gè)是輸入(錄音)緩沖區(qū),另一個(gè)是輸出(回放)緩沖區(qū)。在錄音時(shí),音頻經(jīng)過(guò)全部的兩個(gè)緩沖區(qū),但是 MIDI 觸發(fā)的虛擬樂(lè)器只需要經(jīng)過(guò)回放緩沖區(qū)(不過(guò)當(dāng)然 MIDI 也會(huì)增加一些延遲)。
一般來(lái)說(shuō)在大部分小型系統(tǒng)中,64 采樣大小的緩沖區(qū)設(shè)定一般是理想的——加上“模擬-數(shù)字”和“數(shù)字-模擬”轉(zhuǎn)換器的延遲(某些音頻接口的驅(qū)動(dòng)也會(huì)增加一些額外的延遲時(shí)間),你應(yīng)該會(huì)得到一個(gè)接近 4 - 5 毫秒的延遲時(shí)間。如果你在使用音響監(jiān)聽(tīng),那么這個(gè)延遲時(shí)間還需要增加 3 毫秒左右(聲速大概是每毫秒 1 英尺左右,還記得嗎?)。如果這樣的設(shè)置會(huì)產(chǎn)生一些“噼啪”聲,那么一般來(lái)說(shuō) 128 采樣大小的緩沖區(qū)也足夠解決這些問(wèn)題了,同時(shí)總體 7 - 8 毫秒的延遲也應(yīng)該適合絕大部分的演奏錄音了。
如果你的計(jì)算機(jī)仍舊無(wú)法在 128 采樣的緩沖區(qū)設(shè)置下可靠的工作,那么你就會(huì)陷入一個(gè)比較尷尬的境地。某些音樂(lè)人(尤其是使用虛擬樂(lè)器時(shí))也可以接受 256 采樣緩沖區(qū)的設(shè)置,不過(guò)其他人就不一定了。就我自己的感受而言,在演奏樂(lè)器時(shí),雖然它只有一點(diǎn)點(diǎn)惱人,我也可以繼續(xù)我的演奏,但是我覺(jué)得我對(duì)節(jié)拍的把握并沒(méi)有很理想。如果緩沖區(qū)的設(shè)置會(huì)讓延遲保持在 10 - 12 毫秒以上,那么你肯定需要使用耳機(jī)進(jìn)行監(jiān)聽(tīng),同時(shí)在宿主軟件中查找有沒(méi)有選項(xiàng)可以關(guān)閉額外的保護(hù)性延遲,可能會(huì)對(duì)縮短延遲時(shí)間有一些幫助。同時(shí),也需要查找一下在樂(lè)手的設(shè)備中可能產(chǎn)生延遲的部件,比如如果使用 POD 作為吉他效果器,那么 POD 會(huì)增加額外的幾毫秒的延遲。所以對(duì)我來(lái)說(shuō) 256 采樣的緩沖區(qū)設(shè)定基本上是不在我的選項(xiàng)當(dāng)中的——我可能需要轉(zhuǎn)換成純模擬的監(jiān)聽(tīng)電路,同時(shí)沒(méi)有辦法在錄音期間使用任何數(shù)字音頻宿主提供的信號(hào)處理功能。
極限
在大部分當(dāng)下的數(shù)字音頻宿主和音頻接口中,一般來(lái)說(shuō)它們都會(huì)提供一個(gè) 32 采樣的緩沖區(qū)選項(xiàng)。它能把整體的延遲降低到 1 - 3 毫秒的區(qū)間,這也基本上是軟件數(shù)字音頻處理,以及高端硬件加速數(shù)字錄音設(shè)備的延遲的極限了。在這個(gè)選項(xiàng)里,延遲的瓶頸會(huì)變成你計(jì)算機(jī)的年代和接口類(lèi)型了。三四年前的計(jì)算機(jī)可能會(huì)在這個(gè)選項(xiàng)下出現(xiàn)一些問(wèn)題,但是去年或者今年發(fā)布的新款計(jì)算機(jī)有一定的可能性可以在這個(gè)選項(xiàng)下穩(wěn)定工作,當(dāng)然這也需要你的音頻接口與計(jì)算機(jī)之間使用某種高速接口來(lái)連接,比如之前我們說(shuō)到的 Thunderbolt(雷電)或是 USB3。
更老的接口規(guī)范,比如 FireWire(火線)或者 USB2,在 32 采樣這么低的緩沖區(qū)設(shè)定下,可能沒(méi)有辦法正常工作,當(dāng)然試試看也不會(huì)有什么損失(再說(shuō)一遍,一定要在正式錄音之前測(cè)試。。但如果你在使用一個(gè)比較老的音頻接口(如果沒(méi)壞就不會(huì)想去換的那種),比如使用 Firewire 400 接口的型號(hào),就算使用轉(zhuǎn)接口連接到新款計(jì)算機(jī)上的 Thunderbolt 接口,也不會(huì)有 Thunderbolt 接口的高速性能。128 或是最低 64 采樣的緩沖區(qū)大小應(yīng)該會(huì)是最穩(wěn)定的選項(xiàng),同時(shí)在這樣的設(shè)定下,99.9% 的情況下應(yīng)該都不會(huì)出現(xiàn)什么問(wèn)題。
所以當(dāng)你設(shè)計(jì)安裝好你最新的數(shù)字音頻工作站的時(shí)候,千萬(wàn)不要忘了花一點(diǎn)點(diǎn)時(shí)間在緩沖區(qū)設(shè)定上,同時(shí)也要作為樂(lè)手(或者找到一個(gè)樂(lè)手)來(lái)測(cè)試一下不同設(shè)定之下的延遲狀況。也不要僅僅找到不會(huì)出現(xiàn)“噼啪”聲的最低值,你需要保證整個(gè)工作環(huán)境可以輕松應(yīng)對(duì)一定的壓力,畢竟這是低延遲錄音的基本挑戰(zhàn)。
轉(zhuǎn)自《midifan月刊》2017年11月第140期
【打印此頁(yè)】【返回首頁(yè)】 |