全新世代的 AI 虛擬歌手簡(jiǎn)評(píng)

2022-12-18

隨著虛擬演藝技術(shù)及人工智能的，越來(lái)越多的、帶有AI技術(shù)的虛擬藝人、數(shù)字人、Vtuber主播等層出不窮，其中為這些新生概念奠基的歌聲合成技術(shù)也被一家名為Dreamtonics的公司推向了新的高度，借助強(qiáng)勁的AI能力，虛擬歌手也可以同真人歌手一般富有感情。

Dreamtonics和Synthesizer V Studio

Synthesizer V 是由 Dreamtonics 推出的歌聲合成軟件系列，最新的產(chǎn)品Synthesizer V Studio支持傳統(tǒng)的采樣型聲音庫(kù)和新型AI聲音庫(kù)。通過(guò) Synthesizer V AI 合成的歌聲，有如人類(lèi)歌手般自然流暢，細(xì)節(jié)飽滿，能夠在中文、英語(yǔ)、日語(yǔ)間隨意切換，采用多種聲線演唱各種風(fēng)格音樂(lè)。同時(shí)，經(jīng)過(guò)優(yōu)化的神經(jīng)網(wǎng)絡(luò)無(wú)需復(fù)雜昂貴的硬件即可在大多數(shù)設(shè)備上流暢運(yùn)行。

盡管搭載了先進(jìn)的AI合成技術(shù)，但是軟件的銷(xiāo)售價(jià)格依舊維持在同類(lèi)本地化歌聲合成類(lèi)產(chǎn)品平均水平的價(jià)格。那么讓我們來(lái)看一下，這個(gè)價(jià)格帶來(lái)的價(jià)格是否是物超所值吧~

體積更小，性能更好

傳統(tǒng)的計(jì)算機(jī)虛擬樂(lè)器軟件大多采用采樣器技術(shù)，雖然音質(zhì)在使用采樣的情況下得以保證，但是由于需要使用無(wú)損采樣，部分采樣聲音庫(kù)為了追求高品質(zhì)的合成甚至可以達(dá)到100GB以上。

與傳統(tǒng)的采樣器軟件不同，Synthesizer V Studio所使用的AI聲音庫(kù)使用了優(yōu)化的神經(jīng)網(wǎng)絡(luò)引擎，整體聲音庫(kù)包體大幅縮小，每個(gè)包體的安裝大約在30MB左右，對(duì)于動(dòng)輒幾十上百GB的采樣樂(lè)器庫(kù)來(lái)說(shuō)，Synthesizer V AI聲音庫(kù)在如此小的容量?jī)?nèi)解決了合成演唱的問(wèn)題，真是解放了眾多音樂(lè)人為數(shù)不多的硬盤(pán)空間（這省了多少硬盤(pán)錢(qián)�。。。�。
如果說(shuō)AI聲音庫(kù)的空間占用可稱為“短小“，那么AI聲音庫(kù)的合成效果更可謂是”精悍“。光說(shuō)不練假把式，先來(lái)聽(tīng)一段Demo！

有沒(méi)有被這個(gè)以假亂真的歌聲騙到？？？恰到好處的呼吸聲和精致的轉(zhuǎn)音與真人不相上下，什么？擔(dān)心這個(gè)聲音是為了做Demo特地做出來(lái)的？不不不，以上聲音為產(chǎn)品實(shí)機(jī)效果��！Synthesizer V AI自1.8版本開(kāi)始支持了全新的高速化擴(kuò)散概率模型（Diffusion Probabilistic Models，下稱DPM）得益于全新的技術(shù)，軟件合成出的歌聲相比于之前的版本噪音更少，聲音更自然還原。

鋼琴卷簾，可視化的直觀操作

鋼琴卷簾作為用戶的“工作場(chǎng)所”，自然功能不會(huì)少，除了普通的編寫(xiě)音符與歌詞，Synthesizer V Studio的鋼琴卷簾還支持以下功能

聲音波形顯示：可以即時(shí)直觀的觀察到調(diào)節(jié)參數(shù)對(duì)波形的影響。
音高顯示及編輯功能： Synthesizer V Studio可以在鋼琴卷簾內(nèi)直接編輯音高曲線，也同時(shí)提供了手動(dòng)繪制與錨點(diǎn)調(diào)整兩種手段，不僅調(diào)節(jié)時(shí)能夠更加直觀的感受歌曲實(shí)時(shí)音高的變化，也對(duì)于在自由繪制條件下感到困難的用戶提供了更方便且易于控制的調(diào)整方式。
參數(shù)控制面板：這個(gè)區(qū)域可以通過(guò)包絡(luò)線調(diào)節(jié)歌聲的各種參數(shù)，軟件最多可以打開(kāi)三個(gè)參數(shù)控制面板，三個(gè)面板均可以同時(shí)編輯，Synthesizer V Studio也提供了自由繪制和錨點(diǎn)控制兩種調(diào)整方式，對(duì)于錨點(diǎn)控制還增加了控制模式的選擇；每個(gè)控制面板可以加載顯示于背部的對(duì)比參數(shù)，方便進(jìn)行對(duì)比參考。

自動(dòng)音高，解放更多生產(chǎn)力

長(zhǎng)久以來(lái)，使用虛擬歌手創(chuàng)作歌曲的用戶都有一個(gè)痛點(diǎn)：只要不對(duì)虛擬歌手進(jìn)行調(diào)教，便沒(méi)有辦法輸出自然的歌聲。于是便誕生了【調(diào)�！窟@個(gè)“職業(yè)“，即有專人對(duì)虛擬歌手進(jìn)行發(fā)音及音符音高等參數(shù)的調(diào)整，這個(gè)過(guò)程通常不是一次便能完成的，通常需要多個(gè)人長(zhǎng)時(shí)間的磨合，才能得出一個(gè)尚可使用的結(jié)果，很明顯這個(gè)方式對(duì)于樂(lè)曲創(chuàng)作是非常不合適的，音樂(lè)人的靈感通常來(lái)的快也走的快，無(wú)法及時(shí)的得到演唱結(jié)果，可能會(huì)讓音樂(lè)人措施及時(shí)調(diào)整歌曲的靈感，對(duì)于創(chuàng)作時(shí)非常遺憾的事情。
Synthesizer V Studio的自動(dòng)音高模式便是為了解決這一痛點(diǎn)推出的功能。

使用自動(dòng)音高模式前

使用自動(dòng)音高模式后

這個(gè)功能雖然只有一個(gè)按鍵，但是作用卻非常強(qiáng)大。開(kāi)啟后，軟件將通過(guò)AI學(xué)習(xí)的模型，讓軟件以更貼近真人演唱的方式完成歌曲演唱呈現(xiàn)，無(wú)需人工干預(yù)就可以演唱出自然度較高的歌聲，相比于傳統(tǒng)的采樣歌手需要大批量的調(diào)校與修音，使用AI歌手演唱是十分省時(shí)的選擇，對(duì)于Demo試唱或是專為AI聲庫(kù)制作的歌曲，都可以節(jié)省時(shí)間、提高創(chuàng)作效率，能讓用戶投入更多的精力在音樂(lè)作品的產(chǎn)出上。

AI重錄，提供可控的自由

通過(guò)即時(shí)音高模式，Synthesizer V Studio還原了歌手唱歌的過(guò)程中咬字的隨機(jī)性，但是完全的隨機(jī)是十分不可控的情況，每次隨機(jī)如無(wú)法精準(zhǔn)的解決演唱的問(wèn)題，則可能在用戶問(wèn)題得不到解決的情況下為用戶增添麻煩。

AI重錄功能

為了給隨機(jī)的演唱可能性提供穩(wěn)定可選擇的路徑，Synthesizer V Studio向用戶提供了AI重錄功能。雖然依舊是隨機(jī)計(jì)算演唱，但AI重錄功能為用戶提供了反復(fù)對(duì)比音符不同隨機(jī)方式帶來(lái)的可能性。如果用戶對(duì)于首次生成的演唱結(jié)果不滿意，則可通過(guò)選中需要重錄的音符，使用AI重錄面板，將不滿意的音符進(jìn)行表現(xiàn)力調(diào)整后進(jìn)行再次計(jì)算，創(chuàng)建多個(gè)細(xì)致到音符的演唱重錄版本，最終在多個(gè)AI重錄模塊中選擇保留最滿意的部分即可。

音符屬性，每個(gè)音素都要精致

如果你是一個(gè)對(duì)發(fā)音十分挑剔的人，那么Synthesizer V Studio也提供了可手動(dòng)調(diào)節(jié)的入口。音符屬性面板對(duì)音符發(fā)音提供了細(xì)致到音素的調(diào)節(jié)的可能性，可以將音符發(fā)音中的每個(gè)音素單獨(dú)調(diào)整發(fā)音力度，長(zhǎng)度，讓演唱歌詞的節(jié)奏更準(zhǔn)確。得益于AI的加成，調(diào)整結(jié)果不僅可以以波形的方式可視化展現(xiàn)，也可以立即進(jìn)行回放試聽(tīng)。

音符及跨語(yǔ)種，混合歌詞不再困難

使用了DPM技術(shù)的聲音庫(kù)時(shí)，軟件可在輸入歌詞的時(shí)候支持音符級(jí)別的跨語(yǔ)種功能。

音符級(jí)跨語(yǔ)種

以往演唱混合語(yǔ)中的歌曲時(shí)，需要將歌詞按照語(yǔ)種分進(jìn)不同的軌道，并在軌道內(nèi)設(shè)置不同語(yǔ)種的歌手進(jìn)行合成，這種方式不僅效率低下，并且當(dāng)歌手不支持相應(yīng)語(yǔ)言的情況下，就不得不通過(guò)音素諧音的方式進(jìn)行跨語(yǔ)種調(diào)校，效率低下且效果不好。使用支持DPM技術(shù)的聲庫(kù)后，用戶不僅無(wú)需擔(dān)心歌手是否可以演唱相應(yīng)的語(yǔ)種（前提是軟件支持合成），更無(wú)需再將不同語(yǔ)種的音符分割為多個(gè)軌道分別調(diào)制，只需讓歌詞對(duì)應(yīng)上相應(yīng)的音符后選定，并在音符屬性面板中對(duì)選中的音符進(jìn)行演唱語(yǔ)言指定，即可無(wú)縫銜接多個(gè)語(yǔ)種。

節(jié)拍器與MIDI錄制，效率加倍

Synthesizer V Studio 1.8版本增加了對(duì)MIDI設(shè)備的支持，用戶可以用MIDI設(shè)備向軟件內(nèi)輸入音符，更貼近音樂(lè)人的音符輸入方式。

通過(guò)開(kāi)啟節(jié)拍器和軌道錄制功能，鍵盤(pán)上的音符即可被記錄在選中的軌道中。與普通的DAW軟件不同的是，軟件沒(méi)有，也不需要在軌道上打開(kāi)專用的錄制開(kāi)關(guān)，只需要在錄制前選中相應(yīng)的軌道，然后在控制器中打開(kāi)錄制開(kāi)關(guān)即可直接錄制。

AI聲音庫(kù)，來(lái)自數(shù)據(jù)空間的歌手

本次預(yù)備測(cè)評(píng)的其實(shí)是青溯和Kevin兩款聲音庫(kù)，但是在軟件1.8版本更新后，官方向購(gòu)買(mǎi)了Synthesizer V Studio Pro的用戶提供了免費(fèi)的虛擬歌手Mai，于是便一起做了測(cè)評(píng)。

華語(yǔ)女聲AI聲庫(kù)：青溯

青溯是專門(mén)為華語(yǔ)流行風(fēng)格開(kāi)發(fā)的女聲聲庫(kù)，從聲庫(kù)上手程度來(lái)看，青溯的無(wú)參能力十分強(qiáng)悍，使用不支持DPM的聲庫(kù)進(jìn)行測(cè)試后，青溯是對(duì)華語(yǔ)流行音樂(lè)風(fēng)格支持的最為完善，官方提供的Demo也印證了這點(diǎn)，青溯可能不夠適合演唱更加抒情的歌曲。（如：用青溯唱茉莉花的話，你可能聽(tīng)到一首十分流行的帶有部分類(lèi)似周杰倫風(fēng)味的茉莉花）。

青溯支持的聲線有：Airy、Chest、Power、Soft、Sweet 共五種，屬于溫柔抒情類(lèi)的聲庫(kù)。

得益于青溯華語(yǔ)流行的唱法，在使用英語(yǔ)跨語(yǔ)種的時(shí)候并沒(méi)有出現(xiàn)太過(guò)偏向中國(guó)人發(fā)音習(xí)慣的現(xiàn)象，Chinglish感覺(jué)并不嚴(yán)重，在曲風(fēng)的適應(yīng)方面，青溯同樣可以比較輕松的上手流行曲風(fēng)的歌曲，在目前的音樂(lè)創(chuàng)作中，是比較通用的聲音類(lèi)型了。

更新DPM聲庫(kù)后，青溯的咬字似乎變得更偏向普通國(guó)人的咬字方式了，雖然保留有流行歌手的咬字特征，但是演唱抒情歌曲時(shí)不再會(huì)過(guò)分的違和，或許今后可以開(kāi)發(fā)青溯更多的特殊用法也說(shuō)不定哦~

英語(yǔ)男聲AI聲庫(kù)：Kevin

Kevin是兼顧高音域和低音域歌曲的男性AI歌手，同時(shí)可以兼顧多種英文曲風(fēng)，無(wú)論是電子還是流行，Kevin都可以使用自然的歌聲進(jìn)行演唱。

Kevin支持的聲線有：Belt、Clear、Soft、Solid 共四種，屬于硬朗堅(jiān)實(shí)聲音風(fēng)格的聲庫(kù)。

在DPM聲庫(kù)未更新前，Kevin跨語(yǔ)種的演唱風(fēng)格類(lèi)似于中國(guó)的Rap歌手，有十分特別的味道，得益于略帶西方發(fā)音的歌手，不僅能夠順利的演唱中文的流行歌曲，也可以根據(jù)曲風(fēng)進(jìn)行相應(yīng)的擴(kuò)展，可以預(yù)料到的是，對(duì)發(fā)音咬字要求并不高的曲風(fēng)如：搖滾，電子等風(fēng)格，通過(guò)跨語(yǔ)種功能，Kevin均可駕馭。我很吃驚于這個(gè)版本的Kevin如此優(yōu)秀的跨語(yǔ)種性能，說(shuō)不定用來(lái)唱中文歌會(huì)有更多不同的感覺(jué)。

DPM聲庫(kù)更新后，Kevin的咬字也變得更加清晰了，不過(guò)跨語(yǔ)種咬字似乎比更新之前更像一個(gè)外國(guó)人。如果你希望用Kevin富有磁性的聲音演唱中文歌曲，可能停留在DPM聲庫(kù)更新之前是一個(gè)不錯(cuò)的選擇。

全新日文女聲AI聲庫(kù)-Mai

十分吃驚于Dreamtonics的大度，作為全新發(fā)布的虛擬歌手，Dreamtonics沒(méi)有選擇售賣(mài)，而選用了直接向購(gòu)買(mǎi)Synthesizer V Studio Pro的用戶贈(zèng)送的策略，所以，現(xiàn)在只需要全款購(gòu)買(mǎi)SV Studio Pro就可以直接用于創(chuàng)作了。（當(dāng)然，之前購(gòu)入的用戶可以直接根據(jù)官方的鏈接指示下載安裝使用，不需要激活哦~）

Mai是以日文為默認(rèn)語(yǔ)種的虛擬女性歌手。適合J-POP系列的歌曲，在聽(tīng)Demo的時(shí)候，以為Mai是比較純正的“日本偶像”，清亮的高音十分悅耳，由于Mai是日文聲音茶農(nóng)，一度讓我先入為主的認(rèn)為唱中文一定是軟肋。但在實(shí)際使用中，我發(fā)現(xiàn)Mai演唱中文時(shí)不僅不存在非常強(qiáng)烈的口音，而且吐字清晰，甚至部分發(fā)音比青溯要更加標(biāo)準(zhǔn)，是非常神奇的聲庫(kù)。

青溯默認(rèn)狀態(tài)下是元?dú)鉂M滿的可愛(ài)妹子，與售賣(mài)的聲庫(kù)不同的是，Mai僅僅自帶兩種可切換的聲線，分別是Soft（柔軟）和Emotional（富有感染力的），都是屬于更柔軟的音色。

如果你正好擁有Synthesizer V Studio Pro，推薦你下載Mai體驗(yàn)一下，不管是中文歌還是日文歌，Mai都一定會(huì)是你非常強(qiáng)力的助手。

軟件缺陷：

使用中，正式版雖然修復(fù)了很多的Bug，但是還是存在一些使用上的不便，如AI聲庫(kù)開(kāi)啟【自動(dòng)音高模式】演唱接近C6音高的音符時(shí)，會(huì)出現(xiàn)音高偏移，演唱音符力度很弱，氣聲很強(qiáng)的情況（如：用AI聲庫(kù)演唱《萬(wàn)象霜天》，則會(huì)發(fā)現(xiàn)最高音氣息減弱、音符走調(diào)的情況。）

總結(jié)：

高質(zhì)量的AI能夠解放更多的人類(lèi)的生產(chǎn)力用于其他的生產(chǎn)項(xiàng)目，用戶可以更注重樂(lè)曲本身的編寫(xiě)，調(diào)校師也不用再與發(fā)音的Bug和演唱風(fēng)格作戰(zhàn)，轉(zhuǎn)向更細(xì)致的調(diào)聲工作。雖然在測(cè)評(píng)過(guò)程中遇到軟件的部分問(wèn)題，但是瑕不掩瑜，Synthesizer V Studio和AI聲庫(kù)仍然是目前優(yōu)質(zhì)的歌聲合成產(chǎn)品，在繼續(xù)發(fā)展的道路中，希望Dreamtonics能通過(guò)AI技術(shù)，打磨出更多使用Synthesizer V AI不同風(fēng)格的聲音庫(kù)產(chǎn)品，也希望創(chuàng)作Synthesizer V 的的團(tuán)隊(duì)能在繼續(xù)發(fā)展的路途中不忘初心，讓更多重量級(jí)的虛擬歌手加入Synthesizer V的大家族。

Synthesizer V Studio 官網(wǎng)：https://dreamtonics.com/zh-CN/synthesizerv/

錄音棚設(shè)備解決方案售前咨詢：13366394396 src=http___upload.shejihz.com_2020_02_226fb192bb7c53ecea6825

【打印此頁(yè)】【返回首頁(yè)】