全新世代的 AI 虛擬歌手簡(jiǎn)評(píng)
隨著虛擬演藝技術(shù)及人工智能的,越來(lái)越多的、帶有AI技術(shù)的虛擬藝人、數(shù)字人、Vtuber主播等層出不窮,其中為這些新生概念奠基的歌聲合成技術(shù)也被一家名為Dreamtonics的公司推向了新的高度,借助強(qiáng)勁的AI能力,虛擬歌手也可以同真人歌手一般富有感情。
Dreamtonics和Synthesizer V Studio
Synthesizer V 是由 Dreamtonics 推出的歌聲合成軟件系列,最新的產(chǎn)品Synthesizer V Studio支持傳統(tǒng)的采樣型聲音庫(kù)和新型AI聲音庫(kù)。通過(guò) Synthesizer V AI 合成的歌聲,有如人類(lèi)歌手般自然流暢,細(xì)節(jié)飽滿,能夠在中文、英語(yǔ)、日語(yǔ)間隨意切換,采用多種聲線演唱各種風(fēng)格音樂(lè)。同時(shí),經(jīng)過(guò)優(yōu)化的神經(jīng)網(wǎng)絡(luò)無(wú)需復(fù)雜昂貴的硬件即可在大多數(shù)設(shè)備上流暢運(yùn)行。
盡管搭載了先進(jìn)的AI合成技術(shù),但是軟件的銷(xiāo)售價(jià)格依舊維持在同類(lèi)本地化歌聲合成類(lèi)產(chǎn)品平均水平的價(jià)格。那么讓我們來(lái)看一下,這個(gè)價(jià)格帶來(lái)的價(jià)格是否是物超所值吧~
體積更小,性能更好
傳統(tǒng)的計(jì)算機(jī)虛擬樂(lè)器軟件大多采用采樣器技術(shù),雖然音質(zhì)在使用采樣的情況下得以保證,但是由于需要使用無(wú)損采樣,部分采樣聲音庫(kù)為了追求高品質(zhì)的合成甚至可以達(dá)到100GB以上。
與傳統(tǒng)的采樣器軟件不同,Synthesizer V Studio所使用的AI聲音庫(kù)使用了優(yōu)化的神經(jīng)網(wǎng)絡(luò)引擎,整體聲音庫(kù)包體大幅縮小,每個(gè)包體的安裝大約在30MB左右,對(duì)于動(dòng)輒幾十上百GB的采樣樂(lè)器庫(kù)來(lái)說(shuō),Synthesizer V AI聲音庫(kù)在如此小的容量?jī)?nèi)解決了合成演唱的問(wèn)題,真是解放了眾多音樂(lè)人為數(shù)不多的硬盤(pán)空間(這省了多少硬盤(pán)錢(qián)。。。。
如果說(shuō)AI聲音庫(kù)的空間占用可稱為“短小“,那么AI聲音庫(kù)的合成效果更可謂是”精悍“。光說(shuō)不練假把式,先來(lái)聽(tīng)一段Demo!
有沒(méi)有被這個(gè)以假亂真的歌聲騙到???恰到好處的呼吸聲和精致的轉(zhuǎn)音與真人不相上下,什么?擔(dān)心這個(gè)聲音是為了做Demo特地做出來(lái)的?不不不,以上聲音為產(chǎn)品實(shí)機(jī)效果!Synthesizer V AI自1.8版本開(kāi)始支持了全新的高速化擴(kuò)散概率模型 (Diffusion Probabilistic Models,下稱DPM)得益于全新的技術(shù),軟件合成出的歌聲相比于之前的版本噪音更少,聲音更自然還原。
鋼琴卷簾,可視化的直觀操作
鋼琴卷簾作為用戶的“工作場(chǎng)所”,自然功能不會(huì)少,除了普通的編寫(xiě)音符與歌詞,Synthesizer V Studio的鋼琴卷簾還支持以下功能
- 聲音波形顯示:可以即時(shí)直觀的觀察到調(diào)節(jié)參數(shù)對(duì)波形的影響。
- 音高顯示及編輯功能: Synthesizer V Studio可以在鋼琴卷簾內(nèi)直接編輯音高曲線,也同時(shí)提供了手動(dòng)繪制與錨點(diǎn)調(diào)整兩種手段,不僅調(diào)節(jié)時(shí)能夠更加直觀的感受歌曲實(shí)時(shí)音高的變化,也對(duì)于在自由繪制條件下感到困難的用戶提供了更方便且易于控制的調(diào)整方式。
- 參數(shù)控制面板:這個(gè)區(qū)域可以通過(guò)包絡(luò)線調(diào)節(jié)歌聲的各種參數(shù),軟件最多可以打開(kāi)三個(gè)參數(shù)控制面板,三個(gè)面板均可以同時(shí)編輯,Synthesizer V Studio也提供了自由繪制和錨點(diǎn)控制兩種調(diào)整方式,對(duì)于錨點(diǎn)控制還增加了控制模式的選擇;每個(gè)控制面板可以加載顯示于背部的對(duì)比參數(shù),方便進(jìn)行對(duì)比參考。
自動(dòng)音高,解放更多生產(chǎn)力
長(zhǎng)久以來(lái),使用虛擬歌手創(chuàng)作歌曲的用戶都有一個(gè)痛點(diǎn):只要不對(duì)虛擬歌手進(jìn)行調(diào)教,便沒(méi)有辦法輸出自然的歌聲。 于是便誕生了【調(diào)!窟@個(gè)“職業(yè)“,即有專人對(duì)虛擬歌手進(jìn)行發(fā)音及音符音高等參數(shù)的調(diào)整,這個(gè)過(guò)程通常不是一次便能完成的,通常需要多個(gè)人長(zhǎng)時(shí)間的磨合,才能得出一個(gè)尚可使用的結(jié)果,很明顯這個(gè)方式對(duì)于樂(lè)曲創(chuàng)作是非常不合適的,音樂(lè)人的靈感通常來(lái)的快也走的快,無(wú)法及時(shí)的得到演唱結(jié)果,可能會(huì)讓音樂(lè)人措施及時(shí)調(diào)整歌曲的靈感,對(duì)于創(chuàng)作時(shí)非常遺憾的事情。
Synthesizer V Studio的自動(dòng)音高模式便是為了解決這一痛點(diǎn)推出的功能。
這個(gè)功能雖然只有一個(gè)按鍵,但是作用卻非常強(qiáng)大。開(kāi)啟后,軟件將通過(guò)AI學(xué)習(xí)的模型,讓軟件以更貼近真人演唱的方式完成歌曲演唱呈現(xiàn),無(wú)需人工干預(yù)就可以演唱出自然度較高的歌聲,相比于傳統(tǒng)的采樣歌手需要大批量的調(diào)校與修音,使用AI歌手演唱是十分省時(shí)的選擇,對(duì)于Demo試唱或是專為AI聲庫(kù)制作的歌曲,都可以節(jié)省時(shí)間、提高創(chuàng)作效率,能讓用戶投入更多的精力在音樂(lè)作品的產(chǎn)出上。
AI重錄,提供可控的自由
通過(guò)即時(shí)音高模式,Synthesizer V Studio還原了歌手唱歌的過(guò)程中咬字的隨機(jī)性,但是完全的隨機(jī)是十分不可控的情況,每次隨機(jī)如無(wú)法精準(zhǔn)的解決演唱的問(wèn)題,則可能在用戶問(wèn)題得不到解決的情況下為用戶增添麻煩。
AI重錄功能
為了給隨機(jī)的演唱可能性提供穩(wěn)定可選擇的路徑,Synthesizer V Studio向用戶提供了AI重錄功能。雖然依舊是隨機(jī)計(jì)算演唱,但AI重錄功能為用戶提供了反復(fù)對(duì)比音符不同隨機(jī)方式帶來(lái)的可能性。如果用戶對(duì)于首次生成的演唱結(jié)果不滿意,則可通過(guò)選中需要重錄的音符,使用AI重錄面板,將不滿意的音符進(jìn)行表現(xiàn)力調(diào)整后進(jìn)行再次計(jì)算,創(chuàng)建多個(gè)細(xì)致到音符的演唱重錄版本,最終在多個(gè)AI重錄模塊中選擇保留最滿意的部分即可。
音符屬性,每個(gè)音素都要精致
如果你是一個(gè)對(duì)發(fā)音十分挑剔的人,那么Synthesizer V Studio也提供了可手動(dòng)調(diào)節(jié)的入口。音符屬性面板對(duì)音符發(fā)音提供了細(xì)致到音素的調(diào)節(jié)的可能性,可以將音符發(fā)音中的每個(gè)音素單獨(dú)調(diào)整發(fā)音力度,長(zhǎng)度,讓演唱歌詞的節(jié)奏更準(zhǔn)確。得益于AI的加成,調(diào)整結(jié)果不僅可以以波形的方式可視化展現(xiàn),也可以立即進(jìn)行回放試聽(tīng)。
音符及跨語(yǔ)種,混合歌詞不再困難
使用了DPM技術(shù)的聲音庫(kù)時(shí),軟件可在輸入歌詞的時(shí)候支持音符級(jí)別的跨語(yǔ)種功能。
音符級(jí)跨語(yǔ)種
以往演唱混合語(yǔ)中的歌曲時(shí),需要將歌詞按照語(yǔ)種分進(jìn)不同的軌道,并在軌道內(nèi)設(shè)置不同語(yǔ)種的歌手進(jìn)行合成,這種方式不僅效率低下,并且當(dāng)歌手不支持相應(yīng)語(yǔ)言的情況下,就不得不通過(guò)音素諧音的方式進(jìn)行跨語(yǔ)種調(diào)校,效率低下且效果不好。使用支持DPM技術(shù)的聲庫(kù)后,用戶不僅無(wú)需擔(dān)心歌手是否可以演唱相應(yīng)的語(yǔ)種(前提是軟件支持合成),更無(wú)需再將不同語(yǔ)種的音符分割為多個(gè)軌道分別調(diào)制,只需讓歌詞對(duì)應(yīng)上相應(yīng)的音符后選定,并在 音符屬性 面板中對(duì)選中的音符進(jìn)行演唱語(yǔ)言指定,即可無(wú)縫銜接多個(gè)語(yǔ)種。
節(jié)拍器與MIDI錄制,效率加倍
Synthesizer V Studio 1.8版本增加了對(duì)MIDI設(shè)備的支持,用戶可以用MIDI設(shè)備向軟件內(nèi)輸入音符,更貼近音樂(lè)人的音符輸入方式。
通過(guò)開(kāi)啟節(jié)拍器和軌道錄制功能,鍵盤(pán)上的音符即可被記錄在選中的軌道中。與普通的DAW軟件不同的是,軟件沒(méi)有,也不需要在軌道上打開(kāi)專用的錄制開(kāi)關(guān),只需要在錄制前選中相應(yīng)的軌道,然后在控制器中打開(kāi)錄制開(kāi)關(guān)即可直接錄制。
AI聲音庫(kù),來(lái)自數(shù)據(jù)空間的歌手
本次預(yù)備測(cè)評(píng)的其實(shí)是青溯和Kevin兩款聲音庫(kù),但是在軟件1.8版本更新后,官方向購(gòu)買(mǎi)了Synthesizer V Studio Pro的用戶提供了免費(fèi)的虛擬歌手Mai,于是便一起做了測(cè)評(píng)。
華語(yǔ)女聲AI聲庫(kù):青溯
青溯是專門(mén)為華語(yǔ)流行風(fēng)格開(kāi)發(fā)的女聲聲庫(kù),從聲庫(kù)上手程度來(lái)看,青溯的無(wú)參能力十分強(qiáng)悍,使用不支持DPM的聲庫(kù)進(jìn)行測(cè)試后,青溯是對(duì)華語(yǔ)流行音樂(lè)風(fēng)格支持的最為完善,官方提供的Demo也印證了這點(diǎn),青溯可能不夠適合演唱更加抒情的歌曲。(如:用青溯唱茉莉花的話,你可能聽(tīng)到一首十分流行的帶有部分類(lèi)似周杰倫風(fēng)味的茉莉花)。
青溯支持的聲線有:Airy、Chest、Power、Soft、Sweet 共五種,屬于溫柔抒情類(lèi)的聲庫(kù)。
得益于青溯華語(yǔ)流行的唱法,在使用英語(yǔ)跨語(yǔ)種的時(shí)候并沒(méi)有出現(xiàn)太過(guò)偏向中國(guó)人發(fā)音習(xí)慣的現(xiàn)象,Chinglish感覺(jué)并不嚴(yán)重,在曲風(fēng)的適應(yīng)方面,青溯同樣可以比較輕松的上手流行曲風(fēng)的歌曲,在目前的音樂(lè)創(chuàng)作中,是比較通用的聲音類(lèi)型了。
更新DPM聲庫(kù)后,青溯的咬字似乎變得更偏向普通國(guó)人的咬字方式了,雖然保留有流行歌手的咬字特征,但是演唱抒情歌曲時(shí)不再會(huì)過(guò)分的違和,或許今后可以開(kāi)發(fā)青溯更多的特殊用法也說(shuō)不定哦~
英語(yǔ)男聲AI聲庫(kù):Kevin
Kevin是兼顧高音域和低音域歌曲的男性AI歌手,同時(shí)可以兼顧多種英文曲風(fēng),無(wú)論是電子還是流行,Kevin都可以使用自然的歌聲進(jìn)行演唱。
Kevin支持的聲線有:Belt、Clear、Soft、Solid 共四種,屬于硬朗堅(jiān)實(shí)聲音風(fēng)格的聲庫(kù)。
在DPM聲庫(kù)未更新前,Kevin跨語(yǔ)種的演唱風(fēng)格類(lèi)似于中國(guó)的Rap歌手,有十分特別的味道,得益于略帶西方發(fā)音的歌手,不僅能夠順利的演唱中文的流行歌曲,也可以根據(jù)曲風(fēng)進(jìn)行相應(yīng)的擴(kuò)展,可以預(yù)料到的是,對(duì)發(fā)音咬字要求并不高的曲風(fēng)如:搖滾,電子等風(fēng)格,通過(guò)跨語(yǔ)種功能,Kevin均可駕馭。我很吃驚于這個(gè)版本的Kevin如此優(yōu)秀的跨語(yǔ)種性能,說(shuō)不定用來(lái)唱中文歌會(huì)有更多不同的感覺(jué)。
DPM聲庫(kù)更新后,Kevin的咬字也變得更加清晰了,不過(guò)跨語(yǔ)種咬字似乎比更新之前更像一個(gè)外國(guó)人。如果你希望用Kevin富有磁性的聲音演唱中文歌曲,可能停留在DPM聲庫(kù)更新之前是一個(gè)不錯(cuò)的選擇。
全新日文女聲AI聲庫(kù)-Mai
十分吃驚于Dreamtonics的大度,作為全新發(fā)布的虛擬歌手,Dreamtonics沒(méi)有選擇售賣(mài),而選用了直接向購(gòu)買(mǎi)Synthesizer V Studio Pro的用戶贈(zèng)送的策略,所以,現(xiàn)在只需要全款購(gòu)買(mǎi)SV Studio Pro就可以直接用于創(chuàng)作了。(當(dāng)然,之前購(gòu)入的用戶可以直接根據(jù)官方的鏈接指示下載安裝使用,不需要激活哦~)
Mai是以日文為默認(rèn)語(yǔ)種的虛擬女性歌手。適合J-POP系列的歌曲,在聽(tīng)Demo的時(shí)候,以為Mai是比較純正的“日本偶像”,清亮的高音十分悅耳,由于Mai是日文聲音茶農(nóng),一度讓我先入為主的認(rèn)為唱中文一定是軟肋。但在實(shí)際使用中,我發(fā)現(xiàn)Mai演唱中文時(shí)不僅不存在非常強(qiáng)烈的口音,而且吐字清晰,甚至部分發(fā)音比青溯要更加標(biāo)準(zhǔn),是非常神奇的聲庫(kù)。
青溯默認(rèn)狀態(tài)下是元?dú)鉂M滿的可愛(ài)妹子,與售賣(mài)的聲庫(kù)不同的是,Mai僅僅自帶兩種可切換的聲線,分別是Soft(柔軟)和Emotional(富有感染力的),都是屬于更柔軟的音色。
如果你正好擁有Synthesizer V Studio Pro,推薦你下載Mai體驗(yàn)一下,不管是中文歌還是日文歌,Mai都一定會(huì)是你非常強(qiáng)力的助手。
軟件缺陷:
使用中,正式版雖然修復(fù)了很多的Bug,但是還是存在一些使用上的不便,如AI聲庫(kù)開(kāi)啟【自動(dòng)音高模式】演唱接近C6音高的音符時(shí),會(huì)出現(xiàn)音高偏移,演唱音符力度很弱,氣聲很強(qiáng)的情況(如:用AI聲庫(kù)演唱《萬(wàn)象霜天》,則會(huì)發(fā)現(xiàn)最高音氣息減弱、音符走調(diào)的情況。)
總結(jié):
高質(zhì)量的AI能夠解放更多的人類(lèi)的生產(chǎn)力用于其他的生產(chǎn)項(xiàng)目,用戶可以更注重樂(lè)曲本身的編寫(xiě),調(diào)校師也不用再與發(fā)音的Bug和演唱風(fēng)格作戰(zhàn),轉(zhuǎn)向更細(xì)致的調(diào)聲工作。雖然在測(cè)評(píng)過(guò)程中遇到軟件的部分問(wèn)題,但是瑕不掩瑜,Synthesizer V Studio和AI聲庫(kù)仍然是目前優(yōu)質(zhì)的歌聲合成產(chǎn)品,在繼續(xù)發(fā)展的道路中,希望Dreamtonics能通過(guò)AI技術(shù),打磨出更多使用Synthesizer V AI不同風(fēng)格的聲音庫(kù)產(chǎn)品,也希望創(chuàng)作Synthesizer V 的的團(tuán)隊(duì)能在繼續(xù)發(fā)展的路途中不忘初心,讓更多重量級(jí)的虛擬歌手加入Synthesizer V的大家族。
Synthesizer V Studio 官網(wǎng):https://dreamtonics.com/zh-CN/synthesizerv/
錄音棚設(shè)備解決方案 售前咨詢:13366394396
【打印此頁(yè)】【返回首頁(yè)】 |