昆侖萬維把「AI歌手」推向新高度
在AI音樂領(lǐng)域,中文歌曲的生成一直是個難題。盡管AI技術(shù)在音樂創(chuàng)作上取得了巨大進(jìn)步,但真正能唱出中文歌曲獨特韻味的AI卻寥寥無幾。本文將帶你體驗Mureka V7.5的強(qiáng)大功能,從簡單模式到高級模式,再到音頻編輯,看看它如何讓中文歌曲的創(chuàng)作變得更加簡單和有趣,甚至可能開啟中文音樂創(chuàng)作的新篇章。
這兩年,AI音樂變化有點像坐過山車。
從最早SVC翻唱,到能生成旋律、編曲的大模型,再到Suno這樣的現(xiàn)象級應(yīng)用,讓很多人第一次覺得「原來我也能寫」”。
但在中文歌曲領(lǐng)域,能真正唱出我們耳朵里那種味道的AI,還屈指可數(shù)。
所以,當(dāng)我聽到昆侖萬維上線了一款專門為中文優(yōu)化的AI音樂模型:Mureka V7.5時,第一反應(yīng)是:值得試一試。
畢竟,它不僅號稱在細(xì)節(jié)上,能和國際頂尖模型掰一掰手腕,還專門調(diào)教過咬字、情緒、音色,讓中文歌詞聽起來更自然、更有情感。
抱著好奇,第一時間打開了它。結(jié)果,生成后第一首歌就讓我愣住了,情緒起伏、咬字的細(xì)膩感,是我在AI歌曲里很少聽到的。
話不多說,先聽歌:
感覺怎么樣?進(jìn)入首頁,操作頁面非常簡潔,「創(chuàng)作音樂」區(qū)域有三個模塊:簡單模式、高級模式、音頻編輯。
我先選擇簡單模式。讓AI幫我想了個提示詞:
寫一首流行搖滾風(fēng)的中文歌曲,歌名叫《諾基亞的夏天》。講述一個少年時代的愛情故事,從短信、慢歌、校服,到畢業(yè)分離;主歌溫暖懷舊,副歌情緒瞬間拉高,像是壓抑多年后的情感宣泄。
沒想到,它沒有機(jī)械地照搬,幫我優(yōu)化了提示詞,還補(bǔ)充了創(chuàng)意說明和音樂細(xì)節(jié)。我只要點「下一步」,剩下就是傻瓜式等待。
不到一分鐘,成了。上面你聽到的。高潮部分「那個夏天」幾個字沖上來的瞬間,情緒被點燃,感覺耳蝸把我?guī)У搅诵@場景。
情緒還沒散,我直接切到高級模式,想整一首更有空間感的歌,參考歌曲、歌手、歌詞描述、甚至哼唱旋律,都能自己調(diào)。
選了個Pop風(fēng)的嗓音,起了歌曲名叫《重力之外》,自己寫版歌詞,不過,好像不夠味兒,干脆交給一鍵生成。
前奏一出來,厚實的合成器鋪底,像一層霧撥開,主歌里樂器的留白也很克制,讓我忍不住想去聽完后面有沒有什么驚喜瞬間。
第三輪,我想換個口味,看看Mureka在柔和情緒里能玩到什么程度,就選了 R&B。
給它的提示是:
夜晚的城市,潮濕的路面,路燈在雨幕里暈成一圈一圈的光。
節(jié)奏要松弛點,旋律要帶著慵懶的呼吸。
前奏一響,低沉的貝斯,像雨點敲車窗;
主歌里,嗓音帶著沙啞,好像隔著雨霧,在說一段很久以前的故事;
副歌、和聲慢慢疊上來,情緒也不急不躁,讓人忍不住一遍遍循環(huán)。
玩到這一步,有點上癮。我翻了下它的曲庫,發(fā)現(xiàn)選項夸張到離譜;曲風(fēng)有23種,從古典、世界音樂、朋克、金屬,到藍(lán)調(diào)、民謠一應(yīng)俱全。還能疊加情緒,比如歡快、浪漫、活力”等等。
這次我選了「世界音樂」,因為這種風(fēng)格常有民族打擊樂、空靈和聲,以及像風(fēng)一樣的流動感。
我給它取了個名字:《風(fēng)從遠(yuǎn)方來》。
一生成,第一秒的鼓聲就一拍一拍砸進(jìn)耳朵里,心跳一下被放大了,催著你往前走;背景里的空靈和聲在游走,像遠(yuǎn)處有人在呼喊。旋律不拐彎,很快把我?guī)нM(jìn)狀態(tài)。
到這,我在想,能不能再來點「進(jìn)階玩法」?因為不可能所有音樂一次性做出來都非常滿意。
然后發(fā)現(xiàn),音頻編輯能力也很好玩。這里有四個方面:
局部編輯,能針對某一段歌詞重新生成旋律和演唱,不用推倒重來。比如:一首歌里有一句情緒不到位,可以單獨修改,讓整首歌的情緒一致。
延長,就是給有歌曲加長,比如副歌太短,直接無縫接一個延長段落,保持同樣的風(fēng)格和氛圍。樂器分軌,可以把任何一首歌拆成鼓、貝斯、吉他、伴奏等單獨軌道,這個功能玩混音、做翻唱的人會愛死。
剪裁就不說了,覺得哪里不滿意,直接減掉即可。
像我這樣純好奇去玩的人,也能感受到它的細(xì)節(jié)做得很到位,編輯響應(yīng)快、銜接流暢,沒有那種“AI 硬拼接”的違和感。
不過,寫再多都不如你真實感受下,再放幾首我做的,能進(jìn)到你的耳蝸里嗎:
這些歌,我只是隨手玩出來的,如果它們能讓你哪怕有一秒跟著哼,就算值了;玩到這里,用 Mureka V7.5,三個模式我算是都跑了一遍。
不管是咬字,情緒還是旋律推進(jìn),都蠻自然的,不像過去很多 AI 歌曲,聽著像卡在喉嚨里。
所以,你有沒有想過一個問題:為什么過去 AI 中文歌總是不好聽?
很多人以為 AI 中文歌難聽,因為模型不夠強(qiáng)大、算力不夠。但真正原因是,大多數(shù)模型的「耳朵」是用英文音樂訓(xùn)練出來的。
換句話說,它們理解的是西方旋律結(jié)構(gòu)、英文的音節(jié)節(jié)奏,而不是漢語的聲調(diào)、語感和文化氛圍。
漢語音高變化本身就帶有旋律,一個字的平、上、去、入,會影響一句話的旋律走向,這對 AI 來說,像學(xué)一門完全不同的樂器。
我第一次在老款 AI 歌曲里聽到「愛你」兩個字時,差點沒認(rèn)出來。模型把「愛」唱得像英文的 「I」,而「你」則完全丟了尾音的起伏,瞬間情緒斷層。
詞和曲的脫節(jié),更是常見問題。
過去AI 歌曲生成,更像先做旋律,再硬塞歌詞。尤其中文,字與字之間沒有空格,歌詞按意群和韻腳排布,但 AI 并不懂這種分句習(xí)慣。
于是,我們就會聽到:
有些句子尾音被拉得很怪,只是為了湊節(jié)拍;有些情感詞(比如想你、再見)落在了旋律的弱拍上,唱出來沒力度。
英文歌里,這些問題不明顯,因為英語的重音規(guī)律和四四拍天然契合。但中文歌,哪怕一個詞落錯拍,整句都不對味。
還有情緒。早期的 AI 歌曲,大多靠音量、速度去模擬情緒,快一點顯得興奮,慢一點就是悲傷。但人類的情緒變化不是調(diào)節(jié)按鈕,而是從氣息、咬字、甚至停頓里自然長出來的。
這些細(xì)節(jié),過去AI 很難兼顧,它們聽得懂音符,卻聽不懂中文歌的“呼吸”,也感受不到歌詞背后的文化情緒,于是,就有了聽起來像在唱中文,卻沒有唱出中文的味道。
那Mureka V7.5 又是怎么跨過這些門檻的呢?
后來我忍不住去翻了背后的技術(shù)細(xì)節(jié)。才發(fā)現(xiàn),Mureka V7.5 這次能唱出「中文耳朵的味道」,并不單靠算力或者隨便加點訓(xùn)練量,是把整個模型的「耳朵和大腦」都換了。
它用大量優(yōu)質(zhì)的中文歌曲去重新調(diào)教,讓 AI 真正學(xué)會漢語的聲調(diào)、韻律和情緒落點。
不再像過去那樣用英文旋律去套中文歌詞,那種平、上、去、入的微妙變化,它都能識別出來并融進(jìn)旋律里,甚至?xí)鶕?jù)歌詞里的意境去調(diào)整音高和節(jié)奏。
就像訓(xùn)練一個外國歌手唱京劇,不僅要教他吐字,還要讓他懂得那個“味兒”。
V7.5還學(xué)會了聽歌詞,是先理解歌詞的意群和情感,再去規(guī)劃旋律的走向。
比如一個:想你,它會刻意把“想”落在情緒高點,讓那種牽掛的張力自然出來,這種理解力,靠它在底層用 ASR(語音識別)技術(shù)做了優(yōu)化,讓模型能精準(zhǔn)對齊字與音的關(guān)系。
換句話說,它一邊唱歌一邊看著歌詞,每個字該重、該輕都心里有數(shù)。
還有一點很關(guān)鍵,它用了一套叫 MusiCoT 的架構(gòu)去生成音樂,你可以把它理解成,AI是先學(xué)人類的創(chuàng)作邏輯,先構(gòu)思情緒走向、段落結(jié)構(gòu),再細(xì)化到旋律和配器。
這樣做的結(jié)果,是它的歌聽起來更像一個有想法的創(chuàng)作者寫出來的。
有一個對比數(shù)據(jù):
Mureka V7.5的「音樂性」評分比同類高了 34.8%,歌詞與旋律的契合度高了 45.2%。這些數(shù)字背后,其實就是你耳朵里那種“順”的感覺。
圖釋: 在中文音樂生成評測中,Mureka V7.5 的歌曲質(zhì)量和提示跟隨表現(xiàn)均領(lǐng)先其他模型。
如果只談技術(shù)升級,也還是工具的進(jìn)步。我在意它把中文歌的創(chuàng)作門檻降下來了,讓不會譜曲的人、寫歌詞有障礙的人,都能用母語做出一首有記憶、有情緒的歌。
這相當(dāng)于一次文化上的守護(hù)。
畢竟在全球 AI 音樂潮流里,小語種音樂往往被忽視,而 Mureka V7.5 相當(dāng)于在告訴我們中文歌的美感和文化,不必被犧牲在技術(shù)的統(tǒng)一標(biāo)準(zhǔn)下。
甚至我會想,未來孩子們的第一首原創(chuàng)歌,可能不再是五線譜上的笨拙哼唱,是他們用自己的話、自己的情緒,讓 AI 幫他們唱出來的。
從更長遠(yuǎn)角度看,這可能也和昆侖萬維的多模態(tài)布局、開源戰(zhàn)略價值觀連在一起的。
它試圖在搭一套讓更多人用中文去表達(dá)、去創(chuàng)造的底層能力,這樣的投入,是那種你放在十年后回看,會覺得「好在那時候有人做了這件事」的事情。
或許未來某一天,我們會發(fā)現(xiàn),陪伴一代人成長的旋律,不一定誕生在錄音棚里,也可以誕生在每一個有故事、有情緒的人手中。
那時,我們回頭看今天,可能會說,原來中文歌的新篇章,就是從這里翻開的。
文:王智遠(yuǎn)
本文由人人都是產(chǎn)品經(jīng)理作者【王智遠(yuǎn)】,微信公眾號:【王智遠(yuǎn)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
AI創(chuàng)作中文歌曲是AI發(fā)展的一大進(jìn)步,但是AI歌手還是有很多不足。