輝達生成式AI新模型 可用文字提示創作音樂

輝達(NVIDIA)美國時間25日發表全新人工智慧(AI)研究成果Fugatto,只要使用文字就能控制音訊輸出,並可以將任何文字提示轉換為音訊,也能根據文字提示創作音樂片段、從現有歌曲中增減樂器、改變聲音口音或情感。

輝達發布新聞稿說明,Fugatto是FoundationalGenerativeAudioTransformerOpus1的縮寫,可使用文字與音訊檔案的任何組合,產生或轉換描述的音樂、語音與聲音。

輝達應用音訊研究部門經理巴耶(RafaelValle)表示,「我們希望創造一個能夠像人類一樣理解和生成聲音的模型」,Fugatto是邁向未來的第一步。

輝達指出,音樂製作人可以使用Fugatto快速製作聲音的原型或編輯歌曲構想,嘗試各種風格、聲音和樂器,也能加入效果並提升現有曲目整體音訊品質。

此外,輝達表示,廣告公司可以運用Fugatto,針對現有廣告內容的配音,套用不同口音和情感。語言學習工具可以變得個人化,例如線上課程能使用家人或朋友的聲音講授。
Google新聞-PChome Online新聞


最新財經新聞
人氣財經新聞
行動版 電腦版