En |
Jobs
All Jobs Recommended Job Accounting and auditing Administration and Human Resources Banking / Finance Information Technology Sales / Customer Service / Business Development Frontline Job Professional and Innovative Jobs 專業及創新職位
Employers
All Employers Premium Employer
InsightsLocationsProductsKnowledge Clients About UsContact Us For Individual
Re-invent Your Career of the Future
【創科新思維】NVIDIA 最新 AI Fugatto 可以從文字提示中創建音訊
根據文本提示生成或修改音訊,包括音、語音和各種聲音檔案
職場趣聞 / 貼士 自我增值 職場科技 人才市場見解

晶片製造商 NVIDIA 最近推出了一種名為 Foundational Generative Audio Transformer Opus 1 或 Fugatto 的實驗性生成式 AI 模型,宣稱其為「聲音的瑞士軍刀」。這一模型能夠根據文本提示生成或修改音訊,包括音樂、語音和各種聲音檔案。由全球的 AI研究團隊設計,Fugatto 強調了其工作是多口音和多語言的功能。

研究人員之一、NVIDIA 應用音訊研究經理 Rafael Valle 表示,希望創建一個能夠像人類一樣理解和生成聲音的模型。該公司列舉了一些 Fugatto 的潛在應用場景,音樂製作人可以利用這項技術快速生成歌曲創意的工作原型,並根據不同的風格、聲音和樂器進行編輯。

此外,Fugatto 還可用於生成語言學習工具的材料,幫助學習者練習選擇的聲音。視頻遊戲開發者則可以使用它創建預錄音資產的變體,以適應玩家的選擇和操作。研究顯示,該模型可以通過微調來完成預訓練任務以外的工作,甚至能生成特定情境下的聲音,如帶有特定口音的憤怒語音,或在雷雨中鳥兒唱歌的聲音。Fugatto 還能生成隨時間變化的聲音效果,例如暴雨移動時的衝擊聲。

雖然 NVIDIA 尚未透露是否會向公眾開放 Fugatto 的訪問權限,但這一模型並不是唯一能從文本提示生成聲音的 AI 技術。Meta 先前推出了開源 AI 工具包,而谷歌則擁有名為 MusicLM 的文本轉音樂 AI,並在其 AI Test Kitchen 平台上提供訪問。這些技術的發展表明,生成式 AI 在音頻創作和修改領域的潛力正在不斷擴大。

 文字:編輯部

~~

HKGoodJobs 正在提供全備的招聘服務(包括獵頭服務),

若你是求職者,

請按 Register 登記成為會員並填妥你的個人履歷,

我們將有專人為你配對工作。

若你是僱主

請致電 31884978、WhatsApp 63550329 或電郵至 cs@cooljobz.com 與我們聯絡。

 

熱門文章:

【管理哲學】利用 AI 人力資源管理(HRM)系統 協助飲食業及零售業工作排班的變革

【搵工技巧】求職者利用社交媒體搵工的6個好處

【創科新思維】META Messenger加入 AI 背景功能 選擇添加人工智能生成的背景資

-

CoolJobzHRM 人才資源管理軟件

根據文本提示生成或修改音訊,包括音、語音和各種聲音檔案
Locations
Hong Kong
Published/Last Modified
2024/12/08