Meta專注於改進增強現實(AR)和虛擬現實(VR)。它是 主要願景 的 元節.近日,該公司啟用了 Facebook頭像商店 及 化身反應.今天,Meta 介紹了聲學合成。
Meta 的聲學合成是一種空間音頻工具,可以響應不同的視覺環境。 Meta 認為聲學在聲音體驗中發揮著重要作用。通過構建三個聲學模型,他們可以提供逼真的音質。這些模型是:
- 視聲匹配
- 視覺信息去混響
- 視覺語音
視聲匹配
也稱為 AViTAR,視聲匹配調整音頻以匹配目標圖像的空間。它的目標是轉換音頻空間以匹配指定的視覺圖像。例如,如果視頻是站在一個大的洞穴空間中,聲音應該伴隨著一些迴聲。 Meta 的 AI 聽起來就像 AR 環境顯示的那樣。
視覺信息去混響
Visually-Informed Dereverberation 是消除聲音中混響效果的過程。聲學合成與人們在 AR 眼鏡和其他未來設備中看到的全息圖像的音頻相匹配。它還消除了不需要的背景噪音,使它們聽起來對 AR 用戶更具吸引力。
視覺語音
VisualVoice 是一種多模式工作的聲學合成器。使用聽覺和視覺提示,人工智能可以實現語音分離。例如,如果您參加虛擬小組會議,則混響將隨著聲音在虛擬空間內移動而調整。
Meta 引入聲學合成 2022 年 6 月 24 日.
對營銷人員的影響:
Meta 的聲學合成是音頻技術的重大進步。營銷人員可以通過使用更真實和逼真的聲音來增強他們的音頻和視頻廣告和活動,從而從這種空間音頻工具中受益。
#Pinterest 商業模式
資料來源:: https://about.fb.com/news/2022/06/ai-models-that-understand-how-the-world-around-us-sounds/