Meta揭曉可快速產生清晰、自然,並且能在後續編輯、調整的語音內容生成模型考量可能會被濫用,因此未公布模型原始碼內容

首圖

Meta稍早公布名為Voicebox的語音生成模型,將可透過Flow Matching演演算法,從大量原始音訊與轉錄文字進行學習,進而生成自然生動的語音內容。 同時,Voicebox並未限制僅能用於特定領域的語音內容,透過足夠音訊與文字內容即可產生去除噪音、清晰語音,同時還能進行內容編輯、風格轉換,或是輸出不同聲音特色語音內容。 而藉由Flow Matchi......