Voicebox是一款基于Meta AI提出的Flow Matching方法的全新生成语音系统,可以跨越六种语言生成语音、去除噪音、编辑内容、转换音频风格等多项功能。这一技术突破为语音合成领域带来了新的可能性。

主要特点和功能:

  • 跨越六种语言生成语音;
  • 去除噪音;
  • 编辑内容;
  • 转换音频风格;
  • 支持大规模语音生成。

访问链接: https://research.facebook.com/publications/voicebox-text-guided-multilingual-universal-speech-generation-at-scale/