顔から声を予測する深層学習に基づく音声合成(橋本佳)

研究シーズ紹介

情報工学

橋本佳 (准教授) 研究室ウェブサイトはこちら

研究シーズのスライドを見る スライドのPDFを開く

顔画像からその人の声の特徴を予測し、その人の声の音声を合成することができる音声合成技術を紹介します。顔画像データと音声データを用い、顔と声の関係を深層学習によってモデル化します。

提供の際は諸手続が必要となるため、「科学技術相談」よりお問い合わせください。

研究者の専門知識を生かした指導・助言(コンサルティング)を受けたい方

研究者の技術シーズを活用して自社と共同で研究開発したい方

顔画像からその人の声の特徴を予測し、その人の声の音声を合成することができる音声合成技術を紹介します。顔画像データと音声データを用い、顔と声の関係を深層...