顔から声を予測する深層学習に基づく音声合成
橋本 佳 (准教授)
研究室ウェブサイトはこちら
研究シーズのスライドを見る
スライドのPDFを開く
顔画像からその人の声の特徴を予測し、その人の声の音声を合成することができる音声合成技術を紹介します。顔画像データと音声データを用い、顔と声の関係を深層学習によってモデル化します。