- コンピュータビジョン
- 信号処理
【論文紹介】Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation
【論文紹介】Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation
社内で論文「Looking to listen at the cocktail party a speaker-independent audio-visual model for speech separation」の紹介をしました。資料を掲載します。
論文ではは音声と画像を利用して複数人の音声+ノイズから目的とする音声を抜き出す手法について提案されています。
(googleの発表資料)
https://ai.googleblog.com/2018/04/looking-to-listen-audio-visual-speech.html