Real-time neural text-to-speech with sequence-to-sequence acoustic model and WaveGlow or single Gaussian WaveRNN vocoders Spatial Fourier transform-based localized sound zone generation with loudspeaker array [チュートリアル講演] 音声波形直接生成モデル「ニューラルボコーダ」の比較 [招待講演] スピーカアレイを用いた空間フーリエ変換に基づく局所再生 基本周波数とメルケプストラムを用いたリアルタイムニューラルボコーダに関する検討