[研究論文発表会]
ボイスチェンジャーサービスの研究開発を通した
インターンによる次世代人材育成
白井暁彦*, 中野友介, 堀部貴紀
*GREE VR Studio Laboratory Director,
デジタルハリウッド大学院 客員教授
はじめに: インターンシップの重要性と実施形態
リクルートワークス研究所が米国の人材採用コンサルティング会社、CareerXroads 社の協力を得て実施した調査『2015
Internships USA』では、回答企業のうち、39.0%がインターンシップを単独で実施、51.2%がインターンシップと Co-op
プログラム双方を実施していると回答しており、両者を合わせると、調査対象企業の 90%超がインターンシップを実施し
ていることになる。これは、リクルートキャリア就職みらい研究所が発表した『就職白書 2015 ~インターンシップ編
~』の、2015 年にインターンシップを予定している日本国内の企業の割合(58.3%)を大きく上回る。
[1 ] リクルートワークス研究所 : "海外におけるインターンシップ最新事情"
https://www.works-i.com/research/others/item/160322_Internship_jp.pdf (Accessed 2021-07-31).
はじめに: コロナ禍のインターンシップを通した実践研究
【日本企業のインターン実施における課題】現状、日本で行われる多くのインターンシップは数日〜2週
間程度の短期プログラムであり、企業の活動紹介とハッカソンなどのグループワークにとどまるケースは
少なくない。2019年以降のコロナ禍において、物理的に参集する場を作ることは難しくなった。
【学生視点での課題】(学生側の視点では)志望する企業による採用審査という向きもあり、純粋な成長
の場とは考えづらい。より高度なプロフェッショナルの育成という視点でも、大学院を含めた高等教育で
の研究教育活動や、その研究成果の社会実装と関連がある企業活動に学生がどう関われるかが不明。
【研究的側面】筆者(白井)自身はフランスの高等教育機関にて ポスドクを経験しており、学生イン
ターンシップを通した産学連携の実践とイノベーションサイクルを目の当たりにしてきた。一方で制度的
に整備された環境においては、その個別の取組における工夫や、学生視点の気づきが方法論化しづらい。
日本におけるデジタルコンテンツ分野の次世代技術開発を行う人材育成 に貢献すべく、産学連携、そし
て学生の視点で方法論を具体的な研究開発の事例を通してまとめていきたい。
【今回の論文の価値】(多くは個々の企業におけるノウハウであり、オープンな形では共有されない)
学術的な貢献や高等教育がなすべきエコシステム、ひいては関わる学生の主体的な成長について注目した
設計や方法論について学術文献として明文化した。 知財創出や外部発表で、社員同様の扱いをする点。
技術分野: メタバース研究と音声信号処理
(弊ラボ) GREE VR Studio Laboratory: グリー
グループ でメタバース事業を推進するREALITY
株式会社にある研究開発部門であり、VRSNS・
メタバースのXR化によるUX開発、サービス開
発、関連する知財創出などを扱っている。
本論文では技術分野として特に、音声信号処理
ボイスチェンジャーサービス「転声こえうらな
い」をはじめとするサーバ技術、機械学習、モ
バイルやサーバプラットフォームにおけるリア
ルタイム処理やメタバース化における応用を
扱っている。
Twitter @koeuranai
https://vr.gree.net/lab/vc/
堀部貴紀『転声こえうらない』利用者の基本周波数分析
【いつでもどこでも「なりたい自分」になれるvocoder】

• 収録者のなりたい声のタイプを選ぶ(キャラクターの雰囲気で選びたい)

• 気軽に利用できる

• スマホで収録する



【満足できる品質には至らない例】

・収録者の声質の推定

・収録時に混入する背景雑音

・変換後のキャラクターとの印象

背景:スマホ時代の

アバター配信者のためのボイスチェンジャー

なりたいスタイル
外の騒音
エアコン
部屋の環境や持ち方
堀部貴紀『転声こえうらない』利用者の基本周波数分析
● ブラウザのみで利用できる

無料ボイスチェンジャーサービス


● Twitterでシェアして拡散させる

● なりたい声は13種類

● WebAudio経由で保存した10秒間の音声をボ
コーダーに渡してサーバ上で変換する


● 声のタイプに対応したプリセット(声の高さ
:pitch, フォルマント:formant)

● 利用者は同意に基づき実験に参加


音声サンプルとともに

声のタイプと性別(男性, 中性, 女性)を


自己申告で回答

「転声こえうらない」
 https://vr.gree.net/lab/vc/
堀部貴紀『転声こえうらない』利用者の基本周波数分析
分析対象

対象区間 2019年7月1日から2020年3月31日
最大収録時間 10秒
合計収録件数 40,467件
重複を省いた件数 20,803件
【分析対象とサンプル件数】

● 分析項目

○ 統計的に容易な基本周波数

○ 利用者の収録環境を把握するため信号対雑音比(SNR)

(類似の研究に対して)非常に多くのサンプルを獲得することができた
収録時間、平均基本周波
数、SNRが小数点3桁まで一
致するサンプルを同一発話
とみなして除外

堀部貴紀『転声こえうらない』利用者の基本周波数分析
分析結果

● 最大10秒までにしているが, 10秒以上話している話者が多い

● 本サービス開始からの約 8 ヶ月間において, 男性利用者が多い

● 0 dBあたりのサンプルは収録に失敗していることを示す

● 50 dB付近にピークが観測される以外にも, 150 dB付近に,

もう1つのピークが観測できる(興味深い)

堀部貴紀『転声こえうらない』利用者の基本周波数分析
分析結果 – 期間を区切った分析 -

平均基本周波数
信号対雑音比
女性比率が上がっている
収録環境は概ね均一
堀部貴紀『転声こえうらない』利用者の基本周波数分析
実験結果 - 自己申告の性別を考慮した分析 -

• 音声と性別を紐づけるため, 2020年3月から収録音声に対して自己申告で性別を
男性,女性,中性の3種類の集計を始めた.
• 声のスタイルや自己申告の性別など詳細なデータを集計した 2020 年 3 月 1 日か
ら 3 月 31 日までの 1 ヶ月間について性別に基づいた平均基本周波数のヒストグ
ラム
● 男性を選択した利用者のF0

● 一般男性の平均125 Hz 近辺が 1 番多い


● 利用者の中にも, F0が200 Hz∼250 Hz近辺という結果になった利用者もいた


● 一般女性の声の高さのような特徴を持っていることがわかる
● 中性を選択した利用者:女性のように声が高い


● 本分析のサンプル数が少ないため, 今後も引き続き調査していく必要


堀部貴紀『転声こえうらない』利用者の基本周波数分析
•  

総括

[堀部さんの最近の研究]ARでメタバースを表現してみた
[中野さんの最近の研究]"音"からイキイキした表現を求めて
日々の働き方: オンラインでのインターン研究生活
・日々の作業スタイルは、朝9:30開始、夕方18:30までが定時
・朝会(Zoom)にてその日の行動方針や目標などを各インターンが 自律的に計画
・Google Slidesにて1日1枚の日報を書き、夕会にて成果を発表する。
・必要であれば個別に集中作業としてミーティングやペアプログラミング、
 もしくはモブプログラミング(一人のコーディングを複数人が見ながら学習する)を行うこともある。
・ラボ内で常に 他のメンバーのプロジェクトを見ながら日々進行する
 外部向けのコンテンツやPoCプロジェクト、学会発表などがある場合はQA作業やレビューに積極参加
大学の研究室と異なる点
・時給制のアルバイト社員であり、時間に対するパフォーマンスは常に評価される点である。
・終了時間は特に許可がない限りは残業しない方針。
学生視点での特色
・グリーグループはアルバイトであっても社員と同じ扱いをする。
・社員の全社ミーティングや総会といった比較的機密レベルが高い会議にも出席し、メタバース開発の現
場のサービス開発の現場を学ぶ機会がある。
・社外向けのBlog執筆や特許出願も推奨されており、発明報奨金などの制度も社員と同様。
・なおコロナウイルスに対するワクチン 接種も職域接種で実施した。
まとめ:今後に向けて
短期インターンおよび採用プロセスでは、
「出来上がった優秀な学生を選ぶ」という視点になりがち。
近年の大学の環境を顧みると「人を育てる」という視点で、回り道をしながらも、
できるだけ柔軟に幅広い技術や表現力を、自分の中に「垂直に」醸成できる人物を
育成していくことが近道にも思える。
もちろんそのためには相当の時間も必要であるが、研究開発を自発的に推進するた
めの 基礎力を学生の視点で実務を通して獲得 させながら、
学術活動としての論文執筆や外部発表、社内での展開、知財取得や時間管理など、
企業活動を通した社会実装スキルを高めていく両輪の視点の方法論化は重要であり
今後も長期インターンシップ事例の共有機会があればまとめていきたい。
★本論文を執筆するにあたり、GREE VR Studio Laboratoryのインターン各位、REALITY株式会社・荒木英士氏、および明治大学・森勢将雅先生に感謝を記します。

ボイスチェンジャーサービスの研究開発を通したインターンによる次世代人材育成