人間の声を書き換える！？音声版Photoshop「VoCo」をAdobeがデモ公開

テクノロジー

2016.11.18 大伴

音声版Photoshop!?「VoCo」
- まずはとにかくデモムービー
- 最大の注目技術

いつもWEB制作においてAdobe製品にお世話になり続けているJです。

今年のAdobe MAX 2016をチェックしていたところ、
Adobeの主力製品となるCreative Cloudのバージョンアップ情報等が取り上げられる中で、興味深い同社プロジェクトがデモプレビューされていましたので今回少しご紹介したいと思います。

Adobe MAXとは

世界60カ国からクリエイティブ業界のリーダーやデザイナー、ストラテジスト、ビデオプロフェッショナル、デベロッパー、写真家etc…ありとあらゆるクリエイターが7,000人以上集まる、年に一度のAdobe社のプライベートイベントです。2016年はアメリカ合衆国カリフォルニア州サンディエゴにて開催、日本でもAdobe MAX Japanとして今年は東京ビッグサイトにて開催されました。

音声版Photoshop!?「VoCo」

簡単に言うと「人間の声を自由自在に書き換えたり、発してもいない言葉を簡単に再現出来る！」というものなんです。

Photoshopが画像を簡単に加工・修正・クリエイトしたりできるのに対し、Vocoは例えるなら音声版Photoshopといった感じでしょうか。

まずはとにかくデモムービー

最大の注目技術

今回公開されたデモプレビューの中で最大の注目は、既存の録音された音声を編集するだけでなく、VoCoは発言者である人間の声を学習し、それを元に発言者の声を再現することができるというもの。

音声データの不必要な部分を削除したり、テキストで文字入力すると、コンピュータが学習した声のデータを元にその人の声を再現することができる。
具体的には20分ほどの音声データがあれば可能で、公開されたデモでは、学習した音声入力部分はもちろんのこと、学習データには含まれていない部分（一言も発していない文章）を再現することができていた。

つまり、Vocoを使うと音声データさえあれば、その人間の声で音声を自由自在に作成することができてしまうのです！

まさに本人版の初音ミクですね。

音声版「Photoshop」

データさえあれば1個人の音声を再現できてしまうことには驚きましたが、倫理的な部分で問題にはならないんでしょうかね…。

Adobeによれば、例えば病気で声を無くした人の音声データがあれば、それを元に声を再現したりということも検討しているという。
ただし、政治家が発言してもいないことを発言したかのように利用されるなどの危険性があることも認識しており、
そうした課題に関してはプロテクトを行うなどの検討をしていかなければならないとした。
なお、現在のデモは英語のみに対応しているが、多国語対応はさほど難しいことではなく、英語以外の言語にも応用可能だと言うことだった。
引用元：http://japanese.engadget.com/

アメリカでのデモプレビュー公開ということなので、日本版のサービスが開始されるのはまだ何年も先の話になるのでしょうけど。
アメリカのIT事業は日本の5年先を行くと聞いたことがあります。今回音源・音声を焦点にあてたサービスが公開されたことで、近い将来日本のweb事業にも音源が重要になってるのでしょうか。

デモ版が使用できるようになったら是非触ってみたいですね。