Adobeの挑戦|「VoCo」に秘められた可能性とは

Adobeの挑戦|「VoCo」に秘められた可能性とは

「約みつるって本家同様、スヴェン◯ン式増毛法を活用しているらしいぜ」

人のウワサも七十五日とは言いますが、必ずウワサ話には出処というのが存在します。
出処次第でそのウワサの信ぴょう性が決まってくるものですが、ではそのウワサの発信源が当の本人であれば、そしてそれが肉声であれば誰もが信じますよね?

しかし、自分の得にならないウワサを自分から流すバカはいません。
つまり冒頭の「増毛法」の話はウソである可能性が高いわけですが、これを本人の意識とは無関係に肉声で「利用しています」と言わせてしまうツールをAdobe社が開発しています。

それが『Adobe VoCo』です。

『VoCo』が見せる不思議な体験

先日、日本で開催された「Adobe Max 2016」にて、この『Adobe VoCo』がベールを脱いだわけですが、カンタンに言えば“人間の発言を自由に書き換えるツール”ということです。
ちなみに『VoCo』とは「Voice Conbersion」の略称とのこと。
「膀胱」ではないのですね。。。

Adobe社の人気ソフト「Photoshop」になぞらえて、プレゼンテーションでは「音声版のPhotoshopである」と伝えておりますが、一体どういうことなんでしょう。

YouTube上にプレゼンテーションの模様がアップされていますので、まずはご覧ください。(※音声編集ソフトウエアの説明なので、音量にご注意の上、音付きで視聴ください)

<動画内容解説>
エンジニアのジュ・ジン氏がステージ上にいる喜劇俳優、ジョーダン・ピール氏の音声データを加工していきます。

元データ「僕はイヌにキスして、それから妻にキスしたんだ」
 ↓
加工後①「僕は妻にキスして、それからイヌにキスしたんだ」
※“犬”と“妻”を入れ替えたんですね。これだけなら今までのツールでもできそうですが…
 ↓
加工後②「僕はジョーダンにキスしたんだ、3回」
※ん!? “ジョーダン”とか“3回”とかって言ってないし!!!

「スゴい!」と当時に「不気味!」や「怖い!」が体感できる貴重なデモですね。

トリックを聞いても、なお残る不気味感……

先述した「音声版Photoshop」とはよく言ったもので、音声データの一部分を切り抜いてコピー&ペーストするという機構は想像ができます。

2010年にリリースされた「Photoshop CS5」で実装された機能「コンテンツに応じた塗り」では、画像上にある不要物をカンタンに削除し、周囲のコンテンツから背景を類推して補完することによって、元から何も写り込んでいないかのような自然な画像に仕上げることを可能としていました。

そのような技術があるからこそ、音声データであっても違和感のないつなぎ目を実現し、パッチワークであっても流暢な音声データに仕立てることは可能なのかもしれません。

しかし、「Photoshop」は“無”を“有”にするツールではありません。背景を類推して仕立てた疑似“有”データがあるからこそ、成し得た機能なのです。
それでは、『VoCo』は本当に“無”を“有”にしているのでしょうか。

答えはカンタン。「Photoshop」同様の疑似“有”データを使用しているのです。

『VoCo』では元の音声データの他、話者の20分程度の音声ファイルを必要とし、音声素材を解析した上で新しい文章に対応した音声モデルを作成しているというわけなんですね。

とはいっても不気味ですよね。
残念ながら、約みつるは『VoCo』を利用した“悪だくみ・悪用”しか思い浮かびません…。

『VoCo』が描く未来は“明るい”のか“暗い”のか…

現在のデモ段階では、まだどこが加工された部分なのかを聞き分けることができます。
しかし、開発段階でこのクオリティです。リリース時には恐ろしいことになりますね。
そこで『VoCo』利用で考えられる、“明るい未来”と“暗い未来”を考えてみました。

■明るい未来
・動画編集に携わっている人々にしてみれば、撮り直しの必要がなくなる
・音声編集に至っては、話者にスタジオ入りしてもらう必要すらなくなる
・現存しない人物との疑似コミュニケーションも可能になる

■暗い未来
・本物の子供の声を使用した、高度なオレオレ詐欺が横行する
・音声データ自体の信ぴょう性の低下に伴い、証拠品として不十分な資料に
・テレビに出ている◯◯ちゃんに、◯◯◯って言わせてムフフしちゃおう

一応、プレゼンテーションでは画像で言うところの“透かし”を入れることを検討しているとのことですが、電話口でこの加工技術を使用されたら“透かし”なんて無意味です。
コミュニケーションを図ることが森羅万象、有効な施策と考えられてきた現代ですが、未来では「セキュリティ重視のために無口であれ」なんてことも!?

ちなみにAdobe社は『VoCo』を商用プロダクトに乗せるとは言っていないので、そのままリリースされるかは定かではありません。しかし、“Adobeの底ヂカラ”を見せつけるには十分なカンファレンスだったのではないでしょうか。

そしてウソである可能性が高いとしていた「約みつるの増毛疑惑」も、将来的には定かではないですね。。。

コメント