東芝デジタルソリューションズが開発した「コエステーション」というアプリをご存知だろうか。人の声を音声合成でデジタル化し、それをアプリに登録すると、その人にそっくりな声でテキストを読み上げてくれる。
Twitterでトレンド入りを果たすなど話題のサービスだ。さらなる発展を目指すべく、2020年2月に東芝からカーブアウトしてエイベックスとの合併会社「コエステ株式会社」を設立し、事業推進を加速していくという。
その執行役員に就任するのが、発起人でもある現・東芝デジタルソリューションズの金子祐紀氏。これまでも数々の話題作を生み出してきた金子氏が語る、世界70億人の声を集めるビジョンとは? そして、斬新な新規事業のアイデアを生む思考についても迫った。
取材・文:吉田真也(CINRA) 写真:熊原哲也
好きな人の声で毎朝起こしてもらえる。音声合成をつかったコエステーションとは?
HIP編集部(以下、HIP):コエステーションは、どういったサービスなのでしょうか?
金子祐紀氏(以下、金子):簡単にいうと、「音声合成」の技術を使ったサービスです。「音声合成」とは、テキストを音声に変換して、人工的にいろんな言葉を喋らせる技術のこと。よくカーナビや駅の案内などで使われている音声ですね。コエステーションでは、「音声合成の声」を「コエ」と表現しています。
金子:コエステーションが一般ユーザー向けに提供しているのは、誰でも気軽に「コエ」がつくれるアプリ。まず、スマホでアプリをダウンロードしてもらい、いくつかの文章を読み上げていただきます。すると、音声合成エンジンがその声の特徴を自動で学習してコエを生成します。その後は、テキストを入力すれば、そのコエで文章を読み上げてくれるようになるので、さまざまなコミュニケーションが可能になるんです。
HIP:たとえばどういったことが可能になるのでしょうか?
金子:コエステーションは、自分のコエだけでなく、家族や友達のコエも、リクエストが承認されたら使えるようになるんです。
たとえば、「孫の声で毎朝ニュースを聞きたい」というおじいちゃんの願いを実現できたり、SNSのメッセージを送信者の声で読み上げてくれたり。また、一般人だけでなく、有名人の声も集めています。これにより、好きなアイドルの声で自分の名前を呼んでもらうことも、毎朝違うフレーズで起こしてもらうことも可能になります。
また、コエを登録しておけば、万が一、病気や怪我で声が出なくなっても自分のコエでコミュニケーションができます。さらには、いま研究中のクロスリンガルという技術が確立すると、日本語のコエをもとに多言語に変換して喋らせることもできます。翻訳技術を組み合わせれば、自分のコエでドイツ語やフランス語などを喋ることができたり、アニメや映画を原作の声のまま海外展開することも可能になるかもしれません。
HIP:コエをたくさん集めることで、コミュニケーションの幅がかなり広がりそうですね。
金子:はい。世界70億人のコエを集めることが目標です。コエステーションは、じつは「声」ではなく「人」にフォーカスしたプラットフォームなんです。たとえば、「Aさんの声色が好きだから、声を聴きたい」という人は少数なはず。「人」としてAさんのことが好きだから、アイデンティティの一部である声も聞きたくなるんだと思います。
だからこそ、コエステーションでは誰かに似せたコエを勝手につくるのではなく、本人同意のもと、多くの人のコエを集めることにこだわっています。
りん議を通す秘訣などない。サービスが良ければ「正面突破」でいけるはず
HIP:コエステーションを始めることになった経緯を教えてください。
金子:東芝は40年以上前から、音声合成の研究をしてきました。一時期だと日本のカーナビの約9割が東芝の音声合成を使っていた時代もあり、たしかな技術やノウハウが蓄積していたんです。
ただ、良い技術はあるけど「物を売って終わり」のビジネスから脱却するのはなかなか難しかった。さらにはスマートスピーカーやワイヤレスイヤホンなどの音声インターフェイスが増えてきて、世間の音声機能の注目度も上がっていました。そうした時代背景もあり、2016年に上層部から「音声合成の技術を使って、何か良いサービスができないか?」という相談が私にきたんです。
HIP:なぜ金子さんに相談がきたのでしょうか?
金子:これまで東芝でさまざまな新しい事業をつくってきたからだと思います。私はもともとソフトウェアのエンジニアでした。2011年に全チャンネル録画とシーン検索できるクラウドテレビ「REGZA シリーズ」の製品づくりに携わったり、2016年2月にはメガネ型ウェアラブル「WearvueTM」をつくったりしました。
どちらもいまでは珍しくない機能かもしれませんが、当時はセンセーショナルで話題になったんです。そうした実績もあったので、次第に「東芝のいろんな技術を新規事業化する請負人」みたいになっていました(笑)。
HIP:それで今度は、音声合成の技術を活かした事業を考えてほしいと。金子さんご自身に音声合成の技術や知識は、もともとあったのでしょうか。
金子:まったくなかったです。最初は、音声合成を利用したサービスを使い倒してみたり、専門家からいろいろお話を聞いたりするところから始めました。2016年4月にジョインしたのですが、コエステーションの構想を思いついたのは、2か月後の6月。
そこからは、数か月かけて経営層にひたすらプレゼンしまくりました。その後、2017年の7月に一旦ベータ版としてリリースし、正式にローンチしたのは2018年4月です。
HIP:りん議を通すために工夫したことはありますか?
金子:特にコツとかはなくて、「正面突破」ですね。コエステーションの構想に自信を持っていたので、「ちゃんと伝えれば、わかってくれる」と思っていました。
良いサービスであれば、誰だって納得してくれるはず。だから、「りん議を通す方法」を考えるのではなく、ワクワクするサービスをつくることに注力したほうが賢明だと私は思います。
わずか1年3か月でリリースできた理由。強行突破の広報活動がカギだった
HIP:とはいえ、事業構想からわずか1年3か月でベータ版をリリースできたのは、ほかの大企業と比べてもかなり早いと思います。事業スピードを早めるために取り組んだことがあれば教えてください。
金子:広報に無理をいって、かなり早い段階で「ベータ版リリース」というかたちで世間に発表させてもらいました。大企業の場合、100点のプロダクトができて準備万端になるまで情報を解禁しないのが一般的なので、もちろん広報とは一悶着ありましたよ(笑)。
ですが、最初のプロジェクトチームは私ひとり。協業パートナーも営業先も、全部自分で開拓するとなると、時間やリソースが足りません。ただ、面白いサービスになる自信はありましたし、先に公表してしまえば、メディアが食いついてくれるはず。そうすれば、協力してくれそうな方や見込み顧客先の目に止まり、問い合わせがくるようになると思ったんです。
HIP:実際に問い合わせはあったのでしょうか。
金子:おかげさまで、かなりの問い合わせをいただきました。世間から良い反応があると、自然と社内も協力的になります。スピード感を持って新規事業を推進するには、考えるより先に行動することが大事だと、あらためて実感しましたね。