立派なアナウンサー? アマゾンの文字読みAIに驚き
奔流eビジネス (スクラムベンチャーズ マーケティングVP 三浦茜氏)
米アマゾン・ドット・コムが変えているのは世界の買い物だけではない。アマゾンのクラウドサービスであるアマゾンウェブサービス(AWS)の中に、人工知能(AI)を活用したテキスト読み上げサービスがあることはご存じだろうか。Amazon Polly(アマゾンポリー)と呼ばれる音声エンジンだ。
2016年のアマゾンの開発者向けイベントで初登場したこのサービスは、機械学習技術を使用して、まるで人が話しているような生き生きとした音声でテキストを読み上げてくれる。25種類の言語、そして52種類の男女の声が提供されている。もちろん日本語も対応し、女性の声のミズキ、男性の声のタクミという2種類の声から選ぶことができる。
先日この機能をワードプレスで編集したブログに組み込めるプラグインソフトが発表された。早速、筆者自身のブログにインストールしてみた。
テキストデータだったブログが自動的に音声コンテンツになる。さらにはポッドキャストとして配信することもできる。ブログの内容が少しでも多くの人の目に、そして耳にふれる機会が増えるということは、書き手・作り手としてうれしい限りである。
利用するにはプラグインのインストールのほか、AWSのアカウントも必要となる。少々手間はかかるが、自分でワードプレスのブログを構築したことがある人であれば、そこまで難しくはない印象だ。
日本語の女性の声のミズキに設定し読み上げてもらったところ、まるでラジオのニュースのように筆者のブログを読み上げてくれた。クエスチョンマークの部分では語尾を上げ、句読点がなくても適切な場所で間を取るなど思った以上によくできていた。もちろんまだまだな部分もあるのだが、ちょっとなまっているアナウンサーという感じだ。技術に心得がある人であれば、さらに個別にチューニングすることも可能だそうだ。
英語での読み上げも試してみた。アメリカ英語、イギリス英語だけでなく、オーストラリア英語、インド英語など独特のアクセントにも対応している。日本語のミズキに英語を読ませたところ、日本語なまりの英語で読み上げてくれた。
こんなに気軽に音声読み上げサービスを個人が活用できることに驚いた。料金もほぼ無料で使うことができる。使い始めて12カ月間は月500万文字までは無料。無料枠を超えても、100万文字あたり4ドルと非常に安価だ。
アマゾンはこのポリーを利用する想定例として、言語学習、カスタマーコンタクトセンター、教育やeラーニングの現場での活用をあげている。世界中で2億人の利用者を誇る言語学習アプリのDuolingoもポリーを活用している。言語学習アプリでも利用されるほどの発音精度ということのようだ。
家庭用セキュリティーカメラを開発するY-camも一部製品にアマゾンポリーの声を採用している。ロボットのような無機質な声よりも、人間の声に近い方が利用者に好まれるのだという。ほかにも、視覚障害者向けに即座にコンテンツを音声変換するサービスのエンジンとしても使われている。
日本でも面白い活用事例があった。和歌山県のコミュニティー放送「エフエム和歌山」ではこのアマゾンポリーがAIアナウンサーとして活躍していると聞く。AIアナウンサーなら災害時に休憩することなくニュースを読み続けることもでき、実際昨年に台風が和歌山県を襲った際には、このAIアナウンサーが約5時間にわたって情報を読み続けたという。
ポリーを実際に使ってみてそのクオリティーに驚き、また様々な活用例を見て、よい意味でAIはすでに我々の仕事を奪い始めていると感じた。AIが人間の職を奪うという表現はネガティブに語られることも多いが、エフエム和歌山のように活用する余地もある。筆者は柔軟に採り入れていきたいと思った。
[日経MJ2018年3月2日付]