AI・機械学習

グーグル「Cloud Text-to-Speech」--アップデート版「WaveNet」で音声波形の生成を高速化

グーグルは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Googleは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Cloud Text-to-Speechは、コールセンターの音声応答システムに活用したり、リアルタイムで自然言語に変換したりといった多くの使い方ができると、Googleのブログ投稿に記されている。また、テレビや自動車、ロボットを含むモノのインターネット(IoT)機器でユーザーの質問に音声で応答することが可能になるほか、ニュース記事や本といったテキストベースのメディアをポッドキャストやオーディオブックなどの音声形式に変換することも可能だ。

 Cloud Text-to-Speechでは、12種類の言語や派生言語にわたる32種類の音声から選択できると、同ブログ投稿に記されている。また、名前や日付、時刻、住所といった複雑なテキストも正しく発音することができ、音声のピッチや発話速度、ボリュームゲインのカスタマイズも可能だという。さらに、MP3、WAVなど複数のオーディオフォーマットに対応する。

編集部おすすめの関連記事

残り本文:約739文字 ログインして続きを読んでください。

あなたにおすすめの記事

関連記事

ホワイトペーパーランキング

  1. 急増する「非マルウェア攻撃」は、どのように防げばいいのか?─新たな発想による防御が必須に
  2. IBM データ経営の教科書-ビジネス変革3つの柱はデータ、アナリティクス、クラウド
  3. 幸せなA社と不幸なB社、天国と地獄を分けたのは1年前の決断だった!-中堅・中小企業のERP導入
  4. 【保存版】金融・製造・小売・医療…業界別のAI活用シナリオで“ブーム”の次のフェーズへ!
  5. 実は“落とし穴”の多いOffice 365への移行。スムーズな活用に欠かせない“ある秘策”とは?

編集部おすすめ

トレンドまるわかり![PR]

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ
新興技術
IoT
ドローン
ロボット
VR・AR
AI・機械学習
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
学習

ベンダー座談会

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]