AI・機械学習

グーグル「Cloud Text-to-Speech」--アップデート版「WaveNet」で音声波形の生成を高速化

グーグルは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Googleは米国時間3月27日、「Cloud Text-to-Speech」サービスを発表した。これにより開発者は、テキストを自然な発音で読み上げる技術をさまざまな製品に組み込めるようになる。

 Cloud Text-to-Speechは、コールセンターの音声応答システムに活用したり、リアルタイムで自然言語に変換したりといった多くの使い方ができると、Googleのブログ投稿に記されている。また、テレビや自動車、ロボットを含むモノのインターネット(IoT)機器でユーザーの質問に音声で応答することが可能になるほか、ニュース記事や本といったテキストベースのメディアをポッドキャストやオーディオブックなどの音声形式に変換することも可能だ。

 Cloud Text-to-Speechでは、12種類の言語や派生言語にわたる32種類の音声から選択できると、同ブログ投稿に記されている。また、名前や日付、時刻、住所といった複雑なテキストも正しく発音することができ、音声のピッチや発話速度、ボリュームゲインのカスタマイズも可能だという。さらに、MP3、WAVなど複数のオーディオフォーマットに対応する。

編集部おすすめの関連記事

残り本文:約739文字 ログインして続きを読んでください。

あなたにおすすめの記事

関連記事

ホワイトペーパーランキング

  1. 多機能、シンプル管理、サポート面--管理者の「欲しい」を全部入りにしたストレージとは
  2. IoT、AI、自動化で事業を組み上げよ--製造業のITのための最新テクノロジー完全ガイド
  3. クラウドサービスの氾濫に備えよ! シャドーITを可視化しリアルタイム制御できる次世代CASBが上陸
  4. 営業赤字13億円からの黒字回復!老舗企業ゆえに陥った成長鈍化の罠、その脱出劇【事例資料】
  5. 12社のオールフラッシュアレイを徹底比較! 世界のバイヤーが参考にする「AFA製品評価ガイド」公開

編集部おすすめ

トレンドまるわかり![PR]

サーバ
PC・モバイル
ストレージ
ネットワーク
仮想化
クラウドサービス
OS・ミドルウェア
開発
データベース
運用
セキュリティ
新興技術
IoT
ドローン
ロボット
VR・AR
AI・機械学習
財務・経理
人事・労務
マーケ・営業
購買・調達
生産・製造
データ分析
コミュニケーション
通信・通話
文書・コンテンツ
サイト構築
PCソフト
学習

ベンダー座談会

Follow TechRepublic Japan

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]