テキスト読み上げAIデモを無料で一般公開

AI総合研究所として活動する東大発企業のNABLAS社は、ディープラーニングをベースとした音声合成モデルを用いたテキスト読み上げAIのデモサイトを無料で一般公開しました。

Edge POINT

  • ディープラーニングによる自然言語処理技術を用いて大規模ボコーダーを活用した音声合成モデル
  • テキストデータをAIが4種類のボイスで音声化
  • 日本語のひらがな、カタカナ、漢字、複雑な熟語、数字や簡単な英単語にも対応

ひらがな・熟語・英単語などをAIが4種類のボイスで音声化

公開したテキスト読み上げAIは、ディープラーニングによる自然言語処理技術を用いて大規模ボコーダーを活用した音声合成モデルで、任意で入力されたテキストデータをAIが4種類のボイスで音声化します。日本語のひらがな、カタカナ、漢字だけでなく、複雑な熟語にも対応し、数字や簡単な英単語などの入力データからでも自然な音声の生成が可能です。

本技術は、メール・原稿の読み上げや聴覚障害者のアシスト、音声ガイダンスなど、音声に関する課題解決やDX推進といった幅広い場面で産業的な価値をもたらすと期待されています。

AIが人間の言葉を自然な音声で出力する音声合成技術は、ここ数年の進化が著しい分野の1つです。NABLAS社によると、引き続き音声読み上げAIモデルの精度向上に取り組むと同時に、多くの産業やユースケースに対して応用が可能なAI技術の開発を進めていくということです。

リリース:PR TIMES

関連記事

ページ上部へ戻る