【文字起こしAI】Whisperによる自動文字起こし
この記事では、OpenAIが公開した音声認識モデルであるWhisperを使用し、音声入力からの文字書き起こしを紹介しています。Whisperのモデルは、EncoderとDecoderから構成されるTransfomerモデルであり、音声データをテキストに変換することができます。
記事を見るこの記事では、OpenAIが公開した音声認識モデルであるWhisperを使用し、音声入力からの文字書き起こしを紹介しています。Whisperのモデルは、EncoderとDecoderから構成されるTransfomerモデルであり、音声データをテキストに変換することができます。
記事を見るGPUSOROBANのインスタンスを利用し、事前学習済みBERTモデルをファインチューニングして、ニュース記事をカテゴリに分類する方法が紹介しています。BERTは双方向エンコーダ表現を利用するTransfomerをベースとした大規模言語モデルです。
記事を見るGPUSOROBANのWindowsインスタンスにPyTorchをインストールする手順を解説しています。手順は次のとおりです。Windowsインスタンスへの接続後に、Python、CUDA、cuDNN、PyTorchをインストールします。
記事を見るGPUSOROBAN高速コンピューティングのプリインストールの利用方法を説明しています。PyTorchやTensosrFlow、JupyterLabがプリインストールされたインスタンスを使うことで環境構築にかかる時間を削減できます。
記事を見る