catch-img

【Llama2】Meta・HuggingFaceへの利用申請

この記事では、Llama2を使用するためのMeta・HuggingFaceへの利用申請について解説しています。


目次[非表示]

  1. 1.Llama2とは
  2. 2.Metaへのモデル利用申請
  3. 3.HuggingFaceの設定
    1. 3.1.HuggingFaceのアカウント作成
    2. 3.2.HuggingFaceでトークン作成
    3. 3.3.HuggingFaceでモデルの利用申請
  4. 4.生成AI・LLMならGPUクラウド
  5. 5.まとめ


Llama2とは

Llama2(Large Language Model Meta AI 2/ラマツー)とは、Facebookを運営するMeta社が開発した言語生成AI(LLM)で、OpenAI社のChatGPTに匹敵するの性能を持っています。


Llama2の特徴としては、軽量モデルで高性能、そして無料で使えるオープンソースであるため、開発者にとって扱いやすいモデルになっています。

llama2


Llama2のモデルを使用するにあたって、Metaへの申請やHuggingFaceでの設定が必要になります。


Llama2の詳細については、以下の記事で解説しています。


  Llama2とは?使い方・日本語性能・商用利用について解説 | 初心者ガイド この記事では、Llama2について幅広く解説しています。Llama2の性能や安全性、商用利用、日本語対応、様々な環境での使い方などに触れています。 業界最安級GPUクラウド | GPUSOROBAN


Metaへのモデル利用申請

Llama2のモデルを使用するにあたり、Metaへの申請方法を解説します。
申請は以下のサイトから行います。

  Llama 2 - Meta AI Llama 2 — The next generation of our open source large language model, available for free for research and commercial use. Meta AI


[Download the Model]をクリックすると、[Request access to the next version of Llama]の画面に遷移しますので、必要事項を入力します。

llama-meta-huggingface


[Select the models you would like access to:]の項目で、[Llama2&Llama Chat]および[Code Lama]にチェックを入れます。

llama-meta-huggingface


[I accept the terms and conditions]にチェックを入れて、[Accept and Continue]ボタンをクリックします。

llama-meta-huggingface


承認メールが届くのに数日かかる可能性があります。タイミングによっては早く承認されるかもしれません。


メールに書かれているリンク[https://download.llamameta.net/~Download-Request-ID=xxxxxx]は後に使うため、控えておきます。


Llama2の承認メール

llama-meta-huggingface


Code Llamaの承認メール

llama-meta-huggingface


HuggingFaceの設定

HuggingFaceを使ってLlama2を使用する場合の設定方法について解説します。


HuggingFaceのアカウント作成

HuggingFaceのアカウント未作成の場合は、[Sign Up]からアカウントを作成してください。

  Hugging Face – The AI community building the future. We’re on a journey to advance and democratize artificial intelligence through open source and open science. https://huggingface.co/


llama-meta-huggingface


HuggingFaceでトークン作成

HuggingFaceに接続してモデルをダウンロードするのにアクセストークンの作成が必要になります。

HuggingFaceログイン後、ヘッダーの[赤い丸印]から[Settings]を選択します。

llama-meta-huggingface

サイドバーから[Access Tokens]を選び、[New token]ボタンをクリックします。llama-meta-huggingface


[Create a new access token]のページで、[Name]にアクセストークンの任意の名称を入力し、[Generate a token]をクリックするとアクセストークンが作成されます。

llama-meta-huggingface


アクセストークンは後ほど使用するため、控えておきます。

llama-meta-huggingface


HuggingFaceでモデルの利用申請

Huggingfaceの以下のページにアクセスし、モデルの利用申請をします。

  meta-llama (Meta Llama 2) Org profile for Meta Llama 2 on Hugging Face, the AI community building the future. https://huggingface.co/meta-llama



[Models]から利用するLlamaのモデルを選択します。

llama-meta-huggingface

凡例)
Llama-2 : ラマ2のモデル
7b : パラメータ数70億のモデル
13b : パラメータ数130億のモデル
70b : パラメータ数700億のモデル
chat : 会話用にトレーニングされたモデル
hf : Hugging Face Transformersのフォーマットに変換されたモデル


遷移したページで[I agree~Meta website]にチェックをいれて、[Submit]をクリックします。

llama-meta-huggingface


このときモデル使用申請時にMetaに登録したメールアドレスと、HuggignFaceで登録したメールアドレスが同じである必要がありますので、ご注意ください。

Submitボタンをクリック後に以下の表示がされ、リポジトリ管理者からのレビュー待ちになりますので、しばらく待ちます。

Your request to access this repo has been successfully submitted, and is pending a review from the repo's authors.


[Access granted] Your request to access model meta-llama/xxxxx has been acceptedというタイトルで、HuggingFaceからメールが届くと承認完了です。

llama-meta-huggingface


ここまでがMeta・HuggingFaceへの利用申請になります。

モデルの使い方については、以下の記事で解説しています。


  Llama2とは?使い方・日本語性能・商用利用について解説 | 初心者ガイド この記事では、Llama2について幅広く解説しています。Llama2の性能や安全性、商用利用、日本語対応、様々な環境での使い方などに触れています。 業界最安級GPUクラウド | GPUSOROBAN


生成AI・LLMならGPUクラウド

Llama2やその他のLLMを使用する際には、モデルサイズやタスクに応じて必要なスペックが異なります。

LLMで使用されるGPUは高価なため、買い切りのオンプレミスよりも、コストパフォーマンスが高く柔軟な使い方ができるGPUクラウドをおすすめしています。


GPUクラウドのメリットは以下の通りです。

  • 必要なときだけ利用して、コストを最小限に抑えられる
  • タスクに応じてGPUサーバーを変更できる
  • 需要に応じてGPUサーバーを増減できる
  • 簡単に環境構築ができ、すぐに開発をスタートできる
  • 新しいGPUを利用できるため、陳腐化による買い替えが不要
  • GPUサーバーの高電力・熱管理が不要


コスパをお求めなら、メガクラウドと比較して50%以上安いGPUクラウドサービス「GPUSOROBAN」がおすすめです。


  生成AIに最適なGPUクラウド「高速コンピューティング」|GPUSOROBAN GPUSOROBANの高速コンピューティングは、NVIDIAの高速GPUが業界最安級で使えるクラウドサービスです。NVIDIA A100を始めする高速GPUにより、画像生成AI、大規模言語モデルLLM、機械学習、シミュレーションを高速化します。 業界最安級GPUクラウド | GPUSOROBAN


大規模なLLMを計算する場合は、NVIDIA H100のクラスタが使える「GPUSOROBAN AIスパコンクラウド」がおすすめです。


  LLMに最適なH100が業界最安級「AIスパコンクラウド」| GPUSOROBAN AIスパコンクラウドはNVIDIA H100を搭載したGPUインスタンスが業界最安級で使えるクラウドサービスです。HGX H100(H100 x8枚)を複数連結したクラスタ構成により、LLMやマルチモーダルAIの計算時間を短縮します。料金はAWSのH100インスタンスと比較して75%安く設定しており、大幅なコストダウンが可能です。 業界最安級GPUクラウド | GPUSOROBAN


まとめ

この記事では、Llama2を使用するためのMeta・HuggingFaceへの利用申請について紹介しました。

Llama2は無料で使えて商用利用可能な利便性の高いモデルでありながら、ChatGPTと同等以上の性能があります。

Llama2に関する詳細な情報は、以下の記事でまとめて紹介していますので、あわせてご覧ください。


  Llama2とは?使い方・性能・商用利用について解説 | 初心者ガイド この記事では、Llama2について幅広く解説しています。Llama2の性能や安全性、商用利用、日本語対応、様々な環境での使い方などに触れています。 業界最安級GPUクラウド | GPUSOROBAN



MORE INFORMATION

GPUでお困りの方はGPUSOROBANで解決!
お気軽にご相談ください

10日間無料トライアル
詳しい資料はこちら
質問・相談はこちら