TensorFlowのインストール(Ubuntu)【GPUSOROBAN】

本記事ではGPUSOROBANのUbuntuインスタンスにTensorflowをインストールする手順を紹介します。

GPUSOROBANは高性能なGPUインスタンスが低コストで使えるクラウドサービスです。
GPUSOROBANについて詳しく知りたい方は、以下の公式サイトをご覧ください。


  生成AIに最適なGPUクラウド「高速コンピューティング」|GPUSOROBAN GPUSOROBANの高速コンピューティングは、NVIDIAの高速GPUが業界最安級で使えるクラウドサービスです。NVIDIA A100を始めする高速GPUにより、画像生成AI、大規模言語モデルLLM、機械学習、シミュレーションを高速化します。 業界最安級GPUクラウド | GPUSOROBAN


GPUSOROBANでは、TensorFlowをプリインストールしたインスタンスを提供しています。プリインストールの使い方は、以下の記事をご覧ください。


  プリインストールの利用方法(PyTorch、TensorFlow、JupyterLab)| GPUSOROBAN GPUSOROBAN高速コンピューティングのプリインストールの利用方法を説明しています。PyTorchやTensosrFlow、JupyterLabがプリインストールされたインスタンスを使うことで環境構築にかかる時間を削減できます。 業界最安級GPUクラウド | GPUSOROBAN


目次[非表示]

  1. 1.インスタンスへのSSH接続
  2. 2.NVIDIAドライバーのバージョン確認
  3. 3.Tensorflowのインストール(インスタンスの NVIDIAドライバーのバージョンが510と515の場合 )
  4. 4.Tensorflowのインストール(インスタンス のNVIDIAドライバーのバージョンが455の場合)


インスタンスへのSSH接続

はじめにインスタンスへのSSH接続をします。
GPUSOROBANを初めてご利用される場合は、こちらの記事をご確認ください。


  会員登録~インスタンス作成手順 | GPUSOROBAN GPUSOROBANの会員登録からインスタンス作成・接続までの手順を詳しく解説する記事です。会員登録、電話番号認証、SSHキー作成、インスタンスの作成、キーの設置、ターミナルからのインスタンス接続までの流れを説明しています。 業界最安級GPUクラウド | GPUSOROBAN


NVIDIAドライバーのバージョン確認

NVIDIAドライバーのバージョンに合ったTensorflowをインストールするために
ドライバーのバージョンを確認する必要があります。

下記コマンドを実行し、NVIDIAドライバーのバージョンを確認します。

※下記画像のNVIDIAドライバーのバージョンは515になります

nvidia-smi


NVIDIAドライバーバージョン確認_nvidia-smiコマンド




Tensorflowのインストール(インスタンスの NVIDIAドライバーのバージョンが510と515の場合 )

インスタンス接続後にTensorFlowのインストールをします。
※インスタンスのNVIDIAドライバーのバージョンによってTensorFlowのバージョンが異なりますので、ご注意ください。


(インスタンスの NVIDIAドライバーのバージョンが510の場合)

pip install tensorflow===2.6.2


(インスタンスの NVIDIAドライバーのバージョンが515の場合)

pip install tensorflow===2.8.2


※WARNINGが出力される場合がありますが問題ありません。

pip install tensorflow===2.8.2


以下がインストール後の確認手順になります。

Pythonを起動します。

python3


TensorFlowをインポートします。

import tensorflow as tf


TensorFlowのバージョンを確認します。(インストールしたバージョンが表示されることを確認します。)

tf.__version__


GPUが認識されていることを確認します。(>> Num GPUs Available:  1が返されることを確認)

print("Num GPUs Available: ", len(tf.config.list_physical_devices('GPU')))


$ python


以上でTensorFlowのインストール手順は完了です。(インスタンスの NVIDIAドライバーのバージョンが510と515の場合)


Tensorflowのインストール(インスタンス のNVIDIAドライバーのバージョンが455の場合)

インスタンス のNVIDIAドライバーのバージョンが455の場合、CUDAとcudnnのバージョンをアップグレードした後に、TensorFlowをインストールします。

※インスタンスのNVIDIAドライバーのバージョンによってTensorFlowのバージョンが異なりますので、ご注意ください。

まずCUDAのインストール手順を確認します。


SSH接続先のインスタンス上で以下のコマンドを実行し、ファイルをダウンロードします。

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin


CUDAファイルのURL取得


ダウンロードしたファイルを[/etc/apt/preferences.d/cuda-repository-pin-600]ディレクトリに移動させます。

sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600


ダウンロードしたファイルを移動


URLを指定してファイルをダウンロードします。

wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda-repo-ubuntu1804-11-0-local_11.0.3-450.51.06-1_amd64.deb


CUDAファイルのダウンロード


パッケージをインストールします。

sudo dpkg -i cuda-repo-ubuntu1804-11-0-local_11.0.3-450.51.06-1_amd64.deb


パッケージのインストール


下記コマンドで、単一ファイルに鍵を追加します。

sudo apt-key add /var/cuda-repo-ubuntu1804-11-0-local/7fa2af80.pub


単一ファイルに鍵を追加


パッケージをアップデートします。

sudo apt-get update


sudo apt update


cudaをインストールします。

sudo apt-get -y install cuda


sudo apt-get -y install cuda


上記完了後、以下にて/home/user/.bashrcのcudaのパス周りの設定を編集します。

bashrcファイルを開きます。

nano ~/.bashrc


bashrcファイルの最終行にある下記2つの行をコメントアウトします

#export PATH=$PATH:/usr/local/cuda-10.1/bin

#exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.0/extras/CUPTI/lib64:/usr/local/cuda-11.0/lib64


bashrcファイルに下記の2行を追加します。

export PATH=$PATH:/usr/local/cuda-11.0/bin
exportLD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.0/extras/CUPTI/lib64:/usr/local/cuda-11.0/lib64


nano ~/.bashrc


ファイル編集後に「Ctrl」+「s」で保存して、「Ctrl」+「x」で編集画面から抜けます。
以上まで実行後、ターミナル2上で、下記を実行してインスタンスからログアウトします。

exit


その後、下記コマンドで再ログインします。

ssh user@localhost -p 20122 -i .ssh\mykey.txt


再ログイン後、次のコマンドでCUDA11.0.3が返されることを確認します。

nvcc -V


以上でcuda11.0.3のインストールが完了です。


続いてcudnnをインストールします。

echoコマンドで標準出力した内容をファイルに出力します。

echo "deb https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64 /" | sudo tee /etc/apt/sources.list.d/nvidia-ml.list


cudnnインストールファイル出力


パッケージリストの更新をします。

sudo apt update


パッケージリストの更新


cudnnをインストールします。

sudo apt-get install -y --no-install-recommends --allow-downgrades cuda-11-0 \libcudnn8=8.0.4.30-1+cuda11.0  \libcudnn8-dev=8.0.4.30-1+cuda11.0


cudnnをインストール


cudnnのインストール後に、正しいバージョンの8.0.4.30-1+cuda11.0が返されることを確認します。

dpkg -l | grep "cudnn8"


パッケージが更新されないようにホールドします。

sudo apt-mark hold cuda-11-0 libcudnn8 libcudnn8-dev


パッケージが更新されないようにホールド


次にTensorFlowのインストール手順を確認します。

下記コマンドでTensorFlowをインストールします。

pip3 install tensorflow===2.4.3


pip3 install tensorflow===2.4.3

※WARNINGが出力される場合がありますが問題ありません。


以下、TensorFlowのインストール後の確認をします。
Pythonを起動します。

python3


TensorFlowをインポートします。

import tensorflow as tf


TensorFlowのバージョンを確認します。(2.4.3が返されることを確認)

tf.__version__


GPUが認識されることを確認します。(>> Num GPUs Available:  1が返されることを確認します。)

print("Num GPUs Available: ", len(tf.config.list_physical_devices('GPU')))


print("Num GPUs Available: ", len(tf.config.list_physical_devices(


以上でTensorFlowのインストールが完了しました。(インスタンス のNVIDIAドライバーのバージョンが 455の場合 )


本環境には、GPUSOROBANのインスタンスを使用しました。
GPUSOROBANは高性能なGPUインスタンスが低コストで使えるクラウドサービスです。


GPUSOROBANについて詳しく知りたい方は、以下の公式サイトをご覧ください。


  生成AIに最適なGPUクラウド「高速コンピューティング」|GPUSOROBAN GPUSOROBANの高速コンピューティングは、NVIDIAの高速GPUが業界最安級で使えるクラウドサービスです。NVIDIA A100を始めする高速GPUにより、画像生成AI、大規模言語モデルLLM、機械学習、シミュレーションを高速化します。 業界最安級GPUクラウド | GPUSOROBAN



MORE INFORMATION

GPUでお困りの方はGPUSOROBANで解決!
お気軽にご相談ください

10日間無料トライアル
詳しい資料はこちら
質問・相談はこちら