超微塔式伺服器
顯卡 NVIDIA TITAN Xp *4
內存 128G
CPU 2620V4* 2
電源 1600w *2
硬碟 256G*2+2T*2
二、安裝
1.安裝Ubuntu
使用U盤進行Ubuntu作業系統的安裝:
參考:
https://jingyan.baidu.com/article/a3761b2b66fe141577f9aa51.html
一開始安裝選擇"Install Ubuntu"回車後過一會兒屏幕如果顯示「輸入不支持」,這和Ubuntu對顯卡的支持有關,在安裝主界面的F6,選擇nomodeset,就可以進入下一步安裝了。
安裝過程略,安裝鏡像下載地址:
ubuntu.com/download/des
下載:ubuntu-18.04.2-desktop-amd64.iso
2.安裝ssh
備註:這一步需要到伺服器桌面上的命令窗口輸入,這一步完成後,就可以用ssh工具遠程連接伺服器了,本文使用的是XShell。
sudo apt-get install openssh-server
3. 安裝NVIDIA TITAN Xp顯卡驅動
默認安裝的顯卡驅動不是英偉達的驅動,所以先把舊得驅動刪除掉。
sudo apt-get purge nvidia*
添加Graphic Drivers PPA
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
查看合適的驅動版本:
ubuntu-drivers devices
圖:可用的nvidia 驅動列表圖中可以看出推薦的是最新的430版本的驅動,安裝該驅動:
sudo apt-get install nvidia-driver-430
安裝完畢後重啟機器:
sudo reboot
重啟完畢運行
nvidia-smi
看看生效的顯卡驅動:
圖:生效的顯卡驅動4.安裝依賴庫
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-devlibgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
5.GCC降低版本
CUDA9.0要求GCC版本是5.x或者6.x,其他版本不可以,需要自己進行配置,通過以下命令才對GCC版本進行修改。
# 版本安裝:
sudo apt-get install gcc-5
sudo apt-get install g++-5
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
6.安裝Anaconda和tensorflow、keras和pytorch
重點:讓conda自動安裝cuda和cudnn!!!
由於Anaconda可以提供完整的科學計算庫,所以直接使用Anaconda來進行相關的安裝。
1)安裝Anaconda
下載地址:https://www.anaconda.com/download/
這裡我們下載Python 3.7 64bit 的linux版本。
安裝:
bash Anaconda3-2019.03-Linux-x86_64.sh
2)更改pip和conda為國內的源
由於國內訪問pip和conda比較慢,建議更改為國內的源:
a.更改pip的源為阿里云:
mkdir ~/.pip
cat > ~/.pip/pip.conf << EOF
[global]
trusted-host=mirrors.aliyun.com
index-url=https://mirrors.aliyun.com/pypi/simple/
EOF
備註:conda 國內源都封了,不需要更換源了
3)在Anaconda中安裝Python3.7的虛擬環境
創建一個Python的虛擬環境
conda create --name tf python=3.7 #創建tf環境
虛擬環境主要命令:
source activate tf #激活tf環境
source deactivate tf #退出tf環境
conda remove --name tf --all #刪除tf環境(全部刪除)
4)在Anaconda中安裝TensorFlow GPU 1.9
conda install tensorflow-gpu==1.9
將會自動安裝:
cuda,cudnn以及相關的其他組件
5)使用下列代碼測試安裝正確性
命令行輸入:
source activate tf
python
Python命令下輸入以下代碼:
import tensorflowas tf
hello= tf.constant('Hello, TensorFlow!')
sess= tf.Session()
print(sess.run(hello))
沒有報錯就是配置好了。
6)安裝Keras
直接在這個虛擬環境中安裝:
pip install keras
7)安裝Pytorch
直接在這個虛擬環境中安裝:
conda install pytorch torchvision -c pytorch
系統會自動安裝cuda和cudnn
測試Pytorch是否安裝成功:
命令行輸入:
source activate tf
python
python命令下輸入以下代碼:
import torch
print(torch.cuda.is_available())
返回True說明安裝成功了。
總結
為避免讀者踩坑,本文測試成功了Ubuntu18.04環境下配置深度學習環境包括:CUDA+CUDNN+TensorFlow1.9+Pytorch1.1的安裝和測試。
參考
http://blog.csdn.net/weixin_41863685/article/details/80303963
覺得這篇文章有幫助?請轉發給更多人
關注 AI有道 加星標,獲取最新 AI 乾貨
最新 AI 乾貨,我在看❤️