摘要:云主機環境配置檢查設備識別表示識別為表示為獲取網絡源,并配置官方源地址安裝在安裝前請檢測當前內核版本,然后確保對應版本的包已經安裝,否則無法正常編譯驅動。
1. 檢查GPU設備識別
$ sudo lspci | grep NVIDIA
3D controller: NVIDIA Corporation GK210GL [Tesla K80] 表示識別為K80
3D controller: NVIDIA Corporation GP102GL [Tesla P40] (rev a1) 表示為P40
2. 獲取cuda網絡源,并配置
NVidia官方源地址http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/
$ wget http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1404/x86_64/cuda-repo-ubuntu1404_8.0.44-1_amd64.deb
$ sudo dpkg -i cuda-repo-ubuntu1404_8.0.44-1_amd64.deb
$ sudo apt-get update
3. 安裝cuda 8.0
在安裝前請uname -a 檢測當前內核版本,然后確保對應版本的kernel-header包已經安裝,否則無法正常編譯驅動。
$ uname -a
$ Linux X-X-X-X 3.13.0-123-generic #172-Ubuntu SMP Mon
$ sudo apt search 3.13.0-123-generic
$ p linux-cloud-tools-3.13.0-123-generic - Linux kernel version specific cloud tools for version 3.13.0-123
$ p linux-headers-3.13.0-123-generic - Linux kernel headers for version 3.13.0 on 64 bit x86 SMP
$ p linux-headers-3.13.0-123-generic:i386 - Linux kernel headers for version 3.13.0 on 32 bit x86 SMP
$ sudo apt-get install linux-headers-3.13.0-123-generic
安裝cuda
$ sudo apt-get install cuda-8.0
3.1 查看驅動狀態
$ sudo nvidia-smi
看到如下輸出表示GPU驅動正常:
4. 測試GPU基本功能(可選)
4.1 增加LD path
$ export LD_LIBRARY_PATH="/usr/local/cuda-7.5/lib64:/usr/lib64/:$LD_LIBRARY_PATH"
4.2 安裝cuda examples
$ cd /usr/local/cuda/bin
$ sh cuda-install-samples-8.0.sh ~/cuda-test/
$ cd ~/cuda-test/NVIDIA_CUDA-8.0_Samples
$ make
$ ./bin/x86_64/linux/release/deviceQuery 獲取設備狀態
$ ./bin/x86_64/linux/release/bandwidthTest 測試設備帶寬
如果編譯過程發現lnvcuvid的錯誤,可以執行:
$ find . -type f -execdir sed -i s/UBUNTU_PKG_NAME = "nvidia-367"/UBUNTU_PKG_NAME = "nvidia-375"/g {}
其中nvidia-375是當前安裝的驅動的版本
5. 安裝cudnn
選裝,注:不同AI框架對cudnn的版本支持不同
5.1 下載cudnn軟件包
https://developer.nvidia.com/cudnn ,需要注冊nvidia賬號后才能下載
5.2 安裝
案例使用cudnn5.1 因為TensorFlow目前僅支持5.1
ubuntu 可以選擇 cuDNN v5.1 Runtime Library for Ubuntu14.04 (Deb)
$ sudo dpkg -i libcudnn5_5.1.10-1+cuda8.0_amd64.deb
6. 關閉ubuntu自動更新內核及NVidia Tools
建議操作
$ sudo vim /etc/apt/apt.conf.d/10periodic
將 APT::Periodic::Update-Package-Lists "1"; 修改為 APT::Periodic::Update-Package-Lists "0"; 以禁止ubuntu自動更新軟件包
FAQ
這個問題是系統讀取gpu狀態信息不準確導致,執行下列命令可更正,讓系統讀取命令正確。
# nvidia-smi -pm 1
可提交工單,或聯系工作人員,獲得UCloud制作的包含GPU驅動和Cuda環境的鏡像,節省人工安裝的時間。
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/126103.html
摘要:除自行安裝外,是否有其它可獲得驅動鏡像的方法可提交工單,或聯系工作人員,獲得制作的包含驅動和環境的鏡像,節省人工安裝的時間。實時文檔歡迎訪問GPU云主機UHost Ubuntu 16.04 環境配置1. 檢查GPU設備識別 $ sudo lspci | grep NVIDIA 3D controller: NVIDIA Corporation GK210GL [Tesla K80] 表...
摘要:云主機環境配置檢查設備識別表示識別為表示為屏蔽開源驅動編輯如下文件寫入下列內容更新并重啟控制臺鏡像的內核為,該版本在官方已無法下載狀態,此為安裝驅動所必需,建議先升級內核至后續版本。GPU云主機UHost Ubuntu 18.04 環境配置1. 檢查GPU設備識別 $ sudo lspci | grep NVIDIA 3D controller: NVIDIA Corporation ...
摘要:注意下載安裝案例使用因為目前僅支持解壓的路徑可以自由選擇,一般是下面,這邊假設為發現使用率,為什么這個問題是系統讀取狀態信息不準確導致,執行下列命令可更正,讓系統讀取命令正確。GPU云主機UHost CentOS 7環境配置1. 檢查GPU設備識別 $ yum install pciutils $ sudo lspci | grep NVIDIA 3D controller: NV...
摘要:概覽概覽產品簡介產品優勢機型與性能深度學習指南驅動安裝指南環境配置環境配置環境配置環境配置 概覽產品簡介產品優勢機型與性能深度學習指南驅動安裝指南CentOS7環境配置Ubuntu14.04環境配置Ubuntu16.04環境配置Ubuntu18.04環境配置
摘要:概覽概覽產品簡介產品優勢機型與性能深度學習指南驅動安裝指南環境配置環境配置環境配置環境配置 概覽產品簡介產品優勢機型與性能深度學習指南驅動安裝指南CentOS7環境配置Ubuntu14.04環境配置Ubuntu16.04環境配置Ubuntu18.04環境配置
閱讀 3530·2023-04-25 20:09
閱讀 3734·2022-06-28 19:00
閱讀 3055·2022-06-28 19:00
閱讀 3074·2022-06-28 19:00
閱讀 3163·2022-06-28 19:00
閱讀 2873·2022-06-28 19:00
閱讀 3036·2022-06-28 19:00
閱讀 2631·2022-06-28 19:00