修復 V100 驅動不匹配問題

2021-02-24 深度覺醒

最近打比賽,登錄 V100 的訓練環境,突然發現沒法用 cuda 了,記錄一下修復過程。

顯示 Failed to initialize NVML: Driver/library version mismatch

1. 查詢原因

查詢一下內核版本:

cat /proc/driver/nvidia/version

查詢硬體

lspci | grep -i nvidia

看來硬體沒有什麼問題,主要原因是由於ubuntu自動更新驅動的關係,顯卡驅動被升級為

nvidia-driver-460 (460.32.03-0ubuntu0.18.04.1) 造成的不匹配。

2. 卸載驅動
sudo apt-get purge nvidia*


3. 查找可用的驅動版本
ubuntu-drivers devices

這裡可見最新的驅動為nvidia-driver-460,標記為推薦,自動更新會與我們安裝的深度學習環境衝突。

4. 安裝450版本驅動

要選擇匹配核心版本455.38的驅動,這裡安裝nvidia-driver-450-server版本。

sudo apt-get install nvidia-driver-450-server nvidia-settings nvidia-prime

5. 重啟生效

驅動安裝後不會立即生效,必須要重啟一下伺服器。

sudo reboot

6. 修復成功

查詢 nvcc版本

nvcc -V

查看驅動

nvidia-smi

驅動修復正常了!

7. 測試訓練環境

測試一下pytorch的環境,跑一下mmdetection代碼

conda activate open-mmlab

import torch
torch.cuda.is_available()

8. 保持驅動

為了防止下次ubuntu再自動更新,可以設置驅動保持。

sudo apt-mark hold nvidia-driver-450-server

搞定,這樣下次作業系統就不會無腦自動更新顯卡驅動了。

相關焦點

  • N卡熱修復驅動發布 修復《漫威復仇者聯盟》卡頓問題
    N卡熱修復驅動發布 修復《漫威復仇者聯盟》卡頓問題 時間:2020-12-22 09:20:39 來源:wccftech
  • NVIDIA放出驅動 修復顯卡能被彈出的問題
    NVIDIA放出驅動 修復顯卡能被彈出的問題 2016年02月03日 11:06作者:strike編輯:孫斌        NVIDIA在上周發布了
  • 修復藍屏問題 Intel核芯顯卡新版驅動更新
    Intel核芯顯卡驅動最近動作頻頻,不僅僅大幅提高了遊戲性能,更新密度也增加了不少,連不常更新的XP系統驅動這兩個月也是連續更新。日前,Intel發布了核芯顯卡在XP系統下的新版驅動14.46.7.5384版,顯示驅動版本6.14.10.5384版,HDMI音頻驅動版本5.14.00.3074版,更新內容如下:— 修復如果在Windows XP登錄界面前打開主顯示器,Intel高清圖形顯卡將無法檢測DisplayPort顯示器的問題。
  • 英偉達顯卡驅動417.58發布:修復黑屏問題
    IT之家12月29日消息 英偉達顯卡驅動GeForce Hotfix Driver Version 417.58現已發布,主要是修復了 417.xx版本驅動導致顯示器喚醒時黑屏的問題。英偉達顯卡驅動GeForce Hotfix Driver Version 417.58修復了以下問題:某些使用DP接口的顯示器從休眠狀態恢復時出現黑屏Windows 7:遊戲中G-sync與V-sync一起使用時FPS下降《古墓麗影:暗影》:修復了DirectX 12模式下偶爾的應用程式崩潰問題144Hz刷新率的BenQ XL2730顯示器上的黑屏問題微星 GT83筆記本電腦從睡眠狀態恢復時的黑屏問題點擊相應的連結下載驅動程序
  • Intel Iris/HD驅動下載:修復啟動問題
    Intel發布了新版Iris和HD顯卡驅動更新,版本號為20.19.15.4424。本次更新修復了Win10下的啟動問題,解決了某些DX9遊戲全屏無法狀態下無法旋轉的問題,還修復了《最終幻想13》《戰地4》等遊戲具體問題。
  • Intel發布Wi-Fi驅動更新:修復Win10藍屏問題
    Intel本周發布了Wi-Fi驅動更新,版本號為21.120.0,修復了多個問題,包括導致Windows 10藍屏(BSOD)的問題,改善了系統以及無線連接的性能。
  • NVIDIA 364.51 Beta驅動發布 修復藍屏問題
    然而諸多用戶在更新驅動的過程中出現了藍屏問題,官方在今日快速應對,放出了全新的364.51Beta驅動,主要就是修復此前出現的藍屏問題。 NVIDIA 365.51 Beta驅動修復藍屏問題   出現問題的小夥伴可點擊連結下載NVIDIA 364.51Beta驅動
  • 英特爾發布無線驅動更新:增強穩定性 修復藍屏問題
    如果驅動程序出現損壞或者過時情況,那麼就可能導致崩潰和穩定性問題。近日,英特爾發布了適用於 Windows 10 的無線驅動程序更新,以修復系統崩潰並提高系統和無線連接的性能。此外,英特爾也修復了由英特爾無線驅動本身引起的藍屏問題。
  • NVIDIA修復了GeForce 436.02驅動安裝包的問題
    本文轉自超能網昨天NVIDIA發布了一個比較重大的顯卡驅動更新,在部分遊戲裡面給自家顯卡做了比較大的優化,另外就是帶來了許多新的功能
  • 可選更新KB4568831發布:修復Realtek驅動等諸多問題
    本次可選更新修復了大量 BUG,包括修復藍牙 Realtek 驅動程序同時連接滑鼠、鍵盤或耳機等多個設備的問題,還重新啟用了對英特爾 iGPU 可變刷新率的支持。本次可選更新,微軟修復了大量錯誤,修復了文件管理器使用 UWP 應用程式時意外崩潰的問題。此外,微軟正在恢復從文件資源管理器搜索欄中刪除以前的搜索項目的選項。本次更新中,修復了在安裝 Outlook 的時候,文件資源管理器無法渲染 .msg 文件預覽的問題。微軟還在解決微軟 Word 和 Excel 的問題。
  • Intel發布Wi-Fi驅動更新:修復Windows 10藍屏問題
    Intel本周發布了Wi-Fi驅動更新,版本號為21.120.0,修復了多個問題,包括導致Windows 10藍屏(BSOD)的問題,改善了系統以及無線連接的性能。英特爾無線驅動21.120.0更新列表:--由英特爾無線驅動引起的藍屏問題--當你在玩遊戲時啟用Windows 10移動熱點時導致的藍屏--當重新啟動設備時出現的藍屏--有Modern Standby的系統遇到的藍屏
  • 被憤的玩家怒罵怕了,AMD承諾修復DX9驅動崩潰問題
    面對玩家的抱怨,AMD官方日前表示由於人力資源有限,他們沒法給這些舊遊戲再開發驅動支持了,一副我就是不管了的態度。這樣的表態後果可想而知,AMD顯卡用戶被瘋狂激怒了,面對這樣的情況,AMD也不得不出來自己打臉——承諾修復DX9下的驅動崩潰問題。
  • 適用於Windows 10的Intel GPU驅動更新:修復問題
    英特爾今天發布了適用於 Windows 10 系統的新版 Universal Windows Driver (UWD) 圖形驅動,也就是聲明性組件化硬體支持的應用程式(DCH)驅動。在今天發布的 27.20.100.9097 版本中,對部分遊戲進行了優化。
  • 修復驅動停止響應問題 Intel發布14.46.9.5394版顯卡驅動-英特爾...
    大家在使用電腦的時候是否都出現過顯示驅動停止響應問題?這似乎已經成為了顯卡上最普遍的問題,無論你的作業系統是WinXP、Vista還是Win7,無論NVIDIA、AMD還是Intel顯卡都存在此類問題。
  • 當安裝Win10預覽版出現了網卡驅動問題,驅動哥教你如何解決!
    雖然Win10預覽版系統會自帶部分電腦驅動,但並不一定和你的電腦匹配,比較常見的就是網卡驅動問題,下面小編就教大家如何來解決這個網卡驅動問題。 當Win10系統的網卡驅動出現問題時,一般會有如下症狀: 1. 電腦桌面右下角,電腦圖標出現了比如紅色X。 2. 進入設備管理器中沒有網適配器,且黃色的感嘆號設備也沒有。 3.
  • 英偉達發布驅動熱更新 這5大問題已被修復
    英偉達發布驅動熱更新 這5大問題已被修復 來源:IT之家 • 2020-12-21 10:53:36 就在本月 15 日
  • AMD發布Adrenalin 驅動:再次修復RX 5700黑屏問題
    發布9個月了,RX 5700系列的黑屏問題徹底解決了沒?好像並沒有,好消息是AMD一直在修復,日前又推出了Radeon Software Adrenalin 20.4.2 Optional驅動,除了黑屏bug修復之外,還優化了《戰爭機器 戰略版》和《鐵血戰士:狩獵場》兩款遊戲。
  • NVIDIA發布Hotfix驅動:緊急修復光追開啟性能下降問題
    NVIDIA前不久才發布了GeForce 452.06驅動,這是個Game Ready驅動,日前又緊急推出了GeForce 452.22 hotfix驅動,修復了開啟光追導致性能間歇性下降的問題。修復的內容不多,主要是遊戲及兼容性問題,具體如下:NVIDIA Geforce Game Ready Driver顯卡DCH驅動452.22 Hotfix版For Win10-64昨日,NVIDIA在社區論壇放出了一款新的熱修版驅動,版本號452.22,在452.06版的基礎上,修復了如下
  • 速報:NVIDIA修復了GeForce 436.02驅動安裝包的問題
    ,不過NVIDIA方面在今天就修復了這個bug,大家可以放寬心更新驅動了。小編做了一個測試,可以看到修復後的顯卡驅動安裝選項中,GeForce Experience前面的框確實不再是灰色不可取消的狀態了。
  • NV發布430.53顯卡驅動 修復CPU佔用過高等問題
    NV在發布移動版GTX 1660 Ti/1650顯卡以及桌面版1650顯卡的同時放出了430.39版驅動,對新卡提供支持,同時新驅動還支持Windows 10 v1903更新版本,並繼續優化遊戲、消除Bug。