반응형
Nvidia GPU를 이용한 딥러닝 연구시 간혹가다 서버에서 gpu를 못잡고 재기동이 필요한 경우가 있다.
그런데 서버 재기동이 번거러운 환경에서 매번 재기동을 하는 경우 불편함이 있어 재기동 없이 조치하는 방법을 기록으로 남긴다.
os : Ubuntu 20
증상 : nvidia-smi시 아래와 같은 오류 발생
Failed to initialize NVML: Driver/library version mismatch
NVML library version: 535.104
적용 커맨드
- 오류 모듈 재설치
- sudo apt --fix-broken install
- nvidia 관련 모둘 재기동
- lsmod | grep nvidia
- sudo rmmod nvidia_drm
- sudo rmmod nvidia_modeset
- sudo rmmod nvidia_uvm
- sudo rmmod nvidia
- sudo modprobe nvidia
- 정상 작동확인
- nvidia-smi
오류 발생시 관련 화면 캡처를 못해 커맨드 명령어만 남긴다.
반응형
'IT' 카테고리의 다른 글
VS Code로 원격작업시 group이 적용되지 않는 경우 해결방법 (1) | 2023.10.18 |
---|---|
Excel 또는 csv파일을 Pandas을 이용하여 DB(Oracle 등)에 insert 하는 방법 (1) | 2023.10.11 |
Freesurfer를 이용한 Brain MRI 영상 처리(feat. mri_synthstrip) (0) | 2023.09.15 |
Obsidian - Github 연동 (0) | 2023.09.14 |
Langchain으로 Arxiv 문서 가져오기 (0) | 2023.08.16 |