确认GPU型号和操作系统版本
准备gpu驱动和CUDA软件包
在nvidia官网进行驱动包下载
GPU驱动下载链接 Linux系统均选择 Linux 64-bit、CUDA Toolkit选择最新版本
注意该版本一定要大于等于cuda软件的版本。
选择CUDA及GPU驱动版本,需同时考虑与客户程序的兼容性问题。
CUDA 11.0 建议搭配CUDA CUDA toolkit 11.0版本的GPU驱动
CUDA下载链接
选择合适的操作系统版本进行下载。
检查服务器GPU识别情况
安装GPU驱动之前需要在操作系统下查看GPU卡是否能够完全识别,如不能识别需要进行重新插拔、对调测试 步骤进行硬件排查,确保可以查看到所有的GPU
GPU驱动卸载方法:
CUDA卸载方法:
老版本卸载方法
安装gcc、g++编译器
GPU驱动安装时需要gcc编译器。
cuda安装samples测试程序进行make时需要g++,但安装cuda软件包时不需要。
CentOS 7
检查版本
软件包安装
SUSE
检查版本
软件包安装
Ubuntu
检查版本
软件包安装
软件包检查
安装kernel-devel和kernel-headers软件包
CentOS 7
Ubuntu
Ubuntu可以不安装,也可以从阿里镜像站或网易镜像站下载,需注意内核版本。
SUSE
只安装这一个即可
禁用系统自带的nouveau模块
检查nouveau模块是否加载,已加载则先禁用
CentOS 7
没有blacklist-nouveau.conf文件则创建
添加内容如下
执行如下命令使内核生效
需要重启服务器后才可真正禁用nouveau
Ubuntu
在文本最后添加以下内容:
保存退出,执行以下命令生效:
重启操作系统
修改系统运行级别为文本模式GPU驱动安装必须在文本模式下进行
CentOS 7
Ubuntu
然后ctrl+alt+F1 切换到其他字符终端窗口(F7为图形中断窗口),或者init 3
SUSE
修改id:5:initdefault:为id:3:initdefault:
重启系统后,使禁用nouveau模块配置生效并进入文本模式
1、root用户下进行GPU驱动
2、配置GPU驱动内存常驻模式
GPU驱动模式设置为常驻内存:
3、设置开机自启动
在文件中添加一行
4、赋予/etc/rc.d/rc.local文件可执行权限
若无/etc/rc.d/rc.local,也可修改
可以参考此文档
1、创建文件:
2、将下面的文字复制里面
3、创建文件:
4、赋予可执行权限
5、启动服务并设置服务开机自启动
6、重启系统后验证
没有就新建
安装完GPU驱动后,可以使用nvidia-smi命令进行GPU状态查看及相关配置。