使用AWS EC2进行AI训练进行显卡驱动配置

慈云数据 1年前 (2024-03-18) 技术支持 69 0

首先创建EC2实例选择P类型或者G类型

以下是EC2实例对应的N卡产品类型和系列,可以通过这个在官网上找到对应的驱动进行手动驱动安装

官方链接:官方驱动 | NVIDIA

创建完成登录远程ssh连接至服务器

连接以后安装gcc和make

sudo  apt-get install gcc make -y

 更新软件包缓存并获取实例软件包更新

sudo apt-get update -y

 升级 linux-aws 程序包以接收最新版本

 sud重启实例以加载最新内核版本

 重启实例以加载最新内核版本

sudo reboot

 重新连接实例

添加NVIDIA PPA

sudo add-apt-repository ppa:graphics-drivers/ppa

sudo apt-get update

为当前运行的内核版本安装 gcc 编译器和内核标头软件包

sudo apt-get install -y gcc make linux-headers-$(uname -r)

 禁用 NVIDIA 显卡的 nouveau 开源驱动程序以免与NVIDIA官方驱动可能不兼容

 将 nouveau 添加到 /etc/modprobe.d/blacklist.conf 黑名单文件

cat

微信扫一扫加客服

微信扫一扫加客服