ubuntu 22.10 安装 Rocm

发布于 2023-04-02  86 次阅读


novelai官方只支持NVIDIA cuda,但我看不惯老黄的做法,用的amd显卡,说的就是一个便宜皮实,但amd用不了cuda怎么办呢?还好,amd自己有cuda的转义层Rocm,可以让amd显卡ntr cuda的程序,哈哈哈哈

一、我的配置

CPU: AMD R5 5600x

GPU: Radeon 6600

System: Ubuntu 22.10 (理论上20.04也可以用,未测试)

最好使用python 3.10+

二、安装AMD Rocm

最好先给apt配置好代理,否则国内会很慢,可以参考这一篇文章三种方式给apt设置代理 - 俺踏月色而来 - 博客园

不要从amd官网直接下载驱动!!!!!!!

否则会出现如下bug

有一些软件包无法被安装。如果您用的是 unstable 发行版,这也许是

因为系统无法达到您要求的状态造成的。该版本中可能会有一些您需要的软件

包尚未被创建或是它们已被从新到(Incoming)目录移出。

下列信息可能会对解决问题有所帮助:

下列软件包有未满足的依赖关系:

rocm-llvm : 依赖: python 但无法安装它

依赖: libstdc++-5-dev 但无法安装它 或

libstdc++-7-dev 但无法安装它

依赖: libgcc-5-dev 但无法安装它 或

libgcc-7-dev 但无法安装它

推荐: gcc-multilib 但是它将不会被安装

推荐: g++-multilib 但是它将不会被安装

E: 无法修正错误,因为您要求某些软件包保持现状,就是它们破坏了软件包间的依赖关系。

应当直接使用如下命令下载特定版本

wget https://repo.radeon.com/amdgpu-install/5.3/ubuntu/jammy/amdgpu-install_5.3.50300-1_all.deb

你可能会问为什么是jammy,这不是2004吗?“啪!”,问那么多干啥,问就是rocm没有官方支持2210,不过2004也可以通用(可见科技以换皮为本(笑)

用apt安装好后安装Rocm 5.3

sudo apt-get install ./amdgpu-install_5.3.50300-1_all.deb
sudo amdgpu-install --usecase=rocm,hip,mllib --no-dkms

然后添加账户

# 该命令现定于ubuntu,linux mint等请自行查找
sudo usermod -a -G video $LOGNAME
sudo usermod -a -G render $LOGNAME

于是,rocm就安装好了

装gpu驱动直至终端中输入rocm-smi后正常输出才算完成!

如果你觉得需要,可以把rocm性能设置为高

sudo rocm-smi --setperflevel high

如果还是有,你也可以参考这篇文章 RX 6700s for Machine Learning using ROCm 5.2.3 | videogames.ai

三、安装pytorch Rocm版本

pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/rocm5.2/

你可能又要问,我明明装的是rocm5.3,为什么这是5.2?问那么多干啥,运行就完了(其实我也想问。。。)别自作聪明改成rocm5.3,没有这个仓库,然后就会自动安装cuda版本的

End