解决非root服务器上安装cuda和cudnn,深度学习环境的配置
创始人
2025-01-18 10:32:52
0

问题:

conda环境中安装不了cuda11.8以上的版本,然而自动下载的torch2.3.1需要cuda的版本为12.1。

再:conda中安装的cuda版本是精简版,找不到一些nvcc之类的东西。

再:服务器没有root权限,不能把整个服务器的GPU装cuda

解决方案:

1.cuda

参考:ubuntu20.04安装12.2版本的cuda_to install for cuda 12, perform the above configur-CSDN博客

去官网上下载指定版本,转移到非root权限的服务器上,安装。

1.1去官网,点击需要的版本,以12.1为例

CUDA Toolkit Archive | NVIDIA Developer

1.2选runfile版本

用deb方式安装CUDA,会附带安装显卡驱动,默认安装;

用run方式安装CUDA,会附带安装显卡驱动,可以选择不安装;

·安装命令:

sh cuda_12.2.0_535.54.03_linux.run

·输入:accept

cuda安装包是自带显卡驱动的,所以这一步按空格去掉安装显卡驱动的选项,然后选择install

对我来说,仅空格选CUDA Toolkit一项即可

-options 改安装的目录,不然会因为没有权限而失败

│ Options │

│ Driver Options │

Toolkit Options

Library install path (Blank for system default) 改为相同的自定义路径:/yangbingkun/cuda12.1 │

Done

-Toolkit Options

│ CUDA Toolkit │

Change Toolkit Install Path 改为相同的自定义路径:/yangbingkun/cuda12.1

│ [ ] Create symbolic link from /usr/local/cuda 非root用户不需要在/usr/local/cuda目录下创建符号链接

│ - [ ] Create desktop menu shortcuts 不创建桌面快捷方式

│ [ ] Yes │

│ [ ] No │

│ [ ] Install manpage documents to /usr/share/man 取消此选项,因为您不是root用户 │

Done

2.cudnn

2.1去官网,找对应cuda的版本

cuDNN Archive | NVIDIA Developer

下载:arch : x86_64对应 Local Installer for Linux SBSA (Tar) 版本

2.2解压

tar -xvf cudnn-linux-x86_64-8.9.7.29_cuda12-archive.tar.xz

2.3复制到cudatoolkit目录

cp -p /data/yangbingkun/packages/cudnn-linux-x86_64-8.9.7.29_cuda12-archive/lib/libcudnn* /data/yangbingkun/cuda-12.1/lib

cp /data/yangbingkun/packages/cudnn-linux-x86_64-8.9.7.29_cuda12-archive/include/* /data/yangbingkun/cuda-12.1/include

(实际在这里:/data/yangbingkun/cuda-12.1/targets/x86_64-linux/include/)

2.3查看cudnn的信息

cat /data/yangbingkun/cuda-12.1/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

2.5设置路径

export PATH="/data/yangbingkun/cuda-12.1/bin:$PATH" export CUDA_HOME="/data/yangbingkun/cuda-12.1" export LD_LIBRARY_PATH="/data/yangbingkun/cuda-12.1/lib64:$LD_LIBRARY_PATH"

3.anaconda

安装最新的Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

换源:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

conda config --set show_channel_urls yes

4.pytorch

把setup.py中的需求包拷贝出来,用conda安装

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 torchmetrics kornia omegaconf pytorch-lightning tqdm scikit-learn numpy matplotlib timm==0.4.12 -c pytorch -c conda-forge -c nvidia

(pytorch-cuda=12.1安装指定的cuda版本和pytorch)

ps:一些其他的源

channels:

  • defaults show_channel_urls: true default_channels:

  • SUSTech Open Source Mirrors

  • SUSTech Open Source Mirrors

  • SUSTech Open Source Mirrors

  • SUSTech Open Source Mirrors

  • SUSTech Open Source Mirrors custom_channels: conda-forge: SUSTech Open Source Mirrors msys2: SUSTech Open Source Mirrors bioconda: SUSTech Open Source Mirrors menpo: SUSTech Open Source Mirrors pytorch: SUSTech Open Source Mirrors simpleitk: SUSTech Open Source Mirrors nvidia: SUSTech Open Source Mirrors envs_dirs:

相关内容

热门资讯

第十分钟辅助!小程序边锋辅助(... 第十分钟辅助!小程序边锋辅助(辅助挂)切实存在有挂(详细辅助透视教程);1、玩家可以在小程序边锋辅助...
十分钟了解!爱玩联盟辅助软件(... 1、十分钟了解!爱玩联盟辅助软件(辅助挂)其实是有挂(详细辅助app)(UU poker、爱玩联盟辅...
详细说明"关春天凑一... 详细说明"关春天凑一桌游戏辅助器"关春天凑一桌游戏辅助器(其实存在有挂);1、上手简单,内置详细流程...
黑科技辅助挂“创思维透视下载链... 黑科技辅助挂“创思维透视下载链接”外挂透视辅助工具(总是是真的有挂)1、打开软件启动之后找到中间准星...
重大通报!wepoker辅助软... 重大通报!wepoker辅助软件(辅助挂)其实真的是有挂(详细辅助扑克教程)1、许多玩家不知道wep...
第七分钟辅助!玖天乐游辅助(辅... 第七分钟辅助!玖天乐游辅助(辅助挂)本来有挂(详细辅助曝光教程)一、玖天乐游辅助软件透明挂的定义与意...
第7分钟了解!微信小程序微乐辅... 第7分钟了解!微信小程序微乐辅助免费(辅助挂)一贯有挂(详细辅助攻略);支持2-10人实时对战,虚拟...
每日必备"凑一桌开挂... 每日必备"凑一桌开挂"凑一桌开挂(总是真的是有挂)1、凑一桌开挂系统规律教程、凑一桌开挂辅助透视等服...
黑科技辅助挂“情怀四川辅助哪里... 黑科技辅助挂“情怀四川辅助哪里可以装”外挂透视辅助器(原来有挂);1、进入游戏-大厅左侧-新手福利-...
揭秘真相!皇豪互众控制系统(辅... 揭秘真相!皇豪互众控制系统(辅助挂)起初真的是有挂(详细辅助高科技教程)是一款可以让一直输的玩家,快...