文章目录[隐藏]
好的,没有问题。以下是一份完整的、可用于文档记录的 在 Ubuntu 24.04 (Noble Numbat) 上安装 NVIDIA CUDA Toolkit 的标准操作流程。
这份文档总结了我们之前的所有讨论,并包含了从清理错误安装到最终验证的全部步骤,确保即使在“踩过坑”的系统上也能成功安装。
文档:在 Ubuntu 24.04 上安装 NVIDIA CUDA Toolkit 指南
目标: 在运行 Ubuntu 24.04 LTS (Noble Numbat) 的系统上,正确安装 NVIDIA CUDA Toolkit,包括驱动程序、编译器和相关库。
适用场景:
- 全新安装 Ubuntu 24.04。
- 已尝试安装但因版本不匹配(如误用 Ubuntu 22.04 的包)而失败的系统。
第一步:系统准备与清理(关键步骤)
在开始之前,必须确保系统处于干净的状态,没有残留的错误配置。
卸载错误的仓库包:
如果之前错误地安装了为其他 Ubuntu 版本准备的cuda-repo
包,请用此命令彻底清除它及其配置文件。sudo dpkg -P cuda-repo-ubuntu2204-12-4-local
删除错误的 Pinning 文件:
此文件会错误地引导apt
包管理器的优先级。sudo rm /etc/apt/preferences.d/cuda-repository-pin-600
删除错误的 GPG 密钥:
移除之前为错误仓库添加的信任密钥。sudo rm /usr/share/keyrings/cuda-*-keyring.gpg
删除已下载的安装文件(可选):
释放磁盘空间。rm cuda-repo-ubuntu2204-*.deb cuda-ubuntu2204.pin
更新系统并刷新软件源缓存:
这是为了确保接下来的操作都基于系统最新的状态,并清除旧的仓库信息。sudo apt-get update sudo apt-get upgrade -y
第二步:下载并安装正确的 CUDA 仓库
现在,我们从 NVIDIA 官方获取适用于 Ubuntu 24.04 的安装文件。
下载 Pinning 优先文件:
该文件确保系统在安装时会优先选择 NVIDIA 官方的软件包,而不是 Ubuntu 自带的。wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin
将 Pinning 文件移动到指定目录:
sudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600
下载 CUDA 本地仓库安装包:
注意: 如果以下链接失效 (HTTP 404),请前往 NVIDIA CUDA 官方下载页面,选择Linux
>x86_64
>Ubuntu
>24.04
>deb (local)
获取最新的wget
命令。wget https://developer.download.nvidia.com/compute/cuda/12.5.1/local_installers/cuda-repo-ubuntu2404-12-5-local_12.5.1-1_amd64.deb
安装本地仓库包:
此命令会将 NVIDIA 的软件源信息添加到你的系统中。sudo dpkg -i cuda-repo-ubuntu2404-12-5-local_12.5.1-1_amd64.deb
导入 NVIDIA 的 GPG 密钥:
上一步安装后,系统会提示 GPG 密钥未安装。运行此命令来导入密钥,使apt
信任这个新添加的软件源。sudo cp /var/cuda-repo-ubuntu2404-12-5-local/cuda-*-keyring.gpg /usr/share/keyrings/
再次更新软件源列表:
让apt
读取到刚刚添加的 NVIDIA 新仓库中的软件包信息。sudo apt-get update
第三步:安装 CUDA Toolkit
系统现已准备就绪,可以执行核心安装命令。
- 执行安装:
此命令会自动处理依赖关系,并安装完整的 CUDA 工具包,其中已包含兼容的 NVIDIA 驱动程序。sudo apt-get -y install cuda-toolkit
第四步:配置环境变量(安装后必要步骤)
为了让系统能够在任何路径下都能调用 CUDA 的命令(如 nvcc
),需要将其路径添加到环境变量中。
将 CUDA 路径写入 Shell 配置文件:
以下命令会自动将export
语句追加到您用户~/.bashrc
文件的末尾。使用/usr/local/cuda
这个符号链接可以确保在未来升级 CUDA 版本后无需修改此配置。echo 'export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}' | sudo tee -a /etc/profile.d/cuda.sh echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' | sudo tee -a /etc/profile.d/cuda.sh
(更新:写入到
/etc/profile.d/
对系统所有用户生效,是更规范的做法。)重启系统(强烈推荐):
重启是确保新安装的 NVIDIA 驱动内核模块正确加载,并使环境变量完全生效的最可靠方法。sudo reboot
第五步:验证安装
系统重启后,打开一个新的终端,通过以下命令验证 CUDA 是否安装成功。
检查 NVIDIA 驱动和 GPU 状态:
nvidia-smi
如果成功,该命令会显示一个包含驱动版本、CUDA 版本以及 GPU 信息的表格。
检查 CUDA 编译器版本:
nvcc --version
如果成功,该命令会显示 NVIDIA CUDA 编译器 (
nvcc
) 的版本信息,表明 CUDA Toolkit 已被正确安装并且路径已配置成功。
如果以上两个命令都能返回正确信息,则表示您的 CUDA 环境已在 Ubuntu 24.04 上成功部署。