在 Ubuntu 24.04 上安装 NVIDIA CUDA Toolkit 指南

好的,没有问题。以下是一份完整的、可用于文档记录的 在 Ubuntu 24.04 (Noble Numbat) 上安装 NVIDIA CUDA Toolkit 的标准操作流程

这份文档总结了我们之前的所有讨论,并包含了从清理错误安装到最终验证的全部步骤,确保即使在“踩过坑”的系统上也能成功安装。


文档:在 Ubuntu 24.04 上安装 NVIDIA CUDA Toolkit 指南

目标: 在运行 Ubuntu 24.04 LTS (Noble Numbat) 的系统上,正确安装 NVIDIA CUDA Toolkit,包括驱动程序、编译器和相关库。

适用场景:

  • 全新安装 Ubuntu 24.04。
  • 已尝试安装但因版本不匹配(如误用 Ubuntu 22.04 的包)而失败的系统。

第一步:系统准备与清理(关键步骤)

在开始之前,必须确保系统处于干净的状态,没有残留的错误配置。

  1. 卸载错误的仓库包:
    如果之前错误地安装了为其他 Ubuntu 版本准备的 cuda-repo 包,请用此命令彻底清除它及其配置文件。

    sudo dpkg -P cuda-repo-ubuntu2204-12-4-local
  2. 删除错误的 Pinning 文件:
    此文件会错误地引导 apt 包管理器的优先级。

    sudo rm /etc/apt/preferences.d/cuda-repository-pin-600
  3. 删除错误的 GPG 密钥:
    移除之前为错误仓库添加的信任密钥。

    sudo rm /usr/share/keyrings/cuda-*-keyring.gpg
  4. 删除已下载的安装文件(可选):
    释放磁盘空间。

    rm cuda-repo-ubuntu2204-*.deb cuda-ubuntu2204.pin
  5. 更新系统并刷新软件源缓存:
    这是为了确保接下来的操作都基于系统最新的状态,并清除旧的仓库信息。

    sudo apt-get update
    sudo apt-get upgrade -y

第二步:下载并安装正确的 CUDA 仓库

现在,我们从 NVIDIA 官方获取适用于 Ubuntu 24.04 的安装文件。

  1. 下载 Pinning 优先文件:
    该文件确保系统在安装时会优先选择 NVIDIA 官方的软件包,而不是 Ubuntu 自带的。

    wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2404/x86_64/cuda-ubuntu2404.pin
  2. 将 Pinning 文件移动到指定目录:

    sudo mv cuda-ubuntu2404.pin /etc/apt/preferences.d/cuda-repository-pin-600
  3. 下载 CUDA 本地仓库安装包:
    注意: 如果以下链接失效 (HTTP 404),请前往 NVIDIA CUDA 官方下载页面,选择 Linux > x86_64 > Ubuntu > 24.04 > deb (local) 获取最新的 wget 命令。

    wget https://developer.download.nvidia.com/compute/cuda/12.5.1/local_installers/cuda-repo-ubuntu2404-12-5-local_12.5.1-1_amd64.deb
  4. 安装本地仓库包:
    此命令会将 NVIDIA 的软件源信息添加到你的系统中。

    sudo dpkg -i cuda-repo-ubuntu2404-12-5-local_12.5.1-1_amd64.deb
  5. 导入 NVIDIA 的 GPG 密钥:
    上一步安装后,系统会提示 GPG 密钥未安装。运行此命令来导入密钥,使 apt 信任这个新添加的软件源。

    sudo cp /var/cuda-repo-ubuntu2404-12-5-local/cuda-*-keyring.gpg /usr/share/keyrings/
  6. 再次更新软件源列表:
    apt 读取到刚刚添加的 NVIDIA 新仓库中的软件包信息。

    sudo apt-get update

第三步:安装 CUDA Toolkit

系统现已准备就绪,可以执行核心安装命令。

  1. 执行安装:
    此命令会自动处理依赖关系,并安装完整的 CUDA 工具包,其中已包含兼容的 NVIDIA 驱动程序。

    sudo apt-get -y install cuda-toolkit

第四步:配置环境变量(安装后必要步骤)

为了让系统能够在任何路径下都能调用 CUDA 的命令(如 nvcc),需要将其路径添加到环境变量中。

  1. 将 CUDA 路径写入 Shell 配置文件:
    以下命令会自动将 export 语句追加到您用户 ~/.bashrc 文件的末尾。使用 /usr/local/cuda 这个符号链接可以确保在未来升级 CUDA 版本后无需修改此配置。

    echo 'export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}' | sudo tee -a /etc/profile.d/cuda.sh
    echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' | sudo tee -a /etc/profile.d/cuda.sh

    (更新:写入到 /etc/profile.d/ 对系统所有用户生效,是更规范的做法。)

  2. 重启系统(强烈推荐):
    重启是确保新安装的 NVIDIA 驱动内核模块正确加载,并使环境变量完全生效的最可靠方法。

    sudo reboot

第五步:验证安装

系统重启后,打开一个新的终端,通过以下命令验证 CUDA 是否安装成功。

  1. 检查 NVIDIA 驱动和 GPU 状态:

    nvidia-smi

    如果成功,该命令会显示一个包含驱动版本、CUDA 版本以及 GPU 信息的表格。

  2. 检查 CUDA 编译器版本:

    nvcc --version

    如果成功,该命令会显示 NVIDIA CUDA 编译器 (nvcc) 的版本信息,表明 CUDA Toolkit 已被正确安装并且路径已配置成功。

如果以上两个命令都能返回正确信息,则表示您的 CUDA 环境已在 Ubuntu 24.04 上成功部署。

暂无评论

发送评论 编辑评论

|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇