好的,这里是根据你的安装日志总结的一份完整的操作文档。你可以直接将这些内容复制保存。
CUDA 12.4 安装后修复与配置指南
本文档旨在解决使用 .run
文件安装 CUDA Toolkit 后,因未安装驱动程序(Driver)导致安装不完整的问题,并指导完成后续的环境配置和验证。
1. 问题分析
根据安装程序的输出日志:
Driver: Not Selected
Toolkit: Installed in /usr/local/cuda-12.4/
...
WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 550.00 is required...
结论是:
- 成功:CUDA 工具包(编译器
nvcc
、库文件等)已成功安装到/usr/local/cuda-12.4/
目录。 - 失败:NVIDIA 显卡驱动程序未被安装。CUDA 工具包必须依赖特定版本的驱动程序才能与 GPU 硬件通信。
- 要求:CUDA 12.4 需要版本号不低于 550.00的驱动程序。
2. 核心操作步骤
请按照以下顺序完成所有步骤。
步骤 2.1: 安装 NVIDIA 驱动
你有两种方法可以安装驱动程序,请任选一种。
方法一 (推荐): 使用 CUDA 安装包补充安装驱动
这是最直接的方法,因为安装程序已经为你提供了精确的命令。
在终端中执行以下命令:
sudo bash cuda_12.4.0_550.54.14_linux.run --silent --driver
--silent
: 以静默模式运行,不会弹出交互式菜单。--driver
: 只安装驱动程序组件,不会影响已安装的 Toolkit。
方法二 (备选): 使用系统的包管理器 (apt) 安装
对于 Ubuntu/Debian 系统,使用 apt
管理驱动更便于后续更新。
首先,检查系统推荐的驱动版本:
ubuntu-drivers devices
输出结果中会列出兼容的驱动,并标记一个为
recommended
。安装版本号为 550 或更高的推荐驱动。通常包名会是
nvidia-driver-550
。sudo apt update sudo apt install nvidia-driver-550
(如果上一步推荐的驱动包名不同,请替换成对应的包名)
步骤 2.2: 重启系统
无论使用哪种方法安装了驱动,都必须重启电脑才能使新的内核模块生效。
sudo reboot
步骤 2.3: 配置环境变量
为了让系统和终端知道在哪里找到 CUDA 的可执行文件和库文件,需要配置环境变量。
执行以下两条命令,将 CUDA 的路径添加到你用户的
.bashrc
配置文件末尾。echo 'export PATH=/usr/local/cuda-12.4/bin${PATH:+:${PATH}}' >> ~/.bashrc echo 'export LD_LIBRARY_PATH=/usr/local/cuda-12.4/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}' >> ~/.bashrc
PATH
变量用于查找可执行文件(如nvcc
)。LD_LIBRARY_PATH
变量用于查找动态链接库(.so
文件)。
让刚刚的配置在当前终端立刻生效(或者直接关闭终端再重新打开一个)。
source ~/.bashrc
3. 验证安装
完成以上所有步骤后,通过以下命令来验证整个 CUDA 环境是否配置成功。
验证驱动程序
运行nvidia-smi
命令。nvidia-smi
如果成功,你会看到一个包含 GPU信息的表格。请重点关注左上角的
Driver Version
,它应该是550.54.14
或其他 550 以上的版本。验证 CUDA Toolkit
运行nvcc --version
命令,检查 CUDA 编译器版本。nvcc --version
如果成功,你会看到 CUDA 编译器的版本信息,应显示
release 12.4
。
如果以上两条命令都返回了正确的结果,那么你的 CUDA 环境已经完整、正确地安装和配置好了。