低端主机 Ubuntu22.4 配置

低端主机 Ubuntu22.4 配置

配置

AMD处理器a8 9600 华硕主板a320m 四代内存条ddr4 8g 2666 独显4g显卡索泰gtx1050ti 影驰120固态硬盘 机箱电源

Ubuntu 22.04.4 LTS

Nvidia 驱动

问题:没有安装显卡驱动,表现:nvidia-smi得不到输出

nvidia-smi

处理

卸载原有的nvidia的驱动:

sudo apt-get autoremove --purge nvidia-*  # 这一个就行
sudo apt-get --purge remove nvidia*
sudo apt-get --purge remove "*nvidia*"
sudo apt-get --purge remove "*cublas*" "cuda*"
sudo apt autoremove

输入之后就能发现nvidia-smi命令不可以使用了,证明显卡驱动卸载成功!

查看显卡支持的驱动版本:

ubuntu-drivers devices

因为内核比较新,直接选择最新的,安装nvidia535驱动:

sudo apt install nvidia-driver-535
sudo reboot # 重启生效

然后通过 nvidia-smi 命令可以查看有没有应用在使用NAVIDIA显卡驱动。

参考:Linux(Ubuntu20.4)系统安装nvidia450驱动+pytorch1.8.1+cuda10.2+cudnn7.6.5教程详解

其他

QQ;VScode;Anaconda:Anaconda3-2024.02-Linux-x86_64

bash Anaconda3-2024.02-1-Linux-x86_64.sh # 不要sudo

Pytorch

conda create -n py39-torch python=3.9

https://pytorch.org/get-started/previous-versions/ 寻找合适的nvidia-smi显示的更低的CUDA版本以及对应的Pytorch等。

conda activate py39-torch
conda install pytorch==2.1.0 torchvision==0.16.0 torchaudio==2.1.0 pytorch-cuda=12.1 -c pytorch -c nvidia

测试:

import torch

# 检查PyTorch版本
print("PyTorch version:", torch.__version__)

# 检查CUDA是否可用
if torch.cuda.is_available():
    print("CUDA is available. 🚀")
    # 获取当前CUDA设备的名称,通常是你的GPU的名称
    print("CUDA Device Name:", torch.cuda.get_device_name(0))
    # 创建一个简单的Tensor并移动到GPU上
    tensor = torch.tensor([1.0, 2.0, 3.0]).cuda()
    print("A tensor in CUDA:", tensor)
else:
    print("CUDA is not available. Please check your installation.")

期望输出:

PyTorch version: 2.1.0 CUDA is available. 🚀 CUDA Device Name: NVIDIA GeForce GTX 1050 Ti A tensor in CUDA: tensor([1., 2., 3.], device='cuda:0')