如何配置一台GPU服务器多人使用?
发布时间:2023-03-15 19:24:44 来源:吴锡洪
下面是关于如何配置搭建一台GPU服务器可以提供多人使用的方法,大部分是在实验室使用的GPU服务器多些。
1、购买相关GPU服务器硬件配置:
两块或者以上的GPU,推荐的GPU是1080Ti,具有较高的性价比。要配置比较大容量的硬盘,是需要分配每个用户需要使用。需要性能比较好些的 的CPU,可以选择16核的CPU。
2、虚拟化和容器化:
为了保证分配给每一个人的环境相对独立而又互相不影响,比如有conda、python、LXC、LXD等环境使用。是以LXD为例:
安装命令如下:
sudo apt update
sudo apt install lxd
sudo apt install zfsutils-linux
3、主机的配置:
1. 查看分区,比如df, du 指令等
2. 把一个未挂载的已经格式化分区取出
如sudo fdisk /dev/sdb1
按m可以help指令
比如我取出了2TB空间用作组群使用
在选择空间时就选择+2T
选择512GB就选择+512G
3.LXD 初始化
sudo lxd init
依次选择
no
yes
yes
/dev/sdb1 (取决于初始化了哪里)
no
yes
lxdbr1
auto
auto
no
yes
yes
加入清华源为例:sudo lxc remote add tuna-images https://mirrors.tuna.tsinghua.edu.cn/lxc-images/ --protocol=simplestreams --public
4、创建容器:
sudo lxc launch tuna-images:ubuntu/18.04 zdbzuishuai
sudo lxc launch tuna-images:ubuntu/18.04 zdbzhenshuai
这样就可以创造了一个zdbzuishuai和zdbzhenshuai的容器,两个容器的位置在之前的/dev/sdb1路径里面的。
5、进入容器
sudo lxc exec test bash
就可以直接进入设置好的容器。
打开进去后,sudo apt install ssh
sudo /etc/init.d/ssh restart
ssh是为了ssh访问
修改密码:passwd ubuntu
退出:exit
5、编程
有很多用户是喜欢使用jupyter进行编程,可以把容器的8888端口映射到主机的端口,就可以先把ssh到属于需要的服务器容器,然后把jupyter打开,就可以通过主机的端口访问了。
jupyter notebook --ip 0.0.0.0
把容器的8888端口映射到主机的12345端口,就可以直接打开jupyter后,把网址的172.0.0.1:8888直接改成主机IP地址:12345。
6、jupyter notebook
conda install ipykernel
python -m ipykernel install --user --name 环境名字 --display-name "jupyter 显示的名字"
把以上设置好后,就可以在jupyter用虚拟环境后进行编程了。