Docker使用说明
一、安装docker
安装docker,参考零基础入门Docker-cuda练习场_学习赛_赛题与数据_天池大赛-阿里云天池 (aliyun.com)
windows下安装完后启动Docker Desktop,如果能正常启动,进入终端管理员,docker -v能显示版本则安装成功
安装时出现了Hyper -V报错,参考了下面的链接。
https://www.cnblogs.com/qaing123/p/11142563.html
1 | bcdedit /set hypervisorlaunchtype auto |
二、拉取镜像
可以之间拉取之前我建好的镜像
1 | 登录仓库 |
三、上传镜像
可以按照教程新创一个仓库,创建好仓库之后应该有对应的上传命令
零基础入门Docker-cuda练习场_学习赛_赛题与数据_天池大赛-阿里云天池 (aliyun.com)
1 | docker login --username=XXX registry.cn-shanghai.aliyuncs.com |
四、常用的Docker命令
1 | 列举所有镜像 |
五、Dockerfile说明
最初版本的镜像构建,Dockerfile2里
1 | FROM registry.cn-shanghai.aliyuncs.com/tcc-public/pytorch:2.0.0-py3.9.12-cuda11.8.0-u22.04 |
还需要在镜像中装apt-get install nvidia-cuda-toolkit
,进入镜像后nvcc --version
能显示版本号即可。(1.5版本已经装过了)
六、如何修改
如果想修改代码生成新的仓库,只需要改app和tmp路径下的文件,然后修改Dockerfile和build.sh即可
1 | # Dockerfile |
最后执行sh build.sh
,即可生成新镜像
程序运行的具体流程可以看日志log_local.txt
,使用registry.cn-shanghai.aliyuncs.com/bgm_chatglm/smp_chatglm:1.4
本地执行的结果。1.4在本地仿照服务器的路径创建了tcdata,其余的和1.5一样。