# Summary Autodl(Auto Deep Learning)是一个在中国比较流行的深度学习云平台,主要提供GPU算力租用服务。以下是它的主要特点: # Notes ```shell # 开梯子 source /etc/network_turbo # 清空回收站 rm -rf /root/autodl-tmp/.Trash-0/* # 使用 HuggingFace 镜像 export HF_ENDPOINT=https://hf-mirror.com export HF_HOME=/root/autodl-tmp/cache # 或者使用 ModelScope 镜像 export HF_ENDPOINT=https://modelscope. ``` ## 监控 ### 1. 在新终端监控GPU使用 ```bash # 实时监控GPU watch -n 1 nvidia-smi # 或者更详细的监控 nvidia-smi dmon -s pucvmet -d 5 ``` ### 2. 查看训练日志 ```bash # 如果有输出日志文件 tail -f outputs/training.log ``` ### 3. 检查内存使用 bash ```bash # 查看系统资源 htop ``` 1. 硬件资源: - 提供各种型号的 NVIDIA GPU(如 $3090$、$4090$、$A100$ 等) - 按小时计费的租用模式 - 可以选择不同配置的显卡和内存组合 2. 主要功能: - Jupyter Notebook 环境 - SSH 远程连接 - 常用深度学习框架预装(PyTorch, TensorFlow 等) - 数据持久化存储 - 自定义镜像部署 3. 使用场景: - 深度学习模型训练 - 大规模数据处理 - AI 研究开发 - 学术研究 4. 价格优势: - 比自建服务器成本低 - 按需付费,不使用不计费 - 经常有优惠活动和学生优惠 5. 基本使用流程: ```bash # 1. 选择实例并启动 # 2. 连接到实例(SSH或Jupyter) ssh -p <端口> root@<实例IP> # 3. 上传数据(可以用scp或者在线下载) scp -P <端口> 本地文件 root@<实例IP>:目标路径 # 4. 运行训练脚本 python train.py # 5. 下载结果 scp -P <端口> root@<实例IP>:结果文件 本地路径 ``` 6. 常见使用建议: - 使用前先估算好需要的时长和配置 - 重要数据要及时备份 - 不用时记得停止实例以节省费用 - 可以使用自动关机脚本避免超支 - 使用永久存储来保存模型和数据集 7. 替代选择: - Google Colab(免费但限制多) - AWS/GCP(功能全但价格较贵) - 阿里云/腾讯云(国内服务但价格较高) - 本地搭建(前期成本高但长期使用划算) 如果你是初学深度学习或者只是临时需要GPU算力,Autodl是一个不错的选择。它的使用门槛相对较低,价格也比较实惠。不过要注意合理规划使用时间,避免产生不必要的费用。