AutoDL - 🎯转了码的刘公子

# Summary Autodl（Auto Deep Learning）是一个在中国比较流行的深度学习云平台，主要提供GPU算力租用服务。以下是它的主要特点： # Notes ```shell # 开梯子 source /etc/network_turbo # 清空回收站 rm -rf /root/autodl-tmp/.Trash-0/* # 使用 HuggingFace 镜像 export HF_ENDPOINT=https://hf-mirror.com export HF_HOME=/root/autodl-tmp/cache # 或者使用 ModelScope 镜像 export HF_ENDPOINT=https://modelscope. ``` ## 监控 ### 1. 在新终端监控GPU使用 ```bash # 实时监控GPU watch -n 1 nvidia-smi # 或者更详细的监控 nvidia-smi dmon -s pucvmet -d 5 ``` ### 2. 查看训练日志 ```bash # 如果有输出日志文件 tail -f outputs/training.log ``` ### 3. 检查内存使用 bash ```bash # 查看系统资源 htop ``` 1. 硬件资源： - 提供各种型号的 NVIDIA GPU（如 $3090$、$4090$、$A100$ 等） - 按小时计费的租用模式 - 可以选择不同配置的显卡和内存组合 2. 主要功能： - Jupyter Notebook 环境 - SSH 远程连接 - 常用深度学习框架预装（PyTorch, TensorFlow 等） - 数据持久化存储 - 自定义镜像部署 3. 使用场景： - 深度学习模型训练 - 大规模数据处理 - AI 研究开发 - 学术研究 4. 价格优势： - 比自建服务器成本低 - 按需付费，不使用不计费 - 经常有优惠活动和学生优惠 5. 基本使用流程： ```bash # 1. 选择实例并启动 # 2. 连接到实例（SSH或Jupyter） ssh -p <端口> root@<实例IP> # 3. 上传数据（可以用scp或者在线下载） scp -P <端口> 本地文件 root@<实例IP>:目标路径 # 4. 运行训练脚本 python train.py # 5. 下载结果 scp -P <端口> root@<实例IP>:结果文件本地路径 ``` 6. 常见使用建议： - 使用前先估算好需要的时长和配置 - 重要数据要及时备份 - 不用时记得停止实例以节省费用 - 可以使用自动关机脚本避免超支 - 使用永久存储来保存模型和数据集 7. 替代选择： - Google Colab（免费但限制多） - AWS/GCP（功能全但价格较贵） - 阿里云/腾讯云（国内服务但价格较高） - 本地搭建（前期成本高但长期使用划算）如果你是初学深度学习或者只是临时需要GPU算力，Autodl是一个不错的选择。它的使用门槛相对较低，价格也比较实惠。不过要注意合理规划使用时间，避免产生不必要的费用。