← ClaudeAtlas

lab-cluster-1listed

当需要在 lab cluster 1 / PJLAB 上使用开发机、rlaunch worker 或 rjob 任务时使用;覆盖交互 SSH、安全边界、路径规范、代理、CPU/GPU 分区、训练/部署、服务访问和排错,并要求使用原始 rlaunch/rjob 命令。
black-yt/skills · ★ 2 · AI & Automation · score 63
Install: claude install-skill black-yt/skills
# Lab Cluster 1 ## 文件导航 | 序号 | 文件内容概览 | 关键词 | 触发时机 | 文件路径 | | --- | --- | --- | --- | --- | | 1 | 概括开发机、CPU/GPU worker 和 rjob 的安全边界,列出禁止修改共享环境/conda/配置、不要在开发机跑重任务、必须使用原始 rlaunch/rjob、当前实测状态和提交前检查。 | lab cluster、dev host、rlaunch worker、rjob、CPU/GPU、environment safety、conda、shared config、raw commands、tested status、storage limit、no secrets | 触发本 skill 后默认读取;接触开发机/worker/rjob 前;准备跑测试、训练、部署、联网或改环境前;不确定某个操作是否会影响共享环境时读取 | `SKILL.md` | | 2 | 说明交互式 SSH 工作流和远端文件编辑边界,覆盖登录方式、域名不可用时的备用 IP 登录、后台持续终端、个人项目路径、代码/数据存放、标准 unified diff + `git apply`、`perl`/`sed` 小替换、`scp` 传输和临时文件清理。 | SSH、interactive shell、domain fallback、10.102.254.2、remote editing、project path、storage path、`git apply --check`、unified diff、`perl -0pi`、`sed -i`、`scp`、tmp cleanup、remote git repo | 登录开发机前;域名 SSH 连接失败或解析异常时;需要远端编辑文件前;本地工具无法直接改远端文件时;准备传输文件、应用 patch、小范围替换、清理临时文件或确认远端路径边界时必须读取 | [references/remote-access-and-editing.md](references/remote-access-and-editing.md) | | 3 | 记录网络和存储资源规则,覆盖开发机/CPU/GPU 节点联网差异、代理启停、`no_proxy`、公共模型/软件目录、大文件放置、缓存控制、ai4sdata/scieval 当前资源状态和历史可用性。 | proxy、network、`setup_proxy.sh`、`no_proxy`、CPU internet、GPU no internet、shared storage、model weights、HuggingFace cache、large files、ai4sdata、scieval、partition status | 需要联网下载/访问 API 前;CPU/GPU 节点网络行为不确定时;选择分区前;查模型权重/公共软件路径前;放置大文件、缓存或排查代理/407/timeout 问题时必须读取 | [references/network-storage-resources.md](references/network-storage-resources.md) | | 4 | 给出交互式 `rlaunch` CPU/GPU worker 的原始命令模板,包含资源配比、scieval/ai4sdata 分区差异、mount、启动后检查、联网测试、GPU 检查和 worker 释放边界。 |