跳转到主要内容

Safe Debug

技能 已验证 活跃

用于深度学习研究工作的可信赖的调试技能。当用户粘贴了堆栈跟踪、终端错误、CUDA OOM、检查点加载失败、形状不匹配、NaN 损失症状或训练失败,并希望在任何修补之前进行保守诊断时使用。请勿用于广泛重构、推测性适配、自动探索性修补或通用存储库熟悉。

目的

提供安全且保守的深度学习研究调试体验,确保诊断彻底,并对任何建议的代码更改进行最小化处理并获得明确批准。

功能

  • 对深度学习研究故障进行保守错误诊断
  • 将错误分类到不同类别(CUDA OOM、检查点不匹配等)
  • 建议最小化、安全的修复和恢复步骤
  • 在修补代码前需要用户明确批准
  • 输出详细的诊断和修补计划

使用场景

  • 诊断 CUDA Out Of Memory 错误
  • 分析检查点加载失败
  • 处理模型张量中的形状不匹配问题
  • 调查训练期间的 NaN 损失症状
  • 理解终端错误和堆栈跟踪

非目标

  • 执行广泛的代码库重构
  • 自动探索性修补
  • 在没有故障症状的情况下进行通用代码库熟悉
  • 推测性代码适配

安装

npx skills add lllllllama/ai-paper-reproduction-skill

通过 npx 运行 Vercel skills CLI(skills.sh)— 需要本地安装 Node.js,以及至少一个兼容 skills 的智能体(Claude Code、Cursor、Codex 等)。前提是仓库遵循 agentskills.io 格式。

质量评分

已验证
99 /100
1 day ago 分析

信任信号

最近提交5 days ago
星标75
许可证MIT
状态
查看源代码