Safe Debug
技能 已验证 活跃用于深度学习研究工作的可信赖的调试技能。当用户粘贴了堆栈跟踪、终端错误、CUDA OOM、检查点加载失败、形状不匹配、NaN 损失症状或训练失败,并希望在任何修补之前进行保守诊断时使用。请勿用于广泛重构、推测性适配、自动探索性修补或通用存储库熟悉。
提供安全且保守的深度学习研究调试体验,确保诊断彻底,并对任何建议的代码更改进行最小化处理并获得明确批准。
功能
- 对深度学习研究故障进行保守错误诊断
- 将错误分类到不同类别(CUDA OOM、检查点不匹配等)
- 建议最小化、安全的修复和恢复步骤
- 在修补代码前需要用户明确批准
- 输出详细的诊断和修补计划
使用场景
- 诊断 CUDA Out Of Memory 错误
- 分析检查点加载失败
- 处理模型张量中的形状不匹配问题
- 调查训练期间的 NaN 损失症状
- 理解终端错误和堆栈跟踪
非目标
- 执行广泛的代码库重构
- 自动探索性修补
- 在没有故障症状的情况下进行通用代码库熟悉
- 推测性代码适配
安装
npx skills add lllllllama/ai-paper-reproduction-skill通过 npx 运行 Vercel skills CLI(skills.sh)— 需要本地安装 Node.js,以及至少一个兼容 skills 的智能体(Claude Code、Cursor、Codex 等)。前提是仓库遵循 agentskills.io 格式。
质量评分
已验证类似扩展
Trajectory Review
99对失败的代理轨迹进行事后诊断。将第一个无法恢复的步骤分类为九种失败类别之一(计划遵循性、幻觉信息、无效工具调用、误读工具输出、意图-计划不匹配、意图不明确、意图不支持、护栏触发、系统故障),并生成有证据支持的根本原因报告。
Node Connect
100Diagnose OpenClaw Android, iOS, or macOS node pairing, QR/setup code, route, auth, and connection failures.
Openclaw Debugging
100Debug OpenClaw model, provider, tool-surface, code-mode, streaming, and live/Crabbox behavior by choosing the right logs, probes, and proof path before changing code.
Systematic Debugging
100Systematic debugging methodology emphasizing root cause analysis over quick fixes
Troubleshooting
100使用 Chrome DevTools MCP 和文档来排查连接和目标问题。当 list_pages、new_page 或 navigate_page 失败,或服务器初始化失败时,触发此技能。
Root Cause Tracing
99Use when errors occur deep in execution and you need to trace back to find the original trigger - systematically traces bugs backward through call stack, adding instrumentation when needed, to identify source of invalid data or incorrect behavior