Safe Debug

技能已验证活跃

用于深度学习研究工作的可信赖的调试技能。当用户粘贴了堆栈跟踪、终端错误、CUDA OOM、检查点加载失败、形状不匹配、NaN 损失症状或训练失败，并希望在任何修补之前进行保守诊断时使用。请勿用于广泛重构、推测性适配、自动探索性修补或通用存储库熟悉。

目的

提供安全且保守的深度学习研究调试体验，确保诊断彻底，并对任何建议的代码更改进行最小化处理并获得明确批准。

功能

对深度学习研究故障进行保守错误诊断
将错误分类到不同类别（CUDA OOM、检查点不匹配等）
建议最小化、安全的修复和恢复步骤
在修补代码前需要用户明确批准
输出详细的诊断和修补计划

使用场景

诊断 CUDA Out Of Memory 错误
分析检查点加载失败
处理模型张量中的形状不匹配问题
调查训练期间的 NaN 损失症状
理解终端错误和堆栈跟踪

非目标

执行广泛的代码库重构
自动探索性修补
在没有故障症状的情况下进行通用代码库熟悉
推测性代码适配

安装

npx skills add lllllllama/ai-paper-reproduction-skill

通过 npx 运行 Vercel skills CLI(skills.sh)— 需要本地安装 Node.js,以及至少一个兼容 skills 的智能体(Claude Code、Cursor、Codex 等)。前提是仓库遵循 agentskills.io 格式。

质量评分

已验证

99 /100

about 2 months ago 分析

信任信号

最近提交about 2 months ago

GitHub 所有者 lllllllama

星标75

许可证MIT

状态

查看源代码

类似扩展

Trajectory Review

对失败的代理轨迹进行事后诊断。将第一个无法恢复的步骤分类为九种失败类别之一（计划遵循性、幻觉信息、无效工具调用、误读工具输出、意图-计划不匹配、意图不明确、意图不支持、护栏触发、系统故障），并生成有证据支持的根本原因报告。

技能

majiayu000

Node Connect

100

Diagnose OpenClaw Android, iOS, or macOS node pairing, QR/setup code, route, auth, and connection failures.

技能

steipete

Openclaw Debugging

100

Debug OpenClaw model, provider, tool-surface, code-mode, streaming, and live/Crabbox behavior by choosing the right logs, probes, and proof path before changing code.

技能

steipete

Systematic Debugging

100

Systematic debugging methodology emphasizing root cause analysis over quick fixes

技能

bobmatnyc

Troubleshooting

100

使用 Chrome DevTools MCP 和文档来排查连接和目标问题。当 list_pages、new_page 或 navigate_page 失败，或服务器初始化失败时，触发此技能。

技能

ChromeDevTools

Root Cause Tracing

Use when errors occur deep in execution and you need to trace back to find the original trigger - systematically traces bugs backward through call stack, adding instrumentation when needed, to identify source of invalid data or incorrect behavior

技能

NeoLabHQ