跳转到主要内容

Oraclaw Calibrate

技能 已验证 活跃

AI 代理的预测质量评分。Brier 分数、对数分数和多源收敛性分析。了解您的预测是否准确以及您的数据源是否一致。

目的

为 AI 代理提供精确的数学工具,用于评估其预测的准确性以及不同信息源之间的一致性。

功能

  • 评分预测准确性(Brier 分数、对数分数)
  • 分析多源一致性/收敛性
  • 检测异常数据源
  • 提供确定性的算法答案
  • 提供 MCP 服务器、REST API 和 SDK

使用场景

  • 评分过去预测的准确性
  • 检查多个数据源是否对预测达成一致
  • 找出与共识不一致的异常数据源
  • 跨不同模型比较预测质量

非目标

  • 提供预测本身
  • 执行通用的 AI 代理推理
  • 作为主要 LLM 功能的替代品

安装

npx skills add Whatsonyourmind/oraclaw

通过 npx 运行 Vercel skills CLI(skills.sh)— 需要本地安装 Node.js,以及至少一个兼容 skills 的智能体(Claude Code、Cursor、Codex 等)。前提是仓库遵循 agentskills.io 格式。

质量评分

已验证
97 /100
1 day ago 分析

信任信号

最近提交12 days ago
星标8
许可证MIT
状态
查看源代码