Zum Hauptinhalt springen
Dieser Inhalt ist noch nicht in Ihrer Sprache verfügbar und wird auf Englisch angezeigt.

Eval

Skill Verifiziert Aktiv
Teil von:Agenthub

Evaluate and rank agent results by metric or LLM judge for an AgentHub session.

Zweck

To provide a structured and objective way to assess the performance and quality of agent results within an AgentHub session.

Funktionen

  • Evaluate agent results by metric
  • Evaluate agent results using LLM judge
  • Support for hybrid evaluation modes
  • Rank agent results for a session
  • Update session state after evaluation

Anwendungsfälle

  • Use when comparing multiple agent runs in a session.
  • Use to objectively rank agent performance based on predefined metrics.
  • Use when qualitative assessment of agent outputs is needed to break ties or provide context.
  • Use after an agent session concludes to determine the best performing agent.

Nicht-Ziele

  • Running agent sessions themselves.
  • Modifying agent configurations or parameters.
  • Directly merging or deploying agent results.

Installation

Zuerst Marketplace hinzufügen

/plugin marketplace add alirezarezvani/claude-skills
/plugin install agenthub@claude-code-skills

Qualitätspunktzahl

Verifiziert
98 /100
Analysiert 1 day ago

Vertrauenssignale

Letzter Commit1 day ago
Sterne14.6k
LizenzMIT
Status
Quellcode ansehen

Ähnliche Erweiterungen

Context Compression

100

This skill should be used when the user asks to "compress context", "summarize conversation history", "implement compaction", "reduce token usage", or mentions context compression, structured summarization, tokens-per-task optimization, or long-running agent sessions exceeding context limits.

Skill
muratcankoylan

Horizon Track

100

Track long-horizon objectives across multiple sessions with milestone checkpoints, progress persistence, and drift detection

Skill
ruvnet

Treat

100

Bereinigen Sie aufgeblähte Sitzungen mit einer Verordnung. Entfernt Fortschrittspunkte, veraltete Lesevorgänge, doppelte Inhalte und mehr.

Skill
Ruya-AI

Guard

100

Schützen Sie Claude Code-Sitzungen vor Kontextüberlauf, indem Sie einen Hintergrund-Daemon ausführen, der die Sitzungsgröße überwacht und automatisch bereinigt, bevor die Komprimierung erreicht wird. Verwenden Sie dies, wenn der Benutzer "guard", "protect session", "context getting long", "prevent compaction", "session management" sagt oder Agententeams ausführt, die einen kontinuierlichen Kontextschutz benötigen.

Skill
Ruya-AI

Claude Handoff

100

Führen Sie /handoff aus, um Sitzungsdaten zu erfassen, und schreiben Sie dann einen phasenweisen Implementierungsplan, der darauf verweist. Erstellt Beads für die Nachverfolgung.

Skill
REMvisual

List Topics

100

Verwenden Sie dies, wenn der Benutzer nach Themen fragt, die in der aktuellen Sitzung besprochen wurden, eine Themenliste sehen möchte oder fragt, worüber gesprochen wurde.

Skill
hatawong