Zum Hauptinhalt springen
Dieser Inhalt ist noch nicht in Ihrer Sprache verfügbar und wird auf Englisch angezeigt.

Agent Benchmark Suite

Skill Verifiziert Aktiv

Agent skill for benchmark-suite - invoke with $agent-benchmark-suite

Zweck

To automate and enhance the performance optimization lifecycle for software systems by providing comprehensive benchmarking, regression detection, and validation capabilities.

Funktionen

  • Comprehensive benchmarking framework
  • Automated performance regression detection
  • Automated performance testing and validation
  • Integration with MCP for advanced analysis
  • CLI commands for operational control

Anwendungsfälle

  • Running performance benchmarks for new features or infrastructure changes
  • Detecting performance regressions before they impact users
  • Validating performance against Service Level Agreements (SLAs)
  • Automating performance testing as part of CI/CD pipelines

Nicht-Ziele

  • Functional testing of application logic
  • Security vulnerability scanning beyond performance-related aspects
  • End-user application support or bug fixing

Workflow

  1. Configure benchmark parameters (duration, iterations, baseline)
  2. Execute comprehensive benchmark suite or specific benchmarks
  3. Analyze benchmark results for performance metrics and trends
  4. Detect performance regressions by comparing current results with historical data
  5. Validate performance against predefined criteria (SLAs, scalability)
  6. Generate summary reports and recommendations

Praktiken

  • Performance Optimization
  • Automated Testing
  • Regression Prevention
  • Continuous Integration

Voraussetzungen

  • Claude Code environment
  • Access to MCP server (for full functionality)

Installation

npx skills add ruvnet/ruflo

Führt das Vercel skills CLI (skills.sh) via npx aus — benötigt Node.js lokal und mindestens einen installierten skills-kompatiblen Agent (Claude Code, Cursor, Codex, …). Setzt voraus, dass das Repo dem agentskills.io-Format folgt.

Qualitätspunktzahl

Verifiziert
99 /100
Analysiert about 20 hours ago

Vertrauenssignale

Letzter Commitabout 21 hours ago
Sterne50.2k
LizenzMIT
Status
Quellcode ansehen

Ähnliche Erweiterungen

Telegram Crabbox E2e Proof

100

Use when reviewing, reproducing, or proving OpenClaw Telegram behavior with a real Telegram user on Crabbox, including PR review workflows that need an agent-controlled Telegram Desktop recording, TDLib user-driver commands, Convex-leased credentials, WebVNC observation, and motion-trimmed artifacts.

Skill
steipete

Openclaw Testing

100

Choose, run, rerun, or debug OpenClaw tests, CI checks, Docker E2E lanes, release validation, and the cheapest safe verification path.

Skill
steipete

OpenClaw Release Maintainer

100

Prepare or verify OpenClaw stable/beta releases, changelogs, release notes, publish commands, and artifacts.

Skill
steipete

ClawSweeper Skill

100

Use for all ClawSweeper work: OpenClaw issue/PR sweep reports, commit-review reports, repair jobs, cloud fix PRs, @clawsweeper maintainer mention commands, trusted ClawSweeper-reviewed autofix/automerge, GitHub Actions monitoring, permissions, gates, and manual backfills.

Skill
steipete

Agent Browser

100

Browser-automatisierungs-CLI für KI-Agenten. Verwenden Sie diese, wenn der Benutzer mit Websites interagieren muss, einschließlich der Navigation auf Seiten, dem Ausfüllen von Formularen, dem Klicken auf Schaltflächen, dem Aufnehmen von Screenshots, dem Extrahieren von Daten, dem Testen von Webanwendungen oder der Automatisierung beliebiger Browseraufgaben. Auslöser sind Anfragen wie "öffne eine Website", "fülle ein Formular aus", "klicke auf eine Schaltfläche", "mache einen Screenshot", "scrappe Daten von einer Seite", "teste diese Web-App", "melde dich bei einer Seite an", "automatisiere Browser-Aktionen" oder jede Aufgabe, die eine programmatische Webinteraktion erfordert.

Skill
shanraisshan

Benchmark

100

Performance regression detection using the browse daemon. Establishes baselines for page load times, Core Web Vitals, and resource sizes. Compares before/after on every PR. Tracks performance trends over time. Use when: "performance", "benchmark", "page speed", "lighthouse", "web vitals", "bundle size", "load time". (gstack) Voice triggers (speech-to-text aliases): "speed test", "check performance".

Skill
garrytan