Manage Token Budget
Skill Verifiziert AktivMonitor, cap, and recover from context accumulation in agentic systems. Covers per-cycle cost tracking, context window auditing, budget caps with enforcement policies, emergency pruning when approaching limits, and progressive disclosure integration to minimize token spend on routing. Use when running long-lived agent loops (heartbeats, polling, autonomous workflows), when context windows are growing unpredictably between cycles, when API costs spike beyond expected baselines, when designing new agentic workflows that need cost guardrails from the start, or when post-mortem analysis reveals a cost incident caused by context accumulation.
To control the cost and context footprint of agentic systems by implementing robust token budget management and ensuring efficient context window utilization.
Funktionen
- Per-cycle cost tracking
- Context window auditing
- Budget caps with enforcement policies
- Emergency context pruning
- Progressive disclosure for routing
Anwendungsfälle
- Running long-lived agent loops
- Managing unpredictable context growth
- Controlling API cost spikes
- Designing agentic workflows with cost guardrails
Nicht-Ziele
- Replacing core agentic system logic
- Managing external application costs outside the agent's context
- Providing a generic log analysis tool
Installation
/plugin install agent-almanac@pjt222-agent-almanacQualitätspunktzahl
VerifiziertVertrauenssignale
Ähnliche Erweiterungen
Context Mode Ops
100Verwalten Sie GitHub-Issues, PRs, Releases und Marketing mit parallelen Subagenten-Armeen im Context-Mode. Orchestriert 10-20 dynamische Agenten pro Aufgabe. Verwenden Sie dies bei der Triage von Issues, der Überprüfung von PRs, der Veröffentlichung von Versionen, dem Schreiben von LinkedIn-Posts, der Ankündigung von Releases, der Behebung von Fehlern, dem Mergen von Beiträgen, der Validierung von ENV-Variablen, dem Testen von Adaptern oder dem Synchronisieren von Branches.
Janitor Tokens
100Zeigt an, wie viele Token im Kontextfenster jede Fähigkeit verbraucht. Verwenden Sie dies, wenn der Benutzer nach Token-Kosten, Budget, Kapazität oder nach Fähigkeiten fragt, die am meisten Kontextspeicherplatz verschwenden.
Cloud Architect
100Designs cloud architectures, creates migration plans, generates cost optimization recommendations, and produces disaster recovery strategies across AWS, Azure, and GCP. Use when designing cloud architectures, planning migrations, or optimizing multi-cloud deployments. Invoke for Well-Architected Framework, cost optimization, disaster recovery, landing zones, security architecture, serverless design.
Cost Booster Route
99Route tasks through hooks_route, partition by Agent Booster availability, and report Tier 1 bypass utilization with $0 cost
Cost Benchmark
99Run the corpus benchmark — booster locally, optional Gemini/Sonnet/Opus baselines — and persist a verifiable measured-vs-claimed table
Cost Mode
99Kostensensible Claude Code-Modus. Reduziert Ausgabetokens um 40-70 % und Gesamtkosten um 30-60 %, indem prägnante Antworten, intelligentes Modell-Routing und effiziente Workflow-Muster durchgesetzt werden. Behält die volle technische Genauigkeit bei. Aktivieren Sie mit /cost-mode oder „enable cost mode“. Automatische Auslösung bei Erwähnung von Budget, Kosten, Tokens oder Ausgaben.