Inside AskData: Wie Pinecone den Token-Verbrauch um über 90 Prozent senkte

Datengetriebene Entscheidungen sind der Motor moderner Unternehmen. Doch der Weg von einer spontanen Frage zur richtigen SQL-Abfrage ist oft lang und teuer. Pinecone zeigt mit seinem internen KI-Agenten AskData, wie ein durchdachter Knowledge Layer die Token-Kosten um über 90 Prozent reduziert – bei gleichbleibender Analysequalität.

Das Problem der letzten Meile

BigQuery, dbt, Dashboards: Pinecones Datenstack folgt dem Standardmodell moderner Unternehmen. Die Pipeline funktioniert, die Tabellen sind vorhanden, doch zwischen der Geschäftsfrage und der korrekten Abfrage klafft eine Lücke. Diese letzte Meile ist kein Datenproblem, sondern ein Wissensproblem.

Die Bedeutung von Metriken wie ARR oder Pipeline-Gesundheit lebt nicht im Schema, sondern in Slack-Threads, Call-Transkripten und Analysten-Notizen. Ohne diesen Kontext werden Ad-hoc-Fragen nie gestellt oder auf Basis veralteter Zahlen beantwortet.

Von Null auf eins: Die Geburt von AskData

Der erste Ansatz vertraute auf lokale Coding-Agenten. Doch dieser Weg offenbarte schnell vier zentrale Schwächen:

Inkonsistenz: Dieselbe Frage führte zu unterschiedlichen SQL-Varianten und Ergebnissen.
Fehlende Transparenz: Ohne zentrales Wissensmanagement blieb jede Korrektur isoliert.
Kein Feedback: Es gab keine Evaluationspipeline oder Beobachtbarkeit im Betrieb.
Orientierungssteuer: Jede Sitzung startete bei Null und verbrannte tausende Tokens für den Kontextaufbau.

Der Knowledge Layer als Wendepunkt

Die Lösung lag nicht im SQL selbst, sondern in der Ebene darüber. Pinecone entwickelte eine Wissensschicht, die unstrukturierte Quellen wie Gong-Aufzeichnungen, Slack-Verläufe und dbt-Kommentare mit den strukturierten Warehouse-Daten verknüpfte.

Das Ergebnis war eine Knowledge Base von 234 Markdown-Dateien, angereichert durch einen Curator-Agenten, der Lücken identifizierte und Verbesserungen vorschlug. Drei Monate nach dem Launch beantwortete AskData 3.690 Fragen – mit einer Follow-up-Rate von 49 Prozent. Nutzer führten also tatsächlich Dialoge mit den Daten, statt nur einzelne Zahlen abzufragen.

Wenn Wachstum zur Belastung wird

Der Erfolg von V1 brachte jedoch Komplexität. Das System umfasste 22 Tools, sechs Retrieval-Oberflächen und 1.300 Zeilen Airflow-Code. Eine einzige komplexe Frage konnte 240.000 Tokens und neun Verarbeitungsschritte in Anspruch nehmen, nur um das richtige Datenmodell zu identifizieren.

Der Agent musste bei jeder Anfrage das Wissen neu zusammensetzen, statt auf eine kompilierte Semantik zuzugreifen.

Nexus: Die nächste Generation der Wissensverwaltung

Pinecone Nexus wurde als Antwort auf diese Schmerzpunkte entwickelt. Die zentrale Innovation ist ein einheitlicher Kontext-Compiler, der Informationen aus strukturierten, semi-strukturierten und unstrukturierten Quellen in einem einzigen Schritt aufbereitet.

Statt mehrerer ETL-Pipelines und manueller Pflege entstand ein adaptives System, das sich iterativ verbessert und menschliches Feedback direkt integriert.

Messbare Erfolge der Migration

Die Migration auf AskData V2 dauerte drei Wochen. Auf einem Evaluationsdatensatz von 101 Fragen erreichte das System dieselbe Genauigkeit wie V1 – bei drastisch reduzierten Kosten:

Token-Verbrauch: minus 93,7 Prozent
Verarbeitungsschritte: minus 78 Prozent
Kosten pro Frage: minus 80,2 Prozent

Im direkten Vergleich mit einer reinen Claude-Code-Session ohne Knowledge Base benötigte AskData V2 nur ein Sechzehntel der Input-Tokens.

Was die Zahlen im Detail bedeuten

Der Wechsel von sechs Retrieval-Tools auf zwei zentrale Funktionen reduzierte die Streuung der Token-Anzahl um das Vierfache. Ein einfacher Umsatz-Lookup, der in V1 noch 74.000 Tokens verbrauchte, kostete in V2 nur noch 11.000 Tokens. Der Agent erhielt statt eines 478-spaltigen Schema-JSONs einen präzisen Brief mit den exakten Spaltennamen, Filtern und Anti-Patterns.

Besonders wichtig: Unstrukturierte Daten liefern den Warum-Kontext. Während das Warehouse sagt, dass die Nutzung eines Accounts sinkt, erklären Support-Threads und Gesprächsaufzeichnungen, dass dieser Wechsel zu einer neuen Infrastruktur gesund und geplant ist.

Fazit: Weniger Code, mehr Klarheit

Die Migration auf Nexus bedeutete nicht nur neue Features, sondern vor allem rigorose Reduktion. 25.000 Zeilen Code verschwanden, der Curator-Agent wurde überflüssig, und die Handpflege der Knowledge Base endete. Was übrig blieb, ist ein schlanker, wartbarer Agent, der zeigt: Die Zukunft datengetriebener Unternehmen liegt nicht in mehr Dashboards, sondern in intelligenter Wissenskompilierung.

Quelle: https://www.pinecone.io/blog/inside-askdata/