Um das Ausmaß dieses Umbruchs zu verstehen, lohnt ein Blick auf das Fundament der Modelle: den „Token“. Er ist die Abrechnungseinheit der KI, vergleichbar mit einem Baustein aus Text oder Code. Zur Einordnung: 1.000 Tokens entsprechen etwa 750 Wörtern.
Die Verbrauchskurven haben sich im Februar 2026 gekreuzt, wie Daten von OpenRouter zeigen. Die Plattform, die weltweit mehr als 300 KI-Modelle für Entwickler bündelt, gilt inzwischen als Referenzindikator für die tatsächliche Token-Nutzung im globalen Maßstab.
Während amerikanische Modelle (OpenAI, Google, Anthropic) bei hochwertigen Anwendungen weiterhin die Nase vorn haben, hat sich die chinesische Produktion in eine klar industrielle Dimension verschoben. Laut Liu Liehong, Leiter der Nationalen Datenverwaltung, übersteigt der tägliche Token-Verbrauch in China inzwischen 140 Billionen – mehr als das Tausendfache der rund 100 Milliarden pro Tag Anfang 2024 und ein Plus von 40% gegenüber Ende 2025.
Die Welle agentischer KI
Dieser sprunghafte Anstieg ist vor allem auf den Aufstieg sogenannter Agenten zurückzuführen. Anders als klassische Chatbots sind diese Programme darauf ausgelegt, kontinuierlich spezifische Aufgaben auszuführen – etwa die Echtzeit-Optimierung von Kalendern oder das automatische Verfassen von Meeting-Protokollen. Indem sie entlang klar definierter Entscheidungsprozesse arbeiten, werden agentische Systeme zu echten Produktionswerkzeugen.
Der Skaleneffekt ist drastisch: Während die Zusammenfassung eines Textes rund 30.000 Tokens erfordert, kann eine Programmier- oder Datenanalyseaufgabe, die einem Agenten übertragen wird, laut Financial Times bis zu 20 Millionen Tokens in einer einzigen Iteration verbrauchen.
In diesem Umfeld wird der Preis pro Token zum entscheidenden Wettbewerbsfaktor. Entwickler haben das längst erkannt. Terry Zhang, ein in Hongkong tätiger Spezialist, berichtet, dass er 80% seiner Arbeitslast auf das Modell Kimi (Moonshot) verlagert hat und amerikanische Modelle nur noch für kritische Anwendungen nutzt. Der Erfolg gibt ihm recht: Seit Ende Februar belegen chinesische Modelle die ersten drei Plätze weltweit bei der Nutzung auf OpenRouter. Spitzenreiter MiniMax M2.5 verzeichnete innerhalb eines Monats ein Nutzungswachstum von 476%.
Preiskrieg: Ein Kostenunterschied von 1 zu 10 lähmt den Markt
Der zentrale Hebel bleibt der Preis. Während chinesische Modelle wie DeepSeek V3.2 oder MiniMax M2.5 zwischen 0,10 und 0,30 US-Dollar pro Million Tokens kosten, operiert die US-Konkurrenz auf einem deutlich höheren Niveau. Das Anfang März eingeführte GPT-5.4 oder Claude 4.6 Sonnet liegen zwischen 0,90 und 3 US-Dollar für Eingaben – und steigen für Ausgaben (also generierte Antworten) auf bis zu 15 US-Dollar.
Dieses Verhältnis von eins zu zehn blockiert den Markt. Konkret bedeutet das: Für den Preis einer einzelnen Antwort eines hochwertigen US-Modells kann ein Unternehmen mit chinesischen Lösungen das Zehnfache an Datenvolumen verarbeiten. Im großskaligen Einsatz wird Wettbewerb damit nahezu unmöglich.
Dieser Vorsprung ist politisch gewollt. Während der „Two Sessions“ im März 2026 – Chinas wichtigste jährliche Legislativsitzung – erklärte die Regierung die „Synergie von Rechenleistung und Strom“ zur Priorität. Laut Liu Liehong steigert die Umwandlung von Strom in KI-Dienstleistungen den Exportwert um das 22-Fache. Anders gesagt: Statt mit Stromexporten einen Dollar zu verdienen, kann China durch die Nutzung derselben Energie zur Generierung von KI-Diensten bis zu 22 Dollar erlösen.
Energie als industrieller Hebel
Diese Strategie basiert auf weitgehend fehlenden Energieengpässen: Laut SemiAnalysis hat China seit 2011 seine Stromkapazitäten um das Äquivalent des gesamten US-Stromnetzes erweitert. Effizienz tritt dabei hinter Skalierung zurück.
Ein Beispiel ist Huaweis CloudMatrix 384: Da China derzeit keine Chips auf dem Leistungsniveau von Nvidia fertigen kann, wird die Lücke durch Masse geschlossen. 384 Prozessoren werden über eine vollständig optische Architektur vernetzt. Das System erreicht eine Rechenleistung von 300 PFLOPs – nahezu doppelt so viel wie Nvidias GB200 –, allerdings bei einem 4,1-fach höheren Stromverbrauch.
In einem Land mit reichlich verfügbarer Energie wird diese Ineffizienz zur industriellen Waffe, um rekordhohe Token-Volumina zu ermöglichen. Gleichzeitig wird die Dichtheit der westlichen Hardware-Sanktionen zunehmend infrage gestellt. Hinweise auf Umgehungsstrategien bei kritischen Komponenten wie HBM-Speicher deuten auf eine gewisse Durchlässigkeit hin. In Kombination mit MoE-Architekturen (Mixture of Experts) erklärt dies die technische Tragfähigkeit dieser Massenproduktion. Das Zusammenspiel aus brachialer Skalierung und Graumarkt sichert Preise, die bis zu zehnmal unter denen des Silicon Valley liegen – allerdings um den Preis einer extrem hohen Energieintensität.
Technologische Unabhängigkeit trifft auf Zuverlässigkeitsrisiken
Die strategische Dimension bleibt entscheidend. Um im Wettbewerb zu bestehen, präsentierte Alibaba Anfang März den Prozessor XuanTie C950, gefertigt in 5-Nanometer-Technologie und speziell für KI-Agenten konzipiert. Der Chip basiert auf der offenen RISC-V-Architektur und ermöglicht es China, westliche Lizenzabhängigkeiten zu umgehen. Parallel hat der Konzern seine Strukturen im „Alibaba Token Hub“ (ATH) gebündelt, einer neuen Einheit unter der Leitung von CEO Eddie Wu.
Doch der Effizienzfokus birgt erhebliche Risiken. Im Februar 2026 geriet Knowledge Atlas Technology (Zhipu AI) – eines der sechs großen chinesischen „AI Tigers“ und erst im Januar in Hongkong an die Börse gegangen – unter dem Druck der globalen Nachfrage ins Straucheln. Die Reaktion der Investoren fiel drastisch aus: Massive Serviceeinschränkungen führten zu einem Kurssturz von rund 23% an nur einem Handelstag. Laut Financial Times wurden binnen Stunden rund 10 Milliarden US-Dollar an Börsenwert vernichtet, wie die South China Morning Post berichtet.
Dieser Vorfall, ebenso wie der ROME-Agent-Zwischenfall bei Alibaba, bei dem GPU-Leistung zum Kryptomining zweckentfremdet wurde, verdeutlicht potenzielle Sicherheits- und Stabilitätsprobleme dieser kostengünstigen Systeme.
Das strategische Ziel bleibt jedoch klar: Künstliche Intelligenz soll zu einem skalierbaren Exportgut werden – etwa über Plattformen wie Accio Work, auf denen Unternehmen operative Aufgaben an KI-Agenten delegieren können. Bei einem täglichen Verbrauch von inzwischen über 140 Billionen Tokens in China hat der Wettlauf um die Kontrolle des digitalen „Treibstoffs“ der Weltwirtschaft gerade erst begonnen.




















