A “tokenmaxxing” eredete és az AI ROI krízise
A „tokenmaxxing” trendje során a fejlesztők extrém mennyiségű AI-tokent égetnek el az „AI-natív” látszatért. A kialakult ROI-krízis miatt a CFO-k immár a puszta fogyasztás helyett kőkemény üzleti megtérülést követelnek.
Az AI Tájoló előző számában a rögzített havidíjas előfizetések végéről és a rejtett tokenköltségek megjelenéséről írtam. Akkor a "tokenmaxxing" kifejezést a pazarló workflow-k kontextusában említettem. A valóságban azonban a tokenmaxxing jelensége egy ennél sokkal extrémebb trend, amely a Szilícium-völgy nagy tech cégeinél ütötte fel a fejét. A kifejezés arra utal, amikor a fejlesztők szándékosan, extrém mennyiségű AI-tokent égetnek el, pusztán azért, hogy a belső statisztikákban "AI-natívnak" tűnjenek.
Nézzük meg, hogyan vezetett ez az új státuszjáték elszálló költségekhez a tech szektor legnagyobbjainál.
A Meta és az "AI-Native" státuszjáték
A tokenmaxxing egyik legkirívóbb példája a Metánál alakult ki, ahol egy "Claudeonomics" nevű belső ranglista követte nyomon mintegy 85 000 alkalmazott AI-token fogyasztását.
Az eredmény: a mérnökök elkezdték a fogyasztás maximalizálását. Egyetlen 30 napos időszak alatt a Meta alkalmazottai 60,2 billió tokent égettek el. Ez a volumen kiskereskedelmi API árakon számolva mintegy 900 millió dolláros elméleti költséget jelentett volna a cégnek a vizsgált időszakban. A vezetőség a negatív sajtóvisszhang miatt végül kénytelen volt leállítani a ranglistát.
Az Uber, ahol 4 hónap alatt kimerítették az éves AI budget-et
A használat esztelen pörgetése máshol is operatív problémákhoz vezetett. Praveen Neppalli Naga CTO bejelentése alapján az Uber mindössze négy hónap alatt felélte a vállalat teljes 2026-os éves AI költségvetését.
A cég korábban belső ranglistákkal ösztönözte és jutalmazta a dolgozókat a minél nagyobb AI-használatra, ami végül egy monumentális számlát eredményezett. A vérzés megállítására a vállalat kénytelen volt egy havi fogyasztási sapkát bevezetni az AI-használatra.
Andrew Macdonald COO nyilatkozata alapján úgy tűnik, hogy az Uber-nél egyelőre nem látják a közvetlen kapcsolatot a fejlesztői AI használat és a leszállított hasznos funkciók között.
Mi motiválta a mérnököket az őrült tokenégetésre?
A mérnököket sok esetben maguk a vállalatok kényszerítették bele ebbe a helyzetbe. A probléma gyökere az, hogy ezek a szervezetek az AI-bevezetés sikerét nem a kimeneti eredményekben, hanem a puszta fogyasztásban mérték.
- A Microsoftnál és a Salesforce-nál kifejezett minimum költési elvárásokat támasztottak a fejlesztőkkel szemben.
- Ezeknél a cégeknél asztali widgetek mutatják a dolgozók saját költését, valamint az elvárt minimumot (például heti 100 dollárt a Claude Code, és 70 dollárt a Cursor használatával a Salesforce-nál).
- A fejlesztők az elvárások miatt teljesen felesleges kérdéseket tesznek fel az AI-nak, vagy olyan funkciókhoz generáltatnak kódot, amelyeket sosem fognak élesíteni, csak hogy elérjék a token-célokat.
A CFO-k ébredése: Jön az ROI-krízis
Az AI-budget-ek gyors tempójú kimerülése kezdi ráébreszteni a döntéshozókat, hogy a puszta fogyasztás mérése nem ad képet a megtérülésről.
Talán ez a menedzser generáció nem emlékszik már arra, amikor még téma volt a szoftverfejlesztésben, hogy a programkód sorok magas száma nem jelenti azt, hogy a programozó jól teljesített? Vagy túl fiatalok, hogy emlékezzenek? Olyan régen alakult már ki a szakmai konszenzus erről a kérdésről (a 80-as években), hogy talán itt az ideje újra emlékeztetni azokat döntéshozókat, akik nem rendelkeznek komoly műszaki tapasztalattal?
Ahogy a szolgáltatók az Enterprise ügyfeleket is egyre inkább a tisztán használatalapú (token-alapú) elszámolás felé terelik (az Anthropic és az OpenAI token alapú számlázásra váltott az Enterprise ügyfeleknél 2026-ban), a fix havidíjak korlátlanságának illúziója szertefoszlik. A fejlesztői tokenégetés és a feleslegesen futtatott háttér-ágensek rejtett költségei gyorsan és kíméletlenül felhalmozódnak, a számlák pedig a pénzügyi vezetők (CFO-k) asztalán landolnak.
Ennek hatására több helyen a CFO-k elkezdik átvenni az irányítást, és szigorúan diktálni az elfogadott AI-metrikákat. A „generált kódsorok száma” vagy a szubjektív „megspórolt munkaórák” egyre több cégnél csupán súlytalan, öncélú mutatóknak (vanity metrics) számítanak, amelyeket a menedzsment már nem fogad el érvényes indoklásként. Helyettük kőkemény, költség- és profitalapú (cost-profit) mérőszámokat követelnek meg.
A vállalati AI-beszélgetéseknek sürgősen el kell mozdulniuk a "hogyan használjuk minél többet?" kérdéskörből az üzleti kimenetek szigorú mérése felé. A jövőben a tokenmaxxing helyett a kőkemény pénzügyi megtérülést és a valós, dollárban mérhető ROI-t kell majd bizonyítani az igazgatótanácsi üléseken.
Mit jelenthet ez a jövőre nézve?
Az új “tokentakarékos” használati szokások kialakítása egy teljesen új játszma lesz, hiszen az eddigi szubvencionált workflow-k egy része már biztosan nem lesz használható.
Elég ha csak megnézünk egy pár Reddit oldalt, amelyeken a fejlesztők a Github Copilot tapasztalataikról számolnak be, miután átálltak használat alapú számlázásra idén júniusban: ezeken az “Egy prompt futtatása elvitte a havi keretem felét!!!” és hasonló, frusztrációról árulkodó beszámolókkal találkozhatunk.
A valóság: nagyon kevesen voltak eddig rákényszerítve arra, hogy takarékosan bánjanak a tokenekkel. Az felhasználók nagyobb része vélhetően a token fogalmával sincs tisztában az LLM-ekkel összefüggésben.
Léteznek szoftverfejlesztői közösségek ahol elsősorban lokálisan futtatot modellekre esküsznek, de az API kulcs alapú LLM-használathoz is alakítottak ki token-takarékos workflow-kat. Érdemes lehet ezeket megkeresni már most azoknak a gyakori AI-használóknak, akik fel akarnak készülni arra az esetre, amikor a megszokott előfizetés alapú számlázás megszűnik a preferált AI-szolgáltatóknál és használat-alapúra változik.
Kérdés a hétre
Nálatok hogyan mérik az AI-eszközök használatának megtérülését? Maradtatok a szubjektív "időmegtakarítás" metrikánál, vagy már próbáljátok kemény pénzügyi mutatókhoz (hard ROI) kötni a havi előfizetések és API-költségek indoklását?
Egyáltalán érezhető már, hogy szükséges lehet valamilyen irányú elmozdulás az eddigi használati szokásoktól?
Felhasznált források és hivatkozások
- [1] The Pragmatic Engineer: The Pulse: Tokenmaxxing as a weird new trend
- [2] Kingy AI: Tokenmaxxing: Silicon Valley's Most Controversial New Status Game
- [3] ITPro: Uber’s eye-watering AI bill shows enterprises are still measuring AI success through consumption...
- [4] Cybernews: Uber spends entire 2026 AI budget in 4 months, sees no ROI