Analyse

12:02 Uhr, 04.03.2026

NVIDIA-Formel und wieso die Kunden weiter investieren werden

Seit vielen Quartalen hört man von allen Seiten "Nächstes Quartal ist es so weit und die Nvidia-Story ist zu Ende". Jensen Huang straft sie alle Lügen, beschleunigt das Wachstum bei Monster-Margen und KGV27e von unter 16. Der Ausblick verspricht weitere Wachstumsexplosion (ohne China). Diese Formel verstehen nur 1 %.

Valentin Schelbert

Fundamental-Analyst & Investor

Follower Folgen

Bild: © stock3 AG

Erwähnte Instrumente

ISIN: US67066G1040Kopiert
Kursstand: 180,050 $ (Nasdaq) - Zum Zeitpunkt der Veröffentlichung
VerkaufenKaufen
Schnell. Sicher. Direkt.Trading über stock3 war noch nie so einfach.
Mehr erfahren Nein, danke

NVIDIA Corp. - WKN: 918422 - ISIN: US67066G1040 - Kurs: 180,050 $ (Nasdaq)

Inference & Tokens

Inference ist der Moment, in dem ein KI-Modell arbeitet, nachdem es fertig trainiert wurde. Also wenn ChatGPT antwortet, wenn Google eine AI Overview schreibt, oder wenn ein AI Agent im Hintergrund Entscheidungen trifft. Wichtig: Inference heißt nicht automatisch LLM. Auch Empfehlungssysteme von Metas Algo. Alles, was live probabilistisch vorhersagt, ist Inference.

Tokens sind die kleinen Textbausteine, aus denen ein Modell Ein- und Ausgaben zusammensetzt. Grob: ein Token ist oft ein Wortteil. Mehr Text, mehr Tokens. Mehr Rechenarbeit, mehr Tokens. Die Reasoning (Thinking) Modelle oder Deep Research benötigen noch mehr Inference-Leistung und generieren noch mehr Tokens, da sie im Hintergrund mit sich selbst sprechen und ihre Antwort kritisch hinterfragen.

Token-Durchsatz: Wie viele Tokens pro Sekunde ein System rausdrückt.
Tokens pro Watt: Wie viele Tokens Du für eine Einheit Energie bekommst.

Das ist der Kern, weil Rechenzentren nicht unendlich Strom, Kühlung und Platz haben.

Total Cost of Ownership, TCO

TCO sind die echten Gesamtkosten, nicht nur der Chip-Preis.

Anschaffung und Abschreibung
Strom
Kühlung
Auslastung
Software, Integration, Betrieb
Zeit bis zum produktiven Einsatz

Der teuerste Chip kann die billigste Lösung sein, wenn er pro Watt und pro Rack mehr Output liefert und schneller produktiv ist.

AktienPuls360 | Fundi & Charting: Best of Both Worlds

Im AktienPuls360 habe ich mich mit Rocco Gräfe als Mann mit über 20 Jahren Erfahrung in Charttechnik zusammengeschlossen und wir kombinieren unsere Talente miteinander. Tiefes fundamentales Research & passende charttechnische Einstiege sind keine Traumvorstellung, sondern sind seit Anfang September 2024 Realität.

👉 Überzeuge Dich 14 Tage unverbindlich

1 Monat kostenlos AktienPlus + Bonusguthaben (aktuell 75 EUR)

Mit einem justTrade Depot kannst Du Aktien- & ETF-Trades optimal direkt über stock3 abbilden.

Die nahtlose Einbindung erlaubt es dir, deine Analysen ohne den Umweg über andere Apps direkt aus dem Chart heraus in Trades umzuwandeln.
Dabei profitierst Du 0 € Orderprovision (zzgl. 1 € Fremdkosten bei Aktien/ETFs).
Ein echtes Highlight ist die Auswahl zwischen drei Börsenplätzen, wodurch du dir per „Quote-Request“ stets den günstigsten Kurs sicherst.
Von über 10.000 Aktien bis hin zu echten Kryptowährungen hast Du die volle Vielfalt eines Top-Brokers direkt in deinem gewohnten Analyse-Terminal oder App zur Hand.
Dies beendet das lästige Interface-Hopping und liefert Dir die nötige Geschwindigkeit, um in volatilen Phasen den entscheidenden Klick voraus zu sein.

👉 Jetzt Depot eröffnen

Jetzt die Mechanik, die an der Börse so viel bewegt

Warum Tokens = Umsatz ?

Viele KI-Produkte verdienen Geld pro Nutzung. Und Nutzung ist oft direkt an Tokens gekoppelt.

Beispiele:

Ein Chatbot wird pro Anfrage abgerechnet. Die Anfrage erzeugt Tokens.
Eine Suchmaschine blendet eine KI-Antwort ein. Dafür laufen Modelle. Wieder Tokens.
Ein Unternehmen bietet eine API an, die nach Tokens oder nach Rechenzeit bepreist wird.

Damit rutscht Inference in die GuV-Logik:

Mehr Tokens heißt oft mehr Umsatz.
Mehr Tokens kostet aber auch mehr Strom und mehr Hardware.
Und am Ende zählt die Marge, also Tokens möglichst günstig erzeugen.

Der Engpass heißt nicht Nachfrage, sondern Energie und Fläche

Viele unterschätzen das. Der Markt denkt gerne in "wie groß wird KI". Die Realität im Datacenter ist anders, denn ...

Stromanschluss ist limitiert.
Kühlung ist limitiert.
Platz pro Rack ist limitiert.
Netzwerke und Speicher werden zum Flaschenhals.
Packaging & Memory werden zum Engpass.

Wenn Du doppelt so viele Tokens verkaufen willst (Umsatz erzielen), brauchst Du nicht nur mehr Kunden. Du brauchst mehr Token-Output pro vorhandener Infrastruktur. Warum das zu Nvidia führt?

Die Gleichung, die Jensen verkauft und die CFOs lieben

Jensen Huang argumentiert von "first principles".

Software wird token-getrieben.
Inference ist Token-Generierung.
Token-Generierung braucht Compute.
Compute steht unter Energie- und Platzlimit.
Also gewinnt, wer mehr Tokens pro Watt und mehr Tokens pro Rack liefert.

Wenn ein Kunde mit Chip A pro Watt 30 % mehr Tokens schafft als mit Chip B, kann er:

mehr Umsatz pro Stromanschluss machen
oder bei gleichem Umsatz die Kosten drücken
oder beides

Und genau da wird Chip-Architektur zu einer Bilanzkennzahl.

In der Praxis zählt aber nicht nur Peak-Leistung, sondern ob du das Gesamtsystem effizient zum Laufen bekommst:

Software-Stack und Entwickler-Ökosystem
Stabilität und Tooling
Optimierte Inference-Libraries
Skalierung über viele GPUs
Time-to-Production

Das ist der Bereich, in dem Nvidia historisch extrem stark war. Deshalb wirkt "wir stellen mal eben um" oft leichter gesagt als getan. AMD kommt nur rein, wenn man zu wenig Chips bekommt oder Preis bzw. Konditionen (AMD verschenkt Firmenanteile) so gut sind, dass der Wechsel-Aufwand kompensiert wird.

Die volle Ausgabe gibt es im AktienPuls360

👉 Überzeuge Dich 14 Tage unverbindlich

Autonome Fahrzeuge & Roboter als das nächste Token-Feld

Heute denken viele bei Tokens an Texte. Ein Roboter "denkt" in Sensordaten, Aktionsplänen, Sprache, Bildverstehen. Ein Auto verarbeitet Kameras, Radar, Planung, Entscheidungen. Das sind Inference-Workloads, nur eben nicht als Chatfenster.

Wenn diese Systeme in großen Stückzahlen laufen, wächst der Token-ähnliche Rechenbedarf massiv. Und wieder gilt: Energie ist begrenzt. Effizienz gewinnt.

Jetzt ganz einfach, für alle

Stell Dir ein KI-Modell wie eine Fabrik vor.

Tokens sind die produzierten Teile.
Inference ist die laufende Produktion.
Strom und Platz sind die Fabrikhalle und der Stromzähler.

Wenn Du Geld pro Teil verdienst, willst du:

mehr Teile pro Stunde
mit weniger Strom
in derselben Halle

Nvidia verkauft in dieser Story oft die Maschinen, die pro Steckdose am meisten Teile ausspucken. Darum fließt so viel Geld in Nvidia-Compute. Nicht weil jeder Nvidia liebt, sondern weil viele rechnen.

Fazit

Tokens sind bei vielen KI-Produkten direkt oder indirekt an Umsatz gekoppelt.
Inference skaliert nicht an Kunden allein, sondern an Strom, Kühlung und Platz.
Deshalb wird Tokens pro Watt zur entscheidenden Kennzahl.
TCO entscheidet, nicht der Listenpreis eines Chips.
Nvidia profitiert, weil es oft den besten Output pro Infrastruktur plus den reifsten Software-Stack liefert.

Den nächsten Kurstrigger stellt Nvidia bald vor - mehr im AktienPuls360

AktienPuls360 | Fundi & Charting: Best of Both Worlds

👉 Überzeuge Dich 14 Tage unverbindlich

Drei Depots mit allen Trades, tiefgründige Recherchen, das Experten-Battle Charttechnik vs. Fundamentalanalyse, tägliche Big-Picture-Einordnungen der Märkte und Live-Webinare zu DAX und US-Werten, ...

Viel Erfolg wünscht Dir Valentin

WKN	Long/Short	KO	Hebel	Laufzeit	Bid	Ask

Keine Ergebnisse gefunden

Zur Produktsuche

NVIDIA-Formel und wieso die Kunden weiter investieren werden

Erwähnte Instrumente

Inference & Tokens

Total Cost of Ownership, TCO

AktienPuls360 | Fundi & Charting: Best of Both Worlds

1 Monat kostenlos AktienPlus + Bonusguthaben (aktuell 75 EUR)

Jetzt die Mechanik, die an der Börse so viel bewegt

Warum Tokens = Umsatz ?

Der Engpass heißt nicht Nachfrage, sondern Energie und Fläche

Die Gleichung, die Jensen verkauft und die CFOs lieben

Die volle Ausgabe gibt es im AktienPuls360

Autonome Fahrzeuge & Roboter als das nächste Token-Feld

Jetzt ganz einfach, für alle

Fazit

Den nächsten Kurstrigger stellt Nvidia bald vor - mehr im AktienPuls360

AktienPuls360 | Fundi & Charting: Best of Both Worlds

Passende Produkte

Keine Kommentare

Schulterschluss für offene KI: NVIDIA, Microsoft & Co. appellieren an den US-Kongress

NASDAQ100 - KI Blase vor dem Platzen?

Chart Tracker: Nvidia, SAP, SpaceX

NVIDIA Corp – Ausbruch im zweiten Versuch?

NVIDIA - Jetzt eskaliert die Lage

Elon Musks Wette auf die totale Automatisierung

NOVO NORDISK: Long-Trade im "OS-DepotKick" bleibt auf Kurs

DAX - Niemand war darauf vorbereitet!

Investmentbank mit klarer Ansage zum Markt, Achtung!

Krypto-Wochenrückblick: Treasury-Firmen wechseln von Bitcoin zu KI

AMD-Aktie - Was geschieht da gerade ?!

Das könnte Dich auch interessieren

Passender Service

Mehr von Valentin Schelbert zu den erwähnten Instrumenten

Wenn Euch Kimi K3 als Deepseek-Moment für Ki-Aktien verkauft wird

Billigere KI-Modelle könnten den KI-Boom sogar beschleunigen

Warum eine Meldung den ganzen KI-Infrastruktur-Trade bewegt

CPO-Debatte: Lumentum und Nvidia widersprechen Verzögerungssorgen

Nvidia, SpaceX & KI-Boom: Steht der nächste Mega-Hype bevor?

KI-Aktien sind nur Hype? Nach diesem Video änderst Du Deine Meinung | AktienPuls360 ReelTalk