Analyse
12:02 Uhr, 04.03.2026

NVIDIA-Formel und wieso die Kunden weiter investieren werden

Seit vielen Quartalen hört man von allen Seiten "Nächstes Quartal ist es so weit und die Nvidia-Story ist zu Ende". Jensen Huang straft sie alle Lügen, beschleunigt das Wachstum bei Monster-Margen und KGV27e von unter 16. Der Ausblick verspricht weitere Wachstumsexplosion (ohne China). Diese Formel verstehen nur 1 %.

Erwähnte Instrumente

  • ISIN: US67066G1040Kopiert
    Kursstand: 180,050 $ (Nasdaq) - Zum Zeitpunkt der Veröffentlichung
    VerkaufenKaufen
  • NVIDIA Corp. - WKN: 918422 - ISIN: US67066G1040 - Kurs: 180,050 $ (Nasdaq)

Inference & Tokens

Inference ist der Moment, in dem ein KI-Modell arbeitet, nachdem es fertig trainiert wurde. Also wenn ChatGPT antwortet, wenn Google eine AI Overview schreibt, oder wenn ein AI Agent im Hintergrund Entscheidungen trifft. Wichtig: Inference heißt nicht automatisch LLM. Auch Empfehlungssysteme von Metas Algo. Alles, was live probabilistisch vorhersagt, ist Inference.

Tokens sind die kleinen Textbausteine, aus denen ein Modell Ein- und Ausgaben zusammensetzt. Grob: ein Token ist oft ein Wortteil. Mehr Text, mehr Tokens. Mehr Rechenarbeit, mehr Tokens. Die Reasoning (Thinking) Modelle oder Deep Research benötigen noch mehr Inference-Leistung und generieren noch mehr Tokens, da sie im Hintergrund mit sich selbst sprechen und ihre Antwort kritisch hinterfragen.

  • Token-Durchsatz: Wie viele Tokens pro Sekunde ein System rausdrückt.
  • Tokens pro Watt: Wie viele Tokens Du für eine Einheit Energie bekommst.

Das ist der Kern, weil Rechenzentren nicht unendlich Strom, Kühlung und Platz haben.

Total Cost of Ownership, TCO

TCO sind die echten Gesamtkosten, nicht nur der Chip-Preis.

  • Anschaffung und Abschreibung
  • Strom
  • Kühlung
  • Auslastung
  • Software, Integration, Betrieb
  • Zeit bis zum produktiven Einsatz

Der teuerste Chip kann die billigste Lösung sein, wenn er pro Watt und pro Rack mehr Output liefert und schneller produktiv ist.

AktienPuls360 | Fundi & Charting: Best of Both Worlds

Im AktienPuls360 habe ich mich mit Rocco Gräfe als Mann mit über 20 Jahren Erfahrung in Charttechnik zusammengeschlossen und wir kombinieren unsere Talente miteinander. Tiefes fundamentales Research & passende charttechnische Einstiege sind keine Traumvorstellung, sondern sind seit Anfang September 2024 Realität.

👉 Überzeuge Dich 14 Tage unverbindlich

1 Monat kostenlos AktienPlus + Bonusguthaben (aktuell 75 EUR)

Mit einem justTrade Depot kannst Du Aktien- & ETF-Trades optimal direkt über stock3 abbilden.

  • Die nahtlose Einbindung erlaubt es dir, deine Analysen ohne den Umweg über andere Apps direkt aus dem Chart heraus in Trades umzuwandeln.
  • Dabei profitierst Du 0 € Orderprovision (zzgl. 1 € Fremdkosten bei Aktien/ETFs).
  • Ein echtes Highlight ist die Auswahl zwischen drei Börsenplätzen, wodurch du dir per „Quote-Request“ stets den günstigsten Kurs sicherst.
  • Von über 10.000 Aktien bis hin zu echten Kryptowährungen hast Du die volle Vielfalt eines Top-Brokers direkt in deinem gewohnten Analyse-Terminal oder App zur Hand.
  • Dies beendet das lästige Interface-Hopping und liefert Dir die nötige Geschwindigkeit, um in volatilen Phasen den entscheidenden Klick voraus zu sein.

👉 Jetzt Depot eröffnen

Jetzt die Mechanik, die an der Börse so viel bewegt

Warum Tokens = Umsatz ?

Viele KI-Produkte verdienen Geld pro Nutzung. Und Nutzung ist oft direkt an Tokens gekoppelt.

Beispiele:

  • Ein Chatbot wird pro Anfrage abgerechnet. Die Anfrage erzeugt Tokens.
  • Eine Suchmaschine blendet eine KI-Antwort ein. Dafür laufen Modelle. Wieder Tokens.
  • Ein Unternehmen bietet eine API an, die nach Tokens oder nach Rechenzeit bepreist wird.

Damit rutscht Inference in die GuV-Logik:

  • Mehr Tokens heißt oft mehr Umsatz.
  • Mehr Tokens kostet aber auch mehr Strom und mehr Hardware.
  • Und am Ende zählt die Marge, also Tokens möglichst günstig erzeugen.

Der Engpass heißt nicht Nachfrage, sondern Energie und Fläche

Viele unterschätzen das. Der Markt denkt gerne in "wie groß wird KI". Die Realität im Datacenter ist anders, denn ...

  • Stromanschluss ist limitiert.
  • Kühlung ist limitiert.
  • Platz pro Rack ist limitiert.
  • Netzwerke und Speicher werden zum Flaschenhals.
  • Packaging & Memory werden zum Engpass.

Wenn Du doppelt so viele Tokens verkaufen willst (Umsatz erzielen), brauchst Du nicht nur mehr Kunden. Du brauchst mehr Token-Output pro vorhandener Infrastruktur. Warum das zu Nvidia führt?

Die Gleichung, die Jensen verkauft und die CFOs lieben

Jensen Huang argumentiert von "first principles".

  • Software wird token-getrieben.
  • Inference ist Token-Generierung.
  • Token-Generierung braucht Compute.
  • Compute steht unter Energie- und Platzlimit.
  • Also gewinnt, wer mehr Tokens pro Watt und mehr Tokens pro Rack liefert.

Wenn ein Kunde mit Chip A pro Watt 30 % mehr Tokens schafft als mit Chip B, kann er:

  • mehr Umsatz pro Stromanschluss machen
  • oder bei gleichem Umsatz die Kosten drücken
  • oder beides

Und genau da wird Chip-Architektur zu einer Bilanzkennzahl.

In der Praxis zählt aber nicht nur Peak-Leistung, sondern ob du das Gesamtsystem effizient zum Laufen bekommst:

  • Software-Stack und Entwickler-Ökosystem
  • Stabilität und Tooling
  • Optimierte Inference-Libraries
  • Skalierung über viele GPUs
  • Time-to-Production

Das ist der Bereich, in dem Nvidia historisch extrem stark war. Deshalb wirkt "wir stellen mal eben um" oft leichter gesagt als getan. AMD kommt nur rein, wenn man zu wenig Chips bekommt oder Preis bzw. Konditionen (AMD verschenkt Firmenanteile) so gut sind, dass der Wechsel-Aufwand kompensiert wird.

Die volle Ausgabe gibt es im AktienPuls360

👉 Überzeuge Dich 14 Tage unverbindlich

Autonome Fahrzeuge & Roboter als das nächste Token-Feld

Heute denken viele bei Tokens an Texte. Ein Roboter "denkt" in Sensordaten, Aktionsplänen, Sprache, Bildverstehen. Ein Auto verarbeitet Kameras, Radar, Planung, Entscheidungen. Das sind Inference-Workloads, nur eben nicht als Chatfenster.

Wenn diese Systeme in großen Stückzahlen laufen, wächst der Token-ähnliche Rechenbedarf massiv. Und wieder gilt: Energie ist begrenzt. Effizienz gewinnt.

Jetzt ganz einfach, für alle

Stell Dir ein KI-Modell wie eine Fabrik vor.

  • Tokens sind die produzierten Teile.
  • Inference ist die laufende Produktion.
  • Strom und Platz sind die Fabrikhalle und der Stromzähler.

Wenn Du Geld pro Teil verdienst, willst du:

  • mehr Teile pro Stunde
  • mit weniger Strom
  • in derselben Halle

Nvidia verkauft in dieser Story oft die Maschinen, die pro Steckdose am meisten Teile ausspucken. Darum fließt so viel Geld in Nvidia-Compute. Nicht weil jeder Nvidia liebt, sondern weil viele rechnen.

Fazit

  • Tokens sind bei vielen KI-Produkten direkt oder indirekt an Umsatz gekoppelt.
  • Inference skaliert nicht an Kunden allein, sondern an Strom, Kühlung und Platz.
  • Deshalb wird Tokens pro Watt zur entscheidenden Kennzahl.
  • TCO entscheidet, nicht der Listenpreis eines Chips.
  • Nvidia profitiert, weil es oft den besten Output pro Infrastruktur plus den reifsten Software-Stack liefert.

Den nächsten Kurstrigger stellt Nvidia bald vor - mehr im AktienPuls360

AktienPuls360 | Fundi & Charting: Best of Both Worlds

👉 Überzeuge Dich 14 Tage unverbindlich

Im AktienPuls360 habe ich mich mit Rocco Gräfe als Mann mit über 20 Jahren Erfahrung in Charttechnik zusammengeschlossen und wir kombinieren unsere Talente miteinander. Tiefes fundamentales Research & passende charttechnische Einstiege sind keine Traumvorstellung, sondern sind seit Anfang September 2024 Realität.

Drei Depots mit allen Trades, tiefgründige Recherchen, das Experten-Battle Charttechnik vs. Fundamentalanalyse, tägliche Big-Picture-Einordnungen der Märkte und Live-Webinare zu DAX und US-Werten, ...


Viel Erfolg wünscht Dir Valentin

Passende Produkte

WKN Long/Short KO Hebel Laufzeit Bid Ask
Keine Ergebnisse gefunden
Zur Produktsuche

Keine Kommentare

Du willst kommentieren?

Die Kommentarfunktion auf stock3 ist Nutzerinnen und Nutzern mit einem unserer Abonnements vorbehalten.

  • für freie Beiträge: beliebiges Abonnement von stock3
  • für stock3 Plus-Beiträge: stock3 Plus-Abonnement
Zum Store Jetzt einloggen