Analyse
08:34 Uhr, 26.03.2026

MICRON – Aktie fällt wegen TurboQuant? Vor einem Jahr ...

Die Marktreaktion auf Googles TurboQuant wird nicht nur von mir, aber auch von zahlreichen Speicherchip-Experten als überzogen dargestellt. So beruht der Abverkauf bei Speicherwerten wie SanDisk oder Micron auf einer Fehlinterpretation der Relevanz dieser Entwicklung.

Erwähnte Instrumente

  • ISIN: US5951121038Kopiert
    Kursstand: 382,090 $ (Nasdaq) - Zum Zeitpunkt der Veröffentlichung
    VerkaufenKaufen

    Schnell. Sicher. Direkt.Trading über stock3 war noch nie so einfach. 

    Mehr erfahren Nein, danke
  • Micron Technology Inc. - WKN: 869020 - ISIN: US5951121038 - Kurs: 382,090 $ (Nasdaq)

Einfach gesagt geht es bei TurboQuant nicht darum, dass plötzlich viel weniger Speicherchips gebraucht werden, sondern darum, dass ein KI-Modell mit dem vorhandenen Speicher effizienter umgehen kann. Genau wie bei Deepseek gilt Jevons Paradoxon.

Was ist KV-Cache?

KV-Cache ist eine Art Kurzzeitgedächtnis eines Sprachmodells. Darin speichert das Modell laufend Informationen aus dem bisherigen Gespräch oder Text, damit es beim nächsten Wort noch weiß, was vorher gesagt wurde. Das meine ich auch, wenn ich von Kontext-Fenster spreche. Dieser Zwischenspeicher braucht Platz im Arbeitsspeicher, besonders bei langen Eingaben und großen Modellen.

TurboQuant ist nun eine Methode, um diese gespeicherten Informationen platzsparender abzulegen.

Gavin Baker

AktienPuls360 bekommt ab sofort eine klarere Struktur

Mit dem Update wird das Angebot in drei spezialisierte Depots aufgeteilt. Neu hinzu kommt ein zweites Depot von mir, damit kurzfristige Einzelaktien-Trades künftig getrennt von meinen langfristigen Investments umgesetzt werden können. In der derzeitigen Marktlage läuft das kurzfristige Trading hervorragend. Seit Juni 2025 sind es 187 % - das kann ich nun endlich auch abbilden. Im Gegenzug wird das bisherige Gemeinschaftsdepot „360 Top Picks“ eingestellt.

Künftig gibt es damit mein kurzfristiges Depot für taktische Aktien-Trades, mein langfristiges Depot mit fundamentalem Fokus und monatlicher Einzahlung von 1.000 Euro sowie Roccos Depot mit klarem Fokus auf chartbasierte Trades.

Zusätzlich führt das Update eine neue Empfehlungsliste ein. Setups, die noch nicht im Depot liegen, werden nun zentral an einem Ort gesammelt. Auch die Analysen werden neu gegliedert. Unter „Beiträge“ gibt es ab sofort getrennte Reiter für Chartanalysen und Fundamentalanalysen. Die ersten Trades im neuen Depot wurden bereits getätigt.

Weniger Puls, mehr Klarheit & Weitsicht an der Börse. Mehr Struktur, weniger Bauch, 2026 so richtig mit dem Traden & Investieren beginnen! Wir helfen dir dabei. Mit uns bist Du immer am Puls der Märkte.

👉 AktienPuls360, jetzt für maximal 2,58 EUR am Tag testen und den Content von Valentin und Rocco "genüßlich" aufsaugen.


Man kann sich das so vorstellen, als würde man eine große Datei komprimieren, damit sie weniger Speicher belegt. Das Ziel ist, dass das Modell möglichst wenig Qualität verliert, obwohl die Daten stärker zusammengepresst werden.

Der Markt tut so, als wäre das ein riesiger Einbruch für den Bedarf an Speicherchips. Denn vieles in diesem Bereich ist schon heute nicht mehr in einer besonders speicherintensiven Form gespeichert.

Ein Teil der Einsparung, über die jetzt gesprochen wird, wurde in der Praxis bereits vorher erreicht.

Deshalb ist der zusätzliche Effekt von TurboQuant im realen Einsatz kleiner als manche Schlagzeilen vermuten lassen.

Relevant kann das Verfahren trotzdem sein, vor allem bei Edge-Anwendungen. Also, wenn KI-Anwendungen direkt auf dem Gerät ausgeführt werden. Zum Beispiel Smartphones, Laptops, Autos oder andere Hardware mit begrenztem Speicher. Dort ist jeder eingesparte Speicherbaustein besonders wertvoll, weil die Systeme kleiner, günstiger oder schneller werden können.

Darüberhinaus beseitigt Googles TurboQuant den Rechenaufwand nicht, sondern verlagert ihn. Demnach muss die GPU bei jedem Zugriff zusätzliche Arbeit leisten, um Vektoren zu komprimieren und wieder zu entpacken, was den Energieverbrauch pro Inferenz erhöhen kann.

Eine weitere Folge ist höhere Latenz. Während Daten in einem klassischen Setup direkt aus dem Speicher gelesen werden, sind bei TurboQuant zunächst mathematische Umformungen nötig, bevor das Modell überhaupt das erste Wort ausgeben könne.

Auch beim Streaming gibt es Nachteile. Statt einer fortlaufenden Wort-für-Wort-Ausgabe kann die Ausgabe hier blockweise erfolgen, sodass die Oberfläche zunächst für mehrere Sekunden einfriert und anschließend größere Textblöcke auf einmal ausgibt.

Schließlich verbraucht der Deep-Thinking-Modus intern mehr Rechenzyklen statt weniger, wodurch Nutzer schneller an Limits stoßen oder nach wenigen Nachrichten sogar zeitweise gesperrt werden könnten.

TurboQuant bringt keinen kostenlosen Effizienzgewinn, sondern mögliche Entlastung beim Speicher mit höherem Aufwand bei GPU/Rechenleistung, Latenz und Nutzungskosten

Fazit

TurboQuant kann helfen, KI effizienter zu machen, aber das ist nicht automatisch gleichbedeutend mit einem massiven Einbruch der gesamten Speichernachfrage.

Als weiterer Vergleich wird DeepSeeks MLA genannt, das den KV-Cache bereits um den Faktor 28 komprimiert habe.

Vor allem aber ist die aktuelle Aufmerksamkeit für TurboQuant extreeeem verspätet, zumal die eingeblendete arXiv-Seite den Preprint bereits auf den 28. April 2025 datiert.

Xcom

Auch ich sehe die Meldung vor allem als möglichen kurzfristigen Belastungsfaktor für Micron, Hynix, Samsung oder Sandisk.


Viel Erfolg wünscht Dir Valentin

1 Monat kostenlos AktienPlus + Bonusguthaben (aktuell 75 EUR)

Mit einem justTrade Depot kannst Du Aktien- & ETF-Trades optimal direkt über stock3 abbilden.

  • Die nahtlose Einbindung erlaubt es dir, deine Analysen ohne den Umweg über andere Apps direkt aus dem Chart heraus in Trades umzuwandeln.
  • Dabei profitierst Du 0 € Orderprovision (zzgl. 1 € Fremdkosten bei Aktien/ETFs).
  • Ein echtes Highlight ist die Auswahl zwischen drei Börsenplätzen, wodurch du dir per „Quote-Request“ stets den günstigsten Kurs sicherst.
  • Von über 10.000 Aktien bis hin zu echten Kryptowährungen hast Du die volle Vielfalt eines Top-Brokers direkt in deinem gewohnten Analyse-Terminal oder App zur Hand.
  • Dies beendet das lästige Interface-Hopping und liefert Dir die nötige Geschwindigkeit, um in volatilen Phasen den entscheidenden Klick voraus zu sein.

👉 Jetzt Depot eröffnen

Passende Produkte

WKN Long/Short KO Hebel Laufzeit Bid Ask
Keine Ergebnisse gefunden
Zur Produktsuche

1 Kommentar

Du willst kommentieren?

Die Kommentarfunktion auf stock3 ist Nutzerinnen und Nutzern mit einem unserer Abonnements vorbehalten.

  • für freie Beiträge: beliebiges Abonnement von stock3
  • für stock3 Plus-Beiträge: stock3 Plus-Abonnement
Zum Store Jetzt einloggen
  • AnJay
    AnJay

    Dekomprimierung in der CPU noch, bevor Instruktionen dafür eingebaut werden. Man errinert sich an die Tensor Units, die in RTX 2000 zuerst zu sehen waren, davor musste man dafür CUDA Kernels nutzen. Es könnte auch ein System mit Cacheschischten aufkommen, wie die CPU Caches für den Instruktionen und die Daten. Schauen wir mal.

    08:39 Uhr, 26.03.