DeepSeek-V4 Preview: Million-Kontextfenster, Pro & Flash

DeepSeek stellt V4 Pro und V4 Flash vor: beide mit einer Million-Token-Kontextfenstern für lange Dokumente, Code-Analyse und komplexes Schlussfolgern. Fokus liegt auf leistungsstarker, erschwinglicher Langkontext-KI.

Julia Weber Julia Weber . Kommentare
DeepSeek-V4 Preview: Million-Kontextfenster, Pro & Flash

3 Minuten

DeepSeek hat den Vorhang für DeepSeek-V4 Preview gelüftet, und die Zahlen sind schwer zu übersehen. Das chinesische KI-Unternehmen bietet nun zwei neue Modelle an, V4 Pro und V4 Flash, beide für Kontextfenster von einer Million Tokens konzipiert, ein Maßstab, der die Verarbeitung langer Dokumente, Code-Analyse und komplexes Schlussfolgern in den Mittelpunkt rückt.

Die Modelle sind bereits über die Website von DeepSeek im Instant-Modus und im Expert-Modus verfügbar, und die API wurde ebenfalls aktualisiert und ist ab heute live. In einem Markt, in dem die Kontextlänge zu einem der härtesten Schlachtfelder der KI geworden ist, verfolgt DeepSeek eine sehr direkte Strategie: ernsthafte Leistungsfähigkeit anbieten, ohne den Premium-Preis.

Zwei Modelle, ein sehr großes Versprechen

Auf dem Papier ist der Unterschied zwischen den beiden Varianten auffällig. DeepSeek-V4 Pro verfügt über insgesamt 1,6 Billionen Parameter mit 49 Milliarden aktiven Parametern, während V4 Flash schlanker daherkommt mit 284 Milliarden Gesamtparametern und 13 Milliarden aktiven Parametern. Beide unterstützen die gleiche massive 1M-Kontextlänge, sind jedoch eindeutig auf unterschiedliche Nutzer und Budgets ausgerichtet.

DeepSeek bezeichnet das Pro-Modell als das Schwergewicht der Familie. Es wurde mit stärkeren agentischen Fähigkeiten, breiterem Weltwissen und fortgeschrittenem Schlussfolgern entwickelt, von dem das Unternehmen behauptet, dass es aktuelle Open-Modelle in Mathematik, MINT-Fächern und Programmierung übertrifft. DeepSeek fügt hinzu, dass Pro mit führenden Closed-Source-Systemen konkurrieren kann, weist jedoch darauf hin, dass es in einigen Bereichen noch hinter Gemini 3.1 Pro zurückbleibt.

Flash ist unterdessen das bessere Preis-Leistungs-Angebot. DeepSeek beschreibt es so, dass das Modell Schlussfolgerungen liefert, die an Pro heranreichen, und bei einfacheren Agentenaufgaben mit Pro gleichzieht. Der eigentliche Reiz liegt in den Kosten. Flash ist als kostengünstigere Option für Entwickler positioniert, die KI mit großem Kontextfenster möchten, ohne ihr Budget zu sprengen.

Die Preisgestaltung spiegelt diese Strategie wider. Bei Flash beginnen die Input-Kosten bei 0,028 USD bei einem Cache-Hit und bei 0,14 USD bei einem Cache-Miss, während Output mit 0,28 USD berechnet wird. Pro liegt deutlich höher: Input kostet je nach Cache-Status 0,145 USD oder 1,74 USD, und Output ist mit 3,48 USD bepreist.

Für Nutzer, die die Modelle sofort ausprobieren möchten, hat DeepSeek den Zugang geöffnet unter chat.deepseek.com. Das Unternehmen teilt außerdem mit, dass die offenen Gewichte verfügbar sind, ebenso wie ein technischer Bericht für alle, die in Architektur, Benchmarks und Trainingsdetails eintauchen möchten.

Es ist eine mutige Veröffentlichung, die die Diskussion um Langzeit-Kontexte erneut vorantreibt. DeepSeek jagt nicht nur Überschriftenzahlen; das Unternehmen versucht zu beweisen, dass massive KI-Modelle weiterhin praktisch, zugänglich und erschwinglich sein können.

"Ich liebe Startups und Innovationen. Meine Artikel beleuchten die kreativen Köpfe hinter der deutschen Tech-Szene."

Kommentar hinterlassen

Kommentare