// COMPUTERBASE — INTELLIGENZA ARTIFICIALE
OpenAI erster eigener Chip: Jalapeño soll KI-Abfragen effizienter beschleunigen
OpenAI und Broadcom haben mit Jalapeño den ersten von OpenAI entworfenen KI-Beschleuniger vorgestellt. Der Chip ist nicht für das Training neuer Modelle gedacht, sondern für die Inferenz: Er soll also Anfragen an große Sprachmodelle wie ChatGPT, Codex oder API-Dienste effizienter verarbeiten. Konkrete Leistungsdaten fehlen noch.
Mit Jalapeño rückt OpenAI tiefer in die (eigene) Hardware-Entwicklung vor. Der Chip wird von den Unternehmen als „Intelligence Processor“ bezeichnet und ist laut Ankündigung von Grund auf für die Inferenz großer Sprachmodelle entworfen worden. Anders als universell einsetzbare Beschleuniger soll Jalapeño stärker auf die Arbeitslasten zugeschnitten sein, die bei interaktiven KI-Diensten entstehen.
Dazu zählen nicht nur reine Rechenleistung, sondern auch Speicherzugriffe, Netzwerk-Anbindung und möglichst geringe Latenzen. Gerade bei Chatbots, Code-Assistenten oder künftigen Agenten-Anwendungen ist nicht nur entscheidend, wie viele Tokens pro Sekunde ein System berechnen kann. Die Antwort soll auch mit möglichst wenig Verzögerung geliefert werden und bei hoher Nachfrage zuverlässig verfügbar bleiben.
An dieser Stelle steht ein externer Inhalt von X, der den Artikel ergänzt und von der Redaktion empfohlen wird. Er kann mit einem Klick geladen und auch wieder ausgeblendet werden.
We’ve designed and built our first AI chip: Jalapeño.Designed from the ground up by OpenAI and brought to production with @Broadcom, Jalapeño is purpose-built for the LLM workloads powering ChatGPT, Codex, the API, and future agentic products.Chips are foundational to the AI… pic.twitter.com/mHU7DaMMTi
Belastbare Benchmarks nennt OpenAI noch nicht. Die Unternehmen erklären lediglich, frühe Tests würden eine deutlich bessere Leistung pro Watt als aktuelle Systeme erwarten lassen. Ein technischer Bericht mit näheren Daten soll erst in den kommenden Monaten folgen. Bis dahin bleibt offen, wie Jalapeño im direkten Vergleich zu Nvidias Beschleunigern, Googles TPUs oder anderen spezialisierten ASICs abschneidet.
Engineering-Samples laufen laut OpenAI bereits im Labor mit Fokus auf Takt und Leistungsaufnahme. Der Tape-out soll in nur neun Monaten erfolgt sein. OpenAI verweist darauf, dass eigene Modelle bei Teilen des Entwicklungs- und Optimierungsprozesses geholfen hätten.
OpenAI entwirft den Beschleuniger nicht allein. Broadcom übernimmt zentrale Aufgaben bei Netzwerk- und Verbindungstechnik. Auch Celestica wird als Partner für Platinen, Racks und Systemintegration genannt. Damit geht es nicht nur um einen einzelnen Chip, sondern um komplette KI-Systeme für Rechenzentren.
Der erste Einsatz ist für Ende 2026 vorgesehen. OpenAI und Broadcom stellen Jalapeño nicht als Einzelchip, sondern als Grundlage für eine über mehrere Jahre angelegte Infrastruktur-Basis dar. Bereits im Oktober 2025 hatten beide Unternehmen eine Zusammenarbeit über 10 Gigawatt an OpenAI-entworfenen KI-Beschleunigern angekündigt, deren Bereitstellung in der zweiten Jahreshälfte 2026 beginnen und bis Ende 2029 abgeschlossen werden soll.
Jalapeño dürfte vorerst vor allem OpenAIs eigene Infrastruktur ergänzen. Der Chip ist auf Inferenz zugeschnitten und damit nicht automatisch ein Ersatz für GPUs, die weiterhin beim Training großer Modelle und für flexible Rechenlasten wichtig bleiben. Für OpenAI kann ein eigener ASIC dennoch strategisch wichtig sein: Je besser Hardware, Software, Modelle und Dienste aufeinander abgestimmt sind, desto stärker lassen sich Kosten, Energiebedarf und Verfügbarkeit beeinflussen.