DiffusionGemma in Corporate LLM nutzen

DiffusionGemma, Googles neues offenes Text-Diffusionsmodell, lässt sich ab sofort in Corporate LLM nutzen: Sie binden es per Bring Your Own Model als eigenen Endpunkt ein, das Modell rechnet auf Ihrer Hardware, und die Anfragen verlassen Ihre Infrastruktur nicht. Schnell, offen lizenziert, in Ihrem Team-Workspace.

Überblick: DiffusionGemma ist nicht als gehostetes Modell in Corporate LLM eingebaut, sondern wird per Bring Your Own Model angebunden. Sie servieren das Modell über einen OpenAI-kompatiblen Endpunkt, etwa mit vLLM, und tragen es im BYOM-Tab ein. Danach steht DiffusionGemma im Modell-Picker, samt Spaces, Agents und Team-Verwaltung. BYOM liegt auf dem Free-Plan und allen bezahlten Stufen, abgesichert per IP-Pinning. So bekommen Sie ein schnelles, lokales Modell in eine geteilte Oberfläche, ohne Ihre Daten aus dem Haus zu geben.

Was ist DiffusionGemma und warum ist es so schnell?

DiffusionGemma erzeugt Text per Diffusion: nicht Token für Token, sondern einen ganzen 256-Token-Block parallel. Das macht es laut Google bis zu viermal schneller, über 700 Token pro Sekunde auf einer einzelnen RTX 5090, und quantisiert passt es in 18 GB VRAM. Es ist Apache-2.0-lizenziert, läuft also lizenzfrei auf eigener Hardware. Wie die Architektur im Detail funktioniert und was sie ändert, lesen Sie im DiffusionGemma-Guide.

Für den Arbeitsalltag zählt daraus eine Sache: Ein schnelles Modell läuft jetzt offline auf einer Consumer-GPU. Genau diese Kombination, hohe Geschwindigkeit plus volle Datenhoheit, war lokal lange das Problem. DiffusionGemma räumt das Tempo-Argument ab.

DiffusionGemma in Corporate LLM nutzen: was ab heute geht

Corporate LLM hostet DiffusionGemma nicht selbst. Stattdessen binden Sie Ihren eigenen DiffusionGemma-Endpunkt per Bring Your Own Model ein. Das Modell läuft dort, wo Sie es betreiben, auf der eigenen Workstation, im eigenen Rechenzentrum oder bei Ihrem Wunsch-Hoster. Corporate LLM legt die Arbeitsoberfläche darüber: Modell-Picker, Spaces, geteilte Agenten und Team-Verwaltung.

Der entscheidende Punkt ist die Wahlfreiheit pro Anwendungsfall. Sie entscheiden je Space oder Agent, ob eine Aufgabe an Ihr lokales DiffusionGemma geht, an ein anderes per BYOM angebundenes Modell oder an die EU-gehostete Standardauswahl mit Auftragsverarbeitungsvertrag. Der Tooling-Stack bleibt derselbe, nur das Modell hinter der Anfrage wechselt. BYOM liegt dabei auf dem Free-Plan und allen bezahlten Stufen, ohne Aufpreis für das Modell selbst.

DiffusionGemma per BYOM anbinden: in 3 Schritten

Drei Schritte, mehr braucht es nicht.

Modell servieren. Starten Sie DiffusionGemma hinter einem OpenAI-kompatiblen Endpunkt. vLLM ist dafür der Standard und liefert die hohen Token-Raten, die das Modell auszeichnen. Quantisiert passt es in 18 GB VRAM, läuft also auf einer hochwertigen Consumer-GPU.
Endpunkt eintragen. Im BYOM-Tab hinterlegen Sie die Endpunkt-URL und Ihren Schlüssel. Jede ausgehende Verbindung läuft über einen IP-Pinning-Dispatcher, der die Ziel-IP vorab prüft und interne Bereiche blockiert. Credentials werden verschlüsselt gespeichert.
Im Team nutzen. DiffusionGemma steht danach im Modell-Picker und lässt sich pro Space oder Agent auswählen. Token-Verbrauch der Verbindung wird separat ausgewiesen, ohne dass Corporate LLM Ihre Rohzahlen gegen eine Rechnung anrechnet.

Wer den BYOM-Mechanismus grundsätzlich verstehen will, findet die Details in der Einordnung zu eigenen Modellen in Corporate LLM.

Warum lokales DiffusionGemma für den Mittelstand zählt

Lokale KI scheiterte im Alltag selten an der Qualität und fast immer an zwei praktischen Hürden: zu langsam und zu umständlich im Team. DiffusionGemma adressiert die erste, BYOM die zweite. Ein schnelles, offen lizenziertes Modell läuft auf einer einzelnen Workstation, und über Corporate LLM nutzt es das ganze Team mit Rechteverwaltung und geteilten Agenten, statt als Einzelplatz-Experiment zu versanden.

Eine Kanzlei lässt Mandantenschreiben lokal zusammenfassen, eine Personalabteilung Bewerbungen vorsortieren, ein Support-Team interne Wissensfragen beantworten. In allen Fällen bleiben die Eingaben auf der eigenen Hardware, und die Antwort kommt in Sekunden. Für die breite Mitte solcher Aufgaben ist ein schnelles lokales Modell oft die ruhigere Wahl als ein Frontier-Modell über eine fremde API.

Ist DiffusionGemma über BYOM DSGVO-konform?

Solange DiffusionGemma auf Ihrer eigenen Hardware rechnet, verlassen Eingaben Ihre Infrastruktur nicht. Damit entfällt die Übermittlung nach Art. 44 DSGVO und den folgenden Artikeln zum Drittlandtransfer, und die technischen und organisatorischen Maßnahmen nach Art. 32 DSGVO erfüllen Sie leichter, weil die Daten im Haus bleiben. Corporate LLM agiert dabei als Routing-Layer, der die Verbindungs-Credentials sicher hält und Audit-Logs schreibt.

Zwei Punkte bleiben wie immer: Steht die Hardware bei einem externen Hoster, brauchen Sie mit diesem einen Auftragsverarbeitungsvertrag nach Art. 28 DSGVO. Und die DSGVO-Pflichten Zweckbindung, Löschkonzept und Dokumentation gelten unverändert weiter. Dass das Modell offen lizenziert ist, ändert daran nichts: Die Lizenz regelt die Nutzung des Modells, nicht den Umgang mit Ihren Daten.

Den größeren Rahmen, wie Sie KI im Unternehmen insgesamt DSGVO-konform aufstellen, vom richtigen Anbieter-Plan über EU-Hosting bis zum lokalen Betrieb, liefert der Leitfaden Claude DSGVO-konform nutzen.

DiffusionGemma testen: Ihre nächsten Schritte

Wenn Sie DiffusionGemma testen wollen, servieren Sie es per vLLM und hängen den Endpunkt im BYOM-Tab ein, auf dem Free-Plan genauso wie in jedem bezahlten Plan. Wenn Sie zuerst verstehen wollen, was hinter dem Tempo steckt und wann sich lokale KI überhaupt lohnt, lesen Sie den DiffusionGemma-Guide und den Leitfaden zu lokalen KI-Modellen. So haben Sie das schnellste offene Modell in einer Oberfläche, die das ganze Team nutzt, und die Daten bleiben dort, wo sie hingehören.

Häufige Fragen

Kann ich DiffusionGemma in Corporate LLM nutzen?

Ja. Sie binden DiffusionGemma per Bring Your Own Model als eigenen Endpunkt ein. Das Modell läuft auf Ihrer Hardware oder bei Ihrem Hoster, Corporate LLM liefert Oberfläche, Spaces, Agents und Team-Verwaltung darüber.

In welchem Plan ist Bring Your Own Model verfügbar?

BYOM ist auf dem Free-Plan und allen bezahlten Stufen verfügbar. Sie binden Ihren eigenen Endpunkt ohne Aufpreis ein; die Modell-Nutzung läuft über Ihre eigene Hardware oder Ihren Vertrag beim jeweiligen Anbieter.

Wie binde ich DiffusionGemma technisch an?

Servieren Sie DiffusionGemma über einen OpenAI-kompatiblen Endpunkt, etwa mit vLLM, und tragen Sie Endpunkt-URL plus Schlüssel im BYOM-Tab ein. Jede ausgehende Verbindung läuft abgesichert über einen IP-Pinning-Dispatcher.

Bleiben die Daten bei DiffusionGemma über BYOM im Haus?

Ja, wenn der Endpunkt auf Ihrer eigenen Hardware oder bei Ihrem EU-Hoster läuft. Die Anfragen gehen direkt an Ihren Endpunkt; Corporate LLM hält nur die Verbindungs-Credentials sicher und schreibt Audit-Logs.

Hostet Corporate LLM DiffusionGemma selbst?

Nein. DiffusionGemma binden Sie als eigenes Modell per BYOM an. Für fertig gehostete Modelle bietet Corporate LLM die EU-gehostete Modellauswahl mit Auftragsverarbeitungsvertrag.

DiffusionGemma jetzt kostenlos und unbegrenzt in Corporate LLM