DeepSeek ist ein 2023 gegründetes chinesisches KI-Unternehmen mit Sitz in Hangzhou. Das Team veröffentlicht große Sprachmodelle als Open-Source-Modelle und tritt damit in direkte Konkurrenz zu US-Anbietern wie OpenAI oder Anthropic. International bekannt wurde DeepSeek 2025 durch das Modell DeepSeek-R1, das sich auf logisches Schließen spezialisiert und in Benchmarks mit den Spitzenmodellen mithalten kann.
Die technische Besonderheit liegt in der Kombination aus Mixture-of-Experts-Architektur, sehr effizientem Training und einem Reasoning-Ansatz, der dem Modell beim Antworten gezielt Denkschritte erlaubt. DeepSeek hat damit gezeigt, dass Spitzenleistung nicht zwingend riesige Trainingsbudgets braucht. Die Modelle sind unter erlaubender Lizenz auf Plattformen wie Hugging Face verfügbar und lassen sich auf eigener Infrastruktur betreiben.
Für Unternehmen ist DeepSeek interessant, weil es eine ernsthafte Open-Source-Alternative ist. Wer Modelle selbst hostet, etwa für sensible Branchen wie Finanzen oder Gesundheit, kann DeepSeek auf eigenen GPUs in EU-Rechenzentren betreiben und damit klare Kontrolle über Daten und Latenzen behalten. Gleichzeitig sollten Compliance-Aspekte geprüft werden, vor allem wenn Modelle ursprünglich in China trainiert wurden.