20.01.2025 Chinas KI-Außenseiter DeepSeek überrascht mit LLM-Innovation
Das chinesische Startup DeepSeek überraschte mit seiner neuen LLM-Architektur den globalen KI-Markt. Das Unternehmen entwickelte innerhalb von zwei Jahren ein Open-Source-Modell, das auf den weniger hochwertigen H800 Chips zu einem Bruchteil der Kosten von Konkurrenten wie GPT-4 oder Llama 3 operiert. Unterstützt vom Hedgefonds High-Flyer nutzt DeepSeek innovative Technologien wie die MLA-Architektur (Multi-Head Latent Attention) und eine ressourcenschonende Sparse-Struktur, um Rechenaufwand und Speicherbedarf drastisch zu senken. Im Gegensatz zu großen chinesischen Tech-Unternehmen konzentriert sich DeepSeek ausschließlich auf Forschung und hat bisher keine Kommerzialisierung oder externe Finanzierung angestrebt. Damit blieb das Unternehmen weitgehend unter dem Radar, hat aber für sein neues Modell Respekt aus der internationalen Tech-Community erhalten. Gründer Liang Wenfeng plädiert für langfristige technologische Fortschritte und fordert mehr Idealismus in der chinesischen KI-Landschaft. Unsere Einschätzung: Die wesentlich günstigere und energieärmere KI-Leistung von DeepSeek hat aus zwei Gründen großes Potenzial. Erstens ist China damit weniger abhängig von US-Halbleitern (auch wenn Nvidia mittlerweile H800 Chips ebenfalls nicht mehr offiziell in China verkaufen darf). Zweitens haben KI-Aktivitäten einen immens hohen Energiebedarf. Für die USA wird geschätzt, dass zukünftig Datencenter über 10% des (steigenden) nationalen Energieverbrauchs benötigt werden. DeepSeek zeigt, dass es auch mit weniger Energie geht – die zudem zukünftig im großen Stil aus erneuerbaren Energiequellen kommen könnte.
Quelle: Chinapolitan Newsletter & Baiguan
Hier können Sie den kostenlosen Newsletter abonnieren.