Het Chinese AI-bedrijf DeepSeek heeft een geweldige doorbraak bereikt in efficiënte, open-source AI-frameworks. Deze vooruitgang is een belangrijke les voor Europese AI-innovators.

Zoals onze collega van eeNews Europe, Nick Flaherty, meldt op, heeft DeepSeek – dat zijn hoofdkantoor heeft in Hangzhou, China – twee AI-frameworks ontwikkeld die in staat zijn om grote taalmodellen (LLM's) uit te voeren die kunnen wedijveren met die van OpenAI, Perplexity en Google – met gebruik van aanzienlijk minder rekenkracht. Het bedrijf maakt gebruik van unsupervised reinforcement learning om het redeneervermogen van zijn AI-modellen te verbeteren en heeft zijn technologie vrijgegeven als open source onder de MIT-licentie.
 
AI news - DeepSeek

DeepSeek LLM's

De LLM's van DeepSeek, die tot 70 miljard parameters aankunnen, zijn geoptimaliseerd om te draaien op Nvidia H100 GPU's, legt Flaherty uit. Deze GPU's zijn weliswaar krachtig, maar presteren minder goed dan chips die onder Amerikaanse overheidsrestricties niet naar China mogen worden geëxporteerd. Rapporten suggereren dat DeepSeek toegang heeft tot wel 50.000 H100 processors.

Voor degenen die geïnteresseerd zijn in de onderliggende technologie is het baanbrekende artikel over de vorderingen van DeepSeek online beschikbaar hier.

"DeepSeek is niet de eerste die laat zien dat een team met veel talent het op kan nemen tegen de toonaangevende AI-modelbedrijven met het meeste kapitaal", zegt Walter Goodwin, CEO en oprichter van de Britse AI-startup Fractile, waarin onlangs is geïnvesteerd door Pat Gelsinger, voormalig CEO van Intel. "In Europa was Mistral gedurende een groot deel van 2024 in staat om open source modellen te leveren die konden wedijveren met de open Llama-modellen van Meta, maar die werden getraind met een fractie van het budget."

Inschrijven
Schrijf u in voor tag alert e-mails over Embedded & AI!


"Europa heeft een hoge talentdichtheid en is minder beperkt in de beschikbaarheid van rekenkracht dan China, en dus zou DeepSeek een wake-up call moeten zijn die bewijst dat Europa het zich ook kan veroorloven om in de voorhoede van AI te spelen."

De open-source aard van DeepSeek's frameworks heeft al gevolgen gehad voor in de VS gevestigde concurrenten die hun AI-chatbotdiensten te gelde maken. In China ontwikkelt WiMi Hologram Cloud intelligente programmeertools die worden aangestuurd door DeepSeek, meldt Flaherty. Deze tools zijn bedoeld om programmeurs te helpen door code aan te vullen, de kwaliteit te analyseren en optimalisaties voor te stellen, waardoor het ontwikkelingsproces wordt gestroomlijnd en de resultaten worden verbeterd.

Populariteit en potentieel

De populariteit van DeepSeek is de afgelopen dagen gestegen, met een chatapp die 2,6 miljoen keer is gedownload. Aanmeldingen werden echter gepauzeerd na een gerapporteerde cyberaanval, merkte Flaherty op.

Nigel Toon, CEO van de Britse AI-chipontwerper GraphCore, heeft ook gewezen op het potentieel van DeepSeek.

"De doorbraken van DeepSeek AI, door gebruik te maken van reinforcement learning en een divers mix-of-experts-model, gaan verder dan wat is bereikt met enkele grote modellen, terwijl het veel efficiënter is," merkte Toon op. "Exportbeperkingen op GPU's waren misschien een beperking, maar ze hebben de innovatie gestimuleerd, wat bewijst dat noodzaak de moeder van de uitvinding is."
Zie eeNews Europe's artikel voor meer informatie. eeNews Europe is een Elektor International Media publicatie.
Inschrijven
Schrijf u in voor tag alert e-mails over Artificial Intelligence!