Le développement de l'intelligence artificielle se poursuit à un rythme vertigineux : c'est désormais au tour de DeepSeek , qui compte lancer son modèle de raisonnement R2 bien plus tôt que prévu.
L'agence Reuters a rapporté cette information hier , citant trois sources anonymes « familières avec l'entreprise ». DeepSeek avait apparemment prévu de sortir R2 début mai, mais selon deux contacts du portail d'information, il souhaite désormais le commercialiser le plus rapidement possible . À quoi s’attendre, pourquoi cette précipitation et qu’est -ce que cela signifie pour le monde de l’IA ? Il est difficile de faire des prédictions, mais essayons d’établir quelques points fixes. Comme vous vous en souvenez peut-être, le lancement de DeepSeek R1 avait provoqué un véritable tremblement de terre sur les marchés boursiers mondiaux. La raison ? Efficacité extrêmement élevée grâce à l'utilisation de techniques telles que le Mixture-of-Experts (MoE) et le Multihead Latent Attention (MLA), qui nous permettent d'offrir des tarifs bien inférieurs à ceux de nos concurrents (lire, ChatGPT ). L'impulsion évolutive pour rechercher une efficacité maximale a été motivée par l' interdiction de 2022 par les États-Unis d'exporter des technologies américaines vers la Chine, qui comprenait une interdiction d'achat des puces A100 de NVIDIA , nécessaires à la formation de l'IA.
Mais il y a eu aussi des polémiques, comme celle d'OpenAI, qui a accusé l'entreprise chinoise d'avoir "distillé" ses modèles pour entraîner DeepSeek (à ce propos, lisez cet article très drôle de Marina Hyde du Guardian), ou de Google, qui avait commenté comme exagérément basses les déclarations sur les coûts d'entraînement du modèle (seulement 5,6 millions de dollars, selon ce qui a été déclaré). Ou comme celui du PDG de Scale AI, Alexandr Wang, selon qui DeepSeek aurait encore jusqu'à 50 000 puces NVIDIA malgré l'interdiction. Néanmoins, DeepSeek R1 a secoué le monde, il fonctionne bien et, en Chine, il bénéficie du soutien du président Xi Jinping. A tel point qu’au moins 13 municipalités et 10 entreprises énergétiques publiques en Chine l’utilisent, en plus de Lenovo, Baidu et Tencent. Sans parler du succès en Occident, avec Microsoft ajoutant le modèle à Azure AI Foundry et sur GitHub, et Amazon à son catalogue Amazon Web Services (AWS). Il est peu probable que DeepSeek R2 provoque le même choc que son prédécesseur, mais il devrait apporter des améliorations en matière de programmation et devrait pouvoir raisonner dans d'autres langues que l'anglais.
Cela semble être une mise à jour mineure sur le papier, mais ce sont des fonctionnalités très importantes. Comme nous l’avons vu dans les récentes annonces d’ Anthropic et de Google , l’IA investit massivement dans l’espace de programmation, et la capacité de raisonner dans plusieurs langages permettra une plus grande diffusion d’un modèle déjà extrêmement populaire . Nous ne connaissons pas les raisons de cette accélération de DeepSeek, mais cela a probablement quelque chose à voir avec les récentes annonces d’OpenAI et d’Anthropic. L'arrivée de ChatGPT 4.5 et 5 a probablement mis la pression sur le géant chinois, qui va désormais à son tour mettre encore plus de pression sur son adversaire américain. Avec ChatGPT 4.5 attendu dans les prochaines semaines et ChatGPT 5 dans les prochains mois, pouvons-nous nous attendre à ce qu'OpenAI progresse également ? Il n’est pas impossible d’émettre des hypothèses. L’IA est désormais devenue un facteur très important en géopolitique également, presque au même titre que la course à l’espace dans les années 1960. Le soutien du gouvernement chinois à DeepSeek (dont l’application a été interdite en Italie et en Corée du Sud) ajoute une pression supplémentaire sur d’autres pays, qui pourraient y voir une raison supplémentaire d’ accroître les restrictions sur les puces d’IA ou les collaborations logicielles, selon Stephen Wu du fonds spéculatif Carthage Capital. (
Lire la suite)