
La startup chinoise DeepSeek a lancé ses derniers modèles d’intelligence artificielle, qui, selon elle, sont au moins aussi performants que les meilleurs modèles américains pour un tarif moins élevé, ce qui pourrait bouleverser l’ordre mondial de la technologie.
La startup chinoise DeepSeek a attiré l’attention des cercles mondiaux de l’IA après avoir écrit dans un article publié en décembre 2024 que l’entraînement de DeepSeek-V3 nécessitait moins de 6 millions de dollars de puissance de calcul provenant de puces Nvidia H800.
L’assistant IA de DeepSeek, basé sur DeepSeek-V3, a dépassé son rival ChatGPT pour devenir l’application gratuite la mieux notée sur l’App Store d’Apple aux États-Unis.
Cette situation a suscité des doutes de la part de certaines entreprises technologiques américaines de consacrer des milliards de dollars à l’investissement dans l’IA. En effet, après la diffusion des nouvelles consacrées à la startup chinoise DeepSeek, les actions de plusieurs grands acteurs technologiques, dont Nvidia, ont dégringolées.
Pourquoi la startup chinoise DeepSeek fait-elle parler d’elle ?
Les avances en IA avaient créé un grand intérêt auprès de la population et particulièrement des entreprises, qui avaient vu là la possibilité de faire des progrès à moindre coût. Ainsi, la sortie du ChatGPT d’OpenAI à la fin de l’année 2022 avait provoqué une engouement au sein des entreprises technologiques chinoises, qui se sont empressées de créer leurs propres chatbots alimentés par l’intelligence artificielle. D’autant plus que la Chine fait face à une restriction sévère de composant technologique, ce qui la conduit à devenir autonome.
Après la publication du premier équivalent chinois du ChatGPT, réalisé par le géant des moteurs de recherche Baidu, l’écart entre les capacités des entreprises américaines et chinoises en matière d’intelligence artificielle se font lourdement sentir.
Cependant, la qualité et la rentabilité des modèles de DeepSeek ont renversé la situation. DeepSeek-V3 et DeepSeek-R1 ont été encensés par les cadres de la Silicon Valley et les ingénieurs des entreprises technologiques américaines. Ces deux modèles sont au même niveau que les modèles les plus avancés d’OpenAI et de Meta, a déclaré la startup chinoise DeepSeek.
Ils sont également moins chers à utiliser. Le DeepSeek-R1, sorti la semaine dernière, est 20 à 50 fois moins cher à utiliser que le modèle OpenAI o1, en fonction de la tâche, selon un communiqué publié sur le compte WeChat officiel de DeepSeek.
Pourquoi le scepticisme de certains?
Toutefois, certains experts ont publiquement exprimé leur scepticisme quant à la réussite de DeepSeek. Le PDG de Scale AI, Alexandr Wang, a déclaré lors d’une interview avec CNBC, le 23 janvier, sans fournir de preuves, que DeepSeek disposait de 50 000 puces Nvidia H100, qu’il a affirmé ne pas vouloir divulguer. En effet, cela serait considéré comme du viol des contrôles à l’exportation de Washington qui interdisent la vente de ces puces d’IA avancées à des entreprises chinoises.
Les analystes de Bernstein ont expliqué le 20 janvier dans une note de recherche que les coûts de formation totaux de DeepSeek pour son modèle V3 étaient inconnus, mais qu’ils seraient beaucoup plus élevés que les 5,58 millions de dollars que la startup a déclaré avoir utilisés pour la puissance de calcul. Les analystes ont également indiqué que les coûts de formation du modèle R1, tout aussi acclamé, n’ont pas été divulgués.
Qui a créé la startup chinoise DeepSeek ?
DeepSeek est une startup basée à Hangzhou dont l’actionnaire majoritaire est Liang Wenfeng, cofondateur du fonds spéculatif quantitatif «High-Flyer», d’après les registres d’entreprise chinois, consultés par l’agence de presse, Reuters.
Le fonds spéculatif quantitatif «High-Flyer» a annoncé en mars 2023 sur son compte WeChat officiel qu’il «repartait à zéro» pour concentrer ses ressources sur la création d’un «nouveau groupe de recherche indépendant, pour explorer l’essence de l’AGI» (Intelligence Générale Artificielle).
DeepSeek a été créé plus tard dans l’année. De leurs côtés, les créateurs de ChatGPT, OpenAI, définissent l’AGI comme des systèmes autonomes qui surpassent les humains dans la plupart des tâches à valeur économique.
Aucune donnée n’a été communiqué que le montant dont High-Flyer a investi dans DeepSeek. Toutefois, High-Flyer possède des bureaux dans le même bâtiment que DeepSeek, ainsi que des brevets relatifs à des grappes de puces utilisées pour entraîner des modèles d’IA, toujours selon les registres d’entreprise chinois.
De plus, l’unité d’IA de High-Flyer a déclaré sur son compte WeChat officiel en juillet 2022 qu’elle possédait et exploitait une grappe de 10 000 puces A100.
Que pense le gouvernement chinois de la startup chinoise DeepSeek?
Le succès rencontré par DeepSeek a été remarqué dans les principaux cercles politiques chinois. Le 20 janvier, jour où DeepSeek-R1 a été rendu public, le fondateur Liang Wenfeng a participé à un symposium à huis clos pour les hommes d’affaires et les experts organisé par le premier ministre chinois Li Qiang, selon l’agence de presse Xinhua.
La présence de Liang Wenfeng à cette réunion peut être un signe que le succès de DeepSeek pourrait être important dans la stratégie politique de Pékin de surmonter les contrôles à l’exportation de Washington et de parvenir à l’autosuffisance dans des industries stratégiques telles que l’IA.
Pourquoi la startup chinoise DeepSeek inquiète les marchés asiatiques?
Les marchés et analystes ont mit du temps à encaisser les annonces selon lesquelles le modèle de DeepSeek serait performant tout en fonctionnant sur des puces à capacité réduite, ce qui pourrait remettre en question la domination des groupes américains du secteur – dont le géant des puces Nvidia.
À Tokyo, les titres des sociétés japonaises liées aux semi-conducteurs, également potentiellement menacées, dévissaient vers 03h00, le 27 janvier, tels que Advantest, le fournisseur de Nvidia (-8,07%), Screen Holdings (-3,85%) et Disco Corp (-2,90%).
Le puissant groupe d’investissement japonais SoftBank, qui avait bondi la semaine dernière avec sa participation au massif projet d’IA dévoilé par Donald Trump aux États-Unis, plongeait également ce 27 janvier à 6,09%. Fujikura, qui fabrique des câbles pour centres de données, s’effondrait aussi de 8%.
«La domination (américaine) ne peut pas être considérée comme acquise. L’émergence de DeepSeek en Chine indique que la concurrence s’intensifie : même si elle ne représente peut-être pas une menace significative pour l’instant, cela montre que les futurs rivaux défieront plus rapidement qu’attendu les entreprises déjà installées», a déclaré Charu Chanana, directrice de la stratégie d’investissement chez Saxo Markets, citée par Bloomberg et l’AFP.