Trusted

L’effet DeepSeek : comment la start-up chinoise a transformé à jamais l’avenir de l’IA

13 mins
Mis à jour par Célia Simon
Rejoignez Notre Communauté de Trading sur Telegram

EN BREF

  • Le modèle d'IA de DeepSeek, à la fois efficace et considérablement plus économe que ceux des géants de l'industrie, a bouleversé la thématique de l'innovation en IA.
  • La start-up chinoise démocratise l'accès à l'IA avancée avec le modèle R1 open-source, favorisant l'innovation et l'intégration industrielle.
  • L'émergence de DeepSeek souligne par ailleurs l'interconnexion des marchés technologique et crypto.
  • promo

La montée de DeepSeek a ébranlé la position confortable des géants de la tech, jusque-là leaders incontestés de l’innovation en IA. La start-up chinoise, de son côté, a démontré comment l’efficacité des modèles peut être atteinte avec moins d’argent et de ressources. 

BeInCrypto s’est entretenu avec dix leaders du secteur sur les raisons pour lesquelles le secteur technologique en quelque sorte “débordé” sur le marché crypto et comment l’ascension de DeepSeek a définitivement redéfini l’avenir du développement de l’IA. 

Une douche glaciale pour les géants tech américains

La montée de DeepSeek et ses effets marqués sur l’ensemble du marché crypto ont servi de véritable signal d’alarme aux secteurs technologiques occidentaux, leur indiquant qu’ils n’ont plus un si grand avantage sur le développement de l’IA. 

Il y a à peine plus de deux semaines, la start-up chinoise a lancé deux modèles d’IA : R1 et V3. Ces systèmes se sont révélés aussi efficaces que ceux développés par les géants de la tech OpenAI et Google, se classant même plus haut que ces leurs concurrents dans certains indicateurs. Ils ont également été produits pour un coût nettement inférieurs aux géants américains.

En effet, alors que la production de modèles d’apprentissage linguistique (LLM) comme Llama 3.1 de Meta coûte plus de 60 millions de dollars, DeepSeek a fait la une en réduisant le coût de formation d’un modèle de pointe à seulement 6 millions de dollars.

Quelques heures après le lancement de DeepSeek, la nouvelle a réduit d’un billion de dollars la capitalisation boursière des principales entreprises technologiques américaines. Nvidia, le principal fournisseur mondial de puces IA, a vu sa valeur chuter de 600 milliards de dollars. 

Le marché boursier américain a subi sa pire perte en une seule journée, affectant à son tour le marché crypto. L’arrivée de DeepSeek a notamment causé des baisses majeures dans les actions de crypto mining comme Marathon et Riot, qui dépendent fortement du matériel Nvidia.

La nouvelle a également déclenché pour un milliard de dollars de ventes crypto ; le cours de Bitcoin a chuté de 5 % tandis que les altcoins ont enregistré des baisses encore plus importantes allant de 8 à 10 %. En parallèle, les cryptos basées sur l’IA ont enregistré une baisse de 10 % de leur capitalisation boursière en 24 heures, quatre des cinq principales cryptos IA ayant subi de lourdes pertes.

Changement de cours des pièces crypto IA le 27 janvier.
Changement de cours des pièces crypto IA le 27 janvier. Source : Messari.

L’émergence de DeepSeek a humilié les géants de la tech assis sur leurs lauriers. Elle a par ailleurs soulevé des questions sur leur dépendance excessive aux investissements de plusieurs milliards de dollars et à la croissance future des revenus. 

Enfin, l’arrivée en trombe de l’IA chinoise a également montré que toute future perturbation dans la course à l’innovation aura inévitablement un impact sur le marché crypto.

La Chine chamboule le secteur IA avec DeepSeek

DeepSeek a secoué les marchés, montrant que la Chine n’était pas si en retard que cela par rapport aux États-Unis dans la course aux modèles d’IA les plus efficaces possibles. Jusqu’à ce que la nouvelle tombe le 27 janvier, les actions technologiques des grands acteurs comme Microsoft, Google et OpenAI affichaient un sentiment positif.

Ce sentiment se trouvait principalement basée sur le fait que ces géants de la tech sont établis et bien financés. Ils disposent déjà d’une position solide sur le marché et d’un accès au matériel et aux logiciels les plus raffinés nécessaires pour stimuler l’innovation dans le monde de l’IA.

« Ces entreprises n’ont pas seulement un avantage technologique, mais aussi au niveau de l’infrastructure, d’énormes ensembles de données et des ressources financières pour maintenir leur domination », a expliqué Pavel Matveev, cofondateur de Wirex

De son côté, sous la présidence de Joe Biden, la société Nvidia s’est vue interdite de vendre ses processeurs GPU à la Chine. Ces restrictions d’exportation ont forcé la Chine à compter sur le stock qu’elle avait entre-temps accumulé.

Et pour répondre à ces défis, la Chine a créé DeepSeek.

« En raison des restrictions à l’exportation des États-Unis, les Chinois n’avaient pas un accès aussi vaste au matériel que les entreprises américaines. Mais encore une fois, c’est là la base de l’économie : la rareté des ressources mène à l’innovation, ou “la nécessité fait loi” pour le reste d’entre nous. La Chine a dû descendre à un niveau d’ingénierie très profond et innover véritablement. C’est une vraie histoire de triomphe », a expliqué Sebastian Pfeiffer, directeur général de Impossible Cloud Network. 

Pour Yang Tang, PDG de QStarLabs, cela devait tôt ou tard arriver.

« Il s’agit d’une évolution naturelle dans le développement technologique : un concurrent plus débrouillard a utilisé un meilleur processus pour obtenir de meilleurs résultats. À noter, tout ce que DeepSeek a fait avait déjà été publié dans des recherches académiques et/ou industrielles. Cela forcera certainement les laboratoires d’IA établis à penser différemment, car beaucoup ont été trop axés sur la recherche », a-t-il expliqué.

L’arrivée de DeepSeek a également enseigné une leçon précieuse au monde occidental.

Parfois, moins c’est vraiment plus

Il y a un an, Sam Altman, PDG d’OpenAI, prédisait que l’industrie de l’IA nécessiterait des investissements de plusieurs milliers de milliards de dollars pour financer le développement de puces spécialisées. Ces puces sont essentielles pour alimenter les centres de données énergivores qui soutiennent les modèles d’IA de plus en plus complexes de l’industrie.

D’autres grandes entreprises technologiques ont récemment pris des initiatives similaires. Meta a déjà annoncé son intention de dépenser jusqu’à 65 milliards de dollars cette année pour étendre son infrastructure d’IA. L’entreprise vise à terminer l’année avec plus de 1,3 million de processeurs graphiques.

Microsoft a pour sa part annoncé des plans pour environ 80 milliards de dollars de développement de centres de données pour l’exercice 2025. De son coté, Amazon s’attend à ce que ses dépenses projetées pour 2025 sur une infrastructure similaire dépassent son investissement estimé à 75 milliards de dollars en 2024.

Beaucoup de ces entreprises accumulent également des GPU et du matériel d’IA connexe. Par exemple, Mark Zuckerberg, PDG de Meta, a déclaré que son entreprise visait à porter son approvisionnement en GPU à 600 000 d’ici la fin de 2024.

Par ailleurs, DeepSeek a utilisé un peu plus de 2 000 unités GPU Nvidia et 6 millions de dollars pour alimenter son modèle R1.

« La percée de DeepSeek dans la réduction des coûts de développement et l’optimisation des modèles d’IA avec des ressources informatiques minimales signale un changement sismique dans le paysage concurrentiel de l’IA. Les géants traditionnels comme Nvidia, OpenAI et Google, qui s’appuient sur une puissance informatique massive et une infrastructure coûteuse (comme des GPU haut de gamme et des services cloud étendus), pourraient voir diminuer leur avantage traditionnel dans le développement d’IA gourmand en ressources », a expliqué Trevor Koverko, cofondateur de Sapien.io, à BeInCrypto.

Par ailleurs, cette prise de conscience par les entreprises occidentales de la bonne position de la Chine dans cette course à l’IA a également effrayé les investisseurs des cercles financiers traditionnels et du marché crypto.

Comment expliquer l’impact de DeepSeek sur le marché crypto ?

Le récent déclin du marché – en particulier au niveau des marchés traditionnels – reflétait plutôt une réévaluation des attentes concernant les valorisations technologiques qu’une simple correction.

« Le marché avait intégré des hypothèses de croissance agressives pour les technologies d’IA, notamment en ce qui concerne les demandes informatiques qui profiteraient à des entreprises comme Nvidia et aux principaux fournisseurs de cloud. La percée de DeepSeek, qui a obtenu des résultats comparables avec moins de puissance informatique, a forcé les investisseurs à réévaluer ces hypothèses », a expliqué Karan Sirdesai, PDG et cofondateur de Mira Network.

Bien que le secteur crypto n’ait pas de liens directs avec DeepSeek, il partage un certain terrain d’action avec les développeurs d’IA. En conséquence, la crypto a été tout aussi affectée par l’annonce du lancement du R1.

Selon Sirdesai, la relation entre les marchés crypto et IA s’avère plus complexe qu’une simple corrélation. Bien que les deux relèvent du domaine technologique, ils opèrent sur des principes fondamentalement différents.

« Les valorisations de Bitcoin et des cryptos sont ancrées dans les dynamiques monétaires, l’adoption du réseau et les paysages réglementaires, tandis que les développements de l’IA se concentrent sur les capacités technologiques et les applications commerciales », a-t-il expliqué.

Néanmoins, la crypto et l’IA ont toutes deux une grande présence dans le secteur technologique.

« Les deux secteurs se disputent les ressources informatiques, en particulier les GPU, créant des liens dans la chaîne d’approvisionnement. De plus, de nombreux investisseurs sont actifs dans les deux domaines, de sorte que le sentiment peut se propager. Lorsque les grandes entreprises technologiques voient de la volatilité due aux développements de l’IA, cela peut se répercuter sur les marchés crypto à travers cette base d’investisseurs partagée », a ajouté Sirdesai.

Les récents mouvements du marché suite à la sortie du modèle R1 de DeepSeek témoignent de la susceptibilité du marché crypto à l’ensemble du sentiment du secteur technologique.

« Cette interaction reflète une synergie culturelle et technologique entre l’IA et la crypto, suggérant que les développements dans un domaine peuvent influencer l’autre considérablement », a ajouté Forest Bai, cofondateur de Foresight Ventures.

En conséquence, il sera crucial de suivre de près comment les géants technologiques américains réagissent à la dernière innovation de DeepSeek, ce afin de comprendre comment des événements similaires pourraient affecter le marché crypto à l’avenir.

Une période de réajustement pour les entreprises tech américaines

La baisse de confiance des investisseurs révèle une incertitude quant à l’avenir du marché de l’IA. Ces doutes se concentrent sur la question de savoir si l’échelle informatique restera la clé de la concurrence et comment les innovations en matière d’efficacité vont remodeler le secteur.

« La course à l’IA ne concerne plus qui a le plus de GPU, mais qui peut entraîner les modèles les plus intelligents et les plus efficaces. La percée de DeepSeek prouve que l’innovation dans l’entraînement peut perturber le monopole de l’IA », a déclaré à BeInCrypto Ilan Rakhmanov, fondateur de ChainGPT.

Rakhmanov a par ailleurs souligné les innovations techniques clés que DeepSeek a mises en œuvre pour contourner les obstacles à l’accès aux GPU.

« Le modèle R1 de DeepSeek atteint probablement son efficacité grâce à une combinaison d’architecture optimisée, de méthodes d’entraînement alternatives, de matériel spécialisé et de stratégies de calcul économes en énergie. En affinant l’efficacité des transformateurs, en utilisant la parcimonie des modèles et en incorporant la génération augmentée par récupération, DeepSeek réduit les exigences computationnelles sans compromettre les performances. Sa dépendance à l’apprentissage auto-supervisé, à l’augmentation de données synthétiques et à l’apprentissage par renforcement minimise la dépendance aux ensembles de données massifs, tandis que les accélérateurs d’IA personnalisés ou les alternatives non-GPU aident à réduire les coûts de calcul », a-t-il expliqué.

À ce propos, Anthony Simonet, responsable de la recherche chez iExec, a ajouté :

« Il utilise des techniques telles que ses architectures Mixture-of-Experts, l’entraînement en basse précision et la distillation des connaissances pour maximiser l’efficacité avec moins de ressources, permettant à l’IA de fonctionner sans problème sur du matériel standard et la rendant plus accessible », a-t-il dit.

De plus, les experts en technologie ont rapidement noté que DeepSeek a publié la recherche à l’origine de son modèle, permettant au public de la consulter.

L’argument pour une IA décentralisée

Contrairement au secret traditionnel des entreprises américaines comme OpenAI, DeepSeek a impressionné en rendant son modèle R1 complètement open-source. De nombreux leaders de l’industrie ont applaudi cette initiative, indiquant que, pour que l’avenir de l’IA reste entre les mains du public, l’accès global doit rester décentralisé. 

« DeepSeek a été un catalyseur pour l’industrie de l’IA, et je crois que c’est exactement le genre de signal d’alarme dont des entreprises comme OpenAI ont besoin. OpenAI a été initialement fondée pour rendre l’IA avancée accessible à tous, mais au fil du temps, nous avons observé un glissement vers des modèles fermés et exclusifs. Le domaine de l’IA évolue, et DeepSeek nous a rappelé quelque chose d’important : la grande technologie doit être construite pour tout le monde, pas seulement pour quelques privilégiés », a déclaré Rakhmanov.

Les petits développeurs avec moins de ressources ont accueilli cette nouvelle avec enthousiasme. L’accès au design et aux articles de recherche de DeepSeek leur permettra de peaufiner leurs modèles sans épuiser leurs budgets de recherche.

« Les modèles moins chers de DeepSeek réduisent le nombre de GPU nécessaires pour entraîner les modèles d’IA, abaissant ainsi les coûts computationnels. Cette efficacité permet à l’IA de se développer de manière plus abordable, la rendant accessible aux entreprises et aux chercheurs ayant des ressources limitées », a déclaré Ron Bodkin, cofondateur de Theoriq.

Avec le modèle de la start-up désormais open-source, les développeurs l’analyseront en profondeur, stimulant ainsi l’innovation dans le domaine de l’IA.

« Puisque DeepSeek est open-source, la course à l’IA se déplacera davantage, ce irrévocablement, vers l’arène open-source, détruisant la thématique des modèles fermés. Être open-source profite à tout le monde, aux entreprises d’IA (chaque acteur de l’écosystème), aux innovateurs et aux consommateurs. Les seuls perdants sont ceux qui s’accrochent au modèle fermé, lequel connaîtra un effondrement rapide dans un avenir proche », a déclaré Steven Pu, cofondateur de Taraxa, à BeInCrypto.

À mesure que l’IA devient moins coûteuse et plus accessible, elle se convertira davantage en une commodité, soit une forme de marchandise.

La technologie IA en tant que commodité

Le jour du lancement de DeepSeek, le PDG de Microsoft, Satya Nadella, a partagé un post sur les réseaux sociaux à propos du Paradoxe de Jevons.

« Le paradoxe de Jevons frappe à nouveau ! À mesure que l’IA devient plus efficace et accessible, nous verrons son utilisation monter en flèche, la transformant en une commodité dont nous ne pourrons plus nous passer », a déclaré Nadella sur X.

Aussi connu sous le nom d’effet rebond, le Paradoxe de Jevons est un principe économique formulé par l’économiste anglais William Stanley Jevons. Selon ce principe, une efficacité accrue dans l’utilisation des ressources peut conduire à une consommation accrue de cette ressource.

Appliqué à l’IA, à mesure que ces systèmes se font plus efficaces, la demande pour leurs tâches pourrait augmenter ; un phénomène que l’accessibilité croissante de la recherche en IA pourrait amplifier.

« Réduire les coûts, tant au niveau de la formation que des phases d’inférence, est une bonne chose. Dans le domaine de la technologie, la réduction des coûts a toujours conduit à une adoption plus large et à une consommation globale plus élevée, pas moins. Lorsque les voitures sont devenues abordables, plus de gens en ont possédé. Lorsque les mainframes ont été réduits en ordinateurs personnels abordables, cela a conduit à la révolution numérique. De même, nous verrons plus d’innovateurs et de start-ups expérimenter avec l’IA maintenant qu’elle est devenue plus abordable, ce qui entraînera une utilisation accrue de l’IA et une demande plus élevée pour l’infrastructure liée à l’IA, comme le matériel GPU », a expliqué Pu à BeInCrypto. 

Pour Pfeiffer, la “marchandisation” de l’infrastructure de l’IA changera également la nature de l’innovation que les entreprises technologiques chercheront désormais. Les développeurs se concentraient autrefois sur la création des modèles LLM les plus raffinés. Désormais, les efforts se tourneront vers l’intégration de cette technologie dans diverses industries.

« DeepSeek s’est formé sur OpenAI et a pu construire considérablement sur les progrès des autres. Le paysage des LLM sera marchandisé et, très probablement, entièrement open source. Cependant, ce n’est pas là que se produira la plupart de l’innovation. En effet, la croissance et l’évolution de l’IA seront moins visibles du côté du développement, mais plutôt à travers l’intégration et l’utilisation de l’IA. Les intégrations verticales et profondes dans les industries et l’accès à leurs données importeront bien plus que des LLM sophistiqués car ils sont marchandisés et leur progrès d’innovation ralentira », a-t-il détaillé. 

Ce paradoxe pourrait également donner un avantage aux géants technologiques américains par rapport aux pays ayant un accès restreint aux ressources computationnelles.

L’avantage des États-Unis

Bien que le modèle le plus récent de DeepSeek ait manifestement réduit l’écart concurrentiel entre les entreprises américaines établies, l’entreprise chinoise n’est pas pour autant à l’abri des défis.

Selon le Paradoxe de Jevons, une demande accrue pour les produits d’IA entraînera également inévitablement une demande accrue pour les ressources nécessaires à leur développement. Bien que d’autres alternatives soient encore explorées, les GPU resteront essentiels pour le développement futur des technologies d’IA.

« DeepSeek semble également atteindre une capacité qui limite leur aptitude à étendre leur offre – ils ont limité les inscriptions pour leur application aux résidents chinois et leur API est beaucoup plus lente qu’à leur lancement. Je crois qu’ils ne parviennent pas à sécuriser des GPU supplémentaires pour leur permettre d’étendre leur offre », a expliqué Bodkin.

La percée de DeepSeek n’annule pas non plus la dévotion de plusieurs décennies des États-Unis au développement de l’infrastructure de l’IA. 

« Malgré les percées d’optimisation de DeepSeek, la course à l’IA est encore largement dictée par l’accès à des ensembles de données massifs, la puissance computationnelle et le contrôle de l’écosystème de bout en bout. Des entreprises comme OpenAI et Google ne se contentent pas de l’échelle brute – elles disposent également de données propriétaires, d’une infrastructure cloud et de pipelines étendus de déploiement. Bien que des méthodologies alternatives soient prometteuses, elles ne perturberont le statu quo que si elles peuvent constamment surpasser les approches traditionnelles dans divers cas d’utilisation. Pour l’instant, il est trop tôt pour dire si DeepSeek représente un changement dans l’industrie ou simplement une amélioration incrémentale dans un paysage déjà compétitif », a expliqué Matveev à BeInCrypto.

Compte tenu de cette réalité, Sirdesai estime que la réaction du marché à DeepSeek a été quelque peu exagérée.

« La réaction du marché semble sous-estimer la complexité de la commercialisation de la technologie IA. L’architecture plus efficace de DeepSeek est considérable, mais le déploiement réussi de l’IA nécessite une solide infrastructure, de considérables mesures de sécurité et une fiabilité prouvée dans les environnements de production. Les entreprises technologiques occidentales ont passé des années à construire ces capacités », a-t-il expliqué.

L’ascension de DeepSeek a indéniablement redéfini la course à l’IA, démontrant que l’innovation peut émerger de sources inattendus et contester la domination des géants établis. 

Alors que l’industrie continue d’évoluer, il est crucial de surveiller de près l’interaction entre les modèles open source, l’accessibilité des ressources et la dynamique de la concurrence, ce qui permettra sans aucun doute de façonner l’avenir du développement de l’IA et son impact sur le monde.

Morale de l’histoire : Une IA en remplace une autre.

Les meilleures plateformes de cryptos | Février 2025
YouHodler YouHodler Explorer
eToro eToro Explorer
Margex Margex Explorer
Les meilleures plateformes de cryptos | Février 2025
YouHodler YouHodler Explorer
eToro eToro Explorer
Margex Margex Explorer
Les meilleures plateformes de cryptos | Février 2025
Wirex Wirex
YouHodler YouHodler
eToro eToro
BYDFi BYDFi
Margex Margex

Avis de non-responsabilité

Avis de non-responsabilité : Conformément aux directives de The Trust Project, BeInCrypto s'engage à fournir des informations impartiales et transparentes. Cet article vise à fournir des informations exactes et pertinentes. Toutefois, nous invitons les lecteurs à vérifier les faits de leur propre chef et à consulter un professionnel avant de prendre une décision sur la base de ce contenu.

Sponsorisé
Sponsorisé