DeepSeek : L’IA open source qui défie OpenAI

L'intelligence artificielle (IA) subit une transformation radicale avec l'émergence de Recherche profonde, une startup chinoise fondée en 2023 qui a attiré l'attention du monde entier grâce à ses modèles open source innovants. Ses dernières créations, DeepSeek R1 y Recherche profonde V3Elles ont eu un impact considérable sur l'industrie technologique, défiant des géants comme OpenAI et mettant en péril la domination des entreprises américaines dans le secteur de l'IA.

L'impact de DeepSeek sur l'industrie technologique

Le fait que DeepSeek ait développé des modèles d'IA très compétitifs, mais avec une consommation de ressources moindre, a provoqué une réaction sur les marchés. Nvidia, l'une des principales entreprises de semi-conducteurs et de matériel d'IA, a subi une baisse de 17 % de ses actions, ce qui représentait une perte de 600 un milliard de dollarsCette chute lui a fait perdre son titre d'entreprise la plus valorisée au monde, dépassée par Apple y MicrosoftD'autres entreprises technologiques ont également été touchées, Alphabet chutant à un certain niveau. 4% et Microsoft 2%.

Cette incertitude sur les marchés a été aggravée par la chute de l'indice. Nasdaq de 3.77%, ainsi que des pertes sur les contrats à terme de Dow Jones (-1.04%) et l' S & P 500 (-2.29%)Cette volatilité reflète les craintes que l'IA chinoise ne supplante les solutions américaines en termes d'efficacité et de coût.

Image fournie par Data Phoenix
Image fournie par Data Phoenix

Restrictions et avancées technologiques de DeepSeek

Malgré la restrictions imposées par les États-Unis D'après le journaliste, DeepSeek a réalisé des progrès significatifs dans la vente de puces de pointe à des entreprises chinoises n'ayant pas accès à du matériel de dernière génération. Holger ZschaepitzLa capacité de DeepSeek à développer des modèles efficaces et peu coûteux remet en question les investissements colossaux réalisés par les entreprises occidentales dans ce secteur.

Qu’est-ce que DeepSeek ?

DeepSeek a été fondée en 2023 par Liang Wenfeng, qui réalise également Gestion du capital de haut vol, la seule entreprise finançant la start-up. Son premier modèle était Codeur DeepSeek, un modèle open-source spécialisé dans la programmation, lancé en novembre 2023.

L'équipe DeepSeek est composée de jeunes diplômés issus de les meilleures universités de Chineavec un accent clair sur l'innovation technologique. En ne dépendant pas d'investisseurs externes, l'entreprise a pu développer sa technologie sans pressions financières, ce qui lui a permis de travailler en toute autonomie. projets d'IA à long terme.

Cependant, DeepSeek est soumis à la réglementation d'Internet en Chinece qui signifie que son IA ne répond pas aux sujets sensibles selon les critères du gouvernement chinois. Par exemple, lorsqu'on lui demande de… les manifestations de la place Tiananmen en 1989Elle évite de répondre, tout en fournissant des informations sur le Guerre civile espagnole.

DeepSeek R1 : IA de raisonnement avancé

El Novembre 20 2023DeepSeek a présenté un aperçu de DeepSeek R1, et le Janvier 20 2024 Il l'a lancé comme un modèle open source. C'est un modèle de raisonnement avancéconçu pour des tâches complexes de logique et de mathématiques, surpassant dans certains paramètres GPT-4o par OpenAI.

Principales caractéristiques de DeepSeek R1

  • Performances supérieures dans les indicateurs cléscomme:
    • AIME (efficacité des modèles d'IA).
    • MATH-500 (résolution de problèmes mathématiques).
    • Banc SWE Vérifié (tâches de programmation).
  • Capacité d'auto-vérification, grâce à son raisonnement en plusieurs étapes.
  • Vitesse de réponse modérée, mais précision accrue, en raison de son orientation vers la planification anticipée et l'exécution des tâches.
  • 671 milliards de paramètres, avec des versions allégées de 1,500 milliard à 70 milliards, adaptés à différents appareils, des ordinateurs portables aux serveurs hautes performances.
  • Logiciel libre sur Hugging Face, sous licence MIT sans restrictions commerciales.

DeepSeek V3 : Mélange d’experts en IA

Quelques jours après le lancement de R1, DeepSeek a présenté Recherche profonde V3une Modèle de langage basé sur l'architecture Mixture-of-Experts (MoE)Cette technologie divise les tâches en différents modules spécialisés, optimisant les performances en n'utilisant que les experts nécessaires pour chaque requête.

Principales caractéristiques de DeepSeek V3

  • Architecture du ministère de l'Éducation: optimise le traitement en répartissant l'apprentissage entre plusieurs experts spécialisés.
  • 671 milliards de paramètresavec 37 milliards activés par jeton.
  • Gestion avancée des tâches textuelles, comprenant:
    • Codage.
    • Traducción.
    • Rédaction et création de contenu.
  • Il surpasse des modèles comme:
    • Lama 3.1 405B.
    • Claudie 3.5.
    • GPT-4o dans divers paramètres.
  • Coût de la formation : 5.5 millions de dollars, nettement inférieur à celui de GPT-4 d'OpenAI (80 millions de dollars).
  • Licence flexible, qui permet son téléchargement, sa modification et son utilisation commerciale dans de multiples applications.
  • Disponible en: Site web de DeepSeek, GitHub et son application officielle.

L'ascension de DeepSeek dans le monde de l'IA

DeepSeek a démontré que c'est possible défier les géants de l'IA avec des modèles open source très efficaces et accessibles. Leur priorité est raisonnement avancé, optimisation des ressources et développement sans restrictions commerciales Cela pourrait marquer un tournant dans le secteur, en offrant des alternatives aux modèles commerciaux propriétaires comme OpenAI.

À mesure que l'IA continue d'évoluer, la capacité de DeepSeek à concurrencer sans accès à du matériel avancé Cela soulève des questions quant à l'avenir du développement de l'IA et à l'efficacité des investissements de plusieurs milliards de dollars consentis par l'Occident. Avec des modèles comme R1 et V3Cette start-up chinoise pourrait devenir une Un point de référence clé pour la prochaine génération d'intelligence artificielle.

Article original de María Bastero | Publié le 27 janvier 2025 dans Marketing4eCommerce