Chatgpt Maker soupçonne que les modèles de l'IA profonde de la terre chinoise pas cher ont été construits à l'aide de données Openai - et l'ironie n'est pas perdue sur Internet

Auteur : Hannah Mar 04,2025

OpenAI soupçonne que les modèles d'IA profonde de la Chine, nettement moins chers que les homologues occidentaux, ont été formés à l'aide de données OpenAI, suscitant la controverse et les troubles du marché. Le modèle R1 de Deepseek, construit sur l'ouverture de Deepseek-V3, n'aurait coûté que 6 millions de dollars pour s'entraîner, une fraction des coûts de développement des modèles d'IA occidentaux. Cette révélation a provoqué une forte baisse des actions liées à l'IA, Nvidia subissant sa plus forte perte d'une journée de l'histoire.

L'incident a incité OpenAI et Microsoft à déterminer si Deepseek a violé les conditions d'utilisation d'OpenAI en utilisant son API pour la distillation du modèle - une technique où les données sont extraites de modèles plus grands pour former des plus petits. OpenAI a confirmé sa conscience de ces tentatives de chinois et d'autres sociétés et a souligné son engagement à protéger sa propriété intellectuelle (IP) par diverses contre-mesures et collaboration avec le gouvernement américain.

Donald Trump, faisant référence à Deepseek, a appelé à un réveil pour l'industrie technologique américaine. Son tsar AI, David Sacks, a en outre indiqué des preuves solides de l'utilisation par Deepseek des modèles OpenAI.

Cette situation met en évidence l'ironie de la position d'Openai, compte tenu de ses propres pratiques passées. Openai a précédemment fait valoir que la création de modèles d'IA comme Chatgpt est impossible sans utiliser de matériel protégé par le droit d'auteur, une affirmation soutenue par leur soumission à la Chambre des Lords du Royaume-Uni. Cette position est encore compliquée par les poursuites en cours du New York Times et 17 auteurs accusant Openai et Microsoft de violation du droit d'auteur. Openai soutient que ses pratiques de formation constituent une «utilisation équitable». Les batailles juridiques entourant l'utilisation du matériel protégé par le droit d'auteur dans la formation de l'IA s'intensifient, en particulier à la lumière d'un bureau de droit d'auteur américain de 2018, la décision de l'art généré par l'IA ne peut pas être protégé par le droit d'auteur.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov / Bloomberg via Getty Images.