Il produttore di chatgpt sospetta che i modelli di AI Deepseek di Dirt Eapt Beach di Cina sono stati costruiti utilizzando i dati OpenIA - e l'ironia non è persa su Internet

Autore : Hannah Mar 04,2025

Openai sospetta che i modelli di AI Deepseek della Cina, significativamente più economici delle controparti occidentali, siano stati addestrati utilizzando i dati aperti, scatenando controversie e turbolenze di mercato. Il modello R1 di DeepSeek, basato sull'apertura open source Deepseek-V3, è costato solo $ 6 milioni per addestrare, una frazione dei costi di sviluppo del modello AI occidentale. Questa rivelazione ha causato un forte calo delle scorte legate all'IA, con Nvidia che ha registrato la sua più grande perdita di un giorno nella storia.

L'incidente ha spinto Openi e Microsoft a indagare se DeepSeek abbia violato i termini di servizio di Openi utilizzando la sua API per la distillazione del modello - una tecnica in cui i dati vengono estratti da modelli più grandi per addestrare quelli più piccoli. Openai ha confermato la sua consapevolezza di tali tentativi da parte dei cinesi e di altre società e ha sottolineato il suo impegno a proteggere la sua proprietà intellettuale (IP) attraverso varie contromisure e collaborazione con il governo degli Stati Uniti.

Donald Trump, riferendosi a DeepSeek, ha chiesto una sveglia per l'industria tecnologica americana. Il suo zar di AI, David Sacks, ha inoltre indicato una forte evidenza dell'uso da parte di Deepseek dei modelli OpenAI.

Questa situazione evidenzia l'ironia della posizione di Openi, date le sue pratiche passate. Openai in precedenza aveva sostenuto che la creazione di modelli di intelligenza artificiale come CHATGPT è impossibile senza usare materiale protetto da copyright, un reclamo supportato dalla loro sottomissione alla House of Lords del Regno Unito. Questa posizione è ulteriormente complicata dalle cause legali del New York Times e di 17 autori che accusano Openai e Microsoft di violazione del copyright. Openai sostiene che le sue pratiche di formazione costituiscono un "equo uso". Le battaglie legali che circondano l'uso di materiale protetto da copyright nella formazione dell'IA si stanno intensificando, in particolare alla luce di una sentenza dell'ufficio del copyright degli Stati Uniti del 2018 che l'arte generata dall'IA non può essere protetta da copyright.

DeepSeek è accusato di usare il modello di Openi per addestrare il suo concorrente usando la distillazione. Credito di immagine: Andrey Rudakov/Bloomberg tramite Getty Images.