Il New York Times impedisce di utilizzare i suoi dati per istruire le AI
Il New York Times ha da poco aggiornato i termini di servizio per impedire che i vari servizi basati su AI utilizzano i suoi contenuti per nutrire gli algoritmi di deep learning che tendono a replicare l’intelligenza di tipo umano. Nello specifico il giornale americano definisce all’interno delle sue policy che senza il consenso scritto del NYT non si può "usare robot, spider, script, servizi, software o dispositivi manuali, strumenti o procedimenti progettati per estrarre dati o contenuti" e che non si può "usare i contenuti per lo sviluppo di qualsiasi programma di software, incluso, ma non limitato, l'allenamento di sistemi di machine learning e intelligenza artificiale” e che "tentare qualsiasi uso proibito può portare a sanzioni civili, penali e/o amministrative, multe e sanzioni contro l'utente o chi lo assiste".
La battaglia fra aziende che sviluppano strumenti basati su AI e proprietari di dati è quindi aperta, dal momento che tutti i grandi modelli linguistici che alimentano servizi AI vengono addestrati su set di dati che potrebbero contenere materiale protetto da copyright o comunque ottenuto dal web senza un vero e proprio permesso dagli autori originali.