Kosmos-1: intelligenza multimodale targata Microsoft
Microsoft è una delle aziende che sta investendo di più in questo settore, sia dal punto di vista dei servizi al pubblico, come dimostra l'integrazione di OpenAI/ChatGPT in Bing e Windows 11, sia per quanto riguarda l’utilizzo nella ricerca di questo strumento. L'ultima novità di casa Microsoft è Kosmos-1, un algoritmo "multimodale" di nuova generazione che può elaborare simultaneamente immagini e testo.
Fino ad oggi, gli utenti erano abituati a rapportarsi con algoritmi in grado di operare solo con una singola tipologia di output (o testuale o visiva). Kosmos-1 rappresenta invece un passaggio importante nella strada verso l'intelligenza artificiale, perché questo strumento parrebbe essere in grado di eseguire compiti e operazioni allo stesso livello di un essere umano. Grazie alla sua multimodalità, infatti, Kosmos-1 si pone come più evoluto rispetto ad altri algoritmi già rilasciati come ChatGPT e DALL-E.
Kosmos-1 è infatti capace di analizzare e riconoscere i contenuti di un'immagine, risolvere puzzle visuali, comprendere testi, passare test del QI umano basati e riconoscere istruzioni impartite dall’essere umano. Ciò significa, ad esempio, che l’utente può sottoporre a Kosmos-1 un'immagine, per poi fargli delle domande in merito al suo contenuto.
Secondo i ricercatori di Microsoft, l'intelligenza artificiale multimodale rappresenta un passo importante nella creazione di un'intelligenza artificiale globale. L'obiettivo finale è quindi quello di creare un algoritmo in grado di eseguire qualsiasi compito o operazione al pari di un essere umano in carne ed ossa.