Che vinca l'AI migliore!
L'utilizzo dei videogiochi per decretare l'AI più performante
Bentornati al consueto appuntamento mensile del mio blog. Visto che l’AI pare essere la ragione per cui tante persone hanno abbandonato i loro blog, io preferisco vedere cosa l’AI possa dare al mio. Che poi mi leggiate qui o tramite una qualche interrogazione ad un algoritmo di intelligenza artificiale generativa, la soddisfazione per quanto mi riguarda è la stessa.
Nel 2025 l’AI generativa è diventata uno strumento a supporto dell’utente con utilizzo giornaliero. Se col rilascio della prima versione di ChatGPT le persone interrogavano la chat di testo mosse da mera curiosità, oggi si inizia ad avere consapevolezza dell’immenso cambio di paradigma che stiamo attraversando.
L’adozione di massa ha portato ad una vera e propria corsa all’oro da parte dell’aziende “Big Tech”. I principali player sul mercato tecnologico hanno costruito un proprio software di intelligenza artificiale generativa: ChatGPT di OpenAI, Copilot di Microsoft, Gemini di Google, Llama di Meta sono solo alcuni esempi tra i più famosi e performanti. Sono esenti rare eccezioni: il mio Amazon Alexa, prodotto che pareva predestinato a vivere una seconda giovinezza attraverso l’utilizzo dell’AI, al momento è rimasto una cassa per la musica e un timer per cronometrare la bollitura della pasta.
Personalmente credo che l’abbondante competizione porti l’utente a vivere quella che mi piace chiamare “sindrome da Netflix”: quale intelligenza adottare per velocizzare la propria operatività?
Per l’uomo comune dal mio punto di vista le differenze di performance sono totalmente irrilevanti: non perdete tempo su cosa scegliere, trovare la tecnologia più semplice per la vostra fruizione e non fatevi prendere dall’ansia di avere sempre il prodotto migliore. Questi algoritmi vengono aggiornati cosi spesso che non ha senso mettere in discussione ogni volta la scelta, focalizzatevi piuttosto su come governare l’AI generativa, ad oggi strumento ausiliare ma non sostitutivo dell’intelligenza umana.
Se però dovessimo trovare un modo per stilare una classifica tra intelligenze, la sfida sarebbe quella di trovare una metrica per decretare un vincitore.
Kaggle, piattaforma online di riferimento per appassionati di data science, ne ha trovata una misurabile ed oggettiva: il gioco.
Dei lettori mensili, solo il 30% è iscritto. Se vi piacciono i miei contenuti questo ricordo essere l’unico modo per supportare il progetto
Kaggle Game Arena
Kaggle nasce come piattaforma per competizioni tech, dal 2017 fa parte di Google. L’incredibile adozione da parte degli esperti del settore l’ha resa un hub tecnologico online dove si è creata una formidabile community. Come funziona? Alcuni utenti postano quesiti in ambito di machine learning e data mining, altri rispondono in competizione tra loro per risolvere il problema, tramite un meccanismo di sfide e ricompense.
Ora che ci penso, Kaggle meriterebbe uno spazio qui sopra tutto per sè, visto che utilizza vari pattern di gamification.
Tornando a noi, l’idea di utilizzare il gioco per comparare le varie tecnologie ha prodotto la Kaggle Game Arena: una piattaforma online dove ogni AI è un partecipante che si sfida su vari giochi.
La prima competizione oggetto della sfida è stata il gioco degli scacchi. Per determinare quale AI sia la più abile, c’è una classifica aggiornata a seguito di ogni incontro.
Essendo una classifica aggregata e composta da più competizioni, la bravura su diversi giochi sarà approssimabile al titolo di: “intelligenza più intelligente”. La metrica individuata, ovvero il gioco, è misurabile. Inoltre la classifica dei partecipanti la rende oggettiva e indiscutibile.
Ovviamente i giochi dovranno essere basati esclusivamente sull’abilità del giocatore. Gli scacchi sono un esempio perfetto perchè la combinazione delle mosse rende ogni singola partita statisticamente unica, e ogni mossa è un gesto intenzionale del giocatore, che ha come obiettivo vincere.
Al momento si è concluso il primo torneo di scacchi, e questo è l’esito:
Primo classificato: ChatGPT O3 (OpenAI)
Secondo classificato: Grok 4 (xAI)
Terzo classificato: Gemini 2.5 Pro (Google)
Su Youtube è possibile rivedere ogni partita svolta di questo primo torneo. Vi propongo qui sotto la finale: interessante è vedere il ragionamento elaborato dalle AI, a sinistra dello schermo.
Non ci resta che aspettare nuovi tornei e nuovi giochi e scoprire a quale AI affidare le minute delle nostre riunioni.



sarebbe bello un approfondimento su Kaggle! complimenti come sempre Giacomo
Stessa cosa per le varie dirette streaming di edizione di giochi Pokémon interamente gestite da AI