Questa settimana ha portato il lancio drammatico del GPT-5, che sta incontrando i primi problemi tecnici, l'India continua a sviluppare i propri modelli linguistici in 22 lingue senza un budget elevato e i video AI stanno passando dai successi virali alle serie su Netflix.

1. GPT-5: aspettative elevate, ma il nuovo modello non funziona ancora bene

OpenAI ha presentato ufficialmente GPT-5 come il modello più avanzato per la programmazione e i compiti degli agenti - in tre versioni (Standard, Mini, Nano), con un'intelligenza che può essere regolata in quattro modalità, da quella minimalista a quella altamente complessa. Questo modello supera regolarmente o3 e altri concorrenti in termini di prestazioni, ad esempio nei test di programmazione (SWE-bench 74,9 %), nella competizione matematica AIME-2025 (94,6 %) e nella scrittura creativa su EQ-Bench.

Tuttavia, si è verificato un problema durante la distribuzione: il router che dovrebbe instradare le query verso la versione appropriata del modello non ha funzionato. Questo ha portato a un ripristino temporaneo dell'accesso alle versioni precedenti di GPT-4 per gli utenti paganti.

2. L'India scommette sul proprio LLM: un'infrastruttura linguisticamente diversificata sotto la pressione dell'austerità

Di fronte alla sfida di "120 lingue e 19.500 dialetti", l'India sta investendo in soluzioni LLM locali con un budget di calcolo limitato. Sono stati lanciati progetti come Sarvam AI (70 miliardi di parametri con supporto vocale), Soket AI, Gan.ai e Gnani.ai, tutti progettati per l'uso multilingue.

L'iniziativa IndiaAI Mission del governo ha stanziato oltre 19.000 GPU (tra cui l'H100) per lo sviluppo di capacità infrastrutturali e modelli, tra cui Sarvam AI e altri.

3. Dalle pubblicità virali alle scene dei programmi televisivi, i video di intelligenza artificiale stanno conquistando gli schermi

I video con intelligenza artificiale generativa stanno passando da fenomeni di internet al mainstream. Lo studio The Dor Brothers ha prodotto videoclip virali con 16 milioni di visualizzazioni e lo studio Genre.ai ha creato uno spot per un gioco per meno di 2.000 dollari. Persino Netflix sta sperimentando scene generate dall'intelligenza artificiale, come una ripresa al rallentatore in una serie di film. The Eternaut.

4. Generazione automatica di dati sintetici per l'LLM basato su codice

I ricercatori di Stanford, Princeton e Alibaba hanno progettato uno strumento, SWE-smith, che genera esempi realistici di correzione di bug nel codice. Ad esempio, utilizza test unitari automatizzati e processi di reversione delle modifiche. I dati risultanti - set di dati, modello e codice - sono disponibili pubblicamente.

Il lotto - DeepLearning.Ai di Andrew Ng / gnews.cz - GH