L’accelerazione dei rilasci nel panorama dell’AI generativa a seguito del terremoto DeepSeek sembra non arrestarsi, così come il bisogno delle big tech americane di sottolineare che non ci sono solo i modelli sulla strada della AGI (Artificial General Intelligence) e di confermare il passaggio agli agenti AI nel corso dell’anno.
La modalità Deep Research di OpenAI
La novità del giorno è la modalità Deep Research rilasciata da OpenAI, un agente che effettua vere e proprie ricerche bibliografiche online costruendo interi report di impressionante qualità, per ora disponibile in anteprima agli utenti pro del servizio, a cui si aggiungeranno gli utenti Plus successivamente. Non si tratta di un’iniziativa isolata, anche Google ha lanciato una funzione con lo stesso nome che però sembra più compilativa di fonti che capace di generare vere e proprie sintesi ragionate. Vediamo come si è comportata questa nuova funzione che si va ad affiancare all’Operator e ai task negli agenti di OpenAI.
Come funziona la Deep Research
La funzione di deep research in sé è abbastanza naturale ed è una versione più sofisticata della funzione che ormai tutti i servizi di AI generativa hanno di cercare informazioni online, analizzarle e proporre una breve sintesi. In questo caso però viene avviato un agente che può eseguire per decine di minuti e continua a cercare informazioni analizzando molte fonti per produrre documenti veri e propri in cui si ottiene un’analisi ragionata del materiale trovato con il riferimento alle fonti.
Il nostro test
Il test condotto ha generato una relazione di circa 12 pagine su un tema decisamente attuale:
Come si può vedere l’agente parte nel suo lavoro quando si seleziona la funzione “Approfondisci” prima di sottomettere il prompt.
Nelle varie prove effettuate ho notato che il sistema chiede di precisare il problema prima di avviare il processo di ricerca vero e proprio:
Una volta che l’agente comincia il suo lavoro l’interfaccia mostra una progress bar (si può anche uscire dalla chat o addirittura chiudere il browser senza interrompere il suo funzionamento) anche se, soprattutto durante le prime esecuzioni mesmerizza osservarne l’attività soprattutto guardando il pannello che si apre alla destra e che mostra le varie fonti che vengono via via analizzate e i ragionamenti che svolge il modello durante il processo come si vene nella seguente figura:
Il risultato è un report decisamente impressionante e molto esteso (nel test di circa dodici pagine di Word) in cui sono riportate le considerazioni relative alla richiesta annotate con tutti i riferimenti bibliografici usati per produrre il risultato di cui mi limito a riportare la fine:
Deep Research, una svolta per istruzione e lavoro
Uno strumento, dunque, straordinariamente efficace.
Tutti noi sappiamo come le ricerche rivestano un ruolo importante nella nostra vita, in un mondo in continuo sviluppo è sempre più difficile essere aggiornati sullo stato dell’arte in ogni settore. L’abilità di ottenere una vera e propria indagine in pochi minuti con la possibilità di verificare le fonti e quindi la loro attendibilità non può non costituire una novità importante, sia nel mondo dell’istruzione che in quello lavorativo.
Gli output generati da questo agente richiedono anche una certa capacità di analisi e talvolta conoscenze elevate da parte del lettore, sottolineando che sempre più spesso il lavoro di chi si avvale dell’AI consiste nella verifica critica dell’output ottenuto, lavoro che può richiedere addirittura ore (sempre meno del tempo necessario ad effettuarne la redazione).
Gemini Deep Research e Open AI Deep Research: il confronto
Google e OpenAi hanno chiamato allo stesso modo i due prodotti. Gemini Deep Research di Google e OpenAI Deep Research presentano però caratteristiche distintive, ciascuna con i propri punti di forza e limitazioni. Ecco un confronto dettagliato:
Funzionalità e Approccio
- OpenAI Deep Research: questa funzionalità è progettata per condurre ricerche approfondite attraverso un processo iterativo che analizza centinaia di fonti online. Utilizza un modello avanzato (o3-mini) che può sintetizzare informazioni in modo autonomo, producendo rapporti di alta qualità simili a quelli di un analista esperto. È in grado di gestire vari formati di file, come PDF e fogli di calcolo, e può citare le fonti in tempo reale
- Gemini Deep Research: anche Gemini offre funzionalità simili, permettendo agli utenti di esplorare argomenti complessi e generare rapporti. Tuttavia, il suo approccio tende a essere più strutturato e veloce, ma potrebbe non raggiungere la stessa profondità analitica di OpenAI. Gemini si distingue per la sua capacità di recuperare una grande quantità di informazioni, ma talvolta può risultare meno coeso nelle sue conclusioni rispetto a OpenAI.
Prestazioni e velocità
- OpenAI Deep Research: sebbene fornisca risultati dettagliati, il processo può richiedere dai 5 ai 30 minuti per completare una ricerca complessa, a seconda della richiesta. Gli utenti hanno notato che l’analisi è più profonda ma può essere più lenta rispetto a Gemini.
- Gemini Deep Research: è generalmente percepito come più veloce nel fornire risposte, rendendolo ideale per chi ha bisogno di risultati rapidi. Tuttavia, questa velocità potrebbe venire a scapito della qualità analitica.
Prezzo e accessibilità
- OpenAI Deep Research: attualmente disponibile solo per gli utenti del piano ChatGPT Pro, che costa 200 dollari al mese. Questo potrebbe limitare l’accesso per alcuni utenti rispetto ad altre opzioni più economiche.
- Gemini Deep Research: offerto a un prezzo inferiore (20 dollari al mese) nel piano One AI Premium di Google, rendendolo più accessibile per gli utenti che cercano strumenti di ricerca avanzati senza un investimento significativo
I limiti di Deep Research
È però importante comprendere i limiti dello strumento per dare il giusto peso alle informazioni ottenute poiché come in tutte le ricerche chi la effettua sceglie cosa includere e cosa escludere, e l’AI non è esente da questo processo. Nel caso di deep research va anche detto che il modello si avvale di un motore di ricerca, e quindi delle sue logiche di ordinamento dei risultati che inevitabilmente influenzano la scelta delle fonti su cui lavorerà l’AI che a sua volta effettuerà altre scelte nell’elaborare i contenuti delle fonti selezionate.
Da quello che si può osservare dall’esecuzione, il processo è incrementale, quindi il modello non si limita ad analizzare i risultati prodotti dalla prima interrogazione e continua a effettuare ricerche e a seguire eventuali link che trova nelle fonti (da qui il termine “deep”), ma è comunque difficile che il risultato possa essere esaustivo e pertanto è essenziale che chi riceve le informazioni ne tenga conto e consideri che, oltre alla verifica delle fonti usate, le informazioni potrebbero essere incomplete.
Anche piccole variazioni nel prompt possono portare a risultati molto differenti, nell’esempio sull’adozione dell’AI nella didattica universitaria i riferimenti ai progetti italiani sono assolutamente corretti ma sono centrati su usi espliciti nel campo della didattica escludendo varie esperienze significative nel contesto accademico che personalmente avrei menzionato.
Ecco una tabella che confronta Gemini Deep Research e OpenAI Deep Research:
Caratteristica | OpenAI Deep Research | Gemini Deep Research |
---|---|---|
Funzionalità | Analisi approfondita e sintesi dettagliate | Recupero rapido delle informazioni |
Approccio | Iterativo, con focus su rapporti di alta qualità | Strutturato, ma meno analitico |
Prestazioni | Maggiore profondità, tempi di attesa (5-30 min) | Risposte più veloci |
Prezzo | 200$/mese (piano Pro) | 20$/mese (piano One AI Premium) |
Limitazioni | Possibili errori interpretativi | Meno coesione nelle conclusioni |
Una spinta alla pubblicazione aperta
Questo nuovo agente lanciato da OpenAI è molto efficace e affronta un problema che tutti abbiamo: ricercare in modo approfondito informazioni. L’esecuzione è decisamente buona, sia in termini di user experience che per il risultato che si ottiene. Il suo uso condizionerà sicuramente tutti quei contesti in cui sono importanti le indagini come, ad esempio, analisi di mercato, analisi competitive, e scenari, ma anche produzione di materiale didattico visto che gli output generati sono decisamente più estesi di quanto siamo abituati.
L’uso del motore di ricerca per la ricerca delle fonti spingerà tutti a pubblicare le proprie informazioni nel modo più aperto possibile, altrimenti si rischia di smettere di esistere a causa dell’assenza online, e chi produce i contenuti online e i SEO dovranno probabilmente cominciare a ottimizzare i propri contenuti per questi agenti al fine di assicurare la presenza nei report che in ultima analisi rischiano di divenire l’unica fonte letta da noi uomini. Colpisce averlo scritto su questo canale poco più di un anno fa e vederlo concretizzarsi così rapidamente: l’AI genera il testo e lo sintetizza aprendo una nuova era per i contenuti testuali.
Una tecnologia disruptive a usare con attenzione
Non si può non sottolineare ancora una volta che l’uso superficiale di questa nuova funzione può essere molto pericoloso, sia nell’accettare conclusioni false anche se partendo da fonti, sia nel considerare esaustivo il risultato della ricerca effettuata. Ma con le dovute attenzioni ritengo che sia il primo uso veramente “disruptive” di questa tecnologia che non vuole saperne di rallentare lo sviluppo e di ridefinire il mondo in cui viviamo.
***** l’articolo pubblicato è ritenuto affidabile e di qualità*****
Visita il sito e gli articoli pubblicati cliccando sul seguente link