NEWS
Stiamo davvero vivendo nel futuro?
Non esattamente, a quanto pare, o almeno secondo quello che immaginavano 120 anni fa alcuni artisti francesi. Un'azienda di tabacco francese, infatti, nel 1899 lanciò una campagna che portò alla creazione di 87 illustrazioni che avrebbero dovuto raffigurare l'anno 2000 secondo l'immaginazione degli artisti coinvolti. L'azienda chiuse per fallimento prima di poterle pubblicare, ma furono presentate come cartoline in occasione dell’Esposizione Universale di Parigi del 1900.
Molte di queste sono estremamente fantasiose e distanti dalla realtà, ma ce ne sono alcune che richiamano l’attenzione più delle altre. La prima raffigura un uomo alla scrivania intento a dettare un testo a una macchina, che lo trascrive in autonomia. Nella seconda si vede un insegnante che introduce libri in una macchina, collegata attraverso dei fili ai caschetti indossati dai suoi studenti.
In maniera neanche troppo forzata, si potrebbe pensare che la prima illustrazione sia una lontana parente dello Speech to Text e la seconda dell’attuale motore di ricerca Google.
Potremmo dunque affermare che alcune delle moderne tecnologie siano effettivamente uno specchio di queste previsioni, che anticipavano la necessità di intelligenze artificiali al servizio delle persone nelle loro attività quotidiane di svago, di lavoro o di socialità.
A proposito di tecnologia che supporta le persone, sempre in linea con questa visione, Google ha lanciato recentemente la sua ultima novità. Scopriamo di cosa si tratta.
Durante il Google I/O 2021, la conferenza globale sui prodotti dell’ecosistema Google, è stato annunciato il nuovo algoritmo Multitask Unified Model, abbreviato in MUM. Una tecnologia sviluppata per rispondere alle esigenze più complesse degli utenti, grazie a una maggiore e migliore comprensione del linguaggio che consente di fornire risposte più precise e utili alle query.
Google ha scommesso (di nuovo) sull’intelligenza artificiale, integrandola maggiormente nel suo sistema di ricerca. Per garantire un sistema semplificato, questo nuovo modello si basa sul preesistente Bert (Bidirectional Encoder Representations from Transformers), ma si differenzia dal suo predecessore perché in grado di gestire ricerche più complesse.
Il nuovo algoritmo è infatti mille volte più potente dell'ormai vecchio Bert. Mille, in questo caso, non è un numero preso a caso: rappresenta la quantità di nodi della rete neurale su cui è progettato MUM. Alla base di questo nuovo sistema c’è l’idea di provare a ricreare le sinapsi del cervello umano: così ogni nodo diventa un punto di decisione attraverso cui l’algoritmo fa passare la ricerca dell’utente.
Google MUM serve a risolvere un problema comune: dover effettuare molte ricerche e inserire numerose parole chiave per ottenere la risposta di cui si ha bisogno in quel momento. Il Multitask Unified Model è, appunto, multitasking e multimodale: ciò significa che può connettere le informazioni per gli utenti in modi nuovi, e adattarsi a una narrazione dei risultati che può avvenire anche tramite immagini o video che accompagnano collegamenti a vari contenuti rilevanti.
La lingua può essere un ostacolo significativo per l’accesso alle informazioni. Google ha provveduto anche a questo: MUM ha il potenziale per abbattere questi confini trasferendo la conoscenza attraverso le lingue, perché può imparare da fonti che non sono scritte nella lingua in cui viene digitata la ricerca e aiutare a ottenere le informazioni richieste.
MUM è stato infatti programmato in 75 lingue diverse utilizzando tutti i dati sottoposti a scansione presenti nell’open web, ossia i contenuti pubblici online. Grazie alla sua complessità, si prevede che MUM riuscirà a fornire dei risultati che non sono un semplice elenco di collegamenti che corrispondono alle parole chiave inserite dall’utente. Se la query è complessa, MUM ne comprenderà il linguaggio e genererà una risposta che potrebbe essere paragonabile a quella fornita da un esperto nel settore.
Come spiegare il funzionamento di MUM con un esempio? Un appassionato di escursionismo ha appena concluso la sua camminata sul Monte Adams, Washington ed è intenzionato a fare un’escursione sul Monte Fuji in Giappone nell’autunno successivo, vorrà dunque sapere cosa fare di diverso per prepararsi.
Oggi Google potrebbe essere comunque utile a questo scopo, ma ci vorrebbero molte ricerche mirate: si dovrebbe cercare l’altezza di ogni montagna, la temperatura media in autunno, la difficoltà dei sentieri escursionistici, l’attrezzatura giusta da usare, e così via. L’alternativa sarebbe parlare con un esperto (umano) di escursionismo, facendo una sola domanda diretta: “Cosa dovrei fare di diverso per prepararmi?” In questo modo, si potrebbe ottenere una risposta ponderata che tenga conto delle sfumature dell’impresa e ci guidi attraverso i molti aspetti da considerare.
I motori di ricerca odierni non sono abbastanza sofisticati per rispondere come farebbe un esperto, ma con la nuova tecnologia Multitask Unified Model ci stiamo avvicinando alla risoluzione di esigenze tanto complesse, riducendo quindi il numero di ricerche necessarie per ottenere le risposte desiderate. Tornando all’esempio sull’escursionismo, tramite insight basati sulla sua profonda conoscenza del mondo, MUM potrebbe evidenziare che “pur essendo le montagne all’incirca della stessa altezza, l’autunno è la stagione delle piogge sul Monte Fuji, e quindi potresti aver bisogno di una giacca impermeabile”. Inoltre, potrebbe anche far emergere utili argomenti secondari per un’informazione più approfondita, come l’attrezzatura più apprezzata o i migliori esercizi di allenamento, proponendo articoli utili, video e immagini da tutto il Web.
Qui risulta fondamentale l’approccio linguistico: ad esempio, potrebbero esserci informazioni davvero utili sul Monte Fuji scritte però in giapponese, che oggi sarebbero accessibili solo tramite una ricerca in questa lingua. MUM può trasferire la conoscenza da fonti in tutte le lingue e utilizzare queste informazioni per trovare i risultati più rilevanti nella lingua dell’utente.
Un’ulteriore applicazione futuristica è la possibilità di scattare una foto, per esempio, degli scarponi da trekking e chiedere: “Posso usarli per fare un’escursione sul Monte Fuji?”. MUM è in grado di comprendere l’immagine e collegarla alla domanda, rispondendo che quegli stivali sono adatti oppure indirizzare a un blog con un elenco di attrezzature consigliate.
Al momento non ci sono ipotesi sul lancio ufficiale di MUM su Google, perché l’azienda è impegnata nella fase di test della tecnologia.
Nayak, responsabile dell'area Search di Google, lo spiega chiaramente: “Ogni volta che facciamo un balzo in avanti con l’intelligenza artificiale per rendere le informazioni del mondo più accessibili, lo facciamo in modo responsabile”. Per questo, “ogni miglioramento della Ricerca Google viene sottoposto a un rigoroso processo di valutazione per garantire che stiamo fornendo risultati più pertinenti e utili”, grazie anche al supporto dei quality rater umani, che seguono le linee guida per la valutazione della qualità della Ricerca e fanno “capire quanto i nostri risultati aiutino le persone a trovare le informazioni”.
Quindi, volendo fare una previsione temporale, “nei prossimi mesi e anni porteremo funzionalità e miglioramenti basati su MUM ai nostri prodotti”. Pur essendo solo agli inizi della sua esplorazione, MUM viene già considerato “una pietra miliare importante verso un futuro in cui Google può comprendere tutti i diversi modi in cui le persone comunicano e interpretano le informazioni in modo naturale”.
Injenia, Premier Partner di Google Cloud, condivide la visione di Google realizzando soluzioni che mirino a favorire le interazioni naturali e sviluppando sistemi di intelligenza artificiale e machine learning al servizio delle persone. Studiando le singole esigenze aziendali, porta avanti per loro i progetti ideati e costruiti su misura.