Novembre 30, 2022

NbaRevolution

Covid crisi politica in Italia

I robot creano immagini e raccontano barzellette. 5 cose da sapere sui modelli di base e sulla prossima generazione di IA

Se vedi le foto di Teiera di avocado Oppure leggi un articolo ben scritto Devia un po’ dalle strane ombrePotresti essere stato esposto a una nuova tendenza nell’Intelligenza Artificiale (AI).

Si chiamano sistemi di apprendimento automatico DALL-EE GPT E palma, palma Innovano attraverso la loro straordinaria capacità di creare lavori creativi.

Questi sistemi sono conosciuti come “modelli di base” e non sono tutti clamore e trucchi per le feste. Quindi, come funziona questo nuovo approccio all’IA? Sarà la fine della creatività umana e l’inizio di un falso incubo?

1. Cosa sono i modelli base?

modelli base Lavora addestrando un enorme sistema su grandi quantità di dati pubblici, quindi adattando il sistema a nuovi problemi. I modelli precedenti tendevano a ricominciare da zero per ogni nuovo problema.

DALL-E 2, ad esempio, è stato addestrato per abbinare le immagini (come l’immagine di un gatto domestico) con la didascalia (“Mr. Fuzzyboots, il gatto soriano che si rilassa al sole”) scansionando centinaia di milioni di esempi. Una volta addestrato, questo modello sa che aspetto hanno i gatti (e altre cose) nelle immagini.

Ma il modello può essere utilizzato anche per molte altre interessanti attività di intelligenza artificiale, come la creazione di nuove foto da un commento da solo (“Mostrami un koala che schiaccia una palla da basket”) o la modifica di foto sulla base di istruzioni scritte (“Fallo sembrare che la scimmia paga le tasse”).

2. Come funzionano?

i modelli di base funzionanoreti neurali profonde“, vagamente ispirato al modo in cui funziona il cervello. Ciò comporta una matematica sofisticata e un’enorme quantità di potenza di calcolo, ma si riduce a un tipo molto complesso di corrispondenza di schemi.

READ  Il nuovo accessorio MagSafe di Moment consente ai registi mobili di riporre facilmente il proprio iPhone

Ad esempio, osservando milioni di immagini tipiche, una rete neurale profonda può associare la parola “gatto” a schemi di pixel che spesso compaiono nelle immagini di gatti, come macchie morbide, sfocate e pelose. Più esempi vede il modello (più dati mostrati) e più grande è il modello (più “strati” o “profondità”), più complessi possono essere questi modelli e correlazioni.



Leggi di più:
Cos’è una rete neurale? Spiega l’informatico


I modelli fondamentali sono, da un lato, semplicemente un’estensione del paradigma del “deep learning” che ha dominato la ricerca sull’IA negli ultimi dieci anni. Tuttavia, mostrano comportamenti non programmati o “emergenti” che possono essere sorprendenti e nuovi.

Ad esempio, il modello linguistico PaLM di Google sembra essere in grado di fornire spiegazioni per metafore e battute complesse. Questo semplicemente trascende Imita i tipi di dati per i quali sono stati originariamente addestrati a elaborare.

Il modello linguistico PaLM può rispondere a domande complesse.
Google AI

3. L’accesso è limitato – per ora

È difficile pensare alla vastità di questi sistemi di intelligenza artificiale. Palm ha 540 miliardi Parametri, il che significa che anche se tutti sul pianeta memorizzassero 50 numeri, non avremmo abbastanza spazio di archiviazione per riprodurre il modello.

I modelli sono così enormi che la loro formazione richiede enormi quantità di risorse computazionali e di altro tipo. Una stima mette il costo della formazione del modello linguistico OpenAI GPT-3 al livello . Circa 5 milioni di dollari USA.



Leggi di più:
I robot possono scrivere? L’apprendimento automatico produce risultati impressionanti, ma è ancora necessario un po’ di assemblaggio


Di conseguenza, solo le grandi aziende tecnologiche come OpenAI, Google e Baidu possono permettersi di costruire modelli di base al momento. Queste aziende determinano chi può accedere ai sistemi, il che ha senso dal punto di vista economico.

Le restrizioni sull’uso possono darci un po’ di conforto Questi sistemi non verranno utilizzati per scopi nefasti (come la creazione di notizie false o contenuti diffamatori) a breve. Ma significa anche che i ricercatori indipendenti non sono in grado di interrogare questi sistemi e condividere i risultati in modo aperto e responsabile. Quindi non conosciamo ancora gli effetti pieni del suo utilizzo.

4. Cosa significheranno questi modelli per le industrie “creative”?

Altri modelli base saranno prodotti nei prossimi anni. I modelli più piccoli sono già stati pubblicati in Moduli open sourcele aziende tecnologiche lo hanno avviato Sperimenta le licenze e il marketing di questi strumenti E i ricercatori di intelligenza artificiale stanno lavorando duramente per rendere la tecnologia più efficiente e accessibile.

La notevole creatività dimostrata da modelli come PaLM e DALL-E 2 mostra che i lavori professionali creativi possono essere interessati da questa tecnologia prima di quanto inizialmente previsto.



Leggi di più:
L’IA potrebbe essere il radiologo del futuro, nel mezzo di una crisi del personale sanitario


La saggezza convenzionale dice sempre che i robot sostituiranno prima i lavori dei “colletti blu”. Il lavoro da “colletti bianchi” doveva essere relativamente al sicuro dall’automazione, in particolare il lavoro professionale che richiedeva creatività e formazione.

I modelli di intelligenza artificiale per il deep learning stanno già mostrando un’incredibile precisione umana in attività come Revisione a raggi X E Rilevamento della degenerazione maculare delle condizioni oculari. I moduli aziendali potrebbero presto fornire creatività a buon mercato e “abbastanza buona” in aree come pubblicità, copywriting, fotografia d’archivio o progettazione grafica.

Il futuro del lavoro professionale e creativo potrebbe sembrare un po’ diverso da quello che ci aspettavamo.

5. Cosa significa questo per prove legali, notizie e media

I modelli base lo faranno inevitabilmente pregiudicare la legge In aree come la proprietà intellettuale e le prove, perché non saremo in grado di presumere Il contenuto creativo è il risultato dell’attività umana.

Dovremo anche affrontare la sfida della disinformazione e della disinformazione generata da questi sistemi. Stiamo già riscontrando enormi problemi con la disinformazione, come vediamo in Lo svolgersi dell’invasione russa dell’Ucraina E il problema nascente falso profondo foto e video, ma i modelli base sono preparati in modo eccellente per affrontare queste sfide.



Leggi di più:
3,2 miliardi di foto e 720.000 ore di video vengono condivisi online ogni giorno. Riesci a distinguere il vero dal falso?


È ora di prepararsi

ricercatori che Studiare gli effetti dell’intelligenza artificiale sulla società, pensiamo che i modelli base faranno un enorme cambiamento. Sono strettamente controllati (per ora), quindi probabilmente avremo un po’ di tempo per capire i loro effetti prima che diventino un grosso problema.

Il genio non è ancora uscito dalla bottiglia, ma i modelli di base sono una bottiglia piuttosto grande e dentro c’è un genio piuttosto intelligente.