Dicembre 3, 2023

NbaRevolution

Covid crisi politica in Italia

QuickVid utilizza l’intelligenza artificiale per creare brevi video, completi di voci fuori campo

QuickVid utilizza l’intelligenza artificiale per creare brevi video, completi di voci fuori campo

L’IA generativa sta arrivando per i video. Nuova sede , QuickVidcombina diversi sistemi di intelligenza artificiale generativa in un unico strumento per creare automaticamente brevi video per YouTube, Instagram, TikTok e Snapchat.

Data una sola parola, QuickVid seleziona un video di sfondo da una libreria, scrive testo e parole chiave e copre le immagini generate da DALL-E 2 Aggiunge una voce fuori campo sintetica e musica di sottofondo dalla libreria musicale royalty-free di YouTube. Il creatore di QuickVid Daniel Habib afferma che sta costruendo il servizio per aiutare i creatori a soddisfare la domanda “sempre crescente” dei loro fan.

“Fornendo ai creatori strumenti per produrre rapidamente e facilmente contenuti di alta qualità, QuickVid aiuta i creatori ad aumentare la produzione di contenuti, riducendo il rischio di esaurimento”, ha dichiarato Habib a TechCrunch in un’intervista via e-mail. “Il nostro obiettivo è consentire al tuo creatore preferito di stare al passo con le esigenze del proprio pubblico sfruttando i progressi dell’intelligenza artificiale”.

Ma a seconda di come vengono utilizzati, strumenti come QuickVid minacciano di inondare canali già affollati di spam e contenuti ripetitivi. Devono anche affrontare potenziali contraccolpi da parte dei creatori che scelgono di non utilizzare gli strumenti, a causa del costo ($ 10 al mese) o in linea di principio, ma potrebbero dover competere con una serie di nuovi video generati dall’intelligenza artificiale.

Vai dopo il video

QuickVid, che Habib, uno sviluppatore autodidatta che in precedenza ha lavorato su Meta e infrastruttura video di Facebook Live, ha lanciato nel giro di poche settimane, QuickVid il 27 dicembre. Per ora è relativamente semplice – Habib afferma che a gennaio arriveranno più opzioni di personalizzazione – ma QuickVid può mettere insieme i componenti che compongono un tipico cortometraggio informativo di YouTube o un video TikTok, inclusi sottotitoli e persino avatar. .

È facile da usare. Innanzitutto, l’utente inserisce un messaggio che descrive di cosa tratta il video che desidera creare. QuickVid utilizza prompt per generare script, sfruttando le potenzialità dello script generativo GPT-3. Dalle parole chiave estratte automaticamente dallo script o inserite manualmente, QuickVid sceglie un video di sfondo dalla libreria multimediale esente da royalty di Pexels e crea sovrapposizioni utilizzando DALL-E 2. Quindi emette una voce fuori campo tramite l’API Text-to-Speech di Google. essere in grado di riprodurre la propria voce, dice Habib, prima di combinare tutti questi elementi in un video.

QuickVid

QuickVid

Crediti immagine: QuickVid

Guarda questo video realizzato da un prompt dei “gatti”:

READ  12 piccoli ma significativi dettagli dell'evento Apple che potresti esserti perso

Cos’è questo nuovo segreto:

QuickVid certamente non spinge i confini di ciò che è possibile con l’IA generativa. Possiede sia Meta che Google mostrato Sistemi di intelligenza artificiale in grado di creare clip completamente originali durante la direzione del testo. Ma QuickVid integra l’intelligenza artificiale esistente per sfruttare il tipico formato ripetitivo dei video B-roll brevi e pesanti, aggirando il problema di dover creare il filmato stesso.

“I creatori di successo hanno un nastro di altissima qualità e non sono interessati a pubblicare contenuti che non sentono essere nella loro voce”, ha detto Habib. “Questo è il caso d’uso su cui ci concentriamo.”

Stando così le cose, in termini di qualità, i video QuickVid sono generalmente un miscuglio. I video di sfondo tendono ad essere un po’ casuali o solo tangenzialmente correlati all’argomento, il che non sorprende dato che QuickVids è attualmente limitato al catalogo Pexels. Nel frattempo, le immagini generate da DALL-E 2 mostrano i limiti dell’odierna tecnologia text-to-image, come testo distorto e proporzioni errate.

In risposta al mio feedback, Habib ha affermato che QuickVid è “testato e modificato quotidianamente”.

Problemi di Copyright

Secondo Habib, gli utenti di QuickVid si riservano il diritto di utilizzare commercialmente i contenuti che creano e ottenere il permesso di monetizzarli su piattaforme come YouTube. Ma lo stato del copyright sui contenuti generati dall’intelligenza artificiale… è oscuro, almeno per il momento. Recentemente, l’Ufficio brevetti e marchi degli Stati Uniti (USPTO). lui si è trasferito Revocare la protezione del copyright per un fumetto generato dall’intelligenza artificiale, ad esempio, sostenendo che le opere protette da copyright richiedono la paternità umana.

Alla domanda su come la decisione dell’USPTO potrebbe influire su QuickVid, Habib ha affermato di ritenere che riguardi solo “l’idoneità ai brevetti” per i prodotti generati dall’intelligenza artificiale e non i diritti dei creatori di utilizzare e monetizzare i loro contenuti. Ha notato che i creatori spesso non depositano brevetti per i video e di solito tendono all’economia dei creatori, consentendo ad altri creatori di riutilizzare le loro clip per aumentare la loro portata.

“I creatori sono interessati a pubblicare contenuti di alta qualità con la loro voce che aiuteranno a far crescere il loro canale”, ha affermato Habib.

Un’altra sfida legale all’orizzonte potrebbe influenzare l’integrazione DALL-E 2 di QuickVid e, per estensione, la capacità del sito di generare sovrapposizioni di immagini. Microsoft, GitHub e OpenAI sono in fase di creazione causa in un’azione legale collettiva accusandoli di violare la legge sul copyright consentendo a Copilot, un sistema di generazione di codice, di restituire sezioni di codice concesso in licenza senza fornire credito. (Copilot è stato sviluppato congiuntamente da OpenAI e GitHub, di proprietà di Microsoft.) Il caso ha implicazioni per l’arte generativa dell’IA come DALL-E 2, che è stata trovata in modo simile. copia e incolla dai set di dati su cui sono stati addestrati (ad esempio immagini).

READ  Imparare al limite | notizie del MIT

Habib non è preoccupato, sostenendo che il genio dell’IA generativa è fuori dalla bottiglia. “Se domani si presenta un’altra causa e OpenAI scompare, ci sono diverse alternative che potrebbero alimentare QuickVid”, ha detto, riferendosi al sistema open source simile a DALL-E 2. diffusione stabile. QuickVid sta già testando Stable Diffusion per la generazione di avatar.

Moderazione e spam

Dilemmi legali a parte, QuickVid potrebbe presto avere un problema di moderazione. Mentre OpenAI ha implementato filtri e tecniche per prevenirlo, l’IA generativa ha conosciuto problemi di tossicità e accuratezza realistica. tubi GPT-3 disinformazione, in particolare in relazione agli eventi recenti, che si estendono oltre i limiti della sua base di conoscenze. E ChatGPT, una progenie finemente sintonizzata di GPT-3, lo era Mostrato Per aver usato un linguaggio razzista e sessista.

Questo è preoccupante, soprattutto per le persone che usano QuickVid per creare video informativi. In un rapido test, ho chiesto al mio partner, che è più creativo di me, specialmente in quest’area, di inserire alcuni suggerimenti offensivi per vedere cosa avrebbe generato QuickVid. A discrezione di QuickVid, affermazioni problematiche come “il nuovo ordine mondiale ebraico” e “teoria del complotto dell’11 settembre” chiaramente non hanno portato a testi tossici. Ma affinché Critical Race Theory indottrinasse gli studenti, QuickVid ha prodotto un video che suggerisce che Critical Race Theory può essere usata per fare il lavaggio del cervello agli scolari.

Vediamo:

QuickVid

QuickVid

Habib afferma di fare affidamento sui filtri di OpenAI per svolgere la maggior parte del lavoro di moderazione e sostiene che gli utenti devono rivedere manualmente ogni video generato da QuickVid per assicurarsi che “tutto rientri nei limiti della legge”.

“Come regola generale, penso che le persone dovrebbero essere in grado di esprimersi e creare qualsiasi contenuto desiderino”, ha affermato Habib.

Questo sembra contenere spam. Habib afferma che gli algoritmi delle piattaforme video, non quelli di QuickVid, sono i migliori per determinare la qualità del video e che le persone che producono contenuti di bassa qualità “danneggiano solo la loro reputazione”. Dice che il danno alla reputazione scoraggerà naturalmente le persone dal creare campagne di spam di massa con QuickVid.

READ  Divertimento nel buco caldo fumante

Ha aggiunto: “Se le persone non vogliono vedere il tuo video, non otterrai la distribuzione su piattaforme come YouTube”. “La produzione di contenuti di bassa qualità farà sì che le persone visualizzino negativamente il tuo canale.”

Ma vale la pena dare un’occhiata alle agenzie pubblicitarie come Fractl, che nel 2019 ha utilizzato un sistema di intelligenza artificiale chiamato Grover per creare un sito pieno di materiali di marketing: al diavolo la reputazione. in un colloquio Con The Verge, la partner di Fractl Christine Tinsky ha affermato di aver anticipato l’IA generativa che consentirà “un enorme tsunami di contenuti generati dal computer ovunque immaginabile”.

In ogni caso, le piattaforme di condivisione video come TikTok e YouTube non hanno dovuto affrontare la modifica su larga scala dei contenuti generati dall’intelligenza artificiale. I deepfake – video sintetici che sostituiscono una persona esistente con l’aspetto di un’altra persona – hanno iniziato a spuntare su piattaforme come YouTube diversi anni fa, Strumento guidato che ha reso facile produrre colpi di profondità. Ma a differenza dei deepfake più convincenti di oggi, è chiaro che i tipi di video creati da QuickVid non sono in alcun modo creati dall’intelligenza artificiale.

La politica di Ricerca Google sul testo generato dall’intelligenza artificiale potrebbe essere un’anteprima di ciò che accadrà nel campo dei video. Google non tratta il testo sintetico in modo diverso dal testo scritto dall’uomo in termini di ranking di ricerca, ma prende provvedimenti Contiene contenuti “intesi a manipolare le classifiche di ricerca, non ad assistere gli utenti”. Include contenuti raggruppati insieme o compilati da diverse pagine web.[doesn’t] aggiungendo valore sufficiente” così come i contenuti generati attraverso processi puramente automatizzati, entrambi applicabili a QuickVid.

In altre parole, i video generati dall’intelligenza artificiale potrebbero non essere banditi direttamente dalle piattaforme se vengono lanciati in modo importante, ma piuttosto diventare il costo per fare affari. È improbabile che ciò plachi i timori degli esperti che credono che piattaforme come TikTok stiano diventando la loro nuova casa ingannevole video, ma – come ha detto Habib durante l’intervista – “non c’è modo di fermare la rivoluzione dell’IA generativa”.