Root NationNyheterIT-nyheterOpenAIs Sora AI-modell vil generere minuttlange videoer fra tekstmeldinger

OpenAIs Sora AI-modell vil generere minuttlange videoer fra tekstmeldinger

-

OpenAI annonserte en ny modell AI Sora, som er i stand til å generere høyoppløselige videoer på opptil ett minutt basert på tekstmeldinger. Sora, som betyr "himmel" på japansk, vil ikke være tilgjengelig for allmennheten med det første, men selskapet vil gi den ut til en liten gruppe forskere og forskere som vil vurdere skaden og potensialet for misbruk.

OpenAI

"Sora er i stand til å generere komplekse scener med flere karakterer, spesifikke typer bevegelser og presise objekt- og bakgrunnsdetaljer," heter det på selskapets nettside. "Modellen forstår ikke bare hva brukeren spurte om i ledeteksten, men også hvordan disse tingene eksisterer i den fysiske verden."

En Sora-generert video viser et par som går gjennom et snødekt Tokyo med kirsebærblomster og snøflak som virvler rundt dem, mens en annen viser realistisk utseende ullene mammuter som går gjennom en snødekt eng mot et bakteppe av snødekte fjellkjeder.

OpenAI sier at modellen jobber med "dyp språkforståelse" som lar den tolke tekstledetråder. Imidlertid, som nesten alle AI-bilde- og videogeneratorer, er ikke Sora perfekt. OpenAI advarer også om at modellen kan være vanskelig å gi årsak og virkning – for eksempel kan den generere en video av en person som spiser en informasjonskapsel, men den viser kanskje ikke bitemerker.

Sora er ikke den første tekst-til-video-konverteringsmodellen. Andre selskaper, inkludert Meta, Google og Runway, har enten antydet tekst-til-video-verktøy eller gjort dem offentlig tilgjengelige. Ingen andre verktøy er imidlertid i stand til å generere en 60-sekunders video. Sora genererer også hele videoer på en gang, i stedet for å samle dem ramme for ramme som andre modeller, slik at objekter i videoen forblir intakte selv når de midlertidig forsvinner fra visningen.

Fremkomsten av tekst-til-video-verktøy har skapt bekymringer om deres potensiale for lettere å lage realistiske falske videoer. Og generativ kunstig intelligens i bredere forstand har forårsaket tilbakeslag fra kunstnere og kreative arbeidere, bekymret for at teknologien potensielt kan erstatte dem.

OpenAI sa at det jobber med eksperter på områder som feilinformasjon, hatinnhold og skjevhet for å teste verktøyet før det blir tilgjengelig for publikum. Selskapet utvikler også verktøy som kan oppdage videoer laget av Sora og inkludere metadata i de opprettede videoene for å gjøre dem lettere å oppdage. Selskapet nektet å si hvordan Sora ble trent, men sa at det brukte både "public domain-videoer" og videoer lisensiert fra rettighetsinnehavere.

Les også:

DzhereloEngadget
Melde deg på
Gi beskjed om
gjest

0 Kommentar
Innebygde anmeldelser
Se alle kommentarer