OpenAI introduserte en ny Sora AI-modell for videoskaping

OpenAI annonserte en ny modell AI Sora, som er i stand til å generere høyoppløselige videoer på opptil ett minutt basert på tekstmeldinger. Sora, som betyr "himmel" på japansk, vil ikke være tilgjengelig for allmennheten med det første, men selskapet vil gi den ut til en liten gruppe forskere og forskere som vil vurdere skaden og potensialet for misbruk.

"Sora er i stand til å generere komplekse scener med flere karakterer, spesifikke typer bevegelser og presise objekt- og bakgrunnsdetaljer," heter det på selskapets nettside. "Modellen forstår ikke bare hva brukeren spurte om i ledeteksten, men også hvordan disse tingene eksisterer i den fysiske verden."

En Sora-generert video viser et par som går gjennom et snødekt Tokyo med kirsebærblomster og snøflak som virvler rundt dem, mens en annen viser realistisk utseende ullene mammuter som går gjennom en snødekt eng mot et bakteppe av snødekte fjellkjeder.

Vi introduserer Sora, vår tekst-til-video-modell.

Sora kan lage videoer på opptil 60 sekunder med svært detaljerte scener, komplekse kamerabevegelser og flere karakterer med levende følelser. https://t.co/7j2JN27M3W

Spørsmål: "Vakker, snødekt ... pic.twitter.com/ruTEWn87vf

- OpenAI (@OpenAI) Februar 15, 2024

OpenAI sier at modellen jobber med "dyp språkforståelse" som lar den tolke tekstledetråder. Imidlertid, som nesten alle AI-bilde- og videogeneratorer, er ikke Sora perfekt. OpenAI advarer også om at modellen kan være vanskelig å gi årsak og virkning – for eksempel kan den generere en video av en person som spiser en informasjonskapsel, men den viser kanskje ikke bitemerker.

Sora er ikke den første tekst-til-video-konverteringsmodellen. Andre selskaper, inkludert Meta, Google og Runway, har enten antydet tekst-til-video-verktøy eller gjort dem offentlig tilgjengelige. Ingen andre verktøy er imidlertid i stand til å generere en 60-sekunders video. Sora genererer også hele videoer på en gang, i stedet for å samle dem ramme for ramme som andre modeller, slik at objekter i videoen forblir intakte selv når de midlertidig forsvinner fra visningen.

Spørring: «Flere gigantiske ullene mammuter nærmer seg tråkket gjennom en snødekt eng, den lange ullen pelsen deres blåser lett i vinden mens de går, snødekte trær og dramatiske snødekte fjell i det fjerne, lys midt på ettermiddagen med stritte skyer og en sol høyt inn. avstanden… pic.twitter.com/Um5CWI18nS

- OpenAI (@OpenAI) Februar 15, 2024

Fremkomsten av tekst-til-video-verktøy har skapt bekymringer om deres potensiale for lettere å lage realistiske falske videoer. Og generativ kunstig intelligens i bredere forstand har forårsaket tilbakeslag fra kunstnere og kreative arbeidere, bekymret for at teknologien potensielt kan erstatte dem.

OpenAI sa at det jobber med eksperter på områder som feilinformasjon, hatinnhold og skjevhet for å teste verktøyet før det blir tilgjengelig for publikum. Selskapet utvikler også verktøy som kan oppdage videoer laget av Sora og inkludere metadata i de opprettede videoene for å gjøre dem lettere å oppdage. Selskapet nektet å si hvordan Sora ble trent, men sa at det brukte både "public domain-videoer" og videoer lisensiert fra rettighetsinnehavere.

Les også:

DzhereloEngadget

Melde deg på

0 Kommentar

Innebygde anmeldelser

Se alle kommentarer

Andre artikler

OpenAIs Sora AI-modell vil generere minuttlange videoer fra tekstmeldinger

Nylige kommentarer