Google gjør zooming og bildeforbedring til en realitet

Du har sikkert sett fantasyfilmer eller TV-serier der hovedpersonen ber om å forstørre bildet og forbedre resultatet – for å vise et ansikt, eller en bilskilt, eller en hvilken som helst annen nøkkeldetalj. Googles nyeste kunstig intelligens (AI)-systemer, basert på den såkalte diffusjonsmodeller, er i stand til å utføre dette trikset.

Det er en vanskelig prosess å mestre fordi det i hovedsak legger til detaljer til et bilde som kameraet ikke opprinnelig fanget, ved å bruke supersmarte gjetninger basert på andre, lignende bilder.

Google

Hos Google kalles denne teknikken naturlig bildesyntese, og i dette spesielle scenariet ultrahøy bildeoppløsning. Du starter med et lite, pikselert bilde og ender opp med noe skarpt, klart og naturlig. Det er kanskje ikke akkurat originalen, men den er nær nok til å se ekte ut for det menneskelige øyet.

Google har introdusert to nye AI-verktøy for denne jobben. Den første kalles SR3, eller Super-Resolution via Repeated Refinement, og den fungerer ved å legge til støy i et bilde og deretter fjerne det. Gjennom en serie sannsynlighetsberegninger basert på en stor database med bilder og noe maskinlæringsmagi, kan SR3 forestille seg hvordan en superhøyoppløselig versjon av et lavoppløselig pikselbilde ser ut.

Det andre verktøyet er CDM, eller Cascaded Diffusion Models. Google beskriver disse som "pipelines" langs hvilke diffusjonsmodeller – inkludert SR3 – kan rettes for bildeoppskalering av høy kvalitet. Det tar forbedringsmodeller og gjør dem til større bilder.

Google

Ved å bruke forskjellige forbedringsmodeller med forskjellige oppløsninger, er CDM-tilnærmingen i stand til å utkonkurrere alternative bildeoppskaleringsmetoder, ifølge Google. Den nye AI-motoren ble testet på ImageNet, en gigantisk database med treningsbilder som vanligvis brukes til forskning innen visuell objektgjenkjenning.

Sluttresultatene til SR3 og CDM er imponerende. I en standardtest med 50 menneskelige frivillige ble bilder av menneskelige ansikter generert av SR3 forvekslet med ekte bilder omtrent 50 % av tiden – og med tanke på at en ideell algoritme skal oppnå 50 %, er det imponerende. Det er verdt å gjenta at disse forbedrede bildene ikke er nøyaktige samsvar med originalene, de er nøye beregnede simuleringer basert på sannsynlighetsmatematikk.

Google

Google lover mye mer fra sine nye AI-motorer og relaterte teknologier – ikke bare når det gjelder å forsterke bilder av ansikter og andre naturlige objekter, men også i andre områder av sannsynlighetsmodellering.

Les også:

Dzherelovitenskapsmann

Melde deg på

0 Kommentar

Innebygde anmeldelser

Se alle kommentarer

Andre artikler

Som i filmene: Googles nye bildebehandlings-AI gjør skalering og forbedring av dem til en realitet

Nylige kommentarer