Hoe Googles AI Street View-beelden omtovert tot prachtige landschapsfoto’s
Google heeft een nieuw experiment met artificiële intelligentie uitgevoerd. Deze keer gebruikt de softwaregigant een AI om landschapsfoto’s te creëren. Hoe mooi zo’n foto is, is een erg subjectief concept. Hierdoor vormt het experiment van Google een erg interessant onderzoek. Welke foto’s vinden we het mooist? En op basis van welke parameters bepalen we deze schoonheid? Googles AI leerde zichzelf de antwoorden op deze vragen.
Subjectief concept
Machine learning is goed om modellen te creëren met een duidelijke doelstelling. Denk hierbij aan taken met een juist of fout antwoord, of classificatieopdrachten, waarbij je gelabelde trainingsdata kan gebruiken. Of een foto mooi is, is echter moeilijk te bepalen. Google gebruikt zijn recentste experiment dan ook om na te gaan hoe je een AI subjectieve concepten kan aanleren.
“Ons systeem bootst de werkwijze van een professionele fotograaf na. De software bekijkt landschapspanorama’s van Google Street View en zoekt naar de beste compositie. Hierna voert het algoritme verschillende postprocessingoperaties uit om een esthetisch beeld te creëren. Onze virtuele fotograaf ‘reisde’ 40.000 panorama’s af in gebieden zoals de Alpen, Jasper National Parks in Canada en Yellow Stone National Park en kwam terug met creaties die vrij indrukwekkend waren,” schrijft Google over zijn experiment.
Generative model
Traditionele AI-algoritmes gebruiken een erg grote dataset met beelden die als mooi of lelijk zijn gelabeld. Deze aanpak neemt erg veel tijd in beslag en is moeilijk haalbaar. Google gebruikte daarom slechts een beperkte collectie van professionele foto’s zonder labels om zijn AI te trainen. De software gaat op zoek naar verschillende aspecten die de schoonheid van foto’s bepalen. De AI leert elk aspect afzonderlijk met behulp van negatieve voorbeelden die door een traditionele beeldfilter worden gemaakt.
De AI cropped het oorspronkelijke panorama , om de mooiste details uit het beeld te halen. Hierna wordt de saturatie en HDR van het beeld versterkt en past de artificiële intelligentie een ‘dramatic mask’-filter toe op de foto.
Google creëerde deze filter met behulp van een nieuwe techniek die ‘generative adversarial network’ (GAN) wordt genoemd. Bij deze techniek gaan wetenschappers ervan uit dat je dingen die je niet kan creëren niet begrijpt. Een generative model bevat een veel kleiner aantal parameters dan in zijn trainingsdata zit, waarna het model een efficiënte manier moet zoeken om de belangrijkste parameters te onthouden. Deze paramaters worden later gebruikt om mooie beelden te creëren.
Turing-test
Google gebruikte een variant op de Turing-test om te bepalen of zijn AI erin slaagt om mooie foto’s te creëren. Professionele fotografen kregen foto’s van zowel professionals als Googles AI te zien en moesten deze beelden telkens een score geven. Ongeveer twee op vijf foto’s kregen een score die in lijn lagen met semiprofessionele of professionele foto’s.
Google heeft een nieuw experiment met artificiële intelligentie uitgevoerd. Deze keer gebruikt de softwaregigant een AI om landschapsfoto’s te creëren. Hoe mooi zo’n foto is, is een erg subjectief concept. Hierdoor vormt het experiment van Google een erg interessant onderzoek. Welke foto’s vinden we het mooist? En op basis van welke parameters bepalen we deze schoonheid? Googles AI leerde zichzelf de antwoorden op deze vragen.
Subjectief concept
Machine learning is goed om modellen te creëren met een duidelijke doelstelling. Denk hierbij aan taken met een juist of fout antwoord, of classificatieopdrachten, waarbij je gelabelde trainingsdata kan gebruiken. Of een foto mooi is, is echter moeilijk te bepalen. Google gebruikt zijn recentste experiment dan ook om na te gaan hoe je een AI subjectieve concepten kan aanleren.
“Ons systeem bootst de werkwijze van een professionele fotograaf na. De software bekijkt landschapspanorama’s van Google Street View en zoekt naar de beste compositie. Hierna voert het algoritme verschillende postprocessingoperaties uit om een esthetisch beeld te creëren. Onze virtuele fotograaf ‘reisde’ 40.000 panorama’s af in gebieden zoals de Alpen, Jasper National Parks in Canada en Yellow Stone National Park en kwam terug met creaties die vrij indrukwekkend waren,” schrijft Google over zijn experiment.
Generative model
Traditionele AI-algoritmes gebruiken een erg grote dataset met beelden die als mooi of lelijk zijn gelabeld. Deze aanpak neemt erg veel tijd in beslag en is moeilijk haalbaar. Google gebruikte daarom slechts een beperkte collectie van professionele foto’s zonder labels om zijn AI te trainen. De software gaat op zoek naar verschillende aspecten die de schoonheid van foto’s bepalen. De AI leert elk aspect afzonderlijk met behulp van negatieve voorbeelden die door een traditionele beeldfilter worden gemaakt.
De AI cropped het oorspronkelijke panorama , om de mooiste details uit het beeld te halen. Hierna wordt de saturatie en HDR van het beeld versterkt en past de artificiële intelligentie een ‘dramatic mask’-filter toe op de foto.
Google creëerde deze filter met behulp van een nieuwe techniek die ‘generative adversarial network’ (GAN) wordt genoemd. Bij deze techniek gaan wetenschappers ervan uit dat je dingen die je niet kan creëren niet begrijpt. Een generative model bevat een veel kleiner aantal parameters dan in zijn trainingsdata zit, waarna het model een efficiënte manier moet zoeken om de belangrijkste parameters te onthouden. Deze paramaters worden later gebruikt om mooie beelden te creëren.
Turing-test
Google gebruikte een variant op de Turing-test om te bepalen of zijn AI erin slaagt om mooie foto’s te creëren. Professionele fotografen kregen foto’s van zowel professionals als Googles AI te zien en moesten deze beelden telkens een score geven. Ongeveer twee op vijf foto’s kregen een score die in lijn lagen met semiprofessionele of professionele foto’s.