nem, nem igazán nézel ki így

amikor egy Lewis Hilsenteger nevű prominens YouTuber (más néven “Unbox Therapy”) tesztelte az őszi új iPhone modellt, az XS-t, észrevett valamit: a bőre extra sima volt az eszköz előre néző szelfi kamerájában, különösen a régebbi iPhone modellekhez képest. Hilsenteger egyfajta digitális sminkhez hasonlította. “Nem így nézek ki” – mondta a jelenséget bemutató videóban. “Ez furcsa … úgy nézek ki, mintha alapozót viselnék.”

nem ő az egyetlen, aki észrevette a hatást, bár az Apple nem ismerte el, hogy bármi mást csinál, mint korábban. Régóta iPhone-felhasználóként és amatőr fotósként beszélve tagadhatatlannak tartom, hogy a portré mód—a világ legnépszerűbb telefonjainak legújabb kiadásában egy sátor technológia—ragyogott. A készülékkel való fényképezés hetei alatt rájöttem, hogy a kamera átlépte a fénykép és a fauxtograph közötti küszöböt. Nem annyira “fényképeztem”, mint a telefon szintetizálta őket.

ez nem teljesen új jelenség: minden digitális fényképezőgép algoritmusokat használ arra, hogy az érzékelőjét érintő különböző hullámhosszú fényeket tényleges képpé alakítsa. Az emberek mindig jó fényt kerestek. Az okostelefonok korában a Snapchat-tól a FaceApp-ig a Beauty Plus-ig terjedő alkalmazások felajánlották az arcod frissítését. Más telefonoknak van egy hibája-kiküszöbölve a “szépség módot”, amelyet be-vagy kikapcsolhat, is. Ami figyelemre méltóvá teszi az iPhone XS bőrsimítását, az az, hogy egyszerűen a kamera alapértelmezett. Készíts egy szelfit, és ez az, amit kapsz.

FaceApp lényegesen több George Clooney hozzáadása az arcomhoz, mint ami valójában létezik (Alexis Madrigal / FaceApp)

ezek a képek nem hamisak, pontosan. De ezek nem is képek, ahogyan azokat a napokban megértették, mielőtt számítógéppel fényképezett volna.

ami változott: a kamerák túl sokat tudnak. Minden kamera információt rögzít a világról—a múltban a fotonokkal kölcsönhatásba lépő vegyi anyagok rögzítették, és definíció szerint egy fénykép egy érzékelő rövid vagy hosszú expozíciója volt a fénynek. Most, a motorháztető alatt, a telefonkamerák több képbemenetből információkat gyűjtenek egy képkimenetbe, valamint olyan neurális hálózatokra rajzolnak, amelyek arra vannak kiképezve, hogy megértsék azokat a jeleneteket, amelyekre mutatnak. Ezt az egyéb információt, valamint az egyéni expozíciót felhasználva a számítógép szintetizálja a végső képet, egyre automatikusabban és láthatatlanabban.

további történetek

a tét nagy lehet: A mesterséges intelligencia megkönnyíti a videók szintetizálását új, fiktív videókká, amelyeket gyakran “deepfakes” – nek hívnak.””Hamarosan egy olyan világban élünk, ahol a szemünk rutinszerűen megtéveszt minket” – írta kollégám, Franklin Foer. “Másképp fogalmazva, nem vagyunk olyan messze a valóság összeomlásától.”A Deepfakes a valóság megolvasztásának egyik módja; egy másik az egyszerű telefonfotó megváltoztatása a szemünkkel látott valóság tisztességes közelítéséről valami egészen másra. Alacsony hőmérsékleten mindenütt jelen van, de nem kevésbé hatékony. És valószínűleg sokkal fontosabb a technológiai vállalatok jövője szempontjából.

ban ben hogyan lássuk a világot, Nicholas Mirzoeff médiatudós a fotózást “a gépek által lehetővé tett világ látásának egyik módjának nevezi.”Nemcsak a gépek használatáról beszélünk, hanem a “hálózati társadalomról”, amelyben képeket készítenek. Mirzoeff számára pedig nincs jobb példa az” új hálózatba kapcsolt, városi Globális Ifjúsági kultúrára”, mint a szelfi.

úgy tűnik, hogy a telefongyártók és az alkalmazásgyártók egyetértenek abban, hogy a Szelfik irányítják üzleti ökoszisztémájukat. Hatalmas erőforrásokat fordítottak az arcok fényképezésére. Az Apple szó szerint új Szilícium chipeket hozott létre, hogy képes legyen-amint azt a vállalat ígéri-figyelembe venni az arcát “még a forgatás előtt.”Először is ott van az arcfelismerés. Ezután a telefon rögzíti az arc “tereptárgyait”, hogy megtudja, hol vannak a szemek, a száj és más funkciók. Végül az arc és az előtér többi része mélység leképezve van, így egy arc kiugrhat a háttérből. Mindezek az adatok az alkalmazásfejlesztők rendelkezésére állnak, ami az egyik oka az arc manipulálására szolgáló alkalmazások elterjedésének, mint például a Mug Life, amely egyetlen fényképet készít, és parancsra kvázi-realisztikus hamis videókká alakítja őket.

semmi hátborzongató ebben a bögre Életképben (Alexis Madrigal / bögre élet)

mindez a munka, amely egy évtizeddel ezelőtt hihetetlenül nehéz volt, és csak a közelmúltban csak felhőszervereken lehetséges, most közvetlenül a telefonon fut, ahogy az Apple leírta. A vállalat egy gépi tanulási modellt képzett ki, hogy hatalmas számú képben találjon arcokat. A modell azonban túl nagy volt, ezért egy kisebb verziót képeztek ki az első kimeneteire. Ez a trükk lehetővé tette a telefon futtatását. Minden fotó, amelyet minden iPhone készít, kis részben ennek a több millió képnek köszönhető, amelyet kétszer szűrtek át egy hatalmas gépi tanulási rendszeren.

de nem csak arról van szó, hogy a kamera tudja, hogy van egy arc és hol vannak a szemek. A kamerák most több képet is rögzítenek abban a pillanatban, hogy újakat szintetizáljanak. A Night Sight, a Google Pixel új funkciója, a legjobban magyarázott példa ennek működésére. A Google új technikákat fejlesztett ki több alsóbbrendű (zajos, sötét) kép egyesítésére egy kiváló (tisztább, világosabb) képpé. Bármely fénykép valóban egy csomó fénykép keveréke, amelyet a központi expozíció körül készítettek. De akkor, mint az Apple esetében, a Google gépi tanulási algoritmusokat telepít ezen képek tetejére. Az, amelyet a vállalat nyilvánosan leírt, segít a fehéregyensúlyozásban—ami segít a kép reális színének biztosításában—gyenge fényviszonyok között. Azt is elmondta a The Verge-nek, hogy “a gépi tanulás érzékeli, hogy milyen tárgyak vannak a keretben, és a kamera elég okos ahhoz, hogy tudja, milyen színűek legyenek.”Fontolja meg, hogy ez mennyire különbözik egy normál fényképtől. A Google kamerája nem rögzíti azt, ami van, de statisztikailag valószínű.

a Google megmutatja éjszakai látási teljesítményét (jobbra), a bal oldali iPhone XS-hez képest (Google).

a fényképezés egyre automatikusabbá vált. Ez olyan, mint a kereskedelmi pilóták repülő repülőgépek: Ezek a kézi vezérlés csak egy kis százaléka egy adott utazás. Telefon-Számítógép-kameráink zökkenőmentesen, láthatatlanul elhomályosítják a különbséget a fényképezőgép és a számítógép által megtehető dolgok között. Természetesen vannak folytonosságok a már létező technikákkal, de csak akkor, ha a digitális fényképezés előrehaladását valamilyen logaritmikus skálán ábrázoljuk.

nagy dinamikatartomány, vagy HDR, a fényképezés a 2000-es években vált népszerűvé, uralva a korai fotómegosztó oldalt Flickr. A fotósok több (általában három) képet készítettek ugyanarról a jelenetről különböző expozíciókkal. Ezután egymásra rakták a képeket, és a legfényesebb fényképről vették az árnyékokkal kapcsolatos információkat, a legsötétebb fényképről pedig a fénypontokkal kapcsolatos információkat. Összerakni őket, és gyönyörű szürrealitást generálhatnak. A jobb kezekben egy HDR-fénykép olyan jelenetet hozhat létre, amely sokkal inkább hasonlít arra, amit a szemünk lát, mint amit a legtöbb kamera általában készít.

jó példa néhány HDR-fénykép intenzív szürrealitására (Jimmy McIntyre / Flickr)

szemünk, különösen változó fényerő esetén, dinamikusan kompenzálhat. Próbáljon például képet készíteni a Holdról. Maga a hold nagyon fényes, és ha megpróbálsz lefényképezni, úgy kell kitenned, mintha délben lenne. De az éjszaka sötét, nyilvánvalóan, és így, hogy részletes képet kapjunk a Holdról, a jelenet többi része lényegében fekete. Szemünk gond nélkül látja mind a Holdat, mind a földi tájat.

mind a Google, mind az Apple szeretné a HDR folyamatot olyan automatikussá tenni, mint a szemünk beállítása. Beépítették a HDR-t alapértelmezett kameráikba, képek sorozatából rajzolva (a Google legfeljebb 15-et használ). A HDR egyszerűen a képek készítésének módja lett a legtöbb ember számára. Mint a bőrsimításnál, ez már nem igazán számít, ha ezt látná a szemünk. Néhány új termék célja, hogy felülmúlja saját testünk lenyűgöző vizuális képességeit. “Az éjszakai látás célja, hogy olyan sötét képeket készítsen a jelenetekről, hogy a saját szemével nem láthatja őket tisztán — szinte olyan, mint egy szuperhatalom!”A Google írja.

a 19.század óta a kamerák különböző sebességgel, hullámhosszon és nagyítással képesek képeket készíteni, amelyek korábban rejtett világokat tárnak fel. Ami lenyűgöző a telefonfotózás jelenlegi változásaiban, az az, hogy annyira feltárják, hogy mit akarunk kinézni, mint a világ vizsgálata. Olyan, mintha felfedeztünk volna egy szondát az arcunk—vagy akár önmagunk—verzióinak megtalálására és megosztására, és ez a folyamat vezérli a világ leginnovatívabb, legjövedelmezőbb vállalatainak viselkedését.

az Amazon bemutatja arcfelismerő technológiájának (Amazon) képességeit.

eközben a vállalatok és a kormányok valami mást tehetnek az arcoddal: olyan arcfelismerő technológiákat hozhatnak létre, amelyek bármilyen kamerát megfigyelő géppé változtatnak. A Google ígéretet tett arra, hogy nem ad el “általános célú arcfelismerő” terméket, amíg a technológiával kapcsolatos etikai kérdéseket nem oldják meg, de az Amazon Rekognition már elérhető, csakúgy, mint a Microsoft Face API-ja, nem is beszélve a kínai internetes vállalatok még szélesebb körű erőfeszítéseiről.

a globális gazdaság az arcodhoz van kötve. És hajlandó megmozgatni az eget és a földet, hogy láthasd azt, amit látni akarsz.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.

More: