Jaroslav Křivánek: Snažím se pochopit faktory lidského vzezření a algoritmicky je reprodukovat na počítači

Jaroslav Křivánek: Snažím se pochopit faktory lidského vzezření a algoritmicky je reprodukovat na počítači

Informatika / rozhovor

Světlo na chodbě třetího patra malostranské budovy, kde docent Křivánek sídlí, už pro fotografování nebylo moc vhodné, a tak jsme se ho vypravili hledat. Stejně by na téma světlo přišla řeč. Jaroslav Křivánek se totiž zabývá vývojem realistické simulace dopadu světla na lidské tělo. Vede na Matfyzu Skupinu pro počítačovou grafiku, která spadá pod Katedru softwaru a výuky informatiky. Hovořili jsme o jeho nedávných úspěších v oblasti věrného zobrazování dopadu světla, o tom jak se pozná grafika od fotografie, i o aktuální dění v jeho skupině studentů.

Nedávno jste se dostal mezi 100 inovátorů ze střední a východní Evropy. Výběr provádí Res publica, Google, Financial Times za spolupráce regionálních institucí. Co to pro Vás znamená?

Cílem tohoto seskupení je zviditelnit lidi, kteří ze střední a východní Evropy podnikají něco, co má globálnější dopad. Do téhle definice moje práce asi spadá, ale stejně dobře tam spadá práce celé řady dalších lidí, a ti se v tom výběru nejspíš objeví v dalších letech. Z kolegů z Matfyzu nebo bývalých kolegů z ČVUT bych jich tam pár určitě patřilo.

A koho byste z Matfyzu zmínil?

Z kolegů na Matfyzu by se v NewErope100 měl určitě objevit Cyril Brom. Vyrobil počítačovou hru Československo 38-89, která propaguje historii Československa, a v zámoří se dostala do finále soutěže spolu s MIT a US Army. Pracuje na originálním výzkumu účinnosti elektronických výukových materiálů s nasazením průkopnických metod (analýza hladiny kortizolu, sledování očních pohybů). Spolupracuje s psychology, historiky a sociology.

Ve vašem medailonku se píše, že je pro vás největší výzvou vytvořit virtuální lidské alter ego. Jak jsme od takového stavu daleko?

Od něčeho, co by se dalo nazvat přirozenou lidskou inteligencí, jsme nesmírně daleko. Moje práce je ale jednodušší: zabývám se tím, jak pomocí počítače vytvořit přesvědčivé vyobrazení člověka. A tenhle cíl není nedosažitelný, vlastně jsme mu docela blízko. Pro většinu trikových záběrů ve filmech se již dnes používají digitální dvojníci. Celý proces tvorby těchto záběrů je ale v současné době založený na nesmírném množství manuální práce a na dobrém oku grafiků, kteří tyto záběry vytvářejí. V interaktivních aplikacích, jako jsou hry, vypadají veškeré záběry lidí zatím dost dřevně. Důvodem je právě to, že v těchto aplikacích jsou obrazy lidí generovány automaticky, a žádné umělecké retuše tam nejsou možné. Moje výzva tedy spočívá v tom pochopit a přesně popsat faktory, které vedou k tomu, že člověk vypadá tak jak vypadá, a pak je algoritmicky reprodukovat na počítači.

Jste také spoluatorem článku Unifying Points, Beams, and Paths in Volumetric Light Transport Simulation, který byl oceněn na prestižní konferenci SIGGRAPH 2014 a nedávno o něm zevrubně informoval server fxguide. Čím se článek zabývá?

Stejně jako většina mé výzkumné práce se článek zabývá simulací šíření světla. Chování světla je potřeba přesně simulovat pro dosažení věrného zobrazení nějakého prostředí nebo předmětu pomocí počítače. Například, pokud chceme na počítači vygenerovat věrné vyobrazení člověka, je potřeba simulovat interakci světla s povrchem kůže i jeho chování pod povrchem, odraz světla od každého jednotlivého vlasu atd.

Ve zmíněném článku se zabýváme simulací chování světla v tzv. “opticky aktivních médiích“, jako např. mlha, kouř, džus, vosk nebo právě i lidská kůže. V této práci se nám podařilo vyvinout unifikovanou metodu, která dokáže simulovat osvětlení ve všech těchto velmi rozdílných prostředích, zatímco dosud bylo potřeba pro každé prostředí použít specializovaný simulační algoritmus. To má obrovský dopad pro použití v praxi, protože uživatelé zobrazovacích algoritmů jsou umělci bez technického vzdělání a netuší, že když chtějí zobrazit mlhu, je dobré použít algoritmus „beam radiance estimate“, zatímco pro zobrazení svíčky je lepší použít „fotonové mapy“. Naše práce jim umožní na podobné technické detaily zapomenout a soustředit se na svou tvorbu.

Doktorand Martin Šik, který se na tomto výzkumu podílel, naimplementoval během své stáže u studia PIXAR tuto technologii do software RenderMan, který PIXAR a řada dalších studií používá pro tvorbu svých filmů.

Změnil se nějak Váš pohled na realitu po té, co se takto intenzivně zabýváte reálností virtuálních povrchů?

Občas zjistím, že při pohledu na hru světla v nějaké zajímavé budově nebo někde venku v přírodě začnu přemýšlet o tom, jak by si s ní poradily naše algoritmy, místo toho, abych si prostě užil její krásu. Je to trochu obsese, ale léčím se...



„Nemyslím si, že lidé budou mít dost fantazie a prozřetelnosti, aby na etické otázky spojené s možností věrné vizuální reprodukce reality důsledně hledali odpovědi a řešení dřív, než takříkajíc dopadne kosa na kámen."



Cítíte, že grafická vývojářská práce by měla mít / nebo má nějaké etické limity? Pokud se dá nasimulovat již prakticky cokoliv, kde se pak ocitají vnitřní hranice?

Nemyslím si, že etické otázky v souvislosti s realistickou grafikou se týkají práce výzkumníků nebo vývojářů. Zodpovědnost za jejich použití je v první řadě na straně jejich uživatelů.Nicméně diskuze na toto téma nás jistě čeká. Tomu ale bude předcházet ještě několik let technologického vývoje. Nemyslím si, že lidé budou mít dost fantazie a prozřetelnosti, aby na etické otázky spojené s možností věrné vizuální reprodukce reality důsledně hledali odpovědi a řešení dřív, než takříkajíc dopadne kosa na kámen.

Pracujete také na softwaru Corona Renderer, který má využití v architektuře a v průmyslovém designu. O jaký software se jedná a komu je určený?

Corona je „renderer“, tedy software určený pro generování věrných vyobrazení „scén“, tj. virtuálních modelů v podstatě čehokoli. Grafik scénu nejdříve vymodeluje ve svém oblíbeném 3D modeláři, jako třeba 3ds Max, Cinema 4D, SketchUp, … a pak může Coronu použít pro vygenerování výsledných fotorealistických obrázků. Corona tedy funguje jako plug-in do 3D modeláře. Používá se převážně pro vizualizace návrhů interiérů nebo exteriérů nebo třeba i pro čistě abstraktní architekturu. Corona byla použita ve vizualizacích pro Lufthansu, pro animace při odhalování nového Fordu GT 2016, používá ji Mercedes Benz USA. Víme, že byla použita i při tvorbě AAA filmových titulů, bohužel zatím nemáme povolení bližší informace publikovat.



„Lidé jsou přímo naprogramování k tomu, aby si všímali těch nejmenších detailů ve vzhledu a chování jiných lidí, a nedají se počítačem snadno ošálit.“



V současné době již skoro nelze poznat počítačově generovaný obrázek od fotografie. Máte na to nějaký trik?

Asi rozeznám počítačově generované obrazy spolehlivěji než netrénované oko, ale často si nejsem jistý. Statické obrázky různých lidských výrobků jsou opravdu od fotografie často k nepoznání. Přírodní materiály a živí tvorové, včetně lidí, jsou rozeznatelní dost snadno. A ve chvíli, kdy se cokoli živého začne hýbat, je to úplně jasné. Dokonale věrné zobrazení živých tvorů, ale hlavně jejich věrná animace, zůstávají stále nevyřešenými problémy. Je to jako když někdo mluví cizím jazykem: ať se snaží, jak chce, vždycky nakonec vypustí z úst něco, co bude rodilému mluvčímu připadat podezřelé. Lidé jsou přímo naprogramování k tomu, aby si všímali těch nejmenších detailů ve vzhledu a chování jiných lidí, a nedají se počítačem snadno ošálit.

Máte povědomí o tom, nakolik se dnes používá grafické simulace oproti fotografiím?

Častěji než bychom si mohli myslet. Nejde pouze o statické fotografie, ale i o film a reklamy. Auta jsou asi nejtypičtějším příkladem. Málokterý obrázek auta, ať už v katalogu nebo reklamě, je záběrem skutečného stroje. Další příklad jsou různé katalogy interiérů, nábytku atd. Zde se zčásti ještě pořád spoléhá na starou dobrou fotografii, ale velká většina obrázků je počítačově generovaných. Počítačově generované obrazy se krom trikových akčních filmů objevují v naprosto obyčejných, „civilních“ snímcích, kde bychom počítačovou grafiku ani nečekali. Většinou se pomocí počítače modeluje pozadí scény, protože je to šetrnější, rychlejší a méně pracné než scénu skutečně fyzicky stavět.

Co je aktuální problém, který počítačový grafik musí řešit vzhledem k technologiím, anebo řekněme k trhu práce. Jaké vědecké problémy ještě zbývá vyřešit?

Pomineme-li vývoj počítačových her, je globální trh s technologií pro počítačovou grafiku relativně malý. A stejně tak je relativně malý i pracovní trh vývojářských pozic v tomto oboru. Zároveň je vývoj pokročilého software po grafiku značně náročnou záležitostí, která od vývojářů vyžaduje nejen schopnost psát kvalitní kód, ale zároveň i hluboké teoretické znalosti z oblasti vědeckých výpočtů, numerické matematiky a výpočetní fyziky. Moje zkušenost ze studia Weta Digital, které vytvořilo mimo jiné Pána prstenů, Avatara nebo Hobita, ukazuje, že mezi vývojáři pokročilých technologií pro grafiku je opravdu hodně lidí s titulem Ph.D., a rozhodně ho nemají jen na ozdobu. Během magisterského studia tuhle technologii a s ní spojenou teorii pořádně zvládne málokdo.

Jak probíhá spolupráce českých grafických vývojářů a velkých zahraničních studií typu PIXAR, Disney apod.?

Vše se točí okolo konference ACM SIGGRAPH, kde se prezentuje to nejlepší z výzkumu v oboru, a zároveň se tam sjedou zástupci studií z celého světa. Velké firmy na první pohled působí suverénním dojmem, ve skutečnosti jsou ale často křehčí, než by se mohlo zdát. Je pro ně životně důležité najít správné lidi a přetáhnout je na svou stranu. Ve chvíli, kdy výzkumník prezentuje na SIGGRAPHu novou technologii, která je pro nějakou firmu důležitá, firma se bude sama snažit o navázání spolupráce. V praxi to pak znamená např. otevřené dveře pro placené stáže pro naše studenty.



„Na výuku filmového řemesla máme samostatnou vysokou školu, kdežto na výuku vývoje her máme pouze obor v rámci výuky informatiky! To asi není úplně dobře.“



Na jaké úrovni jsou čeští grafičtí vývojáři?

Česko je v tomto ohledu na výjimečně dobré úrovni. Grafika je součástí bakalářských a magisterských oborů snad na všech univerzitách, kde se učí informatika. Na Matfyzu máme magisterský obor Počítačová grafika a vývoj počítačových her a také specializovaný doktorský obor Počítačový grafika a analýza obrazu. Magisterský obor se zaměřením na grafiku je také na FEL ČVUT, kde jsem studoval. Zahraniční návštěvy na Matfyzu jsou často překvapeny velkým množstvím nabízených předmětů z počítačové grafiky. Výzkum a doktorské studium, minimálně na Matfyzu a na FELu je na světové úrovni a absolventi doktorského studia si mohou vybírat z pracovních pozic v těch nejznámějších světových firmách. Co nám schází, je komplexnější přístup k výuce vývoje počítačových her. Hry dnes tvoří globální trh s větším objemem než film. Na výuku filmového řemesla máme samostatnou vysokou školu, kdežto na výuku vývoje her máme pouze obor v rámci výuky informatiky! To asi není úplně dobře.

Na MFF UK působíte v rámci Skupiny počítačové grafiky. Jak taková skupina funguje, v čem je její výhoda a kolik studentů se jí účastní?

Naše skupina koncentruje výuku a výzkum v počítačové grafice na Matfyzu. Funguje jako volné sdružení učitelů a doktorandů se zájmem o grafiku. Skupina sestává ze tří učitelů (Josef „Pepča“ Pelikán, Alexander Wilkie a já) a 13 doktorandů. Nabízíme řadu předmětů pro bakalářské a magisterské studenty, pokrývajících témata od úplných základů grafiky až po nejpokročilejší aspekty počítačové syntézy obrazu. Pořádáme pravidelné semináře, kde členové skupiny a zvaní hosté referují o svých výzkumných aktivitách. Studenti bakalářského a magisterského studia si mohou seminář zapsat a prezentovat zde jakékoli zajímavé téma z grafiky. V rámci výzkumu se v současné době věnujeme převážně věrné syntéze obrazu (hlavně simulaci přenosu světla a modelování interakce světla s materiály). Významné výsledky máme i na poli morfometrie: naši studenti vyvíjí algoritmy pro podporu popisu a analýzy tvaru lidského obličeje, které jsou pak využívány kolegy z přírodovědecké fakulty. Krom těchto témat se náš výzkum věnuje i procedurálnímu modelování pro počítačovou grafiku a zpracování medicínských dat.

Jaké nejvýraznější studentské počiny má Skupina PG za sebou?

Naši doktorandi mají výsledky publikované v nejlepších časopisech oboru (ACM Transactions on Graphics, Computer Graphics Forum atd.). To jim otvírá dveře pro spolupráce s velkými mezinárodními firmami a tím i možnost uvést výsledky svého výzkumu do praxe. Jak už jsem zmínil, doktorand Martin Šik implementoval naši metodu „Unified Points, Beams and Paths“ do rendereru studia PIXAR. Jirka Vorba aplikoval metodu ze svého článku „On-line Learning of Parametric Mixture Models for Light Transport Simulation“ ve studiu Weta Digital. Lukáš Hošek pod vedením Alexandra Wilkieho vyvinul model atmosférického záření, který se obratem stal de-facto novým standardem v syntéze obrazu. Projekt Corona Renderer také vznikl jako studentský projekt – za jeho úspěchem stojí v první řadě náš bývalý doktorand Ondra Karlík.

Jste pozvaný na konferenci o počítačové grafice Eurographics. Již víte, s jakým příspěvkem zde vystoupíte?

Na konferenci Eurographics bude prezentovat doktorand Jan Beneš výsledky svého výzkumu v procedurálním modelování. Honza vyvinul velmi zajímavý systém pro simulaci historického vývoje uličních sítí ve městech, od malých osamělých vísek na křižovatkách obchodních cest až po velkoměsta.

Tento článek jsme automaticky naimportovali z předchozího redakčního systému. Pokud se v něm něco pokazilo, dejte nám prosím vědět.