O statistice a plovoucím tělese

O statistice a plovoucím tělese

Matematika / rozhovor

Porota Nadačního fondu Bernarda Bolzana ocenila za rok 2019 také matematika dr. Stanislava Nagye. V práci věnované statistické hloubce se mladému vědci podařilo propojit dvě zdánlivě nesourodé matematické disciplíny.

Mohl byste krátce představit koncept statistické hloubky a jeho využití?

Snáď najjednoduchším príkladom je medián. Povedzme, že máte k dispozícii výsledky experimentu – n meraní nejakej veličiny ktorá vás zaujíma, či už to je teplota varu vody alebo veľkosť vzdialenej hviezdy. Vašou úlohou je týchto n pozorovaní sumarizovať. To znamená popísať pomocou jediného čísla, ktoré dobre vypovedá o skutočnej hodnote meranej veličiny, očistenej od rôznych náhodných chýb ovplyvňujúcich merania. Každému napadne priemer. Ten však často nie je vhodný. Stačí jediné veľmi chybné meranie, a priemer zostane vychýlený smerom k tomuto chybnému pozorovaniu. Podobne, v istých situáciách nie je možné garantovať, že pre počet pozorovaní n rastúci do nekonečna sa bude priemer týchto pozorovaní skutočne blížiť k nejakej zmysluplnej hodnote.

Alternatívnym prístupom k problému je voľba mediánu, teda pozorovania ktoré leží „uprostred“ zoradených hodnôt meraní. Je jednoduché vidieť, že medián bude iba málo ovplyvnený nejakým hrubo chybným meraním. Podobne, je možné ukázať, že pre počet pozorovaní idúci do nekonečna bude medián vždy blízky rozumnej hodnote, ktorá dobre popisuje meranú veličinu.

Rozšírme teda náš experiment a povedzme, že v každom pozorovaní sme schopní namerať dve veličiny (teplotu varu vody a tlak vzduchu, alebo veľkosť a hmotnosť hviezdy) samozrejme opäť s náhodnou chybou v každej zložke. Získame n bodov v rovine, ktoré síce dokážeme vykresliť, nevieme ich už ale rozumne zoradiť. Nedokážeme teda povedať, ktorý bod je „vľavo“ od iného, alebo či je pozorovanie so súradnicami (1,2) „menšie“ ako iné so súradnicami (0,3). Žiadne pozorovanie jasne „uprostred“ neexistuje, a medián nedokážeme definovať.

Tu prichádza na pomoc hĺbka. Pre danú množinu dvojrozmerných (alebo d-rozmerných) pozorovaní, hĺbka je funkcia, ktorá každému bodu x z dvojrozmerného priestoru R2 (resp. Rd) priradí jediné nezáporné číslo, ktoré má popisovať, ako veľmi „centrálne“ postavený x je voči množine pozorovaní. Získavame možnosť zoradiť pozorovania, tentokrát v zmysle od centra (od bodu s najväčšou hĺbkou) smerom von k bodom s nízkymi hodnotami hĺbky. Ako najcentrálnejší bod je definovaný ten s maximálnou hodnotou hĺbky. Tento môžeme zobrať ako nový medián.

V štatistickej literatúre existuje celá rada hĺbok. Nás zaujíma najmä klasická, tzv. polopriestorová hĺbka, ktorá napr. bodu xR2 priradí najmenší počet pozorovaní ležiacich na jednu stranu od priamky prechádzajúcej x. Dá sa ukázať, že medián založený na polopriestorovej hĺbke má stále dobré vlastnosti mediánu známeho z dimenzie d=1.

V čem spočívá síla tohoto konceptu?

Hĺbka nám umožňuje rozumne zoraďovať pozorovania v priestore Rd aj pre d>1. Rovnako ako pre d=1 teda opäť získavame možnosť povedať, ktorý bod je „centrálnejší“, alebo „hlbší“ ako iný. To otvára široké možnosti aplikácie v tzv. neparametrickej štatistickej analýze dát.

Pre jednorozmerné dáta, neparametrická štatistika predstavuje obsiahly súbor metód analýzy založených práve na konceptoch poradí, usporiadania, alebo kvantilov. Až trochu prekvapivo sa ukazuje, ako silné tieto metódy sú v prípade, že z nejakého dôvodu výskumník nechce, alebo nemôže, o svojich dátach predpokladať radu obmedzujúcich predpokladov akými sú normalita, symetria, elipticita apod.

V prípade d>1 už existuje veľké množstvo návrhov na použitie hĺbky pre konštrukciu neparametrických štatistických metód. Na rozdiel od zažitých metód platných pre d=1 však väčšinou doposiaľ nie sú plne akceptované, najmä z dôvodu že o vlastnostiach hĺbky toho stále vieme príliš málo.

V čem je naopak koncept statistické hloubky v rozporu s klasickou statistikou?

V klasickej štatistike máme niekoľko základných výsledkov ako sú rôzne zákony veľkých čísel, alebo centrálne limitné vety. Veľká časť teórie sa dokazuje práve aplikáciou variánt týchto dôležitých tvrdení. Ukazuje sa ale, že na hĺbku tieto výsledky nedokážeme priamo aplikovať. Už štandardné výsledky v oblasti hĺbky teda často skôr čerpajú z iných častí matematiky, a to samozrejme prináša problémy a nezriedka aj chyby.

Oceněné práce se dotýkají více oblastí matematiky, které se obvykle příliš nepotkávají. Co vás inspirovalo k tomuto víceoborovému pohledu?

V skratke, náhoda. Už dlhšiu dobu som vedel, že isté teoretické výsledky o hĺbke patria viac do geometrie než štatistiky a pravdepodobnosti, nikdy som ale nenarazil na priame súvislosti. O to viac som bol prekvapený, keď som pri listovaní známou knihou o geometrii narazil na pojem tzv. plávajúceho telesa. Je jednoduché vidieť, že plávajúce teleso je pojmom ekvivalentným hĺbke, zavedeným ale úplne nezávisle od výskumu v štatistike.

V štatistike sa hĺbka prvýkrát objavila v roku 1975. V geometrii bol pojem plávajúceho telesa zavedený o viac než 150 rokov skôr. Už v roku 1822 sa Charles Dupin pýtal, akým spôsobom plávajú ľahké predmety na vodnej hladine. Uvažujte nejaké teleso z ľahkého dreva K, položte ho na vodnú hladinu, a sledujte spôsob akým sa tento útvar správa, keď ho otáčate. Ak je drevo dosť ľahké, časť telesa zostane pri každom otočení nad hladinou. Táto časť telesa K sa nazýva plávajúce teleso.

Je jednoduché ukázať, že plávajúce teleso je iba variantou polopriestorovej hĺbky, ak ju správne aplikujeme na K. O plávajúcich telesách pritom v matematike existuje viac než sto rokov výskumu, o ktorom sme v štatistike vôbec nevedeli. Na základe týchto neznámych tvrdení sa nám podarilo vyriešiť niekoľko starších otvorených problémov hĺbky a v tejto dobe stále nachádzame ďalšie súvislosti. Zdá sa, že potenciál na prepojenie viacrozmernej štatistiky, geometrie a ďalších oborov matematiky je veľký.

Toto propojování různých pohledů určitě vyžaduje značný přehled. Otevírají se vám díky tomu podobné syntetické pohledy i na další matematické problémy?

Rozhodne áno. Prepojenie polopriestorovej hĺbky a plávajúcich telies berieme ako prvý krok, ktorý nám otvoril možnosti medziodborovej spolupráce v štatistike a všeobecnej matematike. V tejto dobe sa už rovnako venujeme skúmaniu ďalších zaujímavých prepojení týchto oblastí. Ako sľubný sa javí napr. výskum tzv. zonoidov mier, ktoré sa podobne ako hĺbka objavujú súčasne v štatistike, geometrii a funkcionálnej analýze.

Jde podle všeho o unikátní výsledky. Jak dlouho se tématu věnujete?

S hĺbkou som sa prvýkrát stretol tak pred 10 rokmi, počas písania diplomovej práce na MFF UK. Prepojenia hĺbky s geometriou skúmame od roku 2016. V blízkej dobe ale určite tému nevyčerpáme, skôr v tejto dobe venujem úsilie propagácii týchto nových výsledkov, s vierou v zapojenie ďalších odborníkov a šikovných študentov do výskumu.

Co pro vás znamená ocenění NFBB?

Je skvelé vidieť, že práca ktorej venujeme také množstvo úsilia dáva zmysel, a budí záujem.

Spolupracujete osobně trvale se zahraničími kolegy?

Medzinárodná spolupráca prebieha a určite je prospešná. Ja vysoko oceňujem najmä spoluprácu s expertmi z geometrie a matematickej analýzy, kombinácia ich znalostí s tým, čo dokážeme vytvoriť my, posúva výskum na úplne inú úroveň. Rovnako ale nemyslím, že práve v matematike musí byť zahraničná spolupráca vždy tak zásadným kritériom úspechu výskumu, ako často počúvame.

Kam byste zařadil Matfyz na osobním žebříčku srovnávání vědeckých institucí v rámci Evropy či celého světa?

Pracujem najmä v štatistike, samozrejme teda nemôžem hovoriť za všetky obory. Z hľadiska odbornosti je ale na tom, podľa môjho názoru, Matfyz veľmi dobre. Už výuka študentov prebieha na nezriedka ďaleko vyššej úrovni, než na rade prestížnych zahraničných pracovísk. V odbornosti výskumu na tom nie sme horšie. Na druhú stranu sa neviem ubrániť dojmu, že strácame v príprave na vedeckú prácu v Ph.D. programoch. To súvisí s často nižším sebavedomím a priebojnosťou, hlavne v porovnaní s podobnými výskumnými skupinami v zahraničí. A nakoniec sú tu večné problémy zbytočnej administratívnej záťaže, malej motivácie pre ambiciózny výskum a podobné prekážky, ktoré brzdia obrovský tunajší potenciál. To je už ale iný príbeh.

Nadační fond Bernarda Bolzana funguje od roku 1999 při Matematicko-fyzikální fakultě UK. K jeho úkolům patří mimo jiné nevýdělečná podpora vědecké a pedagogické činnosti na Univerzitě Karlově v oborech fyziky, matematiky a informatiky, rozšiřování úrovně experimentálních možností a teoretických postupů nebo zprostředkování širšího mezinárodního uplatnění vědeckých výsledků dosažených v daných oborech na UK.


Mohlo by vás také zajímat:

Jak ochladit molekulu
Kouzlo hledání přibližné hodnoty

Tento článek jsme automaticky naimportovali z předchozího redakčního systému. Pokud se v něm něco pokazilo, dejte nám prosím vědět.