Sté výročí průkopníka počítačové lingvistiky prof. Petra Sgalla

Sté výročí průkopníka počítačové lingvistiky prof. Petra Sgalla

Informatika / Fakulta / článek

V květnu tohoto roku si připomínáme 100 let od narození emeritního profesora Univerzity Karlovy a dlouholetého pracovníka Matematicko-fyzikální fakulty UK PhDr. Petra Sgalla, Dr. h. c. mult. (27. května 1926 – 28. května 2019).

Petr Sgall a Bernard Vauquois z univerzity v Grenoblu na konferenci COLING (foto: ÚFAL MFF UK)
Petr Sgall a Bernard Vauquois z univerzity v Grenoblu na konferenci COLING (foto: ÚFAL MFF UK)

Petr Sgall patří k zakladatelům oboru formální a počítačové lingvistiky u nás. Zároveň je považován za předního českého lingvistu v okruhu tzv. „druhé generace“ světově proslulé strukturalistické a funkční Pražské lingvistické školy. Vrátíme-li se k jeho prvním badatelským zájmům, patří k nim typologie jazyků (v roce 1958 se habilitoval jako docent obecné a indoevropské jazykovědy na Univerzitě Karlově na základě své studie o infinitivu ve staroindickém jazyce). Celý život se věnoval také situaci češtiny, v níž vedle spisovné podoby existuje i forma jazyka obvykle nazývaná „obecná čeština“, která na rozdíl od nářečí není omezena na konkrétní geografickou oblast a kterou většina Čechů používá v každodenní komunikaci.

I když tedy Petr Sgall vyšel z klasické filologie, dokázal jako jeden z prvních na světě propojit výsledky humanitních věd s exaktním matematickým popisem. Jeho jméno je spojeno mj. s vývojem systémů strojového překladu. Sgall byl totiž jedním z autorů prvních algoritmů pro experiment se strojovým překladem realizovaného na několika větách z angličtiny do češtiny a provedeného u nás v lednu 1960 ve spolupráci s odborníky z Výzkumného ústavu matematických strojů v Praze. Byl to jeden z prvních dokladů, že ani toto odvětví automatizovaného přístupu nezůstalo bez povšimnutí v kontextu uplatnění moderních metod u nás a že Sgall se orientoval jak v teoretických, tak empirických problémech nově se rozvíjejících ve světě.

Na počátku 60. let byl jedním z prvních evropských badatelů, kteří se seznámili s nově se rodícím přístupem k popisu jazyka, generativní gramatikou Noama Chomského. Na jedné straně okamžitě pochopil význam explicitního, formálního popisu jazyka, zároveň si však uvědomoval, že generativní přístup, jak byl prezentován v počátcích transformační gramatiky Chomského a jeho stoupenců, postrádá náležitý zřetel k tomu, jak jazyk funguje. Na základě těchto úvah Petr Sgall formuloval a dále rozvíjel originální rámec generativního principu v popisu jazyka, tzv. Funkční generativní popis. Jeho studie z počátku 60. let a jeho knižní publikace z roku 1967 se staly základními kameny originální školy teoretické počítačové lingvistiky, která v Praze od té doby žije a dodnes se rozvíjí. Sgallův inovativní přístup stojí na třech hlavních pilířích: (i) na závislostní syntaxi uplatňované jako nosný popis syntaxe (tedy vztahu mezi slovy ve větě) obecně, tak výhodně použitelný při automatickém zpracování jazyka, (ii) na informační struktuře (vztahu mezi tím, co daná věta říká nového na základě již známé informace) jako integrální součásti významové struktury věty a (iii) na důsledném rozlišování mezi jazykovým významem a kognitivním obsahem.

Petr Sgall se rovněž projevil jako vynikající organizátor. V roce 1959 založil na Filozofické fakultě Univerzity Karlovy malé pracoviště matematické lingvistiky (tehdy nazývané „algebraické“, aby se odlišilo od tradiční kvantitativní lingvistiky) a teorie strojového překladu při Katedře českého jazyka, následované (v roce 1961) založením malé skupiny počítačové lingvistiky při tehdy nově založeném Centru numerické matematiky na Matematicko-fyzikální fakultě téže univerzity. V roce 1968 byly pod jeho vedením obě skupiny sloučeny do Laboratoře algebraické lingvistiky, přičleněné k Filozofické fakultě. Tato laboratoř však, bohužel, vzhledem k politickým změnám v zemi způsobeným ruskou invazí v r. 1968 měla velmi krátkou životnost.

V roce 1972 čelil Sgall nucenému odvolání z univerzity z politických důvodů a celá skupina byla určena k rozpuštění. Naštěstí díky řadě odvážných kolegů a přátel na Matematicko-fyzikální fakultě byli on i jeho spolupracovníci přemístěni na tuto fakultu, která byla strážci ideologie méně přísně politicky sledována než oblast humanitních věd. Přijetí Petra Sgalla a jeho kolegů znamenalo vstřícný a odvážný krok kolegů z MFF UK, kteří navzdory režimu dokázali poskytnout útočiště svobodnému a špičkovému interdisciplinárnímu výzkumu.

Ani zde však podmínky pro Sgalla a jeho skupinu nebyly snadné – počet Sgallových spolupracovníků byl drasticky snížen a výzkumu v oblasti počítačové lingvistiky byly kladeny četné překážky. Sgall osobně byl omezován ve své možnosti učit, vést studenty, cestovat na Západ, účastnit se zahraničních konferencí a teprve postupně a velmi pomalu mohl v 80. letech obnovovat některé ze svých aktivit. Přesto nejen jádro výzkumné skupiny pokračovalo v práci v kontaktu se západními centry a jejich předními osobnostmi, dokládají to např. příspěvky do jeho Festschriftu, editovaného Jacobem Meyem a vydaného nakladatelstvím John Benjamins v roce 1986.

Roky po politických změnách v roce 1989 přinesly Petru Sgallovi zaslouženou satisfakci: možnost pětiměsíčního pobytu jako výzkumného pracovníka na Netherlands Institute of Advanced Studies ve Wassenaaru, členství v prestižní Academia Europaea, Mezinárodní výzkumnou cenu Alexandra von Humboldta v roce 1992, hostující profesuru na Univerzitě ve Vídni v roce 1993, Cenu českého ministra školství ve stejném roce, čestný doktorát na Institut National des Langues et Civilisations Orientales v Paříži v roce 1995 a na Univerzitě v Hamburku v roce 1998 a čestné členství v Linguistic Society of America v roce 2002, nemluvě o řadě pozvání k přednáškám a konferencím po celém světě, od USA až po Malajsii a Japonsko. Jako emeritní profesor Univerzity Karlovy od roku 1995 byl ještě mnoho let aktivně zapojen do výuky a vedení doktorandů, do účasti na českých i mezinárodních výzkumných projektech a předsednictví Vědecké rady Centra Viléma Mathesia, které v roce 1992 pomáhal založit.

Jako zakladatel počítačové lingvistiky v Praze (a v celém bývalém Československu) Petr Sgall vždy velmi citlivě vyvažoval formální a empirické aspekty této interdisciplinární oblasti. Současně byl vždy otevřený novým impulsům; jeho jemný cit pro rozvoj nových směrů výzkumu se odráží v jeho účasti na koncipování a budování Pražského závislostního korpusu (Prague Dependency Treebank, PDT), ve světě po angličtině druhého systematicky morfologicky a syntakticky anotovaného (označkovaného) počítačového korpusu českých textů. Pevný teoretický základ této anotace (využívající Sgallův funkčně generativní popis), její komplexnost a konzistence učinily z PDT jeden z nejčastěji citovaných a nejvíce oceňovaných současných korpusových projektů ve světě, a to i dnes při bouřlivém rozvoji strojového učení a systémů umělé inteligence.

Sgallův rozhled se v kontextu rozvoje současné informatiky jeví jako vizionářský. Základy, které Sgall položil v 60. letech, jsou dnes teoreticky i prakticky využívány v rozvoji nejmodernějších teorií založených na využití rozsáhlých datových souborů včetně velkých jazykových modelů (Large Language Models). Moderní systémy umělé inteligence se už dnes učí rozumět sémantice a vztahům v jazyce a neopírají se jen o náhodnou pravděpodobnost výskytu sousedních dat. Opírají se tak o důkladné zpracování významových vztahů ve větě a textu položených ve Sgallových základních pracích. V tomto duchu vychoval Sgall řadu následovníků sdílejících jeho metodologické základy, kteří činí z Ústavu formální a aplikované lingvistiky, jeho domovského pracoviště na Matfyzu, mimořádné a ve světě uznávané pracoviště.

Vědecké zájmy Petra Sgalla byly mimořádně široké a jeho přínos pro českou i mezinárodní počítačovou lingvistiku a informatiku je ohromující. Jeho publikace svědčí o jeho schopnosti pronikat do podstaty argumentů a podávat přesvědčivé protiargumenty, o konzistenci názorů, ale zároveň o otevřenosti a ochotě k diskusi o pohledu jiných vědců, ale i studentů a doktorandů, pokud k tomu nalezne dobré důvody. Není mnoho badatelů jeho postavení, kteří by dokázali tak kreativně reagovat na podněty zvenčí, poučit se z nich a motivovat své studenty ke stejným cílům: „čti, pokud chceš být čten“ byl jeden z jeho oblíbených sloganů.

Vědecký vývoj Petra Sgalla, jeho působení a vliv na žáky plně ospravedlňují sousloví „Sgallova škola“, které má své místo v současné české, ale i mezinárodní vědecké komunitě.

U příležitosti výročí uspořádal Ústav formální a aplikované lingvistiky MFF UK speciální seminář.