Jak naučit počítač, aby rozuměl lidskému jazyku

Jak naučit počítač, aby rozuměl lidskému jazyku

Matematika / článek

Seminář Matematické problémy nematematiků na konci března navštívil Michal Bída, který se na MFF UK a v pražské pobočce IBM zabývá umělou inteligencí.

V posledních letech došlo v oblasti umělé inteligence k řadě průlomů. Samořídicí auta již v mnoha zemích jezdí po silnicích a počítač porazil šampiona ve hře Go, která byla dlouhou dobu považovaná za svatý grál umělé inteligence. Ačkoli jde o vskutku úžasné úspěchy, odborníci v současnosti stojí před ještě náročnějším úkolem - snaží se naučit stroj, aby rozuměl lidskému jazyku.

Takzvané zpracování přirozeného jazyka (natural language processing) je jedním z nejdůležitějších oborů současného výzkumu v umělé inteligenci. Počítače disponují výpočetní sílou a schopností rychle analyzovat obrovské množství dat. Data však musí být ve formě, které počítač rozumí. Schopnost porozumět lidskému jazyku tak pro počítač znamená, že se libovolný text – od příspěvku na sociální síti až po vědecké publikace – rázem mění na zdroj vědění.

Michal Bída se umělou inteligencí zabývá v rámci doktorského studia na MFF UK. Současně od roku 2013 také pracuje ve výzkumné laboratoři Watson Research & Development v IBM v Praze, kde se podílí na vývoji dialogových systémů a inteligentních algoritmů.

Na semináři Matematické problémy nematematiků posluchačům představil základní metody zpracování přirozeného jazyka. Počítač totiž vidí slova jako vektory, tedy jako dlouhý seznam číselných charakteristik, které zachycují určité vlastnosti každého slova. Ve vektorové řeči umělé inteligence je poté možné slova sčítat a odčítat. Například výraz kůňkoně má podobnou hodnotu jako jablkojablka (zachycuje tak koncept množného čísla) a výraz králmuž + žena počítač vyhodnotí jako královna. Samotné charakteristiky jednotlivých slov se algoritmus učí za pomoci neuronových sítí – techniky, která bylo inspirována tím, jak fungují skutečné biologické neurony.

Michal Bída pracuje na umělé inteligenci IBM Watson, která se na zpracování přirozeného jazyka zaměřuje. Watson se proslavil hlavně svým vítězstvím nad lidskými soupeři v televizní vědomostní soutěži Jeopardy! (Riskuj), jeho využití je však mnohem širší. Například IBM Watson for Oncology je systém, který na základě individuálních zdravotních informací pacientům navrhuje nejlepší možnou léčbu. Čerpá přitom z existující medicínské literatury a na rozdíl od lidského doktora tak disponuje znalostmi načerpanými z 15 milionů stran textu. Vzhledem ke své univerzalitě je však Watson využíván ve všech možných odvětvích, od klientských center po finanční sektor.


Mohlo by vás zajímat:

Využití matematických simulací ve vývoji motorů ŠKODA AUTO
Aplikované matematiky zajímají reálné problémy
Matematické problémy nematematiků v sérii přednášek

Tento článek jsme automaticky naimportovali z předchozího redakčního systému. Pokud se v něm něco pokazilo, dejte nám prosím vědět.