Bakalářská práce

Morfologický analyzátor založený na pravidlech

Rule-based morphological analyzer

Josef Plch, učo 374370
Anotace

Práce se zabývá vývojem algoritmu pro obecnou morfologickou analýzu přirozeného jazyka. Principem je rekurzivní aplikace derivačních pravidel, která postupně zjednodušují vstupní slovní tvar směrem ke tvarům, z nichž byl odvozen.

Abstract

The thesis deals with developement of algorithm for general morphological analysis of natural language. The principle lies in recursive application of derivation rules which gradually simplify the input word form towards the forms it was derived from.

Zadání práce
Student vytvoří morfologický analyzátor vracející pro vstupní slovní tvary lemmata (základní slovní tvary) a značky (příslušné gramatické informace), případně další informace (rozklad na morfémy) na základě pravidel popisujících analyzovaný jazyk. Součástí práce budou pravidla popisující část češtiny, dostatečně velkou, aby bylo možné chování analyzátoru rozumně vyhodnotit a srovnat s existujícími nástroji používanými v Centru zpracování přirozeného jazyka FI MU. Student provede srovnání s analyzátorem majka. Dále svůj analyzátor srovná s existujícím guesserem (hadačem analýz pro analyzátoru neznámá slova), případně jiným vhodně zvoleným nástrojem, přičemž optimálním výsledkem práce by mělo být zjištění, že alespoň v nějakém ohledu studentem navržený přístup překonává dosud používané přístupy.
Práce zkontrolována:
20. 5. 2014 15:28, RNDr. Pavel Šmerk, Ph.D., učo 3880
Plný text práce
1,8 MB / soubor PDF
Jazyk práce
čeština čeština
Termín obhajoby
19. 6. 2014
Práce byla úspěšně obhájena

Vedoucí

RNDr. Pavel Šmerk, Ph.D., učo 3880
OVV FI MU

Oponent

doc. Mgr. Pavel Rychlý, Ph.D., učo 3692
KSUZD FI MU

Literatura

  • Mluvnice češtiny. 2, Tvarosloví. 1. vyd. Praha: Academia, 1986, 536 s.
  • ŠMERK, Pavel. Towards Czech Morphological Guesser. In Petr Sojka, Aleš Horák. Proceedings of Recent Advances in Slavonic Natural Language Processing, RASLAN 2008. Brno: Masarykova univerzita, 2008, s. 1-4. ISBN 978-80-210-4741-9.

Masarykova univerzita Fakulta informatiky
Studijní program
Informatika
Obor
  • Přidání souboru

    Soubor nebo složku lze nahrát pomocí tlačítka Přidat.
  • Další operace se soubory

    Podrobnosti lze zjistit označením příslušného řádku.
  • Pohled pro experty

    Pro častou práci je možné zvolit režim Více možností.
  • Vyhledávání souborů

    Vyhledávaný výraz můžete zadat přímo do adresního řádku.
  • Rychlý přístup k souborům

    Pomocí funkce Nedávné je možné se rychle vrátit k právě prohlíženým souborům. Oblíbené soubory je také možné označit Hvězdičkou.