INL - Inżynieria lingwistyczna, PJWSTK, studia magisterskie


Agnieszka Mykowiecka
Instytut Podstaw Informatyki, PAN, Ordona 21, Warszawa

Celem wykładu jest zaznajomienie studentów z problemami dotyczącymi gromadzenia, przetwarzania i wyszukiwania informacji zapisanej w postaci tekstów w języku naturalnym. Omawiane są teoretyczne zagadnienia dotyczące formalnego opisu języka naturalnego, metody analizy syntaktycznej i semantycznej zdań. Druga część wykładu poświęcona jest budowaniu statystycznych aplikacji przetwarzajacych teksty w języku naturalnym.Omówione są modele n-gramowe oraz HMM. Ponadto przedstawiane są istniejące systemy wykorzystujące język naturalny (m.in. ekstrakcja informacji, systemy dialogowe czy wspomagające tłumaczenie).
Materiały do wykładów dostępne są dla studentów na serwerze PJWSTK.

Wykłady
1. Wstęp, zadania INL, języki formalne.
2. Segmentacja, analiza morfologiczna.
3. Składnia, gramatyki struktur frazowych. Opis wymagań i modyfikacji.
4. Analiza morfologiczna. Struktury atrybutów. Unifikacja.
5. Gramatyki unifikacyjne. Semantyka.
6. Zapis cech języka naturalnego w formalizmach unifikacyjnych. Semantyka.
7. Generowanie tekstów w języku naturalnym.
8. Metody statystyczne w inżynierii lingwistycznej, cz.1. Prawo Bayesa, N-gramy
9. Metody statystyczne w inżynierii lingwistycznej, cz.2. Poprawianie modelu n-gramowego.
10. Ukryte modele Markova (HMM) w rozpoznawaniu mowy. Estymacja parametrów HMM Tagowanie morfologiczne (POS).
11. Selekcja informacji.Wyszukiwanie informacji tekstowych.
12. Systemy QA.Tłumaczenie maszynowe.