| | |
| Agnieszka Mykowiecka Instytut Podstaw Informatyki, PAN, Ordona 21, Warszawa Celem wykładu jest zaznajomienie studentów z problemami dotyczącymi gromadzenia, przetwarzania i wyszukiwania informacji zapisanej w postaci tekstów w języku naturalnym. Omawiane są teoretyczne zagadnienia dotyczące formalnego opisu języka naturalnego, metody analizy syntaktycznej i semantycznej zdań. Druga część wykładu poświęcona jest budowaniu statystycznych aplikacji przetwarzajacych teksty w języku naturalnym.Omówione są modele n-gramowe oraz HMM. Ponadto przedstawiane są istniejące systemy wykorzystujące język naturalny (m.in. ekstrakcja informacji, systemy dialogowe czy wspomagające tłumaczenie). Materiały do wykładów dostępne są dla studentów na serwerze PJWSTK. | Wykłady 1. Wstęp, zadania INL, języki formalne. 2. Segmentacja, analiza morfologiczna. 3. Składnia, gramatyki struktur frazowych. Opis wymagań i modyfikacji. 4. Analiza morfologiczna. Struktury atrybutów. Unifikacja. 5. Gramatyki unifikacyjne. Semantyka. 6. Zapis cech języka naturalnego w formalizmach unifikacyjnych. Semantyka. 7. Generowanie tekstów w języku naturalnym. 8. Metody statystyczne w inżynierii lingwistycznej, cz.1. Prawo Bayesa, N-gramy 9. Metody statystyczne w inżynierii lingwistycznej, cz.2. Poprawianie modelu n-gramowego. 10. Ukryte modele Markova (HMM) w rozpoznawaniu mowy. Estymacja parametrów HMM Tagowanie morfologiczne (POS). 11. Selekcja informacji.Wyszukiwanie informacji tekstowych. 12. Systemy QA.Tłumaczenie maszynowe. |