IIS'99 |
INTELIGENTNE SYSTEMY INFORMACYJNE Ustroń, 14-18 czerwca 1999 Tutorial |
|---|
Rozwoj mocy obliczeniowych zmienil w ciagu ostatniego dziesieciolecia nasze podejscie do rozwiazywania problemow statystycznych. W statystycznej analizie danych, bardzo mocno zwiazanej z uczeniem maszynowym, w tym lub obok tego z odkrywaniem wiedzy, ogromnie rozwiniete zostaly metody oparte na intensywnym wykorzystaniu obliczen komputerowych. Jedna z dziedzin gdzie rozwoj ow okazal sie szczegolnie interesujacy sa metody analizy regresji i klasyfikacji.
Dobrze dzis wiadomo, ze zarowno estymatory funkcji regresji, rozwiazujace zadanie odkrywania zaleznosci funkcyjnych w obecnosci szumow znieksztalcajacych dane, jak i klasyfikatory, rozwiazujace zadanie klasyfikacji w oparciu o probe uczaca, wymagaja stabilizacji. Bez stosownej stabilizacji, otrzymywane estymatory zbyt mocno zaleza od proby uczacej i w rezultacie ich blad predykcji jest zbyt duzy.
Metodologiczne podstawy stabilizacji estymatorow fukcji regresji oraz, szerzej, stabilizacji wyboru najlepszego modelu (tzw. regularyzacji wyboru) sa juz dobrze znane, glownie dzieki pracom Breimana. Najogolniej mowiac, stabilizacja opiera sie na generacji wielu pseudoprob uczacych z proby oryginalnej, konstrukcji estymatorow na podstawie pseudoprob i nastepnie stosownej agregacji otrzymanych estymatorow. Zagadnienie to przedstawimy na przykladzie stabilizacji wyboru modelu w systemie EF (Equation Finder) Zembowicza i Zytkowa.
Idea generacji wielu pseudoprob uczacych, konstrukcji rozwiazan odpowiadajacych pseudoprobom oraz stosownej agregacji otrzymywanych rozwiazan jest jeszcze bardziej interesujaca w przypadku zadania klasyfikacji. Opracowane metody - "bagging" Breimana i, zwlaszcza, "boosting" Freunda i Schapire'a - z reguly przynosza znaczna poprawe jakosci klasyfikacji, ale wyjasnienie przyczyn ich sukcesu jest nielatwe. W drugiej czesci wykladu przedstawimy krotka ale pasjonujaca historie badan nad wymienionymi metodami oraz wspomnimy o metodologiach im pokrewnych.
W trzeciej, najkrotszej, czesci wykladu odniesiemy sie do problemu klasyfikacji, gdy zarowno licznosc proby uczacej jak i wymiarowosc wektora obserwacji jest duza. W szczegolnosci, wspomnimy o zaproponowanych przez Vapnika klasyfikatorach opartych na konstrukcji wektorow podpierajacych.
IIS'99.