IIS'99

VIII Międzynarodowe Sympozjum
INTELIGENTNE SYSTEMY INFORMACYJNE
Ustroń, 14-18 czerwca 1999

Tutorial

Gradacyjny odpowiednik klasycznej analizy danych

Magdalena Niewiadomska-Bugaj, Elzbieta Pleszczynska

West Virginia University, Instytut Podstaw Informatyki PAN

Streszczenie

Motto: Look around and choose your own ground (Pink Floyd)

Szwedzcy architekci integrują starą zabudowę miast z nową łącząc funkcjonalność, piękno i szacunek dla tradycji. Podobne wymagania powinno się stawiać przy integracji różnych kierunków analizy danych. Trzeba w tym celu rozporządzać nowym systemem pojęć, który może pokonać trudności związane ze skalami pomiarowymi, dyskretyzacją i agregacją. Sądzimy, że taki system pojęć (oparty na podstawowym pojęciu koncentracji jednego rozkładu prawdopodobieństwa względem drugiego) tworzy obecnie tak zwana gradacyjna teoria danych. Powstaje w tej teorii nowa infrastruktura statystyczna, za pomocą której stawia się i rozwiązuje takie standardowe zadania jak problemy optymalnej agregacji i redukcji danych, selekcji cech, wyznaczania cech ukrytych, wyszukiwania elementów odstających etc.

Podczas wykładu przedstawimy wyniki gradacyjnej analizy kilku zbiorów danych doświadczalnych: tabeli charakteryzującej zależność między kategorią społeczno-zawodową ojca a kategorią syna, danych eksperymentu psychologicznego dotyczącego pojmowania demokracji, danych eksperymentu medycznego dotyczącego kontroli poziomu glukozy przez pacjentów chorych na cukrzycę, wyników głosowania do Sejmu RP w 1993 i 1997 roku. W podsumowaniu wskażemy co odróżnia opracowania gradacyjne od innych metod analizy danych, zwracając szczególną uwagę na reprezentacje graficzne. Wskażemy też dostępną literaturę i oprogramowanie.

O wykladowcach:

Prof. Elżbieta Pleszczyńska

Elżbieta Pleszczyńska jest profesorem nauk matematycznych (specjalność: statystyka matematyczna), kierownikiem Zespołu Statystycznej Analizy Danych w IPI PAN.

W 1956r. ukończyła studia matematyczne na UW ze specjalnością statystyka. Od 1956 do 1973 pracowała w IM PAN jako asystent a następnie adiunkt w dziale Statystycznej Kontroli Jakości i tam uzyskała stopnie: doktora (1965) i dr hab (1973). Od 1974r. do chwili obecnej pracuje w IPI PAN jako adiunkt, docent i profesor. W 1993r. uzyskuje tytuł profesora. W IPI PAN prowadzi Zespół zajmujący się wnioskowaniem statystycznym i analizą danych.

Należy do pionierów integracji statystyki matematycznej i analizy danych w teorii i praktyce. Od 1954r. podejmuje długotrwałą lub doraźną współpracę ze specjalistami różnych dziedzin nauki i gospodarki (kontrola jakości, psychologia, socjologia, archeologia, biologia, medycyna, ekonomia, inżynieria, ergonomia), opracowując z sukcesem wiele zestawów danych. Od początku włącza w swoje prace metody symulacyjne, korzysta z maszyn liczących, w latach 1959-1962 pracuje dodatkowo na pół etatu w Zakładzie Aparatów Matematycznych i w Biurze Obliczeń i Programów Instytutu Maszyn Matematycznych. Zdobywa wiedzę i doświadczenie w zakresie metodologii statystycznej; wraz z Zespołem przygotowała książkę o teorii i praktyce wnioskowania statystycznego, która ukazuje się w wersji polskiej i angielskiej. Obecnie Zespół pracuje nad stworzeniem gradacyjnej infrastruktury statystycznej i rozwojem opartych na niej metod.

Dr Magdalena Niewiadomska-Bugaj

Magdalena Niewiadomska-Bugaj jest absolwentką wydziału Matematyki i Mechaniki UW. Pracę doktorską nt. redukcji danych w analizie dyskryminacyjnej obroniła w 1987 roku pod kierunkiem prof. Elżbiety Pleszczyńskiej. W latach 1977-1988 była pracownikiem dydaktycznym Instytutu Matematyki PW prowadząc jednocześnie prace badawcze w IPI PAN. Od 1989 pracuje w USA - początkowo w uniwersytecie Ohio-State, a następnie w uniwersytecie Zachodniej Wirginii, gdzie na wydziale statystyki prowadzi działalność dydaktyczną, naukową i konsultacyjną. Jest również konsultantem statystycznym informatycznego ośrodka badawczego Concurrent Engineering Research Center.

Interesuje sie zagadnieniami klasyfikacji ze szczególnym uwzględnieniem analizy dyskryminacyjnej jak również gradacyjnych metod klasyfikacji, nad ktorymi pracuje we wspłpracy z Zespołem Statystycznej Analizy Danych w IPI PAN kierowanym przez prof. Elżbietę Pleszczyńską. Prowadzi także prace nad metodami wnioskowania statystycznego opartymi na wskaźniku Giniego.

Jest autorką około 30-tu prac, w tym, wspólnie z Robertem Bartoszyńskim, podręcznika ,,Probability and Statistical Inference''. Obecnie wspólnie z prof. Elzbietą Pleszczyńską pracuje nad redakcją monografii ,,Models and Methods of Grade Statistics'' przygotowywanej do druku przez Zespół Statystystycznej Analizy Danych IPI PAN.


IIS'99.