Informacje ogólne  Aktualności  Pracownicy  Projekty badawcze  Rada Naukowa   Konferencje   Seminaria   Publikacje   Biblioteka   Wydawnictwo  Usługi lokalne 
Seminaria \ Seminarium Instytutowe \ Archiwum - 2007/2008 \ 9.10.2008 Dominik Ślęzak Mapa serwisu  

Archiwum 2010/2011

Archiwum 2009/2010

Archiwum 2008/2009

Archiwum 2007/2008

Archiwum 2006/2007

Archiwum 2005/2006

Archiwum 2004/2005

Archiwum 2003/2004

Archiwum 2002/2003

Archiwum 2001/2002

 

Seminarium
Instytutowe

 

Seminaria

Informacje ogólne

 


Seminarium Instytutowe - Dominik Ślęzak

8.05.2008

Zależności pomiędzy zbiorami atrybutów: Metody reprezentacji i wyznaczania z danych

Dominik Ślęzak (Infobright)

Automatyczne wyznaczanie zależności pomiędzy atrybutami (zwanymi również cechami, wymiarami, zmiennymi, kolumnami, etc.) stanowi ważną część wielu podejść z zakresu systemów uczących się, czy też odkrywania wiedzy z danych. Przejrzysta reprezentacja zależności pozwala użytkownikom na zrozumienie danych bez wnikania w szczegóły, na przykład, definicji funkcji stosowanych przy obliczaniu stopni spełniania zależności, czy też sposobów analitycznego wyrażania kryteriów praktycznej przydatności zależności. Z drugiej strony, matematyczne podstawy używanych funkcji i kryteriów pozostają rzecz jasna kluczowe dla oceny poprawności, jakości i stosowalności wyników algorytmów poszukujących (sub-)optymalnych reprezentacji zależności w oparciu o dostępne dane.
Referat obejmuje przykładowe metody reprezentacji i wyznaczania zależności pomiędzy atrybutami, w szczególności:

  1. znajdowanie reprezentatywnych kolekcji przybliżonych zależności funkcyjnych pomiędzy zbiorami atrybutów, a także
  2. teoretyczne podstawy dla sieci Bayesowskich reprezentujących występujące w danych warunkowe niezależności pomiędzy zbiorami atrybutów.

W pierwszym powyższym przypadku podamy teoretyczne wyniki dotyczące złożoności problemów znajdowania optymalnych zależności przybliżonych, algorytmiczne metody ich wyznaczania, a także zastosowania w budowie klasyfikatorów i selekcji atrybutów podczas odkrywania wiedzy z danych. W drugim przypadku uogólnimy dotychczasowe twierdzenia o reprezentacji warunkowych niezależności w języku skierowanych grafów acyklicznych na potrzeby szerszej klasy funkcji modelujących stopnie warunkowych niezależności pomiędzy atrybutami. Ponadto, przeprowadzimy dyskusję o możliwości hybrydyzacji różnych podejść do reprezentacji zależności i niezależności atrybutów, a także zaproponujemy możliwie ogólne i spójne podstawy dla funkcji stosowanych przy obliczaniu stopni spełniania różnych rodzajów zależności i niezależności w danych.



      Archiwum - 2007/2008  Archiwum    
  webmaster@IPIPAN.Waw.PL Copyright by IPI PAN - 2003