Podstawowym klasycznym założeniem przy obliczaniu porządku wyników w
wyszukiwarkach jest założenie o niezależności przydatności poszczególnych
wyników w odpowiedzi na zapytanie użytkownika (ang. Independent Relevance
Assumption). Wyniki prezentuje się wtedy w nierosnącej kolejności
dopasowania do zapytania. Podejście takie jest efektywne, gdyż umożliwia
stosowanie prostych algorytmów zachłannych do obliczania listy wyników.
Tak uproszczony model ma jednak poważne wady, gdyż może zwracać wyniki
wysoce powtarzalne albo zdominowane przez najpopularniejsza interpretacje
zapytania w przypadku zapytań wieloznacznych.
Podejście bardziej subtelne, uwzględniające zależności pomiędzy zwróconymi
dokumentami przy obliczaniu ich przydatności, które nazywać będziemy
roboczo "dywersyfikacja wyników", stanowi obecnie jeden z najgorętszych
tematów w dziedzinie wyszukiwania informacji (ang. Information Retrieval)
Na seminarium przedstawione zostaną podstawy zagadnienia, rozszerzenia
klasycznych miar przydatności wyników (NDCG), które uwzględniają
dywersyfikacje, oraz wybrane aspekty algorytmiczne tego zagadnienia.
Zreferowane zostaną wybrane najnowsze prace z dziedziny oraz wymienione
potencjalne kierunki dalszych badań, w tym autora, oraz pokazane będą
związki z podobnymi badaniami w pokrewnych dziedzinach takich jak bazy
danych czy systemy rekomendacyjne.
|