Seminaria - Instytut Podstaw Informatyki Polskiej Akademii Nauk

15.04.2024 - Seminarium Instytutowe — godz. 12:00

Michał Makowski (Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego)

+ - Obliczeniowa siła wyrazu warunkowej niezależności zmiennych losowych Click to collapse

Streszczenie (autorskie):

Warunkowa niezależność zmiennych losowych X i Y pod warunkiem Z intuicyjnie oznacza, że znając Z, jakakolwiek wiedza o X nie mówi nam nic o Y i vice versa. Naturalnie pojawia się chęć wnioskowania o zależnościach pomiędzy tymi niezależnościami. Jak się okazuje, nie istnieje skończony system aksjomatów charakteryzujący warunkową niezależność zmiennych losowych. Co więcej, problem decyzyjny pytający, czy zachodzi implikacja pomiędzy daną koniunkcją warunkowych niezależności a inną daną warunkową niezależnością, jest nierozstrzygalny. Wykazał to w 2022 Cheuk Ting Li oraz niezależnie Kühne i Yashfe. Można rozważać wariant problemu, w którym dziedziny zmiennych są ograniczone, np. do zbioru dwuelementowego. Nietrudno pokazać, że wariant ten należy do klasy złożoności EXPSPACE. W pracy magisterskiej budującej na publikacji C. T. Li wykazałem co-NEXPTIME-trudność tego wariantu problemu. W wystąpieniu przedstawię elementy wykorzystanej konstrukcji, która pozwala za pomocą wyrażeń warunkowej niezależności modelować problem kafelkowania, a co za tym idzie dowolną maszynę Turinga.

28.03.2024 (czwartek) — Seminarium "Przetwarzania Języka Naturalnego" — godz. 11:00

Krzysztof Węcel (Uniwersytet Ekonomiczny w Poznaniu)

Odnośnik do spotkania w MS Teams (nowe okno)

+ - Wiarygodność informacji w kontekście procesu fact-checkingu Click to collapse

Streszczenie (autorskie):

Prezentacja będzie skupiała się na tematyce projektu OpenFact, który jest odpowiedzią na problem fake newsów. W ramach projektu opracowujemy metody, które pozwalają na weryfikację wiarygodności informacji. W celu zapewnienia poprawności metodycznej bazujemy na procesie stosowanym przez agencje fact-checkingowe. Działania te opierają się na złożonych zbiorach danych, pozyskiwanych m.in. z ClaimReview, Common Crawl czy poprzez monitoring mediów społecznościowych i ekstrakcję stwierdzeń z tekstów. Istotne jest również ocenianie informacji pod kątem jej wartości do weryfikacji (checkworthiness) oraz wiarygodności źródeł, których reputacja może wynikać z publikacji z OpenAlex lub Crossref. Analiza stylometryczna pozwala na określenie autorstwa, a porównanie ludzkiej i maszynowej pracy otwiera nowe możliwości w wykrywaniu użycia sztucznej inteligencji. Używamy zarówno małych modeli językowych, jak i LLM uruchamianych zdalnie w różnych wariantach. Zbudowaliśmy duże zbiory stwierdzeń, które mogą służyć do weryfikacji nowych tekstów poprzez badanie podobieństwa semantycznego. Opisane są one dodatkowymi wciąż rozbudowywanymi metadanymi pozwalającymi na realizację różnych scenariuszy użycia.

25.03.2024 — Seminarium "Przetwarzania Języka Naturalnego" — godz. 10:15

Piotr Przybyła ((Uniwersytet Pompeu Fabry i Instytut Podstaw Informatyki PAN))

Odnośnik do spotkania w MS Teams (nowe okno)

+ - Czy klasyfikatory wiarygodności tekstu są odporne na działania antagonistyczne? Click to collapse

Streszczenie (autorskie):

Automatyczne klasyfikatory tekstu wykorzystuje się szeroko do pomocy w moderowaniu platform udostępniających treści generowane przez użytkowników, szczególnie sieci społecznościowych. Mogą być one używane do odsiewania treści nieprzyjaznych, dezinformujących, manipulujących lub wprost nielegalnych. Jednak trzeba wziąć pod uwagę, że autorzy takich tekstów często mają silną motywację do ich rozpowszechniania i mogą próbować modyfikować oryginalną treść, aż znajdą takie sformułowanie, które przedostanie się przez automatyczny filtr. Takie zmodyfikowane wersje oryginalnych danych, nazywane przykładami antagonistycznymi, odgrywają kluczową rolę w badaniu odporności modeli ML na ataki zmotywowanych aktorów. Wystąpienie będzie poświęcone systematycznej analizie tego problemu w kontekście wykrywania dezinformacji. Pokażę konkretne przykłady, gdzie podmiana pozornie nieistotnych słów powoduje zmianę decyzji klasyfikatora, jak również framework BODEGA do systematycznej oceny odporności modeli, wykorzystany również w zadaniu InCrediblAE na warsztatach ewaluacyjnych CheckThat! na konferencji CLEF 2024.

Seminaria w Instytucie Podstaw Informatyki PAN

Seminarium Instytutowe (Poniedziałki, o godz 12:00)

Inne seminaria:

Najbliższe seminaria:

15.04.2024 - Seminarium Instytutowe — godz. 12:00

Michał Makowski (Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego)

28.03.2024 (czwartek) — Seminarium "Przetwarzania Języka Naturalnego" — godz. 11:00

Krzysztof Węcel (Uniwersytet Ekonomiczny w Poznaniu)

25.03.2024 — Seminarium "Przetwarzania Języka Naturalnego" — godz. 10:15

Piotr Przybyła ((Uniwersytet Pompeu Fabry i Instytut Podstaw Informatyki PAN))