• Aktualności

Aktualności Instytutu Podstaw Informatyki PAN

Zapytanie ofertowe nr EA/ZPN-2/9/22
Przygotowanie i opracowanie danych do stworzenia systemu zbierającego
informacje o produktach w sieci Web


Przedmiot zamówienia finansowany z projektu uzyskanego w ramach konkursu INFOSTRATEG III,
finansowanego przez Narodowe Centrum Badań i Rozwoju.

Czytaj więcej: Zapytanie ofertowe nr EA/ZPN-2/9/22

Zapytanie ofertowe nr EA/ZPN-1/9/22
Stworzenie bazy opinii o produktach na podstawie wpisów, treści multimedialnych i komentarzy umieszczonych w sieciach społecznościowych


Przedmiot zamówienia finansowany z projektu uzyskanego w ramach konkursu INFOSTRATEG III,
finansowanego przez Narodowe Centrum Badań i Rozwoju.

Czytaj więcej: Zapytanie ofertowe nr EA/ZPN-1/9/22

Artykuł o metodzie ciągłego uczenia sieci neuronowych przy przy zachowaniu gwarancji niezapominania na konferencji ICML 2022


Paweł Morawiecki z Zakładu Podstaw Informatyki we współpracy z grupą naukowców z Uniwersytetu Jagiellońskiego opublikowali pracę "Continual Learning with Guarantees via Weight Interval Constraints" na konferencji ICML 2022 (International Conference on Machine Learning).

W pracy autorzy zaproponowali nowy rodzaj treningu, który daje pewne gwarancje w uczeniu ciągłym (ang. continual learning) sieci neuronowych. Współczesne metody ciągłego uczenia się skupiają się na efektywnym uczeniu sieci neuronowych ze strumienia danych, jednocześnie redukując negatywny wpływ katastrofalnego zapominania, ale nie dają żadnej solidnej gwarancji, że wydajność sieci nie ulegnie niekontrolowanemu pogorszeniu w czasie.

W pracy pokazano, jak ograniczyć zapominanie poprzez przeformułowanie ciągłego uczenia się modelu jako ciągłego skracania jego przestrzeni parametrów. W tym celu zaproponowano nową metodologię treningu, w której każde zadanie jest reprezentowane przez hiperprostokąt w przestrzeni parametrów, w pełni zawarty w hiperprostokątach poprzednich zadań. Ta formuła redukuje problem NP-trudny z powrotem do czasu wielomianowego, zapewniając jednocześnie odporność na zapominanie. Opublikowana praca może być punktem startowym do dalszych ulepszeń, w których trafność klasyfikacji byłaby lepsza przy zachowania gwarancji niezapominania.

Artykół dostępny jest na stronie Proceedings of Machine Learning Research Volume 162

Rusza rekrutacja do Szkoły Doktorskiej Technologii Informacyjnych i Biomedycznych PAN


20 czerwca rusza rekrutacja do Szkoły Doktorskiej Technologii Informacyjnych i Biomedycznych Instytutów PAN (TIBPAN). TIBPAN prowadzi kształcenie interdyscyplinarne przygotowujące do uzyskania stopnia doktora w następujących dyscyplinach:

  • informatyka techniczna i telekomunikacja,
  • inżynieria biomedyczna,
  • nauki medyczne.

Instytut Podstaw Informatyki PAN w ramach studiów w TIBPAN prowadzi rekrutację w 6 tematach badań doktoranckich:

  1. Badanie segmentacji danych w głębokim uczeniu,
  2. Informacja interakcyjna i jej wykorzystanie w Genome Wide Interaction Studies,
  3. Ku semantycznym miarom zawartości informacyjnej - integracja wiedzy z grafu linków i semistrukturalnej informacji tekstowej,
  4. Learning to rank w modelowaniu różnicowym i medycynie spersonalizowanej,
  5. Określenie źródła zmienności ekspresji genów w populacjach komórek – analiza zależności między sygnałami epigenetycznymi a trójwymiarową strukturą chromatyny,
  6. Weryfikacja socjotechnicznych modeli systemów wieloagentowych i protokołów elektronicznego głosowania.

Więcej na ten temat na stronach:
https://ipipan.waw.pl/studia/szkola-doktorska-tib-pan
http://tib.ippt.pan.pl

Termin nadsyłania zgłoszeń na adres Instytutu Podstawowych Problemów Techniki PAN mija 24 czerwca 2022 r.

13.06.2022 — Seminarium "Przetwarzania Języka Naturalnego" — godz. 10:15

Michał Ulewicz

Streszczenie (autorskie):

Semantic Role Labeling (SRL) pozwala przedstawić znaczenie zdania w postaci struktur (tzw. ramek) składających się z orzeczenia i argumentów związanych z tym orzeczeniem. Takie podejście pozwala podzielić zdanie na istotne znaczeniowo fragmenty i precyzyjnie znaleźć odpowiedzi na pytania: kto, co, komu, kiedy i jak zrobił dla każdego z tych fragmentów. W pierwszym etapie znajdowane są orzeczenia i ujednoznaczniane ich znaczenia. W drugim etapie dla każdej ramki identyfikowane i klasyfikowane są argumenty. Do budowy skutecznych modeli SRL potrzebne są dane i o ile dla języka angielskiego istnieją wysokiej jakości zestawy danych (propbank), to dla pozostałych języków takie zbiory praktycznie nie istnieją, głównie ze względu na wysoki nakład pracy i koszt potrzebny do ich stworzenia. Podczas wystąpienia opowiem jak SRL może pomóc w precyzyjnym przetwarzaniu tekstu. Przedstawię próby automatycznego generowania zestawów danych dla różnych języków w tym języka polskiego z wykorzystaniem techniki rzutowania anotacji (ang. annotation projection). Przedstawię zidentyfikowane problemy związane z automatycznym rzutowaniem anotacji z języka angielskiego na język polski. Opowiem o modelach SRL, które zbudowałem na bazie modeli typu Transformer.

Czytaj więcej: 13.06.2022 - Seminarium "Przetwarzania Języka Naturalnego"


© 2021 INSTYTUT PODSTAW INFORMATYKI PAN | Polityka prywatności | Deklaracja dostępności