Przetwarzanie Języka Naturalnego
Zadania:
- Laboratorium 1 - n-gramy - statystyki korpusów oraz zgadywanie języka wprowadzonego tekstu
- Laboratorium 2 - metryka Levenshtein'a (odległość redakcyjna), jej modyfikacje i poprawianie błędów ortograficznych (prosty spell checker)
- Laboratorium 3 - spell checker oparty na klasyfikatorze Bayesa
- Laboratorium 4 - prosty clustering w oparciu o metryki DICE, COSINE, LCS
- Laboratorium 5 - generowanie artykułów i słów w oparciu o łancuchy Markova
- Laboratorium 6 - prawo Zipfa i Mandelbrota - statystyki Potopu
- Laboratorium 7 - statystyki df, tf, tf-idf, wyszukiwanie na podstawie słów kluczowych, wyszukiwanie podobnych notatek dla korpusu PAP
- Laboratorium 8 - modele LSA i LDA tekstu, wyszukiwanie podobnych notatek dla korpusu PAP na podstawie modeli LSA i LDA
- Laboratorium 9 - model grafowy tekstu, wyszukiwanie podobnych notatek dla korpusu PAP
- Laboratorium 10 - ustalanie rekcji przyimków na podstawie korpusu PAP i Potopu