-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Неправильні XPOS-мітки #277
Comments
Виправив |
Можливо, є якийсь сенс в тому, щоби випустити "оновлений" стандарт MTE, якщо це можливо, з описом змін і відмінностей? Можна, звичайно, посперечатись, але |
Два роки тому ми хотіли випустити оновлений МТЕ, але сам координатор стандарту відмовив нас на користь UD. Можна нормалізувати базу по фічах (кожна колонка відповідає окремій морфологічній рисі, наприклад |
Хочу створити стандарт мітки, яка відображатиме UD-фічі, але для цього потрібно знати, чи використовуєте ви ті самі властивості, які визначені у UD стандарті тут: http://universaldependencies.org/u/feat/index.html? |
Звичайно, корпус в UD репо має стандарт UD. На додачу до універсальних фіч є ще language-specific. Не на всі написана документація. |
Працював з корпусом, і помітив, що деяких XPOS-міток просто не існує у специфікації MULTEXT-East Morphosyntactic Specifications, Version 4. Так, наприклад, з тегами
Ppp-mysaa
(трапляється в тренувальному корпусі на рядках 19114, 32493, 53879, 88733),Ppp-m-sga
(29 випадків, там же) іPpp-n-sga
(8 випадків, там же). (Це тільки перше, що знайшов).Побачив, що якщо попереставляти деякі букви, то з тих тегів вийде щось правильне, але ж машина до такого не здогадається, вона просто викине помилку.
Якщо це до вас, то виправте будь ласка.
The text was updated successfully, but these errors were encountered: