Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Парсинг PDF: списки #9

Open
slavamarcin opened this issue Feb 21, 2023 · 6 comments
Open

Парсинг PDF: списки #9

slavamarcin opened this issue Feb 21, 2023 · 6 comments
Assignees

Comments

@slavamarcin
Copy link
Contributor

На данный момент извлечение списков происходит с множеством ошибок.
Основная проблема состоит в том что создатели документов по разному оформляют списки и какой-то конкретный алгоритм подобрать сложно.
Требуется дальнейшее исследование.

@slavamarcin slavamarcin self-assigned this Feb 28, 2023
@AxiomAlive
Copy link
Contributor

Основная проблема состоит в том что создатели документов по разному оформляют списки и какой-то конкретный алгоритм подобрать сложно.

В чем именно состоит отличие?

@slavamarcin
Copy link
Contributor Author

Отличие в оформлении списков

@AxiomAlive
Copy link
Contributor

Отличие в оформлении списков

Продемонстрируйте примером.

@slavamarcin
Copy link
Contributor Author

image
Первый способ

@slavamarcin
Copy link
Contributor Author

image
2 способ

@slavamarcin
Copy link
Contributor Author

image
3 способ

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants