We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Milvus模式下怎么使用自己的文档作为知识库,才能返回正确的《书名》和出处?是否需要在build前对文本格式做一定的处理?我直接build了一个本地的txt文件,但返回结果时”《》“中的内容并不是小标题而是很长的一段内容文本。
The text was updated successfully, but these errors were encountered:
目前看到了history_sentence_window.py脚本中的处理方式,准备尝试复刻
Sorry, something went wrong.
这段代码定义了一个名为 HistorySentenceWindowNodeParser 的类,它继承自 NodeParser,用于解析文档中的节点。让我来解释它的工作原理和标题提取的过程:
HistorySentenceWindowNodeParser
NodeParser
类的结构:
sentence_splitter
window_size
window_metadata_key
original_text_metadata_key
class_name()
book_name()
from_defaults()
标题提取:
TitleLocalizer
analyze_titles()
build_window_nodes_from_documents()
节点构建和元数据处理:
BaseNode
总体而言,这个类的作用是将文本分解成节点,并为每个节点附加上下文窗口和其他元数据,同时通过 TitleLocalizer 辅助提取和处理文本中的标题信息,用于后续的分析或处理过程。
No branches or pull requests
Milvus模式下怎么使用自己的文档作为知识库,才能返回正确的《书名》和出处?是否需要在build前对文本格式做一定的处理?我直接build了一个本地的txt文件,但返回结果时”《》“中的内容并不是小标题而是很长的一段内容文本。
The text was updated successfully, but these errors were encountered: