中文 | EN
Chat-Knows 是一个基于本地知识库实现智能问答服务,它利用文档向量化和向量搜索的技术,为ChatGPT提供有关问题的回答并提供相关的参考文档。
Chat-Knows 旨在将非结构化文档集合中的知识和信息与 ChatGPT 智能聊天模型相结合,以提供更准确和相关的回答。系统的工作流程如下:
- 允许您使用GPT功能与上传的PDF、Word等文件聊天
- 该应用程序智能地将文档分成更小的块,并采用强大的深度平均网络编码器来生成embedding
- 首先对上传文件内容执行语义搜索,并将最相关的嵌入传递给LLM
- 生成精确的响应,返回的响应中引用信息所在的来源,这增加了响应的可信度,并有助于快速定位相关信息
- 文档上传:将非结构化文档上传到 Chat-Knows 仓库。
- 向量化:将上传的文档转化为数值向量表示。
- 向量搜索:基于向量化的文档集合,实现高效的向量搜索和相关性排序。
- ChatGPT 接口:通过与 ChatGPT 模型的集成,提供回答和参考文档的获取功能。
- 克隆仓库:
git clone https://github.com/YidaHu/chat-knows.git
-
上传文档:将你的非结构化文档上传到仓库中,确保文档符合支持的格式要求。
-
向量化和索引化:使用提供的工具和脚本对上传的文档进行向量化和索引化。
-
启动 ChatGPT:配置 ChatGPT 模型并启动聊天接口。
-
提问和回答:使用 ChatGPT 接口向 Chat-Knows 提问,并获取回答和相关的参考文档。
执行 api.py 利用 fastapi 部署 API
uvicorn api:app --reload
欢迎贡献代码、报告问题以及提供改进建议!如果你想贡献代码,请先阅读贡献指南,并提交 Pull Request。如果你发现了问题或有任何建议,请提交 Issue。
请确保你的贡献符合项目的行为准则,并遵守开源许可证。