-
Notifications
You must be signed in to change notification settings - Fork 114
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
如何利用 AI 向书籍(作者)提问? chatbook.im #398
Comments
https://askmybook.com 开源项目:https://github.com/slavingia/askmybook askmybook 就是很简单的调用 openai 的 Embedding https://github.com/slavingia/askmybook/blob/main/scripts/pdf_to_pages_embeddings.py#L76 |
https://beta.openai.com/playground
|
一些dev项目research,share 一下
|
https://twitter.com/Sarah_A_Bentley/status/1611069576099336207 基于已有文本来进行对话,不过还没有考虑上下文的限制问题。
|
Notion Question-Answering 💪 Built with LangChain 什么是 LangChain?好像 LangChain 是另外一个基于 LLMs (大语言模型)的应用程序开发框架? ⚡ Building applications with LLMs through composability ⚡ ⚡ 通过「可组合性」使用 LLM 构建应用程序 ⚡ 重点就在于这里的 「可组合性」
大型语言模型 (LLM) 正在作为一种变革性技术出现,使开发人员能够构建他们以前无法构建的应用程序。但是单独使用这些 LLM 通常不足以创建真正强大的应用程序——当您将它们与其他计算或知识的来源。 LangChain 库旨在协助开发这些类型的应用程序。这些类型的应用程序的常见示例包括: ❓ Question Answering over specific documents
💬 Chatbots
重点是,能够记住上下文。 由于语言模型擅长生成文本,这使它们成为创建聊天机器人的理想选择。除了基本提示/LLM 之外,聊天机器人需要了解的一个重要概念是 🤖 Agents
Wolfram Alpha(也写作“Wolfram|Alpha”,缩写 W|A),是由 Wolfram Research 公司推出的一款在线自动问答系统。其特色是可以直接向用户返回答案,而不是像传统搜索引擎一样提供一系列可能含有用户所需答案的相关网页[4]。 Wolfram Alpha 于 2009 年 5 月 18 日正式发布[1],其数据来源包括学术网站和出版物、商业网站和公司、科学机构等等,例如中央情报局出版物《世界概况》、康奈尔大学图书馆出版物《All About Birds》、《Chambers Biographical Dictionary》、道琼斯公司、Catalogue of Life (页面存档备份,存于互联网档案馆)、 CrunchBase、百思买 、美国联邦航空管理局、美国地质调查局等 所以,看起来它也可以直接快速搭建一个 ChatBot,[hwchase17/chat-langchain] https://github.com/hwchase17/chat-langchain |
Dust - Design and Deploy Large Language Models Apps Prompt engineering, re-imagined🔥 新概念:
Dust 感觉好棒啊,直接链接了两端:Model 和 Service,语言模型可以拿现成的,数据提供商分开定义,然后数据集来自自有数据,或者网络搜索,哇哦 🤩 |
Dust - bcmejla > AI-album-reviews 这个示例,从Google调取数据,算是一种兜底查询,也就是将 Google Search 作为一种 Service Provider,后续 Dust 还会支持YouTube Search 和 Notion,甚至网络爬虫。
需要先给几个问答的例子作为数据集,解决的问题就是 GPT-3 语言模型未包含最新的网络数据。 |
https://twitter.com/yoheinakajima/status/1619556893500014592 The @dust4ai web search engine template combined web search + scraping. @LangChainAI has a self-ask agent that can keep doing web search until all data is collected. @gpt_index if it’s proprietary data. Study all three an combine learnings for max resiliency. |
GPT Index Use Cases — GPT Index documentation --- GPT 索引用例 — GPT 索引文档
|
LangChain vs GPT Index 投资?Benchmark的合伙人Miles Grimshaw在探索LLM如何给你的产品增加超能力 |
https://chatbase.co Yasser Elsaid 在 Twitter: "Built an AI chatbot trained on your data that lets you create a chatbot from any PDF document. "
http://embra.app?referrer_id=cf1c2a78-0d3c-411d-9be4-125692ce06ed 为你量身定制的 ChatGPT-like 快速 AI 助手。
|
我刚梳理了下 GPT Index vs LangChain 的区别: 根本上是因为 大语言模型支持的context有限,比如ChatGPT的Davinci model只有 4096 tokens,对应中文,可能只有2000 “A big limitation of LLMs is context size (e.g. Davinci's limit is 4096 tokens. Large, but not infinite).”
与此同时,在用 ChatGPT 时,单次输入的 prompt 也有限制,所以 GPT Index 可以简化这个 feed 喂数据的过程。
那为什么还有用上 LangChain 呢?就是因为 LLMs 不止 OpenAI 的 GPT 模型,LangChain 可以对接多种模型,即 Lang 而 Chain 的意思就是把多个 LLM 调用,而且是调用序列,标准化,集成等工作,最后串起来
比如 Loader 部分,它也推出了跟 https://llamahub.ai 类似的 https://github.com/hwchase17/langchain-hub,用来集成外部数据。区别就在于 GPT Index 能用的,LangChain 都能用,LangChain 的 Loader 能加载其他语言模型,是 GPT 的超集。 再比如 Memory 部分,就是用来持久化 内存 状态,所以能实现 ChatGPT 聊天机器人这样的功能,记住以前的交互非常重要,无论是短期的还是长期的。 Agent 部分就更有趣了,可以根据用户输入,再来决定调用这些工具中的哪一个,比如 LangChain 的 GPT+WolframAlpha 示例,甚至还可以根据输入去调用 WolframAlpha,解答你的数学提问,弥补GPT 数学弱智的问题。 当然,它也可以去做 Google 搜索、数据库查找 等操作,通过需要跟 Document Loader 结合起来用,你可以找到类似 https://llamahub.ai/l/file-pdf 等不少例子。 |
🔍 Haystack 是一个开源 NLP 框架,可使用 Transformer 模型和 LLM(GPT-3 等)与您的数据进行交互。 Haystack 提供生产就绪工具来快速构建类似 ChatGPT 的问答、语义搜索、文本生成等。 人家说的是 production-ready |
https://www.fixie.ai/ We're building the first open, completely free marketplace of Smart Agents. Build natural language agents that connect to your data, talk to APIs, and solve complex problems.
Fixie 相当于要在 GPT 等大模型之上搭建一个软件技术栈,framework,一出手就是平台级别的
LangChain 开源路线,还是面对engineer的,而 fixie 更面向业务需求端
|
微软的NPM包,帮助开发 prompt 提示词:microsoft/prompt-engine: A library for helping developers craft prompts for Large Language Models https://github.com/microsoft/prompt-engine How to get Codex to produce the code you want! | Prompt Engineering |
项目纵向拆分
⓵ 定义目标和原则
终极目的
⓶ 展望结果(OKRs)
利益相关人清单
⓷ 思维导图:头脑风暴/集思广益(发散)+ ⓸ 组织整理(收敛)
⓹ 明确「下一步行动」
能够产生反馈结果的小任务:
The text was updated successfully, but these errors were encountered: