🤖QChatGPT 能力 | 基于 向量数据库 和 OpenAI GPT 实现一个自动答疑 QQ 机器人

基于 QChatGPT 项目的插件能力 实现的自动答疑机器人

原理

将需要答疑的领域的相关问题及其解答内容分割成多个文档,从 OpenAI Embeddings 接口 获取文档的向量值,储存到向量数据库(本例中使用 搭配了向量计算插件的 PostgreSQL 数据库)中,在用户问题达到时,计算用户问题的向量值,从数据库中查找出最相近的几个文档,输入给 OpenAI 的 GPT 模型生成自然语言回复。

实现

按照 QChatGPT 文档配置好主程序,按照 llm-embed-qa 的文档进行配置,之后按照插件文档进行安装,配置 llm-embed-qa 的地址后即可向机器人提问相关内容。

局限性和改进

  • 目前将整个文档(包含问题和示例回复)混到一起计算向量值,会导致当用户的问题与文档中的问题相符,但与回复相差甚远时,此文档不会被匹配到。应该为仅计算问题的向量值并存进数据库。
  • 目前均为人工分割大段语料成数个小文档,可以改为尝试使用 OpenAI GPT 进行自动分割。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注