【黄啊码】如何用GPT和向量数据库做问答型AI

openai和chatgpt接口怎么充值，看文章尾部【黄啊码】如何用GPT和向量数据库做问答型AI

知识库服务依赖该数据库，Embedding 形式个性化训练 ChatGPT，必不可少的就是向量数据库因为 qdrant 向量数据库只支持 Docker 部署，所以需要先安装好 Docker 服务。

命令行安装拉取镜像

docker pull qdrant/qdrant 运行服务 docker run -d -p 6333:6333 qdrant/qdrant

宝塔面板下安装 docker 管理器的镜像管理里，拉取 qdrant/qdrant

根据镜像创建容器，注意端口映射那里，填完以后一定要点那个 + 号，其他的是默认的

这样就能安装成功了。

向量数据库

但向量化数据存储到哪里呢？存到MySQL吗?答案显然是不现实的，存到MySQL你怎么做相似性查询，MySQL显然不太擅长做这件事情，想想都难。这时候就该向量数据库登场了

1、先建个collection

curl –location –request PUT ‘your.domain.name/collections… collection name]’
–header ‘Content-Type: application/json’
–data-raw ‘{ “vectors”: { “size”: 1536, “distance”: “Dot” } }’ 注意：由于GPT的向量维度是惊人的1536个维度，所以在这里建collection的时候请填写size为1536，distance默认就是Dot。具体的collection名称在path上传就可以了。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

数据库建好后，我们就可以在这个库里添加向量数据了，但向量数据从哪里来呢?前面说了，我们可以通过openai的API来拿到文档片段的向量数据。

2、文档片段向量化‍

curl –location –request POST ‘your.domain.name/api/xxxx/em…‘
–header ‘Content-Type: application/json’
–data-raw ‘{ “model”: “text-embedding-ada-002”, “input”: “文档片段内容” }’ 返回值：‍‍‍‍

{ “model”: “text-embedding-ada-002-v2”, “object”: “list”, “data”: [ { “object”: “embedding”, “embedding”: [ -0.011098763, 0.0022886666, 0.0019187077, -0.02824744, -6.070769E-4, 0.019469986, -0.014631506, 0.0020021298, -0.015770398, -0.019745642, 0.015494743, …此处省略若干行（1536行实在太长） -0.0138480645, 3.0421853E-4, -0.004363337, -0.0016793226, 0.0029088915, -0.0062639094 ], “index”: 0 } ], “usage”: { “prompt_tokens”: 6, “completion_tokens”: 0, “total_tokens”: 6 } }

这样我们就拿到了文档片段的向量化数据。‍‍‍‍‍‍‍‍‍‍‍‍

3、把向量数据存入向量库‍

继续回到Qdrant的API，下面这个API就负责添加数据，叫add points。‍‍

curl –location –request PUT ‘your.domain.name/collections…‘
–header ‘Content-Type: application/json’
–data-raw ‘{ “points”: [ {“id”: 1, “vector”: [ -0.011098763, 0.0022886666, 0.0019187077, -0.02824744, -6.070769E-4, 0.019469986, -0.014631506, 0.0020021298, -0.015770398, -0.019745642, 0.015494743, …此处省略若干行（1536行实在太长） -0.0138480645, 3.0421853E-4, -0.004363337, -0.0016793226, 0.0029088915, -0.0062639094 ], “payload”: {“doc_segment”: “文档片段内容”}} ] }’

注意：points里边有三个关键字段，id、vector、payload。‍‍‍‍‍

id：唯一编号。相当于mysql的自增id。这个id要和你mysql里的文档片段表的id保持一致，方便后面反查到文档片段。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

vector：向量数据。这里就是上面你拿到的向量数组。‍‍‍‍‍‍‍‍‍‍‍‍

payload：存储一些附加信息。这里我存了文档片段。‍‍

相似性检索‍‍‍‍‍‍‍‍‍

上面已经把一个个文档片段存入到Qdrant。现在我们就可以试试效果了。

1、向量化问题

我们现在把用户的提问进行向量化。同样用的是openai 的embedding API获得向量数组。这里同上就不赘述。‍‍‍‍‍‍‍

2、搜索

这一步是最关键的一步，前面做了那么多，就为了最后这一下搜索。我们使用Qdrant的search points API做相似性检索。

curl –location –request POST ‘your.domain.name/qdrant/coll…‘
–header ‘Content-Type: application/json’
–data-raw ‘{ “vector”: [ -0.009807939, -0.036723405, -0.0041218707, -0.0159379, -0.042078312, …此处省略若干行（1536行实在太长） -0.017488007, -0.022744272, 0.0015791698, -0.008109869, 0.002321635, -6.385377E-4, 0.0057318667 ], “top”: 1 }’

注意：这里我们把上面拿到的问题的向量化数据传入到vector字段，top则传1，表示我们只要一个最相似的结果。

返回值：

{ “result”: [ { “id”: 1, “version”: 0, “score”: 0.77804655, “payload”: null, “vector”: null } ], “status”: “ok”, “time”: 0.000159604 } 注意：可以看出已经返回了最可能的答案，就是id为1的那个文档片段，另外可以发现分数为0.77804655，这里你不要计较这个分数的高低，分数都是相对的，总之你现在已经拿到了最可能的答案。

我们现在知道了最可能的答案就在id为1的文档片段里。是时候把这个文档片段反查出来了。怎么反查呢？其实前面提到了一点。那就是我们采用的是MySQL和向量库双写。MySQL负责管理文档关系，这是MySQL擅长的，Qdrant负责处理向量检索，这也是Qdrant擅长的。嗯，我们拿着这个id去MySQL表里反查文档片段内容。‍‍‍‍‍‍‍‍‍‍‍‍‍‍

MySQL管理文档关系‍

为了管理文档和通过向量化搜索后能拿到文档片段，我们需要在MySQL建两张表。

一张文档表、一张文档片段表，两者是一对多的关系。上面我们从向量库拿到的id就是文档片段的id，这样我们就可以反查到文档片段。

你也许在想我把片段拿到了，但依然不知道具体的答案啊。这时候就需要gpt的prompt出场了。

GPT Prompt最终总结和润色

我们拿到文档片段后，就可以构建下面这样一个prompt，这样就能得到最为准确的结果了

大体prompt的样子：

“{doc_seg}，请从提供的内容中找到最接近的答案（不知道就不回答）： {question}”

有人问：openai和chatgpt接口怎么充值，黄啊码就不讲那么多了，自己看，不懂问他们客服，实在不懂再来问我，记得备注：openai，谢谢 bewildcard.com/i/34NSE4JK

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}}已认证

[Release] Tree Of Savior

服务器文件圣斗士星矢 2024 + 客户端 + GM 工具 + 安装教程 + 新闻更新

Ragnarok M korea mobile game source(O)

PTS_4.6_Guide

[一键安装] 手游-天道情缘

[一键安装] 霸王大陆EP8-5.0 虚拟机+源码+大背包+商城-最新整理

【灵魂行者】【灵魂武器】【SoulWorker】100级端（后宫行者）虚拟机版

[一键安装] 龙之谷手游飓风龙单机版一键端完整GM后台局域网

大模型应用（七）多模态和大模型是如何相互成就的

【AI】『Suno』哎呦不错呦，AI界的周董，快来创作你的歌曲吧！

{{userData.name}}已认证

Related posts: