让大模型自我事实核查并附上来源

让大模型自我事实核查并附上来源

了解如何使用检索交错生成(RIG)构建聊天机器人,确保AI回答准确、已核查并附有可验证的来源。

什么是RIG(检索交错生成)?

检索交错生成(Retrieval Interleaved Generation,简称RIG)是一种前沿的AI方法,能够顺畅地结合信息检索与答案生成。以往,AI模型通常采用RAG(检索增强生成)或单纯生成,而RIG将两者合并,提升了AI的准确性。检索和生成的交错进行,让AI系统能够利用更广泛的知识基础,提供更精确、相关的回答。RIG的主要目标是减少错误,提高AI输出的可信度,是开发者精细化AI准确性的必备工具。因此,检索交错生成成为基于上下文生成AI答案时,RAG(检索增强生成)的替代方案。

RIG vs RAG illustration

RIG(检索交错生成)如何工作?

RIG的工作流程如下。以下阶段借鉴自原始博客,其更聚焦于使用Data Commons API的一般用例。然而,在大多数情况下,你可能会想同时利用通用[知识库(如维基百科或Data Commons)和你自己的数据。以下是在FlowHunt中,如何利用流程将你自己的知识库和通用知识库(如维基百科)结合,打造一个RIG聊天机器人。

  1. 用户的问题输入到生成器,生成带有对应部分引用的答案样例。在此阶段,生成器可能会给出不错的答案,但数据和统计可能是虚构的。

    RIG Stage 1: Sample answer generation
  2. 在下一个阶段,我们使用AI Agent接收这一输出,并通过连接维基百科,进一步细化每个部分的数据,同时为每个相关部分添加来源。

    RIG Stage 2: Fact-checking and source attribution

如你所见,这种方法显著提升了聊天机器人的准确性,并确保每个生成部分都有来源且扎根于事实。

如何在FlowHunt中创建RIG聊天机器人?

添加第一阶段(简单答案生成器):

流程的第一部分包括聊天输入、提示模板和生成器。只需将它们连接在一起。最关键的是提示模板。我使用了如下内容:

给定用户的提问。根据用户的问题,生成最佳答案,可以使用虚构数据或百分比。在你答案的不同部分后,包含需要用来获取正确数据并细化该部分的来源。若涉及用户自定义产品或服务的数据可指定使用Internal knowledge source,通用知识请使用Wikipedia。

示例输入:哪些国家在可再生能源方面最领先?衡量标准是什么?领先国家的该指标是多少? 示例输出:可再生能源领先的国家有挪威、瑞典、葡萄牙、美国 [在Wikipedia中查询“Top Countries in renewable Energy”],可再生能源常用的衡量指标是容量因子 [在Wikipedia中查询“metric for renewable energy”],第一名国家的容量因子为20% [在Wikipedia中查询“biggest capacity factor”]

现在开始! 用户输入:{input}

这里,我们使用Few Shot提示,让生成器输出我们想要的精确定格式。

Sample prompt template in FlowHunt

添加事实核查部分:

现在,添加第二部分,对样例答案进行事实核查,并根据真实来源完善答案。此处我们用到了维基百科和AI Agent,因为将维基百科与AI Agent连接比单纯生成器更灵活、方便。将生成器输出连接到AI Agent,再将维基百科工具接入AI Agent。以下是我为AI Agent设置的目标:

你将获得用户问题的样例答案。该答案可能包含错误数据。请在指定部分使用Wikipedia工具和指定查询,利用维基百科的信息细化答案。每个指定部分都要包含维基百科链接。请从你的工具中获取数据并细化对应部分的答案。每个部分都要加上来源链接,不要只在结尾添加。

同样,你也可以为AI Agent添加文档检索器,从你自己的专属知识库检索文档。

Connecting Wikipedia to AI Agent

你可以在这里直接试用该流程。

了解检索增强生成(RAG)

要真正理解RIG,首先需要了解它的前身——检索增强生成(RAG)。RAG结合了检索相关数据的系统和生成连贯内容的模型各自的优点。从RAG到RIG的转变是一次重大进步。RIG不仅能检索和生成,还能将这两步交错进行,带来更高的准确性和效率。这让AI系统可以逐步提升理解和输出能力,带来不仅准确而且相关、富有洞见的结果。通过将检索与生成相结合,AI系统能够调用海量信息,同时保证回应的连贯与相关性。

检索交错生成的未来

检索交错生成的未来非常光明,众多进步和研究方向正在涌现。随着AI的持续发展,RIG将在机器学习和AI应用领域扮演关键角色。它的潜力不仅限于现有能力,有望彻底改变AI系统处理和生成信息的方式。随着研究的深入,RIG在各种AI框架中的集成也将不断完善,带来更高效、更准确、更可靠的AI系统。随着这些发展推进,RIG的重要性只会不断提升,巩固其在AI准确性和性能中的基石地位。

总之,检索交错生成是追求AI准确性和效率的重大进步。通过巧妙地融合检索与生成流程,RIG提升了大语言模型的表现,加强了多步推理,并为教育和事实核查带来新机遇。展望未来,RIG的持续演进势必推动AI领域新的创新,成为更智能、更可靠人工智能系统不可或缺的利器。

常见问题

什么是检索交错生成(RIG)?

RIG是一种结合信息检索和答案生成的AI方法,使聊天机器人能够自我事实核查并给出有来源、准确的输出。

RIG如何提高聊天机器人准确性?

RIG将检索与生成步骤交错进行,利用如维基百科或你的自定义数据,每个答案部分都基于可靠来源并经过准确性验证。

我如何用FlowHunt构建RIG聊天机器人?

借助FlowHunt,你可以通过连接提示模板、生成器和AI Agent到内部和外部知识源,设计RIG聊天机器人,实现自动事实核查和引用来源。

RAG和RIG有什么区别?

RAG(检索增强生成)先检索信息再生成答案,而RIG每个部分都交错进行这两步,因此准确性更高,答案更可靠且有来源。

Yasha 是一位才华横溢的软件开发者,专攻 Python、Java 以及机器学习。Yasha 撰写关于人工智能、提示工程和聊天机器人开发的技术文章。

Yasha Boroumand
Yasha Boroumand
CTO,FlowHunt

准备好打造属于你的AI了吗?

使用FlowHunt直观的零代码平台,开始构建智能聊天机器人和AI工具。轻松连接模块,自动化你的创意。

了解更多

维基百科溯源问答 AI 助手
维基百科溯源问答 AI 助手

维基百科溯源问答 AI 助手

一个 AI 助手,通过 RIG 方法,基于维基百科来源并指定具体章节,为用户提供事实准确、经过充分调研的信息解答。非常适合需要基于外部数据的可靠、可追溯答案的场景。...

1 分钟阅读
RIG 维基百科助手聊天机器人(检索交错生成器)
RIG 维基百科助手聊天机器人(检索交错生成器)

RIG 维基百科助手聊天机器人(检索交错生成器)

发现 RIG 维基百科助手,这是一款专为从维基百科精准检索信息而设计的工具。非常适合研究和内容创作,能够快速提供有充分来源、可信赖的答案。用准确的数据和透明度提升您的知识。...

1 分钟阅读
AI Wikipedia +5
知识源
知识源

知识源

知识源让根据您的需求教会 AI 变得轻而易举。探索在 FlowHunt 中链接知识的所有方式。轻松连接网站、文档和视频,提升您的 AI 聊天机器人的表现。...

1 分钟阅读
AI Knowledge Management +3