LLM이 응답을 사실 확인하고 출처를 포함하도록 만들기

LLM이 응답을 사실 확인하고 출처를 포함하도록 만들기

Retrieval Interleaved Generation(RIG)을 활용해 AI 응답의 정확성, 사실 확인, 검증 가능한 출처 포함을 보장하는 챗봇 구축 방법을 알아보세요.

RIG(Retrieval Interleaved Generation)이란 무엇인가요?

Retrieval Interleaved Generation, 줄여서 RIG는 정보 검색과 답변 생성을 자연스럽게 결합하는 최첨단 AI 기법입니다. 과거에는 AI 모델이 RAG(Retrieval Augmented Generation)나 단순 생성 방식을 사용했지만, RIG는 이 두 과정을 통합해 AI의 정확도를 한층 높였습니다. 검색과 생성을 교차적으로 엮어 AI가 더 넓은 지식 기반을 활용할 수 있으며, 더욱 정확하고 관련성 높은 답변을 제공합니다. RIG의 주된 목적은 실수를 줄이고 AI 결과의 신뢰도를 높이는 것으로, AI 정확도 향상을 원하는 개발자에게 필수적인 도구입니다. 따라서 Retrieval Interleaved Generation은 문맥에 기반한 AI 답변 생성을 위해 RAG의 대안으로 등장했습니다.

RIG vs RAG illustration

RIG(Retrieval Interleaved Generation)는 어떻게 작동하나요?

RIG의 작동 방식은 다음과 같습니다. 아래 단계는 원본 블로그에서 영감을 얻었으며, 해당 블로그는 Data Commons API를 활용한 일반적인 사례에 더 중점을 두고 있습니다. 하지만 대부분의 경우, 위키피디아나 Data Commons와 같은 일반 [지식 베이스](e.g., Wikipedia or Data Commons)와 함께 본인만의 데이터를 함께 활용하고 싶을 것입니다. FlowHunt의 플로우 기능을 활용하면 사용자 맞춤 지식 베이스와 위키피디아 같은 일반 지식 베이스를 결합해 RIG 챗봇을 만들 수 있습니다.

  1. 사용자 쿼리가 생성기로 전달됩니다. 생성기는 각 섹션에 인용 정보를 포함한 예시 답변을 생성합니다. 이 단계에서 생성기는 훌륭해 보이지만 잘못된 데이터나 통계로 꾸며진 답변을 만들 수 있습니다.

    RIG Stage 1: Sample answer generation
  2. 다음 단계에서는 AI 에이전트가 이 출력을 받아, 각 섹션의 데이터를 위키피디아와 연결해 실제로 정제하고, 각 섹션마다 출처도 추가합니다.

    RIG Stage 2: Fact-checking and source attribution

이 방법을 통해 챗봇의 정확도가 크게 향상되며, 생성된 각 섹션마다 신뢰할 수 있는 출처가 포함되고 진실에 근거한 답변이 제공됩니다.

FlowHunt에서 RIG 챗봇 만들기

1단계 추가(기본 샘플 답변 생성기):

플로우의 첫 부분은 챗 입력, 프롬프트 템플릿, 생성기로 구성됩니다. 이들을 서로 연결해 주세요. 가장 중요한 부분은 프롬프트 템플릿입니다. 아래와 같은 템플릿을 사용했습니다:

사용자의 쿼리가 주어집니다. 사용자의 쿼리에 따라 가장 적합한 답변을 가짜 데이터나 비율로 생성하세요. 답변의 각 다른 섹션 뒤에, 해당 부분을 올바른 데이터로 정제하기 위해 어떤 소스를 사용해야 하는지 표시하세요. 사용자의 제품 또는 서비스에 맞춤 데이터가 있으면 Internal knowledge source를, 일반 지식이 필요하면 Wikipedia를 사용하도록 지정할 수 있습니다.

예시 입력: Which countries are top in terms of renewable energy and what is the best metric for measuring this and what is that measure for top country?
예시 출력: The top countries in renewable energy are Norway, Sweden, Portugal, USA [Search in Wikipedia with query “Top Countries in renewable Energy”], the usual metric for renewable energy is Capacity factor [Search in Wikipedia with query “metric for renewable energy”], and number one country has 20% capacity factor [search in Wikipedia “biggest capacity factor”]

지금 시작합니다!
User Input: {input}

Few Shot 프롬프트 기법을 활용해 생성기가 원하는 형식으로 정확히 출력하도록 합니다.

Sample prompt template in FlowHunt

사실 확인 단계 추가:

이제 두 번째 부분을 추가해, 샘플 답변을 사실 확인하고 실제 신뢰할 수 있는 출처 기반으로 답변을 정제합니다. 여기서는 Wikipedia와 AI 에이전트를 사용합니다. Wikipedia를 AI 에이전트와 연결하는 것이 간단한 생성기보다 더 쉽고 유연하기 때문입니다. 생성기의 출력을 AI 에이전트에 연결하고, Wikipedia 도구도 AI 에이전트에 연결해 주세요. 제가 AI 에이전트에 사용한 목표는 다음과 같습니다:

사용자의 질문에 대한 샘플 답변이 주어집니다. 샘플 답변에는 잘못된 데이터가 포함될 수 있습니다. 각 섹션에 명시된 쿼리로 Wikipedia 도구를 활용해 Wikipedia 정보를 사용해 답변을 정제하세요. 각 지정된 섹션마다 Wikipedia 링크를 포함하세요. 도구에서 데이터를 가져오고 해당 섹션의 답변을 정제하세요. 반드시 해당 섹션에 출처 링크를 포함하고, 마지막에 넣지 마세요.

마찬가지로, AI 에이전트에 Document Retriever를 추가하면, 본인만의 맞춤형 지식 베이스와 연결해 문서를 검색할 수도 있습니다.

Connecting Wikipedia to AI Agent

이 플로우를 여기서 직접 체험해 볼 수 있습니다.

Retrieval-Augmented Generation(RAG) 이해하기

RIG를 제대로 이해하려면, 먼저 그 전신인 Retrieval-Augmented Generation(RAG)을 살펴보는 것이 좋습니다. RAG는 관련 데이터를 검색하는 시스템과 일관성 있고 적합한 콘텐츠를 생성하는 모델의 장점을 결합합니다. RAG에서 RIG로의 진화는 큰 도약입니다. RIG는 검색과 생성뿐 아니라 이 과정을 교차적으로 진행해 더 높은 정확도와 효율성을 달성합니다. AI 시스템이 단계적으로 이해도와 결과를 개선할 수 있으며, 정확성뿐 아니라 관련성 있고 통찰력 있는 결과를 제공합니다. 검색과 생성을 혼합함으로써 AI는 방대한 정보를 활용하면서도 응답의 일관성과 관련성을 유지할 수 있습니다.

Retrieval Interleaved Generation의 미래

Retrieval Interleaved Generation의 미래는 매우 밝으며, 다양한 발전과 연구가 이어질 전망입니다. AI가 계속 성장함에 따라 RIG는 머신러닝과 AI 응용 분야에서 핵심적인 역할을 하게 될 것입니다. 그 영향력은 현재의 한계를 넘어, AI 시스템이 정보를 처리하고 생성하는 방식을 혁신적으로 변화시킬 것으로 기대됩니다. 지속적인 연구를 통해 RIG가 다양한 AI 프레임워크에 더 효과적으로 통합되어, 더욱 효율적이고 정확하며 신뢰할 수 있는 AI 시스템이 구현될 것으로 보입니다. 이러한 발전이 이어짐에 따라, RIG의 중요성은 더욱 커져 AI 정확도와 성능의 핵심 요소로 자리 잡게 될 것입니다.

결론적으로, Retrieval Interleaved Generation은 AI의 정확도와 효율성 향상에 있어 커다란 도약을 의미합니다. 검색과 생성 과정을 정교하게 결합함으로써 RIG는 대형 언어 모델의 성능을 높이고, 다단계 추론 능력을 향상시키며, 교육 및 사실 확인 등 다양한 분야에서 혁신적인 가능성을 제시합니다. 앞으로 RIG의 지속적인 발전은 AI 분야의 새로운 혁신을 이끌 것이며, 더 똑똑하고 신뢰할 수 있는 인공지능 시스템을 위한 중요한 도구로 자리매김할 것입니다.

자주 묻는 질문

Retrieval Interleaved Generation(RIG)이란 무엇인가요?

RIG는 정보 검색과 답변 생성을 결합한 AI 기법으로, 챗봇이 자신의 응답을 사실 확인하고 출처 기반의 정확한 결과를 제공할 수 있도록 합니다.

RIG는 챗봇의 정확도를 어떻게 향상시키나요?

RIG는 검색과 생성 단계를 엮어 Wikipedia나 사용자의 맞춤 데이터 등 신뢰할 수 있는 소스를 활용, 각 답변 섹션이 근거 있는 정보에 기반해 정확성이 검증될 수 있도록 합니다.

FlowHunt에서 RIG 챗봇을 어떻게 만들 수 있나요?

FlowHunt에서는 프롬프트 템플릿, 생성기, AI 에이전트를 내부 및 외부 지식 소스와 연결해 자동 사실 확인과 출처 인용이 가능한 RIG 챗봇을 설계할 수 있습니다.

RAG와 RIG의 차이점은 무엇인가요?

RAG(Retrieval Augmented Generation)는 정보를 검색한 후 답변을 생성하지만, RIG는 각 섹션마다 검색과 생성을 교차 진행해 더 높은 정확도와 신뢰할 수 있는 출처 기반 응답을 제공합니다.

야샤는 파이썬, 자바, 머신러닝을 전문으로 하는 재능 있는 소프트웨어 개발자입니다. 야샤는 AI, 프롬프트 엔지니어링, 챗봇 개발에 관한 기술 기사를 작성합니다.

야샤 보루만드
야샤 보루만드
CTO, 플로우헌트

나만의 AI를 만들 준비가 되셨나요?

FlowHunt의 직관적이고 노코드 플랫폼으로 스마트 챗봇과 AI 도구를 직접 구축해보세요. 블록을 연결해 쉽고 빠르게 아이디어를 자동화할 수 있습니다.

더 알아보기

RIG 위키피디아 어시스턴트 챗봇 (Retrieval Interleaved Generator)
RIG 위키피디아 어시스턴트 챗봇 (Retrieval Interleaved Generator)

RIG 위키피디아 어시스턴트 챗봇 (Retrieval Interleaved Generator)

RIG 위키피디아 어시스턴트를 만나보세요. 이 도구는 위키피디아에서 정확한 정보를 신속하게 검색하도록 설계되었습니다. 연구 및 콘텐츠 제작에 이상적이며, 신뢰할 수 있는 출처와 투명한 답변을 빠르게 제공합니다. 정확한 데이터와 투명성으로 지식을 향상하세요....

1 분 읽기
AI Wikipedia +5
검색 기반 생성(RAG, Retrieval Augmented Generation)
검색 기반 생성(RAG, Retrieval Augmented Generation)

검색 기반 생성(RAG, Retrieval Augmented Generation)

검색 기반 생성(RAG, Retrieval Augmented Generation)은 전통적인 정보 검색 시스템과 생성형 대규모 언어 모델(LLM)을 결합한 고급 AI 프레임워크로, 외부 지식을 통합하여 더 정확하고 최신이며 맥락에 맞는 텍스트를 생성할 수 있도록 합니다....

3 분 읽기
RAG AI +4
검색 기반 생성(RAG) vs. 캐시 기반 생성(CAG)
검색 기반 생성(RAG) vs. 캐시 기반 생성(CAG)

검색 기반 생성(RAG) vs. 캐시 기반 생성(CAG)

AI에서 검색 기반 생성(RAG)과 캐시 기반 생성(CAG)의 주요 차이점을 알아보세요. RAG는 실시간 정보를 동적으로 검색해 유연하고 정확한 답변을 제공하며, CAG는 미리 캐시된 데이터를 사용해 빠르고 일관성 있는 결과를 제공합니다. 어떤 방식이 프로젝트에 적합한지, 실질적 사용 ...

4 분 읽기
RAG CAG +5