图片问答聊天机器人

一个聊天机器人，允许用户上传图片并就其内容提问。它通过OCR和视觉识别分析图片，并通过交互式聊天界面提供相关解答。

流程

AI流程的工作原理

使用输入提示词和选定的LLM模型生成文本。

以下是此流程中用于实现其功能的所有组件的完整列表。组件是每个AI流程的构建块。它们允许您通过连接各种功能来创建复杂的交互并自动化任务。每个组件都有特定的用途，例如处理用户输入、处理数据或与外部服务集成。

FlowHunt 中的聊天输入组件通过在 Playground 捕获消息来启动用户交互。它作为流程的起点，使工作流能够处理文本和基于文件的输入。

聊天开启触发器组件能够检测聊天会话的开始，一旦用户打开聊天窗口，即刻触发工作流响应。它以用户的首条消息启动流程，是构建高响应、互动型聊天机器人的关键组件。

消息小部件组件可在您的工作流中显示自定义消息。非常适合欢迎用户、提供操作说明或显示任何重要信息，支持 Markdown 格式，并可设置为每个会话仅显示一次。

探索 FlowHunt 的生成器组件——利用您选择的 LLM 模型进行强大的 AI 驱动文本生成。通过结合提示词、可选的系统指令，甚至图片作为输入，轻松创建动态聊天机器人回复，使其成为构建智能对话流程的核心工具。

了解 FlowHunt 中的 Chat Output（聊天输出）组件——通过灵活的多部分输出完善聊天机器人回复。是实现流程顺畅结束和打造高级互动式 AI 聊天机器人的关键工具。

流程描述

此工作流实现了一个聊天机器人，使用户能够上传图片并就其内容提问。通过结合光学字符识别（OCR）和视觉识别技术，聊天机器人对图片进行分析，提供准确且符合上下文的答案。对于需要从图片中提取信息或以对话方式与视觉数据交互的任务，此自动化具有极高的价值和可扩展性。

聊天初始化
- 当聊天会话被打开时，工作流使用 消息组件 触发一条欢迎消息。
- 该消息向用户介绍机器人的功能，说明他们可以上传图片并就内容提问。
用户输入处理
- 用户可通过以下方式与机器人互动：
  - 输入有关图片的问题。
  - 上传图片文件。
- 聊天输入 节点同时捕获问题（文本消息）和上传的图片（文件输入）。
图片与问题处理
- 生成器 节点接收：
  - 上传的图片（用于OCR/视觉识别）。
  - 用户的问题（作为大语言模型的上下文）。
- 生成器分析图片，提取信息（如通过OCR识别文本或视觉特征），并针对问题生成相关答案。
响应输出
- 模型生成的答案被传递到 聊天输出 节点，在聊天界面展示给用户。
- 如果用户上传了图片，图片也可以在聊天中展示以供参考。

以下是工作流的简化结构：