Descripción del flujo
Propósito y beneficios
Descripción general del flujo
Este flujo automatiza la creación de presentaciones profesionales a partir de archivos subidos por el usuario, aprovechando la IA para extraer, resumir y estructurar el contenido en Google Slides. El proceso es interactivo, permitiendo que la entrada del usuario y el historial del chat informen las respuestas y decisiones del agente de IA.
El objetivo principal del flujo es escalar y automatizar la tarea de convertir cualquier documento en una presentación bien estructurada de Google Slides con un esfuerzo manual mínimo.
Proceso paso a paso
1. Interacción del usuario y carga de archivos
- Nodo de Entrada de Chat: El flujo comienza con una interfaz donde los usuarios pueden:
- Escribir mensajes en el chat, como instrucciones o aclaraciones.
- Subir archivos (por ejemplo, documentos, PDFs) que se utilizarán como fuente para la presentación.
- Nodo Recuperador de Archivos: Los archivos subidos se procesan para extraer su contenido. El flujo puede manejar varios tipos de archivos y, si es necesario, aplicar OCR para documentos escaneados o basados en imágenes.
- Estrategia: El contenido extraído se gestiona según una estrategia, como incluir secciones de igual tamaño de cada documento, y se limita por un máximo de tokens para asegurar un procesamiento eficiente.
3. Construcción del prompt
- Nodo de Plantilla de Prompt: El flujo utiliza una plantilla de prompt flexible:
El contenido extraído del archivo se inyecta como contexto ({context}
).
La entrada del usuario se incluye como consulta o instrucción actual ({input}
).
La plantilla fusiona estos componentes para generar un prompt para la IA, como:
---CONTENIDO DEL DOCUMENTO---
{context}
---
---ENTRADA DEL USUARIO---
{input}
---
4. Uso del historial de chat
- Nodo de Historial de Chat: Para mantener la continuidad de la conversación y el contexto, el agente de IA puede acceder a los últimos mensajes del chat (por defecto: 5), hasta un cierto límite de tokens. Esto ayuda al agente a generar respuestas más relevantes y coherentes.
5. Configuración del modelo de lenguaje IA
- Nodo OpenAI LLM: El sistema está potenciado por un modelo de lenguaje OpenAI configurable (por defecto: GPT-4.1), con ajustes de:
- Selección de modelo (disponibles varias versiones de GPT).
- Límite de tokens (por defecto: 3000 tokens por respuesta).
- Temperatura (controla la creatividad, por defecto: 0.7).
- Caché para eficiencia.
6. Herramientas para la automatización de Google Slides
- Herramienta de creación de presentaciones: El agente está equipado para crear nuevas presentaciones en Google Slides, incluyendo el título de la presentación, el título de la primera diapositiva y el subtítulo.
- Herramienta de creación de diapositiva: El agente también puede añadir nuevas diapositivas a presentaciones existentes, especificando el contenido de la diapositiva, el título, las notas del orador y, opcionalmente, imágenes destacadas.
7. Rol y objetivo del agente de IA
- Nodo de Agente de IA: El orquestador central es un agente de IA con la siguiente configuración:
- Rol: Especialista en presentaciones.
- Historia: 20 años de experiencia en presentaciones profesionales.
- Objetivo: “Tu tarea es crear una presentación profesional a partir del contenido del archivo que el usuario subió. Debes revisar todo el archivo y asegurarte de que toda la información clave esté mencionada de manera adecuada en la presentación.”
- El agente recibe el prompt, el historial del chat, el contenido del archivo y la entrada del usuario, y determina cómo estructurar la presentación.
- El agente utiliza las herramientas de Google Slides para crear y completar la presentación.
8. Presentación de resultados y salida
- Nodo de Salida de Chat: Las respuestas del agente de IA —incluyendo confirmaciones, progreso o enlaces a la presentación— se muestran al usuario en la interfaz de chat.
Cómo funcionan juntos los componentes
Aquí tienes una tabla que resume los nodos clave y sus propósitos:
Nombre del nodo | Propósito |
---|
Entrada de Chat | Recibe mensajes del usuario y archivos subidos |
Recuperador de Archivos | Extrae texto/contenido de los archivos subidos |
Plantilla de Prompt | Fusiona el contenido del archivo y la entrada del usuario en un prompt |
Historial de Chat | Suministra al agente el contexto reciente del chat |
OpenAI LLM | Proporciona generación de texto IA y llamadas de función |
Crear Presentación | Automatiza la creación de nuevas presentaciones en Google Slides |
Crear Diapositiva | Automatiza el añadido de diapositivas en Google Slides |
Agente de IA | Orquesta el proceso, usando todas las herramientas y entradas |
Salida de Chat | Muestra las respuestas y resultados del agente al usuario |
Por qué este flujo es útil para escalar y automatizar
- Automatiza una tarea intensiva: Transformar documentos densos en presentaciones suele ser manual y llevar mucho tiempo. Este flujo automatiza el proceso, ahorrando horas de trabajo.
- Garantiza consistencia y calidad: Utilizando un agente de IA especializado con un objetivo y una historia claros, las presentaciones generadas mantienen un estándar profesional.
- Interactivo y adaptable: Los usuarios pueden interactuar con el agente, dar aclaraciones o hacer solicitudes, y la IA se adapta según el historial del chat.
- Integración con Google Slides: La integración directa elimina la necesidad de copiar/pegar o diseñar diapositivas manualmente.
- Escalable para equipos o múltiples documentos: El mismo sistema puede usarse para procesamiento por lotes, flujos de trabajo en equipo o integración en sistemas más grandes.
Ejemplos de casos de uso
- Informes corporativos: Convierte informes anuales o notas de reuniones en diapositivas listas para presentar.
- Contenido educativo: Transforma trabajos de investigación o libros de texto en diapositivas para clases.
- Ventas y marketing: Elabora rápidamente presentaciones de producto a partir de especificaciones o whitepapers.
Conclusión
Este flujo agiliza y automatiza el proceso de generación de presentaciones profesionales a partir de cualquier documento, combinando la comprensión de contenido impulsada por IA, el contexto conversacional y la integración directa con Google Slides. Es ideal para usuarios y equipos que buscan escalar la creación de contenido, asegurar calidad y reducir el trabajo manual.