Opis przepływu
Cel i korzyści
Przegląd workflow
Ten workflow automatyzuje tworzenie profesjonalnych prezentacji z plików przesłanych przez użytkownika, wykorzystując AI do wyodrębniania, podsumowywania i strukturyzowania treści w Google Slides. Proces jest interaktywny – umożliwia uwzględnienie danych od użytkownika oraz historii czatu przy generowaniu odpowiedzi i decyzji agenta AI.
Głównym celem workflow jest skalowanie i automatyzacja przekształcania dowolnego dokumentu w dobrze uporządkowaną prezentację Google Slides przy minimalnym nakładzie pracy ręcznej.
Proces krok po kroku
1. Interakcja z użytkownikiem i przesyłanie pliku
- Węzeł wejścia czatu: Workflow rozpoczyna się od interfejsu, w którym użytkownik może:
- Wprowadzić wiadomości na czacie, np. instrukcje lub doprecyzowania.
- Przesłać pliki (np. dokumenty, PDF-y), które będą źródłem do prezentacji.
2. Wyodrębnianie treści pliku
- Węzeł pobierania pliku: Przesłane pliki są przetwarzane w celu wyodrębnienia ich treści. Workflow obsługuje różne typy plików, a w razie potrzeby stosuje OCR do dokumentów skanowanych lub obrazów.
- Strategia: Wyodrębniona treść jest zarządzana zgodnie z określoną strategią, np. włączając równe fragmenty z każdego dokumentu, a całość ograniczana jest maksymalną liczbą tokenów dla sprawnego przetwarzania.
3. Konstrukcja promptu
- Węzeł szablonu promptu: Workflow wykorzystuje elastyczny szablon promptu:
Wyodrębniona treść pliku jest wstrzykiwana jako kontekst ({context}
).
Dane od użytkownika są zawarte jako bieżące zapytanie lub instrukcja ({input}
).
Szablon łączy te komponenty, generując prompt dla AI, np.:
---TREŚĆ DOKUMENTU---
{context}
---
---WEJŚCIE UŻYTKOWNIKA---
{input}
---
4. Wykorzystanie historii czatu
- Węzeł historii czatu: Aby zachować ciągłość i kontekst rozmowy, agent AI może uzyskać dostęp do kilku ostatnich (domyślnie: 5) wiadomości na czacie, do określonego limitu tokenów. Pomaga to generować trafniejsze i spójniejsze odpowiedzi.
5. Konfiguracja modelu językowego AI
- Węzeł OpenAI LLM: System oparty jest o konfigurowalny model językowy OpenAI (domyślnie: GPT-4.1), z ustawieniami dotyczącymi:
- Wybór modelu (dostępne różne wersje GPT).
- Limity tokenów (domyślnie: 3000 tokenów na odpowiedź).
- Temperatura (kontrola kreatywności, domyślnie: 0.7).
- Cache dla zwiększenia wydajności.
6. Narzędzia do automatyzacji Google Slides
- Narzędzie tworzenia prezentacji: Agent potrafi tworzyć nowe prezentacje w Google Slides, ustawiać tytuł prezentacji, tytuł oraz podtytuł pierwszego slajdu.
- Narzędzie tworzenia slajdu: Agent może także dodawać nowe slajdy do istniejących prezentacji, określając treść slajdu, tytuł, notatki prelegenta oraz opcjonalnie obraz wyróżniający.
7. Rola i cel agenta AI
- Węzeł agenta AI: Centralnym “dyrygentem” jest agent AI z następującą konfiguracją:
- Rola: Specjalista ds. prezentacji.
- Tło: 20 lat doświadczenia w tworzeniu profesjonalnych prezentacji.
- Cel: “Twoim zadaniem jest stworzenie profesjonalnej prezentacji na podstawie treści pliku przesłanego przez użytkownika. Musisz przejrzeć cały plik i upewnić się, że wszystkie kluczowe informacje zostały uwzględnione w odpowiedni sposób w prezentacji.”
- Agent otrzymuje prompt, historię czatu, treść pliku i dane od użytkownika, po czym decyduje o strukturze prezentacji.
- Agent wykorzystuje narzędzia Google Slides do tworzenia i uzupełniania prezentacji.
8. Wynikowa prezentacja i rezultaty
- Węzeł wyjścia czatu: Odpowiedzi agenta AI – w tym potwierdzenia, postęp czy linki do prezentacji – są wyświetlane użytkownikowi w interfejsie czatu.
Współpraca komponentów
Oto tabela podsumowująca kluczowe węzły i ich zastosowanie:
Nazwa węzła | Cel |
---|
Wejście czatu | Odbiera wiadomości użytkownika i przesyłane pliki |
Pobieranie pliku | Wyodrębnia tekst/treść z przesłanych plików |
Szablon promptu | Łączy treść pliku i dane od użytkownika w prompt |
Historia czatu | Dostarcza agentowi ostatni kontekst rozmowy |
OpenAI LLM | Generuje tekst AI i obsługuje funkcje |
Tworzenie prezentacji | Automatyzuje tworzenie nowych prezentacji Google Slides |
Tworzenie slajdu | Automatyzuje dodawanie slajdów do Google Slides |
Agent AI | Orkiestruje proces, korzystając z wszystkich narzędzi |
Wyjście czatu | Wyświetla odpowiedzi agenta i wyniki użytkownikowi |
Dlaczego ten workflow jest użyteczny dla skalowania i automatyzacji
- Automatyzuje czasochłonne zadanie: Przekształcanie obszernych dokumentów w prezentacje jest zwykle żmudne i czasochłonne. Ten workflow automatyzuje proces, oszczędzając godziny pracy.
- Gwarantuje spójność i jakość: Dzięki wyspecjalizowanemu agentowi AI z jasno określonym celem i tłem, generowane prezentacje zachowują wysoki, profesjonalny poziom.
- Interaktywny i adaptacyjny: Użytkownicy mogą komunikować się z agentem, doprecyzować oczekiwania, a AI dostosowuje się w oparciu o historię czatu.
- Integracja z Google Slides: Bezpośrednia integracja eliminuje konieczność ręcznego kopiowania i projektowania slajdów od podstaw.
- Skalowalność dla zespołów lub wielu dokumentów: To samo rozwiązanie można stosować do przetwarzania wsadowego, pracy zespołowej czy integracji z większymi systemami.
Przykładowe zastosowania
- Raporty korporacyjne: Zamieniaj raporty roczne lub notatki ze spotkań w gotowe do prezentacji slajdy.
- Materiały edukacyjne: Przekształcaj prace naukowe lub podręczniki w slajdy do wykładów.
- Sprzedaż i marketing: Szybko przygotuj prezentacje produktowe na podstawie specyfikacji lub whitepaperów.
Podsumowanie
Ten workflow usprawnia i automatyzuje proces generowania profesjonalnych prezentacji z dowolnego dokumentu, łącząc zrozumienie treści przez AI, kontekst rozmowy oraz płynną integrację z Google Slides. To idealne rozwiązanie dla użytkowników i zespołów, które chcą skalować tworzenie treści, zapewnić wysoką jakość i ograniczyć pracę manualną.