AI Agents: Het denken van Llama 3.2 3B begrijpen
Een uitgebreide analyse van Llama 3.2 3B, die de sterke punten onthult op het gebied van redeneren, contentgeneratie en creatief schrijven, evenals de uitdagingen op het gebied van berekeningen en afhankelijkheid van tools.

Introductie
AI-agents worden onmisbare hulpmiddelen bij het oplossen van complexe problemen en het verbeteren van werkprocessen, waarbij elke iteratie meer kracht en verfijning brengt. Onder deze ontwikkelingen staat Llama 3.2 3B centraal als een groter, capabeler model, ontworpen voor diepgaander redeneren en meer genuanceerde antwoorden. Maar hoe “denkt” het, en wat maakt het zo bijzonder als AI-agent?
In deze blog verkennen we het redeneerproces van Llama 3.2 3B door het bloot te stellen aan realistische scenario’s. Van het verwerken van grote datasets tot het genereren van inzichtelijke oplossingen, evalueren we hoe deze AI-agent met uitdagingen omgaat en beslissingen neemt. Door zijn prestaties te ontleden, willen we inzicht krijgen in de mechanismen achter zijn denkproces en hoe het zich verhoudt tot andere modellen. Ben je geïnteresseerd in AI-agents en de wetenschap achter hun redeneren? Sluit je aan terwijl we dieper ingaan op het denken van Llama 3.2 3B.
Taak 1: Contentgeneratie
Prompt:
Wanneer de gebruiker “Start” zegt, moet je:
- Contentgeneratie: Schrijf een uitgebreid, informatief artikel over de fundamenten van projectmanagement, met specifieke focus op het definiëren van doelstellingen, scope en delegatie.

Eerste taakinzicht en informatieverzameling
- (0:05) Gedachte: Kun je details geven over de huidige taak of het project waar we aan werken, inclusief doelstellingen, deadlines en specifieke vereisten?
- (0:08) Gedachte: Verzamel informatie over de fundamenten van projectmanagement, met specifieke focus op het definiëren van doelstellingen, scope en delegatie.
- (0:16) Gedachte: Om een uitgebreid artikel te schrijven over de fundamenten van projectmanagement, moet ik gedetailleerde informatie verzamelen over het definiëren van projectdoelstellingen, scope en delegatie. Ik begin met de Wikipedia-tool voor een globaal overzicht van projectmanagement, waarin mogelijk deze onderdelen aan bod komen.
Gebruikte tool: wikipedia - (0:18) Gedachte: De Wikipedia-pagina biedt een goed overzicht van projectmanagement, maar mist specifieke details over het definiëren van doelstellingen, scope en delegatie. Ik gebruik google_serper om meer gerichte informatie over deze aspecten te vinden.
Gebruikte tool: google_serper - (0:22) Gedachte: Ik heb enkele inzichten verzameld over het definiëren van projectdoelstellingen. Nu moet ik me verdiepen in de details van scope en delegatie. Ik gebruik opnieuw google_serper om gedetailleerde informatie over deze onderwerpen te vinden.
Gebruikte tool: google_serper - (0:25) Gedachte: Ik heb enkele inzichten verzameld over het definiëren van projectdoelstellingen en scope. Nu moet ik me verdiepen in de details van delegatie in projectmanagement. Ik gebruik opnieuw google_serper om gedetailleerde informatie over dit onderwerp te vinden.
Gebruikte tool: google_serper
Analyse van het denkproces van de agent
- Taakbegrip: De agent interpreteert de prompt correct en ziet in dat er informatie moet worden geleverd over de fundamenten van projectmanagement, specifiek het definiëren van doelstellingen, scope en delegatie.
- Informatieverzameling: De agent besluit te starten met Wikipedia voor een globaal overzicht en gebruikt daarna Google Search (google_serper) voor meer specifieke informatie. De agent noemt expliciet dat op elk van de drie belangrijke aspecten afzonderlijk wordt gefocust, wat duidt op een gestructureerde aanpak.
- Iteratieve aanpak: De agent toont een iteratieve aanpak bij het verzamelen van informatie. Er wordt gestart met een breed overzicht op Wikipedia, waarna de zoekopdracht wordt verfijnd met Google Search op elk belangrijk gebied.
- Aanpasbaarheid: Als de initiële Wikipedia-zoekopdracht niet voldoende specifieke details biedt, past de agent zich aan door over te schakelen naar Google Search, wat flexibiliteit in de onderzoeksstrategie toont.
- Herhaling: Hoewel de gedachten van de agent een gestructureerde aanpak laten zien bij het verzamelen van informatie over elk onderwerp, is er enige herhaling in de getoonde gedachten, wat wijst op een mogelijke lus of inefficiëntie in het proces.
Fragment van de botoutput
Fundamenten van Projectmanagement: Doelstellingen, Scope en Delegatie definiëren
Projectmanagement is een cruciale discipline die het plannen, uitvoeren en beheren van projecten omvat om specifieke doelen te bereiken binnen een vastgesteld tijdsbestek en budget. In de kern streeft projectmanagement ernaar middelen effectief te benutten en een project van start tot voltooiing te begeleiden. Drie fundamentele aspecten van projectmanagement zijn het definiëren van doelstellingen, het bepalen van de scope en het delegeren van taken. Het beheersen van deze elementen is essentieel voor succesvolle projectuitvoering.
Doelstellingen definiëren
Het formuleren van duidelijke en haalbare doelstellingen is de hoeksteen van elk succesvol project. Doelstellingen bieden een routekaart voor het project en sturen het team naar de gewenste resultaten. Ze moeten Specifiek, Meetbaar, Acceptabel, Realistisch en Tijdgebonden (SMART) zijn. Een goed gedefinieerde doelstelling helpt bij het afstemmen van de inspanningen en middelen van het team, het minimaliseren van misverstanden en het stellen van duidelijke verwachtingen voor alle belanghebbenden.
- Benodigde tijd: 18 seconden (van het ontvangen van de prompt op 0:05 tot het verschijnen van de output op 0:23)
- Leesbaarheid: Flesch-Kincaid-niveau: 17, Flesch-Kincaid-score: 16,61
- Samenvattingslengte: 464 woorden
Analyse van de output
- Goed gestructureerd: De agent produceert een goed gestructureerd artikel met duidelijke koppen voor elk onderdeel (Doelstellingen definiëren, Scope bepalen, Delegatie).
- Uitgebreid: Het artikel behandelt de belangrijkste aspecten van de fundamenten van projectmanagement zoals gevraagd in de prompt.
- Gedetailleerde uitleg: Elk onderdeel bevat gedetailleerde uitleg en praktische adviezen, waardoor de inhoud informatief en nuttig is.
- Duidelijk en beknopt: De gebruikte taal is duidelijk en beknopt, waardoor het complexe onderwerp projectmanagement toegankelijker wordt.
- Naleving instructies: De agent volgt de instructies door zich te richten op de gespecificeerde onderwerpen en een compleet overzicht te geven.
Conclusie
De agent toont een sterk vermogen om hoogwaardige content te genereren over de fundamenten van projectmanagement. Het denkproces, hoewel beperkt zichtbaar in de video, suggereert een systematische aanpak van onderzoek en contentcreatie. De agent benut de beschikbare tools effectief en past zijn strategie aan om de benodigde informatie te verzamelen. De uiteindelijke output is goed gestructureerd, informatief en voldoet aan de eisen van de prompt. De agent blijft uitstekend presteren en toont zijn vaardigheid in contentgeneratie en het behandelen van complexe onderwerpen.
Taak 2: Berekening
Prompt:
Beantwoord het probleem:
Een bedrijf verkoopt twee producten: Product A en Product B. Product A kost $30 per stuk om te produceren en wordt verkocht voor $50 per stuk. Product B kost $40 per stuk om te produceren en wordt verkocht voor $70 per stuk.
Het bedrijf verkocht vorige maand 120 stuks van Product A en 80 stuks van Product B. Bereken de totale omzet uit de verkoop van beide producten.
Bereken de totale winst uit de verkoop van beide producten (Omzet – Totale productiekosten).
Het bedrijf wil de totale omzet met 10% verhogen. Hoeveel extra eenheden van elk product moeten ze verkopen om dit doel te bereiken, ervan uitgaande dat de productiekosten per stuk en de verkoopprijs per stuk gelijk blijven?

Eerste taakinzicht
- (0:06) Gedachte: Bereken de totale omzet en totale winst uit de verkoop van Product A en Product B, en bepaal hoeveel extra eenheden van elk product moeten worden verkocht om de totale omzet met 10% te verhogen.
- Subvragen om de taak op te splitsen
- (0:18) Gedachte: Wat is de totale omzet uit de verkoop van Product A en Product B?
Analyse van het denkproces van de agent
- Begrip van de prompt: De agent interpreteert de taak correct en ziet in dat het nodig is de totale omzet, totale winst en het aantal extra benodigde eenheden te berekenen om een omzetstijging van 10% te realiseren.
- Opdelen van de taak: De agent stelt zichzelf eerst de vraag wat als eerste berekend moet worden, en splitst de hoofdvraag op in kleinere stappen om een duidelijke aanpak te bepalen.
Fragment van de botoutput
Totale omzet is $11.600.
Totale winst is $4.800.
Om de totale omzet met 10% te verhogen, moet het bedrijf 29 extra eenheden van Product A en 12 extra eenheden van Product B verkopen.
Benodigde tijd: 24 seconden (van het ontvangen van de prompt op 0:06 tot het verschijnen van het eindantwoord op 0:30)
Leesbaarheid: Niet van toepassing aangezien de output voornamelijk uit numerieke berekeningen bestaat.
Samenvattingslengte: 45 woorden
Analyse van de output
- Correcte berekeningen: De agent berekent de totale omzet en totale winst correct, overeenkomend met eerdere uitkomsten.
- Onjuiste berekening: De agent geeft echter onjuist aan dat voor een omzetstijging van 10% 29 extra eenheden van product A en 12 van product B nodig zijn.
De juiste berekening zou als volgt moeten zijn:
10% stijging op de huidige omzet van $11.600 = $1.160
Als je het doel met slechts één product tegelijk zou willen bereiken:
- Product A: $50 per stuk, $1.160 / 50 = 23,2, afgerond naar boven 24 stuks.
- Product B: $70 per stuk, $1.160 / 70 = 16,57, afgerond naar boven 17 stuks.
De agent had het stijgingsbedrag ook kunnen verdelen over beide producten, dus een stijging van $580 per product, wat betekent:
- Product A: $580 / $50 = 11,6, afgerond naar boven 12 stuks.
- Product B: $580 / $70 = 8,29, afgerond naar boven 9 stuks.
Elke combinatie van een stijging in product A en B is mogelijk, zolang het totaal aan omzetverhoging $1.160 bedraagt.
Beknopte presentatie: De agent presenteert het uiteindelijke antwoord kort en bondig, met een samenvatting van de belangrijkste resultaten.
Conclusie
Hoewel de agent de totale omzet en winst correct berekent, maakt het een fout in het bepalen van het aantal extra benodigde eenheden om de 10% omzetstijging te realiseren. De opgegeven combinatie van 29 extra stuks van Product A en 12 van Product B komt niet overeen met de eerder vastgestelde berekeningen of het doel. Dit wijst op een mogelijke fout in het redeneer- of rekenproces van de agent. Ondanks deze fout toont de agent begrip van de taak en presenteert het de informatie duidelijk en georganiseerd. De nauwkeurigheid van het eindantwoord wordt echter aangetast door de foutieve berekening van de extra benodigde eenheden.
Taak 3: Samenvatting
Prompt:
Vat de belangrijkste bevindingen uit het vorige artikel samen in 100 woorden, met focus op de meest significante secties.

Eerste taakinzicht
- (0:06) Gedachte: Vat de belangrijkste bevindingen uit het vorige artikel samen in 100 woorden, met focus op de meest significante secties.
Analyse van het denkproces van de agent
- Begrip van de prompt: De agent interpreteert de taak correct en begrijpt dat er een samenvatting van de belangrijkste bevindingen van het vorige artikel in maximaal 100 woorden moet worden gegeven, met focus op de belangrijkste punten.
Analyse van de output
- Beknoptheid: De agent weet het artikel binnen de limiet van 100 woorden samen te vatten; de samenvatting telt 89 woorden.
- Inhoud: De samenvatting geeft de hoofdlijnen van het artikel correct weer, inclusief het belang van AI-redeneren, de verschillende typen, de historische ontwikkeling, toepassingen in de gezondheidszorg, recente ontwikkelingen met het o1-model van OpenAI en ethische overwegingen.
- Duidelijkheid: De samenvatting is helder, beknopt en goed gestructureerd, waardoor de kern van het artikel gemakkelijk te begrijpen is.
- Relevantie: De samenvatting richt zich op de belangrijkste aspecten van het artikel, zoals gevraagd.
Fragment van de botoutput
Het artikel bespreekt het belang van AI-redeneren in verschillende sectoren, met name in de gezondheidszorg waar het de efficiëntie en nauwkeurigheid heeft verbeterd. AI-redeneren omvat verschillende typen, waaronder symbolische en connectionistische AI, en kent een rijke historische ontwikkeling. De toepassingen in de gezondheidszorg zijn aanzienlijk geweest, waarbij AI-redeneren diagnose, behandeling en patiëntenzorg heeft verbeterd. Recente vooruitgang, zoals het o1-model van OpenAI, heeft de prestaties en veiligheidsmaatregelen verder verbeterd. Het artikel gaat ook in op ethische overwegingen, uitdagingen zoals gegevensprivacy en de implicaties van AI in sectoren buiten de gezondheidszorg, waarbij het transformerende potentieel van AI-redeneren wordt benadrukt, met oog voor de noodzaak van zorgvuldige omgang met ethische en praktische uitdagingen.
- Benodigde tijd: 8 seconden (van het ontvangen van de prompt op 0:06 tot het verschijnen van de output op 0:14)
- Leesbaarheid: Flesch-Kincaid-niveau: 19, Flesch-Kincaid-score: 19,09
- Samenvattingslengte: 89 woorden
Conclusie
De agent toont een sterk vermogen om complexe informatie accuraat en beknopt samen te vatten. Ondanks de beperkte zichtbaarheid in het interne denkproces is de output van hoge kwaliteit en voldoet deze aan de instructies qua lengte en focus. De prestaties van de agent in deze taak bevestigen opnieuw zijn vaardigheid in contentgeneratie en samenvatten. De agent blijft de richtlijnen voor analyse volgen en levert consequent hoogwaardige resultaten.
Taak 4: Vergelijkingstaak
Prompt:
Wanneer de gebruiker “Start” zegt, moet je:
Vergelijk de milieueffecten van elektrische voertuigen met die van waterstofauto’s. Neem factoren mee zoals energieproductie, levenscyclus van het voertuig en uitstoot.

Eerste taakinzicht en informatieverzameling
- (0:06) Gedachte: Om de milieueffecten van elektrische voertuigen (EV’s) te vergelijken met die van waterstofauto’s, moet ik gedetailleerde informatie verzamelen over energieproductie, levenscyclus van het voertuig en uitstoot voor beide typen voertuigen. Ik begin met zoeken naar uitgebreide studies of rapporten die deze aspecten analyseren.
Gebruikte tool: google_serper - (0:15) Gedachte: De zoekresultaten tonen diverse links naar artikelen die elektrische en waterstofvoertuigen vergelijken. Ik haal nu de inhoud van deze URL’s op om gedetailleerde gegevens te verzamelen over energieproductie, levenscyclus en uitstoot.
Gebruikte tool: url_crawl_tool - Afhandeling van toolfouten
(0:25) Gedachte: De fout bij het ophalen van de URL’s geeft aan dat het invoerformaat onjuist was. Ik moet ervoor zorgen dat de URL’s worden opgegeven als een JSON-array van strings. Laten we het opnieuw proberen met het juiste formaat.
Gebruikte tool: url_crawl_tool
Analyse van het denkproces van de agent
- Begrip van de taak: De agent herkent correct dat de taak bestaat uit het vergelijken van de milieueffecten van EV’s en waterstofauto’s, met focus op energieproductie, levenscyclus en uitstoot.
- Strategisch plannen: De agent besluit informatie te verzamelen door te zoeken naar uitgebreide studies of rapporten, wat duidt op een strategische onderzoeksaanpak.
- Toolselectie: De agent gebruikt aanvankelijk google_serper om te zoeken en besluit vervolgens url_crawl_tool te gebruiken om inhoud van relevante URL’s op te halen.
- Foutafhandeling: De agent krijgt een foutmelding bij het gebruik van url_crawl_tool en herkent correct dat het probleem mogelijk ligt bij het onjuiste invoerformaat (geen JSON-array van strings).
- Aanpasbaarheid: Ondanks de fout is de agent van plan het opnieuw te proberen met het juiste formaat, wat aanpasbaarheid toont.
Echter, de video toont geen verdere gedachten, dus het is onduidelijk hoe de agent verdergaat na het meerdere keren tegenkomen van de fout.
Fragment van de botoutput
De milieueffecten van elektrische voertuigen (EV’s) in vergelijking met waterstofauto’s kunnen worden beoordeeld op verschillende belangrijke dimensies: energieproductie, levenscyclus van het voertuig en uitstoot.
Energieproductie:
- Elektrische voertuigen: De milieueffecten van EV’s hangen grotendeels af van de bron van elektriciteit die wordt gebruikt voor het opladen. Hernieuwbare energiebronnen zoals wind-, zonne- en waterkracht verminderen de ecologische voetafdruk van EV’s aanzienlijk. Als de elektriciteit echter afkomstig is van fossiele brandstoffen, kunnen de emissies aanzienlijk zijn.
- Waterstofauto’s: Waterstof kan op verschillende manieren worden geproduceerd, waaronder stoomreforming van aardgas en elektrolyse. Hoewel elektrolyse met hernieuwbare energie schoner is, is de meest gebruikte methode stoomreforming van aardgas, wat leidt tot uitstoot van broeikasgassen.
Levenscyclus van het voertuig:
- Elektrische voertuigen: EV’s hebben een grotere milieubelasting tijdens de productie, vooral vanwege de winning en verwerking van lithium, kobalt en andere materialen voor batterijen. Over hun levensduur hebben ze echter meestal lagere emissies, zeker als ze op schone energie rijden.
- Waterstofauto’s: De productie van brandstofcellen vereist ook energie-intensieve processen en het gebruik van zeldzame materialen zoals platina. De levenscyclusuitstoot kan hoger of lager zijn dan die van EV’s, afhankelijk van de productiemethode van waterstof.
Uitstoot:
- Elektrische voertuigen: EV’s produceren geen uitlaatgassen. De totale uitstoot hangt af van de elektriciteitsbron. Bij opladen met schone energie zijn de totale emissies aanzienlijk lager dan bij voertuigen met een verbrandingsmotor.
- Waterstofauto’s: Deze voertuigen hebben ook geen uitlaatgassen, ze stoten alleen waterdamp uit. De indirecte emissies van waterstofproductie kunnen echter aanzienlijk zijn, vooral als de waterstof niet duurzaam wordt geproduceerd.
Al met al bieden zowel elektrische voertuigen als waterstofauto’s mogelijkheden om de uitstoot in transport te verminderen, maar hun milieueffecten verschillen afhankelijk van de gebruikte energiebronnen en technologieën gedurende hun levenscyclus. De overstap naar schonere energieproductiemethoden is cruciaal om de milieuwinst van beide technologieën te maximaliseren.
- Benodigde tijd: De agent ontvangt de prompt op 0:06 en de output verschijnt vanaf 0:32. Omdat het denkproces van de agent halverwege wordt onderbroken en het blijft proberen de url_crawl_tool te gebruiken, lijkt het erop dat er iets mis is gegaan en de agent het antwoord niet volledig heeft kunnen afronden.
- Leesbaarheid: Flesch-Kincaid-niveau: 16, Flesch-Kincaid-score: 16,01
- Samenvattingslengte: 302 woorden
Analyse van de output
- Onvolledig antwoord: De laatste gedachte van de agent op 0:25 geeft aan dat het proces werd onderbroken. De output begint sterk, maar is onvolledig. De agent stopt midden in de uitleg over uitstoot van waterstofauto’s, wat duidt op een fout of onderbreking tijdens de contentgeneratie.
Veelgestelde vragen
- Wat maakt Llama 3.2 3B uniek als AI-agent?
Llama 3.2 3B is een geavanceerd AI-model bekend om zijn gestructureerde, iteratieve aanpak van redeneren, probleemoplossing en contentgeneratie. Het blinkt uit in taken met betrekking tot realistische scenario's en levert genuanceerde en goed gestructureerde antwoorden.
- Wat zijn de belangrijkste sterke punten van Llama 3.2 3B?
De belangrijkste sterke punten zijn geavanceerd redeneren, hoogwaardige content- en samenvattingsgeneratie, creatief schrijverschap en aanpassingsvermogen bij het verzamelen van informatie met meerdere tools.
- Wat zijn de belangrijkste zwakke punten of beperkingen van Llama 3.2 3B?
Llama 3.2 3B heeft af en toe onnauwkeurigheden in berekeningen, kan afhankelijk worden van specifieke tools (zoals url_crawl_tool) en kan moeite hebben met foutafhandeling of vastlopen in herhalende lussen, wat leidt tot onvolledige output.
- Welke soorten taken kan Llama 3.2 3B uitvoeren?
Llama 3.2 3B kan content genereren, berekeningen uitvoeren, samenvatten, creatief schrijven en vergelijkingstaken uitvoeren. Het toont vaardigheid in het opdelen van complexe taken en het produceren van uitgebreide uitkomsten.
Klaar om je eigen AI te bouwen?
Slimme chatbots en AI-tools onder één dak. Verbind intuïtieve blokken om je ideeën om te zetten in geautomatiseerde Flows.