Hvor lang tid tager en AI chatbot sikkerhedsaudit?

En grundlæggende vurdering tager 2 mandedage med aktiv testning plus 1 dag til rapportering — cirka 1 uge kalendertid. En standard chatbot med RAG-pipeline og værktøjsintegrationer kræver typisk 3–4 mandedage. Komplekse agentiske implementeringer kræver 5+ dage. Kalendertid fra opstart til endelig rapport er normalt 1–2 uger.

Hvilken adgang skal jeg give til en AI-sikkerhedsaudit?

Typisk: adgang til produktions- eller staging-chatbotten (ofte en dedikeret testkonto), systemprompten og konfigurationsdokumentation, arkitekturdokumentation (dataflow, integrationer, API'er), videnbase-indholdsoversigt, og eventuelt: adgang til staging-miljø til mere invasiv testning. Kildekodeadgang er ikke påkrævet for de fleste AI-specifikke tests.

Hvad skal jeg rette før en AI-sikkerhedsaudit?

Modstå trangen til at rette alt før auditen — auditens formål er at finde det, du ikke har rettet. Sørg dog for grundlæggende hygiejne: autentifikation er funktionel, åbenlyse testlegitimationsoplysninger er fjernet, og miljøet matcher produktionen så tæt som muligt. At fortælle revisoren, hvad du allerede ved er sårbart, er nyttig kontekst, ikke noget at skjule.

AI Chatbot Sikkerhedsaudit: Hvad Du Kan Forvente og Hvordan Du Forbereder Dig

En omfattende guide til AI chatbot sikkerhedsaudits: hvad der bliver testet, hvordan du forbereder dig, hvilke leverancer du kan forvente, og hvordan du fortolker resultaterne. Skrevet til tekniske teams, der bestiller deres første AI-sikkerhedsvurdering.

AI Security Security Audit Chatbot Security LLM

Book en Audit Book en Demo

Hvorfor AI Chatbot Sikkerhedsaudits Er Anderledes

Organisationer med modne sikkerhedsprogrammer forstår webapplikations-penetrationstest — de har kørt sårbarheds-scans, bestilt pen-tests og reageret på fund. AI chatbot sikkerhedsaudits er ens i struktur, men dækker fundamentalt forskellige angrebsflader.

En webapplikations pen-test tjekker for OWASP Top 10 websårbarheder: injektionsfejl, brudt autentifikation, XSS, usikre direkte objektreferencer. Disse forbliver relevante for infrastrukturen omkring AI chatbots. Men selve chatbotten — LLM-grænsefladen — er en ny angrebsflade med sin egen sårbarhedsklasse.

Hvis du bestiller din første AI chatbot sikkerhedsaudit, guider denne vejledning dig gennem, hvad du kan forvente i hver fase, hvordan du forbereder dig, og hvordan du bruger resultaterne effektivt.

Fase 1: Før-Engagement og Afgrænsning

Afgrænsningsopkaldet

En god AI-sikkerhedsaudit begynder med et afgrænsningsopkald, før nogen testning begynder. Under dette opkald bør auditteamet spørge:

Om chatbot-arkitekturen:

Hvilken LLM-udbyder og model bruger I?
Hvad indeholder systemprompten? (Overordnet beskrivelse, ikke den fulde tekst)
Hvilke datakilder har chatbotten adgang til?
Hvilke værktøjer eller API-integrationer bruger chatbotten?
Hvilke handlinger kan chatbotten udføre autonomt?

Om implementeringen:

Hvor er dette implementeret? (Web-widget, API, mobilapp, internt værktøj)
Hvem er de forventede brugere? (Anonyme offentlige, autentificerede kunder, internt personale)
Hvad er de mest følsomme data, chatbotten kan få adgang til?

Om testmiljøet:

Er der et staging-miljø tilgængeligt?
Hvilke testkonti eller adgang vil blive givet?
Er der systemer, der skal udelukkes fra testning?

Om risikotolerance:

Hvad ville udgøre et kritisk fund for jeres organisation?
Er der regulerings- eller compliance-rammer, der gælder?

Fra denne diskussion definerer en arbejdserklæring den præcise afgrænsning, tidslinje og leverancer.

Forberedelse af Dokumentation

For at understøtte auditen bør du forberede:

Arkitekturdiagram: Hvordan chatbotten forbinder til datakilder, API’er og LLM-udbyderen
Systemprompten-dokumentation: Ideelt set den fulde systemprompt, eller minimum en beskrivelse af dens omfang og tilgang
Integrationsoversigt: Hver ekstern tjeneste, chatbotten kan kalde, med autentifikationsdetaljer
Dataadgangsoversigt: Hvilke databaser, videnbaser eller dokumenter chatbotten kan hente
Tidligere sikkerhedsfund: Hvis du har kørt tidligere vurderinger, del resultaterne (inklusiv punkter, der endnu ikke er afhjulpet)

Jo mere kontekst auditteamet har, desto mere effektiv vil testningen være. Dette er ikke en test, du vil sløre — målet er at finde reelle sårbarheder, ikke at “bestå” en vurdering.

Fase 2: Rekognoscering og Angrebsflademapping

Før aktiv testning begynder, kortlægger revisorerne angrebsfladen. Denne fase tager typisk en halv dag for en standard implementering.

Hvad Bliver Kortlagt

Inputvektorer: Hver måde data kommer ind i chatbotten på. Dette inkluderer:

Direkte brugermeddelelser
Filopload (hvis understøttet)
URL- eller referenceinput
API-parametre
Batch-behandlingsendepunkter
Administrative grænseflader

Dataadgangsomfang: Hver datakilde, chatbotten kan læse:

RAG videnbase-indhold og indtagelsesvejen
Databasetabeller eller API-endepunkter
Brugersessionsdata og samtalehistorik
Systemprompten-indhold
Tredjeparts-tjenesteresponderer

Outputveje: Hvor chatbottens svar går hen:

Direkte brugervendt chat-respons
API-svar
Downstream-systemtriggere
Notifikations- eller e-mailgenerering

Værktøjs- og integrationsoversigt: Hver handling chatbotten kan udføre:

API-kald og deres parametre
Database-skrive-operationer
E-mail- eller beskedhandlinger
Filoprettelse eller -ændring
Eksterne tjenestekald

Hvad Kortet Afslører

Et komplet angrebsfladekortet afslører ofte overraskelser selv for organisationer, der kender deres system godt. Almindelige fund på dette stadie:

Integrationer, der blev tilføjet under udviklingen og glemt
Dataadgang, der er bredere end tilsigtet (“vi gav den adgang til produkttabellen, men den kan også forespørge kundetabellen”)
Systemprompten-indhold, der inkluderer følsomme oplysninger, som ikke burde være der
Indirekte injektionsflader, der ikke blev overvejet under designet

Fase 3: Aktiv Angrebstestning

Aktiv testning er, hvor revisorer simulerer virkelige angreb. For en omfattende audit dækker dette alle OWASP LLM Top 10 kategorier. Her er, hvordan testning ser ud for de vigtigste kategorier:

Prompt Injection Testning

Hvad der testes:

Direkte override-kommandoer (snesevis af variationer, ikke kun “ignorer tidligere instruktioner”)
Rollespil og persona-angreb (DAN-varianter, karakterinkarnation)
Multi-turn eskaleringsekvenser designet til den specifikke chatbot-kontekst
Autoritets-spoofing og kontekstmanipulation
Token smuggling og kodningsbaserede bypass-forsøg

Hvordan et fund ser ud: “Ved hjælp af en multi-turn manipulationssekvens var testeren i stand til at få chatbotten til at give information uden for dens definerede omfang. Testeren etablerede først, at modellen ville engagere sig i hypotetiske scenarier, og eskalerede derefter gradvist for at opnå [specifik begrænset information]. Dette repræsenterer et fund med medium alvorlighed (OWASP LLM01).”

RAG og Indirekte Injection Testning

Hvad der testes:

Kan ondsindet indhold i videnbasen påvirke chatbot-adfærd?
Behandler chatbotten hentet indhold som instruktioner?
Er videnbase-indtagelsesvejene sikret mod uautoriserede tilføjelser?
Bliver dokumenter uploadet af brugere behandlet i en kontekst, hvor injektion er mulig?

Hvordan et fund ser ud: “Et dokument indeholdende indlejrede instruktioner blev behandlet af RAG-pipelinen. Når brugere forespurgte emner dækket af dokumentet, fulgte chatbotten de indlejrede instruktioner til [specifik adfærd]. Dette er et fund med høj alvorlighed (OWASP LLM01), fordi det kan påvirke alle brugere, der forespørger relaterede emner.”

Systemprompten Ekstraktions-testning

Hvad der testes:

Direkte ekstraktionsanmodninger (ordret gentagelse, resumé, fuldførelse)
Indirekte fremkaldelse (begrænsningssondering, reference-ekstraktion)
Injektionsbaseret ekstraktion
Systematisk begrænsningskortlægning gennem mange forespørgsler

Hvordan et fund ser ud: “Testeren var i stand til at udtrække den komplette systemprompt ved hjælp af en to-trins indirekte fremkaldelse: først etablere, at modellen ville bekræfte/benægte information om sine instruktioner, derefter systematisk bekræfte specifikt sprog. Udtrukket information inkluderer: [beskrivelse af hvad der blev eksponeret].”

Data Exfiltrations-testning

Hvad der testes:

Direkte anmodninger om data, chatbotten har adgang til
Cross-user dataadgang (hvis multi-tenant)
Ekstraktion via indirekte injektion
Agentisk exfiltration via værktøjskald

Hvordan et fund ser ud: “Testeren var i stand til at anmode om og modtage [datatype], der ikke burde have været tilgængelig for testbruger-kontoen. Dette repræsenterer et kritisk fund (OWASP LLM06) med direkte regulatoriske implikationer under GDPR.”

API og Infrastruktur-testning

Hvad der testes:

Autentifikationsmekanismesikkerhed
Autorisationsgrænser
Rate limiting og forebyggelse af misbrug
Værktøjsbrugsautorisation

Fase 4: Rapportering

Hvad en God Rapport Indeholder

Executive Summary: En til to sider, skrevet til ikke-tekniske interessenter. Besvarer: hvad blev testet, hvad var de vigtigste fund, hvad er den overordnede risikoprofil, og hvad skal prioriteres? Ingen teknisk jargon.

Angrebsfladekortet: Et visuelt diagram over chatbottens arkitektur med annoterede sårbarhedsplaceringer. Dette bliver en arbejdsreference til afhjælpning.

Fundregister: Hver identificeret sårbarhed med:

Titel og fund-ID
Alvorlighed: Kritisk / Høj / Medium / Lav / Informativ
CVSS-ækvivalent score
OWASP LLM Top 10 kategoriafbildning
Detaljeret teknisk beskrivelse
Proof-of-concept (reproducerbart angreb, der demonstrerer sårbarheden)
Beskrivelse af forretningspåvirkning
Afhjælpningsanbefaling med indsatsvurdering

Afhjælpningsprioritetsmatrix: Hvilke fund skal adresseres først under hensyntagen til alvorlighed og implementeringsindsats.

Forståelse af Alvorlighedsvurderinger

Kritisk: Direkte, høj-impact udnyttelse med minimal angriber-færdighed påkrævet. Typisk: ubegrænset dataadgang, legitimationsoplysnings-exfiltration eller handlinger med betydelige konsekvenser i den virkelige verden. Afhjælp øjeblikkeligt.

Høj: Betydelig sårbarhed, der kræver moderat angriber-færdighed. Typisk: begrænset informationsafsløring, delvis dataadgang eller sikkerhedsbypass, der kræver multi-trins angreb. Afhjælp før næste produktionsimplementering.

Medium: Meningsfuld sårbarhed, men med begrænset impact eller kræver betydelig angriber-færdighed. Typisk: delvis systemprompt-ekstraktion, begrænset dataadgang eller adfærdsafvigelse uden betydelig impact. Afhjælp i næste sprint.

Lav: Mindre sårbarhed med begrænset udnyttelsesmulighed eller impact. Typisk: informationsafsløring, der afslører begrænsede oplysninger, mindre adfærdsafvigelse. Adresser i backlog.

Informativ: Best practice-anbefalinger eller observationer, der ikke er udnyttelige sårbarheder, men repræsenterer muligheder for sikkerhedsforbedring.

Fase 5: Afhjælpning og Gentest

Prioritering af Afhjælpning

De fleste første-gangs AI-sikkerhedsaudits afslører flere problemer, end der kan rettes samtidigt. Prioritering bør overveje:

Alvorlighed: Kritiske og høje fund først
Udnyttelsesmulighed: Problemer, der er lette at udnytte, får prioritet selv ved lavere alvorlighed
Impact: Problemer, der berører bruger-PII eller legitimationsoplysninger, får prioritet
Lethed ved fix: Hurtige gevinster, der reducerer risiko, mens langsigtede løsninger udvikles

Almindelige Afhjælpningsmønstre

Systemprompt-hærdning: Tilføjelse af eksplicitte anti-injektions- og anti-afsløringsinstruktioner. Relativt hurtigt at implementere; betydelig impact på prompt injection og ekstraktionsrisiko.

Privilegiereduktion: Fjernelse af dataadgang eller værktøjskapabiliteter, der ikke er strengt nødvendige. Afslører ofte over-provisionering, der akkumulerede under udviklingen.

RAG-pipeline indholdsvalidering: Tilføjelse af indholdsscanning til videnbase-indtagelse. Kræver udviklingsindsats, men blokerer hele injektionsvejen.

Implementering af outputovervågning: Tilføjelse af automatiseret indholdsmoderering til output. Kan implementeres hurtigt med tredjeparts-API’er.

Gentest-validering

Efter afhjælpning bekræfter en gentest, at rettelser er effektive og ikke har introduceret nye problemer. En god gentest:

Genudføre den specifikke proof-of-concept for hvert afhjulpet fund
Bekræfter, at fundet er ægte løst, ikke bare overfladisk lappet
Tjekker for eventuelle regressioner introduceret af afhjælpningsændringer
Udsteder en formel gentest-rapport, der bekræfter, hvilke fund der er lukket

Konklusion: Gør Sikkerhedsaudits til Rutine

For organisationer, der implementerer AI chatbots i produktion, bør sikkerhedsaudits blive rutine — ikke exceptionelle begivenheder udløst af hændelser. Den AI chatbot sikkerhedsaudit proces beskrevet her er et håndterbart, struktureret engagement med klare input, definerede output og handlingsbare resultater.

Alternativet — at opdage sårbarheder gennem udnyttelse af rigtige angribere — er betydeligt dyrere i alle dimensioner: økonomisk, operationelt og omdømmemæssigt.

Klar til at bestille din første AI chatbot sikkerhedsaudit? Kontakt vores team for et gratis afgrænsningsopkald.

Ofte stillede spørgsmål

Hvor lang tid tager en AI chatbot sikkerhedsaudit?: En grundlæggende vurdering tager 2 mandedage med aktiv testning plus 1 dag til rapportering — cirka 1 uge kalendertid. En standard chatbot med RAG-pipeline og værktøjsintegrationer kræver typisk 3–4 mandedage. Komplekse agentiske implementeringer kræver 5+ dage. Kalendertid fra opstart til endelig rapport er normalt 1–2 uger.
Hvilken adgang skal jeg give til en AI-sikkerhedsaudit?: Typisk: adgang til produktions- eller staging-chatbotten (ofte en dedikeret testkonto), systemprompten og konfigurationsdokumentation, arkitekturdokumentation (dataflow, integrationer, API'er), videnbase-indholdsoversigt, og eventuelt: adgang til staging-miljø til mere invasiv testning. Kildekodeadgang er ikke påkrævet for de fleste AI-specifikke tests.
Hvad skal jeg rette før en AI-sikkerhedsaudit?: Modstå trangen til at rette alt før auditen — auditens formål er at finde det, du ikke har rettet. Sørg dog for grundlæggende hygiejne: autentifikation er funktionel, åbenlyse testlegitimationsoplysninger er fjernet, og miljøet matcher produktionen så tæt som muligt. At fortælle revisoren, hvad du allerede ved er sårbart, er nyttig kontekst, ikke noget at skjule.

Book Din AI Chatbot Sikkerhedsaudit

Få en professionel AI chatbot sikkerhedsaudit, der dækker alle OWASP LLM Top 10 kategorier. Klare leverancer, fast pris, gentest inkluderet.

Book en Audit Book en Demo

Lær mere