"Hva er OpenAI Whisper?"

"OpenAI Whisper er et avansert, automatisk talegjenkjenningssystem (ASR) utviklet av OpenAI, designet for å transkribere talespråk til skriftlig tekst ved hjelp av dyp læring. Det støtter 99 språk og utmerker seg i transkripsjon, oversettelse og språkgjenkjenning."

"Hvordan fungerer Whisper?"

"Whisper bruker en transformer-basert encoder-decoder-arkitektur, prosesserer lyd til log-Mel spektrogrammer, og gir ut tekst via en språkmodell. Det ble trent på 680 000 timer med flerspråklig, multitask-data for høy nøyaktighet og robusthet."

"Hva er hovedfunksjonene til Whisper?"

"Whisper støtter flerspråklig talegjenkjenning, taleoversettelse, automatisk språkgjenkjenning, robusthet mot aksenter og støy, og gir åpen kildekode-tilgang for tilpasning og integrasjon."

"Hva er maskinvarekravene for Whisper?"

"Maskinvarekravene avhenger av modellstørrelsen: mindre modeller som 'tiny' krever ~1GB VRAM, mens den største krever ~10GB. Whisper kjører raskere på GPU-er, men kan fungere på CPU-er med lengre behandlingstid."

"Kan Whisper integreres i Python-prosjekter?"

"Ja, Whisper er implementert som et Python-bibliotek og kan installeres via pip. Det gjør det enkelt å integrere i Python-prosjekter for taletranskripsjon, oversettelse og sanntids taleapplikasjoner."

"Hva er vanlige bruksområder for Whisper?"

"Vanlige brukstilfeller inkluderer automatisert møtetranskripsjon, taleaktiverte chatboter, direkte oversettelse, tilgjengelighetsverktøy (teksting og hjelpemidler), kundesentra-automatisering og taleaktiverte automatiseringssystemer."

"Finnes det alternativer til OpenAI Whisper?"

"Ja, alternativer inkluderer åpen kildekode-motorer som Mozilla DeepSpeech, Kaldi, Wav2vec, og kommersielle API-er som Google Cloud Speech-to-Text, Microsoft Azure AI Speech og AWS Transcribe."

"Er Whisper åpen kildekode?"

"Ja, OpenAI Whisper er åpen kildekode, som gjør at utviklere kan tilpasse, finjustere og integrere det i egne produkter og tjenester uten lisensieringsbegrensninger."

Whisper | FlowHunt

Whisper

OpenAI Whisper er et åpen kildekode ASR-system som nøyaktig konverterer tale til tekst på 99 språk, og støtter transkripsjon, oversettelse og språkgjenkjenning for robust AI-automatisering.

Speech Recognition AI OpenAI Chatbots

Forstå OpenAI Whisper

Er Whisper en modell eller et system?

OpenAI Whisper kan betraktes som både en modell og et system, avhengig av konteksten.

Som en modell består Whisper av nevrale nettverksarkitekturer spesielt utviklet for ASR-oppgaver. Den inkluderer flere modeller i ulike størrelser, fra 39 millioner til 1,55 milliarder parametere. Større modeller gir bedre nøyaktighet, men krever mer datakraft.
Som et system omfatter Whisper ikke bare modellarkitekturen, men også hele infrastrukturen og prosessene rundt. Dette inkluderer treningsdata, forhåndsbehandlingsmetoder og integreringen av ulike oppgaver den kan utføre, som språkgjenkjenning og oversettelse.

Kjernemuligheter i Whisper

Whispers primærfunksjon er å transkribere tale til tekst. Den utmerker seg i:

Flerspråklig talegjenkjenning: Støtter 99 språk, noe som gjør den til et kraftig verktøy for globale applikasjoner.
Taleoversettelse: Kan oversette tale fra hvilket som helst støttet språk til engelsk tekst.
Språkgjenkjenning: Oppdager automatisk hvilket språk som snakkes uten forhåndsdefinering.
Robusthet mot aksenter og bakgrunnsstøy: Trenet på variert data, håndterer Whisper forskjellige aksenter og støyende omgivelser effektivt.

Hvordan fungerer OpenAI Whisper?

Transformer-arkitektur

I kjernen av Whisper ligger Transformer-arkitekturen, spesielt en encoder-decoder-modell. Transformere er nevrale nettverk som utmerker seg i å behandle sekvensielle data og forstå kontekst over lange sekvenser. Introdusert i artikkelen “Attention is All You Need” i 2017, har transformere blitt grunnleggende i mange NLP-oppgaver.

Whispers prosess innebærer:

Lydforbehandling: Inngående lyd deles opp i 30-sekunders segmenter og konverteres til et log-Mel spektrogram, som fanger opp frekvens og intensitet i lydsignalet over tid.
Encoder: Prosesserer spektrogrammet for å generere en numerisk representasjon av lyden.
Decoder: Bruker en språkmodell for å forutsi rekkefølgen av teksttegn (ord eller delord) som tilsvarer lydinngangen.
Bruk av spesialtegn: Inkluderer spesialtegn for å håndtere oppgaver som språkgjenkjenning, tidsstempler og oppgavespesifikke direktiver (f.eks. transkribere eller oversette).

Trening på flerspråklige multitask-superviserte data

Whisper ble trent på et enormt datasett med 680 000 timer veiledet data samlet fra nettet. Dette inkluderer:

Flerspråklig data: Omtrent 117 000 timer av dataene er på 99 ulike språk, noe som gjør at modellen kan generalisere på tvers av språk.
Varierte akustiske forhold: Datasettet inneholder lyd fra ulike domener og miljøer, og sikrer robusthet mot forskjellige aksenter, dialekter og bakgrunnsstøy.
Multitask-læring: Ved å trene på flere oppgaver samtidig (transkripsjon, oversettelse, språkgjenkjenning), lærer Whisper delte representasjoner som forbedrer den samlede ytelsen.

Applikasjoner og brukstilfeller

Transkripsjonstjenester

Virtuelle møter og notatskriving: Automatiser transkripsjon i plattformer for generelle lydopptak og spesifikke bransjer som utdanning, helse, journalistikk og juridiske tjenester.
Innholdsproduksjon: Generer transkripter for podkaster, videoer og direktesendinger for å øke tilgjengeligheten og tilby tekstreferanser.

Språkoversettelser

Global kommunikasjon: Oversett tale på ett språk til engelsk tekst, og muliggjør tverrspråklig kommunikasjon.
Språklæringsverktøy: Hjelper elever å forstå uttale og betydning på ulike språk.

AI-automatisering og chatboter

Taleaktiverte chatboter: Integrer Whisper i chatboter for å muliggjøre talebaserte interaksjoner og forbedre brukeropplevelsen.
AI-assistenter: Utvikle assistenter som kan forstå og behandle muntlige kommandoer på forskjellige språk.

Forbedret tilgjengelighet

Teksting: Generer undertekster for videoinnhold og hjelp personer med nedsatt hørsel.
Hjelpeteknologi: Gjør det mulig for enheter å transkribere og oversette tale for brukere som trenger språkhjelp.

Kundesentra og kundestøtte

Sanntidstranskripsjon: Gi agenter sanntidstranskripter av kundesamtaler for bedre service.
Sentimentanalyse: Analyser transkribert tekst for å måle kundesinnstilling og forbedre interaksjoner.

Fordeler med OpenAI Whisper

Flerspråklig støtte

Med dekning av 99 språk utmerker Whisper seg i å håndtere ulike språklige innspill. Denne flerspråklige kapasiteten gjør den egnet for globale applikasjoner og tjenester rettet mot internasjonale brukere.

Høy nøyaktighet og robusthet

Trent på omfattende veiledet data, oppnår Whisper høy nøyaktighet i transkripsjonsoppgaver. Robustheten mot forskjellige aksenter, dialekter og bakgrunnsstøy gjør den pålitelig i ulike virkelige scenarioer.

Allsidighet i oppgaver

Utover transkripsjon kan Whisper utføre:

Språkgjenkjenning: Oppdager hvilket språk som snakkes uten forhåndsinput.
Taleoversettelse: Oversetter tale fra ett språk til engelsk tekst.
Generering av tidsstempel: Gir frasenivå-tidsstempler i transkripsjoner.

Tilgjengelig som åpen kildekode

Utgitt som åpen kildekode gir Whisper utviklere mulighet til å:

Tilpasse og finjustere: Justere modellen for spesifikke oppgaver eller domener.
Integrere i applikasjoner: Bygg Whisper inn i produkter og tjenester uten lisensbegrensninger.
Bidra til fellesskapet: Forbedre modellen og dele forbedringer.

Begrensninger og hensyn

Datakrav

Ressurskrevende: Større modeller krever betydelig datakraft og minne (opptil 10 GB VRAM for den største modellen).
Behandlingstid: Transkripsjonshastighet kan variere, og større modeller behandler tregere enn mindre.

Tilbøyelighet til hallusinasjoner

Unøyaktige transkripsjoner: Whisper kan noen ganger produsere tekst som ikke ble sagt, kjent som hallusinasjoner. Dette er mer sannsynlig på enkelte språk eller med dårlig lydkvalitet.

Begrenset støtte for ikke-engelske språk

Dataskjevhet: En betydelig andel av treningsdataene er på engelsk, noe som kan påvirke nøyaktigheten på mindre representerte språk.
Behov for finjustering: Ytterligere trening kan være nødvendig for å forbedre ytelsen på spesifikke språk eller dialekter.

Inndata-begrensninger

Lydlengde: Whisper prosesserer lyd i 30-sekunders segmenter, noe som kan komplisere transkripsjon av lengre, sammenhengende lyd.
Filstørrelsesbegrensninger: Den åpne modellen kan ha begrensninger på inndatafilstørrelser og formater.

OpenAI Whisper i AI-automatisering og chatboter

Forbedre brukerinteraksjoner

Ved å integrere Whisper i chatboter og AI-assistenter kan utviklere gjøre det mulig å:

Stemmestyring: La brukerne samhandle med tale i stedet for tekst.
Flerspråklig støtte: Tilpasse seg brukere som foretrekker eller trenger ulike språk.
Bedre tilgjengelighet: Hjelpe brukere med funksjonshemninger eller de som ikke kan bruke tradisjonelle inndatametoder.

Effektivisere arbeidsflyter

Automatisert transkripsjon: Redusere manuelt arbeid med notatskriving og dokumentasjon.
Dataanalyse: Konvertere muntlig innhold til tekst for analyse, overvåking og innsikt.

Eksempler i praksis

Virtuelle møteboter: Verktøy som deltar i nettmøter for å transkribere diskusjoner i sanntid.
Kundeserviceboter: Systemer som forstår og svarer på muntlige forespørsler, og forbedrer kundeopplevelsen.
Utdanningsplattformer: Applikasjoner som transkriberer forelesninger eller gir oversettelser for studenter.

Alternativer til OpenAI Whisper

Åpen kildekode-alternativer

Mozilla DeepSpeech: En åpen kildekode ASR-motor som lar deg trene dine egne modeller.
Kaldi: Et verktøy mye brukt i både forskning og industri for talegjenkjenning.
Wav2vec: Meta AI sitt system for selv-supervisert talebehandling.

Kommersielle API-er

Google Cloud Speech-to-Text: Tilbyr talegjenkjenning med omfattende språkstøtte.
Microsoft Azure AI Speech: Gir taletjenester med tilpasningsmuligheter.
AWS Transcribe: Amazons talegjenkjenningstjeneste med funksjoner som tilpasset vokabular.

Spesialiserte leverandører

Gladia: Tilbyr en hybrid og forbedret Whisper-arkitektur med flere muligheter.
AssemblyAI: Gir tale-til-tekst-API-er med funksjoner som innholdsmoderering.
Deepgram: Tilbyr sanntidstranskripsjon med muligheter for egendefinerte modeller.

Faktorer å vurdere når du velger Whisper

Nøyaktighet og hastighet

Avveininger: Større modeller gir høyere nøyaktighet, men krever mer ressurser og er tregere.
Testing: Evaluer ytelsen med virkelige data som er relevante for din applikasjon.

Lydvolum

Skalerbarhet: Vurder maskinvare- og infrastrukturbehov for å behandle store mengder lyd.
Batch-prosessering: Implementer metoder for å håndtere store datasett effektivt.

Avanserte funksjoner

Ekstra funksjonalitet: Vurder om funksjoner som direktetranskripsjon eller talerskille er nødvendig.
Tilpasning: Vurder innsatsen som kreves for å implementere ekstra funksjoner.

Språkstøtte

Målspråk: Sjekk modellens ytelse på språkene relevante for din applikasjon.
Finjustering: Planlegg for eventuell ekstra trening for mindre representerte språk.

Kompetanse og ressurser

Teknisk ekspertise: Sørg for at teamet ditt har ferdighetene som trengs for å implementere og tilpasse modellen.
Infrastruktur: Vurder maskinvarekrav og hostingmuligheter.

Kostnadshensyn

Åpen kildekode vs. kommersiell: Avvei de innledende kostnadsbesparelsene ved åpen kildekode mot mulige langsiktige utgifter til vedlikehold og skalering.
Total eierkostnad: Ta hensyn til maskinvare, utviklingstid og løpende supportkostnader.

Hvordan brukes Whisper i Python?

Whisper er implementert som et Python-bibliotek, noe som gir sømløs integrasjon i Python-baserte prosjekter. Å bruke Whisper i Python innebærer å sette opp riktig miljø, installere nødvendige avhengigheter og bruke bibliotekets funksjoner til å transkribere eller oversette lydfiler.

Sette opp Whisper i Python

Før du bruker Whisper, må du forberede utviklingsmiljøet ved å installere Python, PyTorch, FFmpeg og selve Whisper-biblioteket.

Forutsetninger

Python: Versjon 3.8 til 3.11 anbefales.
PyTorch: Et rammeverk for dyp læring som kreves for å kjøre Whisper-modellen.
FFmpeg: Et kommandolinjeverktøy for håndtering av lyd- og videofiler.
Whisper-biblioteket: Python-pakken levert av OpenAI.

Steg 1: Installer Python og PyTorch

Hvis du ikke har Python installert, last det ned fra offisiell nettside. For å installere PyTorch, bruk pip:

pip install torch

Alternativt, besøk PyTorch-nettsiden for spesifikke instruksjoner basert på operativsystem og Python-versjon.

Steg 2: Installer FFmpeg

Whisper krever FFmpeg for å behandle lydfiler. Installer FFmpeg med riktig pakkebehandler for ditt operativsystem.

Ubuntu/Debian:

sudo apt update && sudo apt install ffmpeg

MacOS (med Homebrew):

brew install ffmpeg

Windows (med Chocolatey):

choco install ffmpeg

Steg 3: Installer Whisper-biblioteket

Installer Whisper Python-pakken med pip:

pip install -U openai-whisper

For å installere siste versjon direkte fra GitHub-repositoriet:

pip install git+https://github.com/openai/whisper.git

Merknad for Windows-brukere

Sørg for at utviklermodus er aktivert:

Gå til Innstillinger.
Naviger til Personvern og sikkerhet > For utviklere.
Slå på Utviklermodus.

Tilgjengelige modeller og spesifikasjoner

Whisper tilbyr flere modeller som varierer i størrelse og kapasitet. Modellene går fra tiny til large, hver med ulik balanse mellom hastighet og nøyaktighet.

Størrelse	Parametere	Kun engelsk-modell	Flerspråklig modell	Krevd VRAM	Relativ hastighet
tiny	39 M	`tiny.en`	`tiny`	~1 GB	~32x
base	74 M	`base.en`	`base`	~1 GB	~16x
small	244 M	`small.en`	`small`	~2 GB	~6x
medium	769 M	`medium.en`	`medium`	~5 GB	~2x
large	1550 M	N/A	`large`	~10 GB	1x

Velge riktig modell

Kun engelske modeller (.en): Optimalisert for engelsk transkripsjon og gir bedre ytelse for engelske lydfiler.
Flerspråklige modeller: Kan transkribere flere språk og passer for globale applikasjoner.
Modellstørrelse: Større modeller gir høyere nøyaktighet, men krever mer datakraft. Velg en modell som passer til maskinvaren og ytelseskravene dine.

Bruke Whisper i Python

Etter å ha satt opp miljøet og installert de nødvendige komponentene, kan du ta i bruk Whisper i Python-prosjektene dine.

Importere biblioteket og laste inn en modell

Begynn med å importere Whisper-biblioteket og laste inn en modell:

import whisper

# Last inn ønsket modell
model = whisper.load_model("base")

Bytt ut "base" med modellnavnet som passer til din applikasjon.

Transkribere lydfiler

Whisper tilbyr en enkel transcribe-funksjon for å konvertere lydfiler til tekst.

Eksempel: Transkribere en engelsk lydfil

# Transkriber lydfilen
result = model.transcribe("path/to/english_audio.mp3")

# Skriv ut transkripsjonen
print(result["text"])

Forklaring

model.transcribe(): Behandler lydfilen og gir ut en ordbok med transkripsjon og annen metadata.
result["text"]: Henter ut den transkriberte teksten fra resultatet.

Oversette lyd til engelsk

Whisper kan oversette lyd fra ulike språk til engelsk.

Eksempel: Oversette spansk lyd til engelsk

# Transkriber og oversett spansk lyd til engelsk
result = model.transcribe("path/to/spanish_audio.mp3", task="translate")

# Skriv ut oversatt tekst
print(result["text"])

Forklaring

task="translate": Instruerer modellen til å oversette lyden til engelsk istedenfor å bare transkribere.

Spesifisere språk

Selv om Whisper automatisk kan oppdage språket, kan det å spesifisere det forbedre nøyaktigheten og hastigheten.

Eksempel: Transkribere fransk lyd

# Transkriber fransk lyd ved å angi språk
result = model.transcribe("path/to/french_audio.wav", language="fr")

# Skriv ut transkripsjonen
print(result["text"])

Oppdage språket i lyd

Whisper kan identifisere hvilket språk som snakkes i en lydfil med detect_language-metoden.

Eksempel: Språkgjenkjenning

# Last inn og forhåndsbehandle lyd
audio = whisper.load_audio("path/to/unknown_language_audio.mp3")
audio = whisper.pad_or_trim(audio)

# Konverter til log-Mel spektrogram
mel = whisper.log_mel_spectrogram(audio).to(model.device)

# Oppdag språk
_, probs = model.detect_language(mel)
language = max(probs, key=probs.get)

print(f"Detected language: {language}")

Forklaring

whisper.load_audio(): Laster inn lydfilen.
whisper.pad_or_trim(): Tilpasser lydlengden til modellens krav.
whisper.log_mel_spectrogram(): Konverterer lyd til formatet modellen forventer.
model.detect_language(): Returnerer sannsynligheter for hvert språk og identifiserer det mest sannsynlige språket.

Avansert bruk og tilpasning

For mer kontroll over transkripsjonsprosessen kan du bruke lavnivå-funksjoner og tilpasse dekodingsalternativer.

Bruke `decode`-funksjonen

decode-funksjonen lar deg angi alternativer som språk, oppgave og om tidsstempler skal inkluderes.

Eksempel: Egendefinerte dekodingsalternativer

# Sett dekodingsalternativer
options = whisper.DecodingOptions(language="de", without_timestamps=True)

# Dekod lyden
result = whisper.decode(model, mel, options)

# Skriv ut gjenkjent tekst
print(result.text)

Prosessere direkte lydinput

Du kan integrere Whisper for å transkribere direktelyd fra mikrofonen.

Eksempel: Transkribere direkte mikrofoninput

import whisper
import sounddevice as sd

# Last inn modellen
model = whisper.load_model("base")

# Ta opp lyd fra mikrofonen
duration = 5  # sekunder
fs = 16000  # Samplingsfrekvens
print("Opptak...")
audio = sd.rec(int(duration * fs), samplerate=fs, channels=1, dtype='float32')
sd.wait

Vanlige spørsmål

Hva er OpenAI Whisper?: OpenAI Whisper er et avansert, automatisk talegjenkjenningssystem (ASR) utviklet av OpenAI, designet for å transkribere talespråk til skriftlig tekst ved hjelp av dyp læring. Det støtter 99 språk og utmerker seg i transkripsjon, oversettelse og språkgjenkjenning.
Hvordan fungerer Whisper?: Whisper bruker en transformer-basert encoder-decoder-arkitektur, prosesserer lyd til log-Mel spektrogrammer, og gir ut tekst via en språkmodell. Det ble trent på 680 000 timer med flerspråklig, multitask-data for høy nøyaktighet og robusthet.
Hva er hovedfunksjonene til Whisper?: Whisper støtter flerspråklig talegjenkjenning, taleoversettelse, automatisk språkgjenkjenning, robusthet mot aksenter og støy, og gir åpen kildekode-tilgang for tilpasning og integrasjon.
Hva er maskinvarekravene for Whisper?: Maskinvarekravene avhenger av modellstørrelsen: mindre modeller som 'tiny' krever ~1GB VRAM, mens den største krever ~10GB. Whisper kjører raskere på GPU-er, men kan fungere på CPU-er med lengre behandlingstid.
Kan Whisper integreres i Python-prosjekter?: Ja, Whisper er implementert som et Python-bibliotek og kan installeres via pip. Det gjør det enkelt å integrere i Python-prosjekter for taletranskripsjon, oversettelse og sanntids taleapplikasjoner.
Hva er vanlige bruksområder for Whisper?: Vanlige brukstilfeller inkluderer automatisert møtetranskripsjon, taleaktiverte chatboter, direkte oversettelse, tilgjengelighetsverktøy (teksting og hjelpemidler), kundesentra-automatisering og taleaktiverte automatiseringssystemer.
Finnes det alternativer til OpenAI Whisper?: Ja, alternativer inkluderer åpen kildekode-motorer som Mozilla DeepSpeech, Kaldi, Wav2vec, og kommersielle API-er som Google Cloud Speech-to-Text, Microsoft Azure AI Speech og AWS Transcribe.
Er Whisper åpen kildekode?: Ja, OpenAI Whisper er åpen kildekode, som gjør at utviklere kan tilpasse, finjustere og integrere det i egne produkter og tjenester uten lisensieringsbegrensninger.

Begynn å bygge med OpenAI Whisper

Integrer avanserte tale-til-tekst-funksjoner i dine applikasjoner, automatiser arbeidsflyter og forbedre brukeropplevelsen med OpenAI Whisper og FlowHunt.

Prøv FlowHunt Bestill en demo

Lær mer

Egendefinert OpenAI LLM

Lås opp kraften i egendefinerte språkmodeller med komponenten Egendefinert OpenAI LLM i FlowHunt. Integrer sømløst dine egne OpenAI-kompatible modeller – inklud...

Jun 9, 2025 3 min lesing

AI LLM +5

LLM OpenAI

FlowHunt støtter dusinvis av tekstgenereringsmodeller, inkludert modeller fra OpenAI. Her er hvordan du bruker ChatGPT i dine AI-verktøy og chatboter.

May 30, 2025 3 min lesing

AI LLM +5

Claude Opus

Finn ut mer om Opus-modellen til Claude av Anthropic. Oppdag dens styrker og svakheter, og hvordan den sammenlignes med andre modeller.

May 30, 2025 4 min lesing

AI Claude Opus +6

Whisper

Forstå OpenAI Whisper

Er Whisper en modell eller et system?

Kjernemuligheter i Whisper

Hvordan fungerer OpenAI Whisper?

Transformer-arkitektur

Trening på flerspråklige multitask-superviserte data

Applikasjoner og brukstilfeller

Transkripsjonstjenester

Språkoversettelser

AI-automatisering og chatboter

Forbedret tilgjengelighet

Kundesentra og kundestøtte

Fordeler med OpenAI Whisper

Flerspråklig støtte

Høy nøyaktighet og robusthet

Allsidighet i oppgaver

Tilgjengelig som åpen kildekode

Begrensninger og hensyn

Datakrav

Tilbøyelighet til hallusinasjoner

Begrenset støtte for ikke-engelske språk

Inndata-begrensninger

OpenAI Whisper i AI-automatisering og chatboter

Forbedre brukerinteraksjoner

Effektivisere arbeidsflyter

Eksempler i praksis

Alternativer til OpenAI Whisper

Åpen kildekode-alternativer

Kommersielle API-er

Spesialiserte leverandører

Faktorer å vurdere når du velger Whisper

Nøyaktighet og hastighet

Lydvolum

Avanserte funksjoner

Språkstøtte

Kompetanse og ressurser

Kostnadshensyn

Hvordan brukes Whisper i Python?

Sette opp Whisper i Python

Forutsetninger

Steg 1: Installer Python og PyTorch

Steg 2: Installer FFmpeg

Steg 3: Installer Whisper-biblioteket

Merknad for Windows-brukere

Tilgjengelige modeller og spesifikasjoner

Velge riktig modell

Bruke Whisper i Python

Importere biblioteket og laste inn en modell

Transkribere lydfiler

Forklaring

Oversette lyd til engelsk

Forklaring

Spesifisere språk

Oppdage språket i lyd

Forklaring

Avansert bruk og tilpasning

Bruke decode-funksjonen

Prosessere direkte lydinput

Vanlige spørsmål

Begynn å bygge med OpenAI Whisper

Lær mer

Egendefinert OpenAI LLM

LLM OpenAI

Claude Opus

Innstillinger for informasjonskapsler

Nødvendige informasjonskapsler

Analyse-informasjonskapsler

Bruke `decode`-funksjonen