Groq Whisper API
|

Groq Whisper API: En Oversigt

Mens vi var optaget af Claude 3.5 Sonnet, lancerede GroqInc en API til OpenAIs Whisper-large-v3 model. Det er en vanvittigt hurtig tale-til-tekst løsning. Og det koster kun $0.03 per time for transskription! Her er koden til at bruge Groqs whisper API med OpenAI klienten!

from openai import OpenAI
groq = OpenAI(api_key="GROQ_API_KEY",
base_url="
audio_file = open("/indhold/prøve_audio.mp3", "rb")
transcript = groq.audio.transcriptions.create(
model="whisper-large-v3", file=audio_file, response_format="text"
print(transcript)
Koden til at bruge Groqs whisper API med OpenAI klienten

Hvad er Whisper?

Whisper er en fortrænet model udviklet til automatisk talegenkendelse (ASR) og taleoversættelse. Den er trænet på 680.000 timer mærket data, hvilket demonstrerer en stærk evne til at generalisere på tværs af forskellige datasæt og domæner uden behov for finjustering.

Modellen blev introduceret i papiret “Robust Speech Recognition via Large-Scale Weak Supervision” af Alec Radford et al. fra OpenAI. Den oprindelige kodebase er tilgængelig her.

Whisper large-v3 bibeholder den samme arkitektur som de tidligere store modeller, med få mindre justeringer:

  • Inputtet bruger nu 128 Mel-frekvensbånd i stedet for 80.
  • Et nyt sprog token for kantonesisk er blevet tilføjet.

Whisper large-v3 blev trænet på 1 million timer svagt mærket lyd og 4 millioner timer pseudomærket lyd indsamlet ved hjælp af Whisper large-v2. Træningen strakte sig over 2,0 epoker over dette blandet datasæt.

Den large-v3 model viser forbedret præstation på tværs af et bredt udvalg af sprog, opnår en 10% til 20% reduktion i fejl sammenlignet med Whisper large-v2.

Læs mere: Whisper large-v3 model vs large-v2 model

Læs relaterede artikler:



OptiPrime – Global førende total-performance marketing “mate” for at drive virksomheders vækst effektivt. Løft din virksomhed med vores skræddersyede digitale marketingtjenester. Vi blander innovative strategier og banebrydende teknologi for at målrette din målgruppe effektivt og skabe effektfulde resultater. Vores datadrevne tilgang optimerer kampagner for maksimalt ROI.

OptiPrime strækker sig på tværs af kontinenter og strækker sig fra de historiske gader i Quebec, Canada til det dynamiske hjerteslag i Melbourne, Australien; fra den innovative ånd i Aarhus, Danmark til den pulserende energi i Ho Chi Minh City, Vietnam. Uanset om vi øger brandbevidstheden eller øger salget, er vi her for at guide din digitale succes. Begynd din rejse til nye højder med os!

Similar Posts

Leave a Reply

Your email address will not be published. Required fields are marked *