STT Online

Askunci utilitza Bé Models 380+ Sense marca d' aigua No cal signar-up
Model:
+ GPT-5, Claude, Gemini
Carrega un fitxer d' àudio o vídeo ascii o enganxa un URL 2001- {@} i agafa una transcripció neta amb marques de temps. Altament, export de subtítols SRT/ VTT, 100 idiomes amb detecció automàtica. Escala de costs exactament amb longitud de vídeo. S' ha embolit per granv3 i Parake (auto- màquina), més el TEGE Wizper i 11LabT.

Arrossegueu i deixeu anar l' àudio/video o cliqueu per navegar

MP3, WAV, MP4, WebM, M4A atakonsult fins a 500MB

Rumume grans-v3 llengües 99, precisió de classe alta.
Estimació Token per aquest vídeo
YouTube, Instagram, TikTok, bookmarkify, i 1.300+ plataformes
El cost de la transcripció d' URL està basat en la durada real del vídeo que cito després de baixar. S' espera que ~500 fitxes/ minuts al Rumuz.
Gravació: 0:00

Recripció en temps real utilitzant el micròfon

TranscriptCity name (optional, probably does not need a translation)

Transcribant l'àudio...

Això pot trigar un moment per més fitxers.

What people transcribe with Free.ai

Interviews + podcasts

Etiquetes de comunicació cada altaveu. Exporta SRT directament a l' editor de vídeo, o text pla per a un article d' escriptura.

Auto captions + subtitles

Publica una pujada de YouTube o TikTok, escolliu SRT o WebVTT, i crema els subtítols amb /video/subtítol /. Una parada del flux de treball del títol.

Notes de la Reunió

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Trancriu una lliçó de 90 minuts, llavors useu / study/flashcards / o / write/ summarize/ per convertir- la en material d' estudi.

àudio en llengua estrangera

El Rumul detecta automàticament 99 idiomes. Trancric en l' original i després envia el text a través de / traduir/ traduir/ saltar les llengües.

Legal + medical

Marques de temps, etiquetes de parlant, JSON export amb cada paraula del temps de sortida de precisiódentiu dels tribunals o prep clínics.

How Free.ai transcription compares

El que s'obté Free.ai Otter.ai Descript Rev.com
Ús diari lliure5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Idiomes99English-focused2230+
Diarització del president
SRT / Exportació VTTTPaidPaid
API públicaLimitedLimited
TTS en directe (free) Paid
Es requereix la signaturaNoYesYesYes
Les figures de composició reflexen públicament els ties lliures llistat com a 2026. Comproveu cada proveïdor per als plans actuals.
Opcions avançades
Resultat
Els jardiners s'han quedat a baix. Get More Tokens
Want better results? Models Premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love Free.ai? Tell your friends!

Signen per obtenir un enllaç de referència i guanyen 25.000 fitxes per amic.

Vols més? Signa lliure per a 5K fitxes/ dia + 10K bo
Signa lliure

S' està processant la vostra petició...

Free STT tool powered by Whisper large-v3. Upload audio/video, get accurate speech recognition. Export SRT, VTT, TXT. 99 languages.

Com usar- lo STT Online

1
Introduïu l' entrada

Escriu text, puja un fitxer, o descriu el que vulguis. No cal compte.

2
Generació de clic

La nostra IA processa la vostra petició en segons usant els millors models de codi obert.

3
Descarrega i comparteix

Baixeu, copieu o compartiu el vostre resultat. Lliure per a ús personal i comercial.

Usa aquesta eina mitjançant l' API

Automatitzeu aquesta eina del vostre propi codi. Els costos OpenAI compatible amb el punt d' acabament, l' autenticació Beer- token, sense necessitat de SDK extra. Perken coincideixen amb la interfície web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

STT Online — FAQ

STT (Speech-to-Text) converts spoken audio into written text using AI. Free.ai runs Whisper large-v3 — the most accurate open-source speech recognition model — on our own GPUs.

Si. Envia fitxers d' àudio fins a 500MB. ST costa ~500 fitxes per minut d' àudio. Obteniu 25005.000 fitxes lliures per dia.

L'ST accepta el MP3, WAV, MP4, WebM, M4A, OGG, FLAC o format de vídeo, a 500MB per pujada.

Sí. ST els resultats exporten com a TXT, SRT (subtítols), o VT (títols web). Perfecte per a subtítols de YouTube i subtítols de vídeo.

El nostre ST fa servir el Rumul de granv3, normalment l' exactitud de paraula+ de manera clara en anglès i excel· lent qualitat en 99 llengües. El soroll de fons i els accents pesats disminueixen la precisió.

Sí. Habiliteu l' altaveu diarització a les opcions ST i els segments d' etiquetes de la IA com a ponent 1, President 2, etc. Costs per cent més fitxes.

Sí. L' API és OpenATI compatible amb l' àudio de l' OpenAIBI a / v1/audio/transcripcions i rep JSON. Funciona des de qualsevol idioma que pugui enviar peticions HTTP.

La pestanya Li viu captura el micròfon i els raigs a través de ST en temps real amb un retard mínim.

Sí. Enganxa un YouTube, TikTok, Instagram, Tacaify, o URL Vimeo i ST extrau l'àudio i la transcriven. 1.300+ plataformes acceptades.

Gran Bretanya, un clip de 1 minuts acaba en segons, una gravació de 30 minuts en aproximadament un minut, un fitxer d' 1 hora en aproximadament 2 minuts. El Rumors funciona sobre el nostre cúmul de la GPU.

Sí, l'àudio es processa en les nostres pròpies GPUs i s' esborra després de completar-les. Mai es desa a llarg termini, mai compartit i mai s' usa per a entrenar el model.

Rumuleu gran-v3 el model més gran, més precís del Rumors (1.55B paràmetres). L'automuntem a l' A100 GPUs per a la velocitat i la privacitat.

Signa lliure per 10.000 fitxes

Crea compte lliure

No cal targeta de crèdit

Com valoraries aquesta eina?

Like this tool? Share it!