Speech to Text

Askunci utilitza Bé Models 380+ Sense marca d' aigua No cal signar-up
Model:
+ GPT-5, Claude, Gemini
Carrega un fitxer d' àudio o vídeo ascii o enganxa un URL 2001- {@} i agafa una transcripció neta amb marques de temps. Altament, export de subtítols SRT/ VTT, 100 idiomes amb detecció automàtica. Escala de costs exactament amb longitud de vídeo. S' ha embolit per granv3 i Parake (auto- màquina), més el TEGE Wizper i 11LabT.

Arrossegueu i deixeu anar l' àudio/video o cliqueu per navegar

MP3, WAV, MP4, WebM, M4A atakonsult fins a 500MB

Rumume grans-v3 llengües 99, precisió de classe alta.
Estimació Token per aquest vídeo
YouTube, Instagram, TikTok, bookmarkify, i 1.300+ plataformes
El cost de la transcripció d' URL està basat en la durada real del vídeo que cito després de baixar. S' espera que ~500 fitxes/ minuts al Rumuz.
Gravació: 0:00

Recripció en temps real utilitzant el micròfon

TranscriptCity name (optional, probably does not need a translation)

Transcribant l'àudio...

Això pot trigar un moment per més fitxers.

What people transcribe with Free.ai

Interviews + podcasts

Etiquetes de comunicació cada altaveu. Exporta SRT directament a l' editor de vídeo, o text pla per a un article d' escriptura.

Auto captions + subtitles

Publica una pujada de YouTube o TikTok, escolliu SRT o WebVTT, i crema els subtítols amb /video/subtítol /. Una parada del flux de treball del títol.

Notes de la Reunió

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lectures + lessons

Trancriu una lliçó de 90 minuts, llavors useu / study/flashcards / o / write/ summarize/ per convertir- la en material d' estudi.

àudio en llengua estrangera

El Rumul detecta automàticament 99 idiomes. Trancric en l' original i després envia el text a través de / traduir/ traduir/ saltar les llengües.

Legal + medical

Marques de temps, etiquetes de parlant, JSON export amb cada paraula del temps de sortida de precisiódentiu dels tribunals o prep clínics.

How Free.ai transcription compares

El que s'obté Free.ai Otter.ai Descript Rev.com
Ús diari lliure5K+ tokens/day300 minutes/mo1 hr/month
MotorWhisper large-v3, ParakeetProprietaryProprietaryHuman + AI
Idiomes99English-focused2230+
Diarització del president
SRT / Exportació VTTTPaidPaid
API públicaLimitedLimited
TTS en directe (free) Paid
Es requereix la signaturaNoYesYesYes
Les figures de composició reflexen públicament els ties lliures llistat com a 2026. Comproveu cada proveïdor per als plans actuals.
Opcions avançades
Resultat
Els jardiners s'han quedat a baix. Get More Tokens
Want better results? Models Premium (GPT-5, Claude, Gemini) deliver higher quality. View Plans

❤️ Love Free.ai? Tell your friends!

Signen per obtenir un enllaç de referència i guanyen 25.000 fitxes per amic.

Vols més? Signa lliure per a 5K fitxes/ dia + 10K bo
Signa lliure

S' està processant la vostra petició...

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Com usar- lo Speech to Text

1
Introduïu l' entrada

Escriu text, puja un fitxer, o descriu el que vulguis. No cal compte.

2
Generació de clic

La nostra IA processa la vostra petició en segons usant els millors models de codi obert.

3
Descarrega i comparteix

Baixeu, copieu o compartiu el vostre resultat. Lliure per a ús personal i comercial.

Usa aquesta eina mitjançant l' API

Automatitzeu aquesta eina del vostre propi codi. Els costos OpenAI compatible amb el punt d' acabament, l' autenticació Beer- token, sense necessitat de SDK extra. Perken coincideixen amb la interfície web.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai offers Whisper-powered speech to text with excellent accuracy, 99 languages, subtitle export, speaker detection, and live mic capture — completely free.

Publica un fitxer d' àudio o vídeo (MP3, WAV, MP4, M4A), clica Tranc, i obté un discurs precís al text en segons. O registre viu des del micròfon.

Si. Enganxa qualsevol URL de YouTube a la pestanya URL i el discurs a l' eina de text s' extrau l' àudio i la converteix. Funciona amb Instagram, TikTok, TikTokify, i 1.300 plataformes +.

Sí, detecta automàticament o selecciona des de 99 idiomes. El nostre discurs a text gestiona accents, soroll de fons i àudio en llenguatge mixta.

Sí. Seleccioneu múltiples fitxers d' àudio al mateix temps s' envien a través de l' idioma al text amb el seguiment del progrés i els resultats es poden descarregar separadament o combinats.

Sí. El discurs a l' API de text a / api / és compatible amb l' OpenAI. Carrega el programa d' àudio i rep JSON amb la transcripció, el llenguatge i els segells de temps.

Sí. Commuta la detecció de l' altaveu abans de pujar i el discurs a la sortida de text s' etiqueta per altaveu ( Altaveu 1, Altaveu 2...). Afegiu un 50% per a mostrar el cost.

El discurs al text accepta fitxers a 500MB per pujada. Per a contingut multi- hores, primer divideix l' àudio en trossos.

És molt precís per a l' ús d' àudio Inger, normalment el 95% de paraula+ en anglès amb el nostre gran dorsal del Rumors. La qualitat depèn de la claredat de l' àudio, l' accent i el soroll de fons.

Sí. La transcripció és completament editable en el lloc. Arreglant errors, reformat, i copieu/ downloads com TXT, SRT, o VT.

Sí. L' àudio es processa en les nostres pròpies GPUs i s' esborra després de que el discurs completi el text. No hi ha res emmagatzemat a llarg termini, compartit o usat per a l' entrenament.

Sí. Pugeu un fitxer d' àudio o vídeo en / chat / i demaneu a la IA que el transcrivisca amb un text que combina les preguntes i la sumació en un flux de treball.

Signa lliure per 10.000 fitxes

Crea compte lliure

No cal targeta de crèdit

Com valoraries aquesta eina?

Like this tool? Share it!