Speech to Text

Askunci utilitza Bé Models 380+ Sense marca d' aigua No cal signar-up

Carrega un fitxer d' àudio o vídeo ascii o enganxa un URL 2001- {@} i agafa una transcripció neta amb marques de temps. Altament, export de subtítols SRT/ VTT, 100 idiomes amb detecció automàtica. Escala de costs exactament amb longitud de vídeo. S' ha embolit per granv3 i Parake (auto- màquina), més el TEGE Wizper i 11LabT.

Arrossegueu i deixeu anar l' àudio/video o cliqueu per navegar

MP3, WAV, MP4, WebM, M4A atakonsult fins a 500MB

Idioma

Motor Rumume grans-v3 llengües 99, precisió de classe alta.

Format de sortida

Detecció delveu — etiqueta qui parla quan (+50% fitxes)

Nombre de altaveus

YouTube, Instagram, TikTok, bookmarkify, i 1.300+ plataformes

Motor

Format de sortida

Detecció delveu — +50%

El cost de la transcripció d' URL està basat en la durada real del vídeo que cito després de baixar. S' espera que ~500 fitxes/ minuts al Rumuz.

Recripció en temps real utilitzant el micròfon

What people transcribe with Free.ai

Entrevista + podcasts

Etiquetes de comunicació cada altaveu. Exporta SRT directament a l' editor de vídeo, o text pla per a un article d' escriptura.

Autotítols + subtítols

Publica una pujada de YouTube o TikTok, escolliu SRT o WebVTT, i crema els subtítols amb /video/subtítol /. Una parada del flux de treball del títol.

Notes de la Reunió

Upload a Zoom/Teams recording — get transcript + speaker labels. Pair with /write/summarize/ for bullet-point minutes.

Lliçons + lliçons

Trancriu una lliçó de 90 minuts, llavors useu / study/flashcards / o / write/ summarize/ per convertir- la en material d' estudi.

àudio en llengua estrangera

El Rumul detecta automàticament 99 idiomes. Trancric en l' original i després envia el text a través de / traduir/ traduir/ saltar les llengües.

Legal + medicina

Marques de temps, etiquetes de parlant, JSON export amb cada paraula del temps de sortida de precisiódentiu dels tribunals o prep clínics.

How Free.ai transcription compares

El que s'obté	Free.ai	Otter.ai	Descript	Rev.com
Ús diari lliure	5K+ tokens/day	300 minutes/mo	1 hr/month	—
Motor	Whisper large-v3, Parakeet	Proprietary	Proprietary	Human + AI
Idiomes	99	English-focused	22	30+
Diarització del president
SRT / Exportació VTTT		Paid	Paid
API pública		Limited	Limited
TTS en directe	(free)	Paid	—	—
Es requereix la signatura	No	Yes	Yes	Yes

Les figures de composició reflexen públicament els ties lliures llistat com a 2026. Comproveu cada proveïdor per als plans actuals.

Best free speech to text tool. Upload MP3, WAV, MP4 or record live. Auto-detect language. Speaker diarization. No sign up required.

Com usar- lo Speech to Text

Introduïu l' entrada

Escriu text, puja un fitxer, o descriu el que vulguis. No cal compte.

Generació de clic

La nostra IA processa la vostra petició en segons usant els millors models de codi obert.

Descarrega i comparteix

Baixeu, copieu o compartiu el vostre resultat. Lliure per a ús personal i comercial.

Usa aquesta eina mitjançant l' API

Automatitzeu aquesta eina del vostre propi codi. Els costos OpenAI compatible amb el punt d' acabament, l' autenticació Beer- token, sense necessitat de SDK extra. Perken coincideixen amb la interfície web.

Documentació de l' API Obtén la clau de l' API

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"file": "@audio.mp3", "language": "auto"}'

Speech to Text — FAQ

Free.ai offers Whisper-powered speech to text with excellent accuracy, 99 languages, subtitle export, speaker detection, and live mic capture — completely free.

Publica un fitxer d' àudio o vídeo (MP3, WAV, MP4, M4A), clica Tranc, i obté un discurs precís al text en segons. O registre viu des del micròfon.

Si. Enganxa qualsevol URL de YouTube a la pestanya URL i el discurs a l' eina de text s' extrau l' àudio i la converteix. Funciona amb Instagram, TikTok, TikTokify, i 1.300 plataformes +.

Sí, detecta automàticament o selecciona des de 99 idiomes. El nostre discurs a text gestiona accents, soroll de fons i àudio en llenguatge mixta.

Sí. Seleccioneu múltiples fitxers d' àudio al mateix temps s' envien a través de l' idioma al text amb el seguiment del progrés i els resultats es poden descarregar separadament o combinats.

Sí. El discurs a l' API de text a / api / és compatible amb l' OpenAI. Carrega el programa d' àudio i rep JSON amb la transcripció, el llenguatge i els segells de temps.

Sí. Commuta la detecció de l' altaveu abans de pujar i el discurs a la sortida de text s' etiqueta per altaveu ( Altaveu 1, Altaveu 2...). Afegiu un 50% per a mostrar el cost.

El discurs al text accepta fitxers a 500MB per pujada. Per a contingut multi- hores, primer divideix l' àudio en trossos.

És molt precís per a l' ús d' àudio Inger, normalment el 95% de paraula+ en anglès amb el nostre gran dorsal del Rumors. La qualitat depèn de la claredat de l' àudio, l' accent i el soroll de fons.

Sí. La transcripció és completament editable en el lloc. Arreglant errors, reformat, i copieu/ downloads com TXT, SRT, o VT.

Sí. L' àudio es processa en les nostres pròpies GPUs i s' esborra després de que el discurs completi el text. No hi ha res emmagatzemat a llarg termini, compartit o usat per a l' entrenament.

Sí. Pugeu un fitxer d' àudio o vídeo en / chat / i demaneu a la IA que el transcrivisca amb un text que combina les preguntes i la sumació en un flux de treball.

Signa lliure per 30.000 fitxes

Crea compte lliure

No cal targeta de crèdit

Com valoraries aquesta eina?

Speech to Text

What people transcribe with Free.ai

Entrevista + podcasts

Autotítols + subtítols

Notes de la Reunió

Lliçons + lliçons

àudio en llengua estrangera

Legal + medicina

How Free.ai transcription compares

Resultat

Com usar- lo Speech to Text

Introduïu l' entrada

Generació de clic

Descarrega i comparteix

Usa aquesta eina mitjançant l' API

Speech to Text — FAQ

Quina és la millor llibertat d'expressió per a l'eina de text?

Com puc convertir el discurs al text en línia?

Pots parlar amb els vídeos de YouTube?

El discurs treballa en altres idiomes?

Puc pujar múltiples fitxers per al discurs al text?

Hi ha un discurs a l' API del text?

El discurs a text permet etiquetes d' altaveu?

Quina mida permet el discurs del fitxer d' àudio al text?

Quina precisió té el discurs a la sortida de text?

Puc editar el discurs a la transcripció de text?

És un discurs al text privat i segur?

Puc usar el discurs al text de l'IA Chat?

Obtén 10.000 Torken lliures

Espera't a l'Arkake que li donen 10K Free Token!

Vols més?