ElevenLabs STT

Free.ai · stt · ~500 token per minute

Unggah audio

Jatuhkan berkas audio atau video, atau tempel URL di bawah ini

~500 token per minute

Berjalan bebas di GPU kami. Tingkatkan untuk ElevenLabs STT →

ElevenLabs STT is a model ucapan-ke-teks. Rute melalui model eksternal --{t} token per menit (50% markup atas biaya hulu).

Gunakan melalui API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'

Dokumentasi API Dapatkan Kunci API

Similar models

Fal Speech-to-Text

Wizper (Whisper v3)

Browse all models →

Pertanyaan yang Sering Diajukan

ElevenLabs STT transcribes spoken audio into text. Upload an MP3, WAV, M4A, or video file and ElevenLabs STT returns the full transcript plus optional SRT/VTT subtitles with timestamps.

ElevenLabs STT handles dozens of languages — Whisper-family models cover 90+, Parakeet covers ~25, others vary. Pick "auto-detect" or specify the language for highest accuracy.

Tingkat Word-error adalah 5U10% pada audio bahasa Inggris bersih, 10°20% pada audio yang bising atau aksen. varian besar dari arsitektur yang sama melakukan lebih baik pada kasus-kasus keras memilih lebih besar ketika audio kasar.

Ekspor SRT atau VTT dan peta waktu langsung ke video Anda.

ElevenLabs STT is a premium transcription engine. About ~500–1,500 tokens per minute of audio. $1 = 750,000 tokens.

MP3, WAV, M4A, FLAC, OGG, plus video (MP4, MOV, WebM) kita mengekstrak audio. Max 500 MB per upload.

Speaker diarization is a separate pass — toggle "diarize" on /transcribe/. ElevenLabs STT handles the transcription; diarization labels each segment with Speaker 1 / Speaker 2 / etc.

Ya /batch/menerima folder berkas audio. Setiap transkrip mendarat di /account/?tab=cerita dengan nama berkas asli. Untuk pelestarian folder-tree menggunakan API.

Ya POST audio Anda ke /v1/stttt/trancribe/ dengan model=ElevenLabs STT". Mengembalikan JSON dengan teks + segmen + tanda waktu tingkat kata. /api/ memiliki referensi penuh.

Model berhost diri menjaga audio pada GPU kami; premium lulus melalui DPA. Audio dihapus setelah jendela berbagi (24h anon, 7d signed-in). Kami tidak melatih input anda.

Yes — Free.ai grants commercial use of transcripts. You need rights to the audio you uploaded (your own recording, licensed material, or content with consent).

Faktor real-time adalah kira-kira 0.05.2× ° 60 menit transncribes podcast dalam 31 menit. model Premium sering selesai lebih cepat. Gunakan tombol antrian untuk menutup tab.

ElevenLabs STT

Gunakan melalui API

Similar models

Pertanyaan yang Sering Diajukan

Apa yang ElevenLabs STT lakukan?

How many languages does ElevenLabs STT support?

Seberapa akurat nama __FREAAI_PH?

Apakah ElevenLabs STT termasuk tanda waktu?

Berapa biaya per menitnya?

What audio formats can I upload to ElevenLabs STT?

Bisakah ElevenLabs STT mengidentifikasi speaker yang berbeda?

Can I batch transcribe with ElevenLabs STT?

Apakah ada API untuk ElevenLabs STT?

Bagaimana dengan privasi ketika saya menuliskan dengan ElevenLabs STT?

Apakah ElevenLabs STT keluaran aman untuk penggunaan komersial?

Berapa lama waktu yang diperlukan?

Dapatkan 10.000 Token Bebas

Tunggu, ambil 10K Token Bebas!

Mau lagi?