ElevenLabs STT
Free.ai
·
stt
·
~500 ටොකන minute
ෆ්රෙඩී බාහිර ආකෘති හරහා මාර්ගය - ~ 500 ටොකන් මිනිත්තුවට (50% උඩුගත පිරිවැය මත මාකප්).
API හරහා භාවිත කරන්න
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
API ලේඛන
API යතුර ලබාගන්න
නිතර අසන ප්රශ්න
ElevenLabs STT පෙළ බවට කතා ශ්රව්ය පරිවර්තනය. MP3 එකක් උඩුගත, WAV, M4A, හෝ වීඩියෝ ගොනුවක් සහ ElevenLabs STT කාලය මුද්රා සමග විකල්ප SRT / VTT උපසිරැසි පූර්ණ පරිවර්තනය ප්ලස් ආපසු.
ElevenLabs STT භාෂා දස දහස් ගණනක් හැසිරවීම - Whisper-පවුලේ ආකෘති ආවරණය 90+, Parakeet ආවරණය ~25, අනෙක් අය වෙනස්. "ස්වයංක්රීයව හඳුනා" තෝරන්න හෝ ඉහළම නිරවද් යතාව සඳහා භාෂාව සඳහන් කරන්න.
වචන-දෝෂ අනුපාතය පිරිසිදු ඉංග්රීසි ශ්රව්ය මත 5-10% වේ, 10-20% ශබ්ද හෝ accented ශ්රව්ය මත. එම ගෘහ නිර්මාණ ශිල්පය විශාල විකල්ප අසීරු නඩු මත අර්ථවත් වඩා හොඳ කරන්නේ - ශ්රව්ය දෘඩ විට විශාල තෝරන්න.
ඔව් - සෑම කොටසක් ආරම්භ / අවසන් timestamps ඇතුළත් වේ. SRT හෝ VTT ලෙස අපනයනය සහ ඔබේ වීඩියෝව මත කෙලින්ම කාලය සිතියම.
ElevenLabs STT වාරික පරිවර්තනය එන්ජිමක් වේ. ~ 500-1,500 ශ්රව්ය විනාඩියකට ටොකන් ගැන. $ 1 = 750,000 ටොකන්.
MP3, WAV, M4A, FLAC, OGG, ප්ලස් වීඩියෝ (MP4, MOV, WebM) — අපි ශ්රව්ය උපුටා. මැක්ස් 500 MB එකකට. දිගු ගොනු? /audio/cut/ සමග බෙදා හෝ /v1/stt/batch/ භාවිතා කරන්න.
කථානායක diarization වෙනම අවසර - /transcribe/ මත "diarize" මාරු කරන්න. ElevenLabs STT පරිවර්තනය හැසිරවීම; diarization කථානායක 1 / කථානායක 2/ ආදිය සමග එක් එක් කොටස ලේබල්.
ඔව් — / කණ්ඩායම / ශ්රව්ය ගොනු බහාලුමක් පිළිගනී. එක් එක් පරිවර්තනය මුල් ගොනු නාමය සමග / ගිණුම /?tab = ඉතිහාසය ගොඩබිම්. බහාලුම්-ගස සංරක්ෂණය සඳහා API භාවිතා කරන්න.
ඔව් — ඔබේ ශ්රව්ය ප්රකාශනය /v1/stt/transcribe/ සමග ආකෘතිය සමග POST="ElevenLabs STT". පෙළ සමග JSON ආපසු + කොටස් + වචන මට්ටමේ timestamps. /api/ සම්පූර්ණ උපුටා දැක්වීම ඇත.
ස්වයං-සත්කාරක ආකෘති අපගේ GPUs මත ශ්රව්ය තබා; වට්ටම් DPA සමග හරහා ගමන්. ශ්රව්ය කොටස්-කවුළුව පසු මකා දමයි (24h anon, 7d සභාපති-in). අපි ඔබේ ආදාන පුහුණු නැහැ.
ඔව් - Free.ai පරිවර්තන වාණිජ භාවිතය ලබා දෙයි. ඔබ ඔබ උඩුගත ශ්රව්ය අයිතිවාසිකම් අවශ්ය (ඔබේම පටිගත, බලපත්ර ද්රව්ය, හෝ අනුමැතිය සමග අන්තර්ගතය).
තත්ත්ව සාධකය දළ වශයෙන් 0.05-0.2 × වේ - මිනිත්තු 60 ක පොඩ්කාස්ට් මිනිත්තු 3-12 ක් තුළ පරිවර්තනය කරයි. ප් රතිලාභ ආකෘති බොහෝ විට වේගයෙන් අවසන් වේ. ටැබය වසා දැමීමට පෝලිම් බොත්තම භාවිතා කරන්න.