ElevenLabs STT
Free.ai
·
stt
·
~500 प्रति टोकन minute
ElevenLabs STT a पाठमा भाषण नमूना हो । बाह्य मोडेल मार्फत मार्ग — ~ 500 टोकन प्रति मिनेट (50% माथि अपस्ट्रिम लागत मा मार्कअप).
API मार्फत प्रयोग गर्नुहोस्
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
मिसिलीकरण
API कुञ्जी प्राप्त गर्नुहोस्
प्राय सोधिने प्रश्नहरू
ElevenLabs STT ले पाठमा बोलेको अडियो प्रतिलिपि गर्दछ । MP3, WAV, M4A, वा भिडियो फाइल अपलोड गर्नुहोस् र ElevenLabs STT ले समय चिन्हहरूसँगै पूर्ण प्रतिलिपि र वैकल्पिक SRT/VTT उपशीर्षकहरू फर्काउँछ ।
ElevenLabs STT भाषाहरूको दर्जनौं ह्यान्डल गर्दछ - Whisper-परिवार मोडेलहरू 90+, Parakeet ~25, अन्य फरक हुन्छन्। "स्वचालित पत्ता लगाउनुहोस्" चयन गर्नुहोस् वा उच्चतम सटीकताका लागि भाषा निर्दिष्ट गर्नुहोस्।
शब्द-त्रुटि दर सफा अंग्रेजी अडियो मा 5-10% छ, 10-20% हल्ला वा accented अडियो मा। एउटै वास्तुकला को ठूलो प्रकार्यहरू अर्थपूर्ण रूपमा कठिन मामला मा राम्रो गर्छन् - अडियो कच्चा छ जब ठूलो चयन।
हो - हरेक खण्ड सुरु / अन्त्य timestamps समावेश. SRT वा VTT रूपमा निर्यात र समय आफ्नो भिडियो मा सीधा मानचित्र.
ElevenLabs STT एक प्रिमियम अनुवाद इन्जिन हो। ~500–1,500 टोकन प्रति मिनेट अडियोको बारेमा। $1 = 750,000 टोकन।
MP3, WAV, M4A, FLAC, OGG, प्लस भिडियो (MP4, MOV, WebM) — हामी अडियो निकाल्ने. अधिकतम 500 मेगाबाइट प्रति अपलोड. लामो फाइलहरू? /audio/cut/ संग विभाजन वा /v1/stt/batch/ प्रयोग गर्नुहोस्।
वक्ता diarization एक अलग पास छ - टगल "diarize" मा / transcribe /. ElevenLabs STT हस्तान्तरण ह्यान्डल; diarization लेबल वक्ता 1 / वक्ता2/ आदि प्रत्येक खण्ड
हो — /batch/ ले अडियो फाइलको फोल्डर स्वीकार गर्दछ । प्रत्येक प्रतिलिपि मूल फाइलनामसँग /account/?tab=history मा पुग्छ । फोल्डर-ट्री संरक्षणका लागि API प्रयोग गर्नुहोस् ।
हो — /v1/stt/transcribe/ मा तपाईँको अडियो POST गर्नुहोस्, मोडेल="ElevenLabs STT" संग । पाठ + खण्ड + शब्द-स्तर समय चिन्हहरूको साथ JSON फर्काउँछ । /api/ मा पूर्ण सन्दर्भ छ ।
आत्म-होस्ट मोडेल हाम्रो GPUs मा अडियो राख्न; प्रिमियम एक डीपीए संग मार्फत पास. अडियो साझेदारी-सञ्झ्याल पछि मेटिएको छ (24h अनन, 7d साइन-इन). हामी आफ्नो इनपुट मा ट्रेन छैन.
हो — Free.ai transcripts को व्यावसायिक प्रयोग प्रदान गर्दछ। तपाईंले अपलोड गरेको अडियोमा अधिकार आवश्यक पर्दछ (तपाईंको आफ्नै रेकर्ड, लाइसेन्स प्राप्त सामाग्री, वा सहमतिको साथ सामग्री)।
वास्तविक समय कारक लगभग 0.05-0.2 × हो - एक 60-मिनेट पोडकास्ट 3-12 मिनेटमा प्रतिलिपि गर्दछ। प्रिमियम मोडेलहरू प्रायः छिटो समाप्त हुन्छन्। ट्याब बन्द गर्न लाम बटन प्रयोग गर्नुहोस्।