ElevenLabs STT

Free.ai · stt · ~500 प्रति टोकन minute

अडियो वा भिडियो फाइल छोड्नुहोस्, वा तल यूआरएल टाँस्नुहोस्

~500 प्रति टोकन minute
यो पत्रिकाको प्रकाशक एफएमसी हो। यसका लागि स्तरबृद्धि गर्नुहोस् ElevenLabs STT →

ElevenLabs STT a पाठमा भाषण नमूना हो । बाह्य मोडेल मार्फत मार्ग — ~ 500 टोकन प्रति मिनेट (50% माथि अपस्ट्रिम लागत मा मार्कअप).

API मार्फत प्रयोग गर्नुहोस्

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/elevenlabs/speech-to-text","audio_url":"https://..."}'
मिसिलीकरण API कुञ्जी प्राप्त गर्नुहोस्

प्राय सोधिने प्रश्नहरू

ElevenLabs STT ले पाठमा बोलेको अडियो प्रतिलिपि गर्दछ । MP3, WAV, M4A, वा भिडियो फाइल अपलोड गर्नुहोस् र ElevenLabs STT ले समय चिन्हहरूसँगै पूर्ण प्रतिलिपि र वैकल्पिक SRT/VTT उपशीर्षकहरू फर्काउँछ ।

ElevenLabs STT भाषाहरूको दर्जनौं ह्यान्डल गर्दछ - Whisper-परिवार मोडेलहरू 90+, Parakeet ~25, अन्य फरक हुन्छन्। "स्वचालित पत्ता लगाउनुहोस्" चयन गर्नुहोस् वा उच्चतम सटीकताका लागि भाषा निर्दिष्ट गर्नुहोस्।

शब्द-त्रुटि दर सफा अंग्रेजी अडियो मा 5-10% छ, 10-20% हल्ला वा accented अडियो मा। एउटै वास्तुकला को ठूलो प्रकार्यहरू अर्थपूर्ण रूपमा कठिन मामला मा राम्रो गर्छन् - अडियो कच्चा छ जब ठूलो चयन।

हो - हरेक खण्ड सुरु / अन्त्य timestamps समावेश. SRT वा VTT रूपमा निर्यात र समय आफ्नो भिडियो मा सीधा मानचित्र.

ElevenLabs STT एक प्रिमियम अनुवाद इन्जिन हो। ~500–1,500 टोकन प्रति मिनेट अडियोको बारेमा। $1 = 750,000 टोकन।

MP3, WAV, M4A, FLAC, OGG, प्लस भिडियो (MP4, MOV, WebM) — हामी अडियो निकाल्ने. अधिकतम 500 मेगाबाइट प्रति अपलोड. लामो फाइलहरू? /audio/cut/ संग विभाजन वा /v1/stt/batch/ प्रयोग गर्नुहोस्।

वक्ता diarization एक अलग पास छ - टगल "diarize" मा / transcribe /. ElevenLabs STT हस्तान्तरण ह्यान्डल; diarization लेबल वक्ता 1 / वक्ता2/ आदि प्रत्येक खण्ड

हो — /batch/ ले अडियो फाइलको फोल्डर स्वीकार गर्दछ । प्रत्येक प्रतिलिपि मूल फाइलनामसँग /account/?tab=history मा पुग्छ । फोल्डर-ट्री संरक्षणका लागि API प्रयोग गर्नुहोस् ।

हो — /v1/stt/transcribe/ मा तपाईँको अडियो POST गर्नुहोस्, मोडेल="ElevenLabs STT" संग । पाठ + खण्ड + शब्द-स्तर समय चिन्हहरूको साथ JSON फर्काउँछ । /api/ मा पूर्ण सन्दर्भ छ ।

आत्म-होस्ट मोडेल हाम्रो GPUs मा अडियो राख्न; प्रिमियम एक डीपीए संग मार्फत पास. अडियो साझेदारी-सञ्झ्याल पछि मेटिएको छ (24h अनन, 7d साइन-इन). हामी आफ्नो इनपुट मा ट्रेन छैन.

हो — Free.ai transcripts को व्यावसायिक प्रयोग प्रदान गर्दछ। तपाईंले अपलोड गरेको अडियोमा अधिकार आवश्यक पर्दछ (तपाईंको आफ्नै रेकर्ड, लाइसेन्स प्राप्त सामाग्री, वा सहमतिको साथ सामग्री)।

वास्तविक समय कारक लगभग 0.05-0.2 × हो - एक 60-मिनेट पोडकास्ट 3-12 मिनेटमा प्रतिलिपि गर्दछ। प्रिमियम मोडेलहरू प्रायः छिटो समाप्त हुन्छन्। ट्याब बन्द गर्न लाम बटन प्रयोग गर्नुहोस्।

प्रेम Free.ai? आफ्नो साथीहरूलाई भन्नुहोस्!

यो पृष्ठ दर