Wizper (Whisper v3)
Free.ai
·
stt
·
~500 குறிகள் minute
Wizper (Whisper v3) is a உரையாடல்-உரை மாதிரி. வெளி மாதிரிகள் வழியாக வழிநடத்தப்பட்டது — ~500 டாக்கன்கள் நிமிடத்திற்கு (50% மார்கப் மேலே செலவு).
API மூலம் பயன்படுத்து
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/stt/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/wizper","audio_url":"https://..."}'
API ஆவணமாக்கல்
API விசை பெறு
அடிக்கடி கேட்கப்படும் கேள்விகள்
Wizper (Whisper v3) பேசப்பட்ட ஒலியை உரைகளாக மாற்றுகிறது. MP3, WAV, M4A, அல்லது வீடியோ கோப்பினை ஏற்றவும் Wizper (Whisper v3) முழுமையான மாற்றத்தை மற்றும் தேர்ந்தெடுக்கக்கூடிய SRT/VTT துணை தலைப்புகளை நேர அச்சிடத்துடன் திரும்பத் தரும்.
Wizper (Whisper v3) பல மொழிகளை கையாளுகிறது - Whisper-குடும்ப மாதிரிகள் 90+, Parakeet ~25, மற்றவை மாறுபடுகின்றன. "தானாகவே கண்டறியவும்" தேர்ந்தெடுக்கவும் அல்லது மிகவும் சரியான மொழியை குறிப்பிடவும்.
வார்த்தை- பிழை விகிதம் 5–10% சுத்தமான ஆங்கில ஒலியில், 10–20% சத்தமான அல்லது உச்சரிக்கப்பட்ட ஒலியில். அதே கட்டமைப்பின் பெரிய மாறுபாடுகள் கடினமான வழக்குகளில் பொருள்பட நன்றாக செய்கின்றன - ஒலி மெலிந்தால் பெரியதை தேர்ந்தெடு.
ஆம் - ஒவ்வொரு பகுதியும் துவக்க/முடிவு நேர அச்சிடலை உள்ளடக்கியது. SRT அல்லது VTT ஆக ஏற்றுமதி செய்யவும் மற்றும் நேர வரைபடத்தை உங்கள் வீடியோவில் நேரடியாக இடவும்.
Wizper (Whisper v3) என்பது ஒரு சிறந்த மொழிபெயர்ப்பு இயந்திரம். ஒலிக்கு ஒரு நிமிடத்திற்கு ~500–1,500 டாக்கன்கள். $1 = 750,000 டாக்கன்கள்.
MP3, WAV, M4A, FLAC, OGG, மற்றும் வீடியோ (MP4, MOV, WebM) — ஒலியை பிரித்தெடுக்கிறோம். ஒரு பதிவேற்றத்திற்கு அதிகபட்சம் 500 MB. நீண்ட கோப்புகள்? /audio/cut/ அல்லது /v1/stt/batch/ ஐ பயன்படுத்தி பிரிக்கவும்.
பேசுபவர் தினசரிப்படுத்தல் தனித்தனியான ஒரு பாதையாகும் - /transcribe/ இல் "diarize" மாற்றவும். Wizper (Whisper v3) தினசரிப்படுத்தலை கையாளும்; தினசரிப்படுத்தல் ஒவ்வொரு பகுதியையும் பேசுபவர் 1 / பேசுபவர்2/ etc.
ஆம் - /batch/ ஒலி கோப்புகளின் அடைவை ஏற்றுக் கொள்கிறது. ஒவ்வொன்றும் /account/?tab=history ல் துவக்க கோப்பு பெயருடன் இடம்பெறும். அடைவு-மர பாதுகாப்புக்கு API யை பயன்படுத்தவும்.
ஆம் — உங்கள் ஒலியை /v1/stt/transcribe/ க்கு POST செய்யவும் model="Wizper (Whisper v3)" உடன். JSON உரை + பகுதிகள் + வார்த்தை-மட்ட நேர அச்சிடுதல்களுடன் திரும்பும். /api/ முழு உரை உள்ளது.
தனியாக நிறுவப்பட்ட மாதிரிகள் ஒலியை எங்கள் ஜிபியூவில் வைத்திருக்கலாம்; பிரீமியம் ஒரு டிபிஏ மூலம் செல்கிறது. ஒலி பகிர்வு சாளரத்திற்குப் பிறகு நீக்கப்படுகிறது (24 மணிநேரம் அனானி, 7d நுழைவு). நாங்கள் உங்கள் உள்ளீடுகளை பயிற்சி செய்யவில்லை.
ஆம் - Free.ai வணிக பயன்பாட்டிற்கு ஒலி பதிவுகளை அனுமதிக்கிறது. நீங்கள் பதிவேற்றிய ஒலிக்கு உரிமைகள் தேவை (உங்கள் சொந்த பதிவு, உரிமம் பெற்ற பொருள் அல்லது அனுமதியுடன் உள்ளடக்கம்).
உண்மையான நேர காரணி சுமார் 0.05–0.2× — 60 நிமிடப் பட்காஸ்ட் 3–12 நிமிடங்களில் பதிவு செய்யப்படுகிறது. பிரீமியம் மாதிரிகள் பெரும்பாலும் விரைவாக முடிகிறது. தத்தலை மூட வரிசை பொத்தானை பயன்படுத்தவும்.