faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 ਟੋਕਨਾਂ ਪ੍ਰਤੀ minute

ਆਡੀਓ ਜਾਂ ਵੀਡਿਓ ਫਾਇਲ ਸੁੱਟੋ ਜਾਂ URL ਹੇਠਾਂ ਚਿਪਕਾਓ

~500 ਟੋਕਨਾਂ ਪ੍ਰਤੀ minute

faster-whisper large-v3 a ਬੋਲੀ- ਤੋਂ- ਪਾਠ ਮਾਡਲ ਹੈ, ਜੋ ਕਿ OpenAI / SYSTRAN ਨੇ ਬਣਾਇਆ ਹੈ । Accurate transcription ਉੱਤੇ ਸਭ ਤੋਂ ਮਜ਼ਬੂਤ। Free.ai GPUs ਉੱਤੇ ਸਵੈ-ਹੋਸਟ ਕੀਤਾ — ਤੁਹਾਡੀ ਰੋਜ਼ਾਨਾ ਟੋਕਨ ਪੁਲ (500 ਟੋਕਨ ਪ੍ਰਤੀ ਮਿੰਟ) ਦੇ ਖਿਲਾਫ ਮੁਫ਼ਤ ਚੱਲਦਾ ਹੈ। MIT ਅਧੀਨ ਜਾਰੀ — Free.ai ਉੱਤੇ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਮਨਜ਼ੂਰ ਹੈ।

API ਰਾਹੀਂ ਵਰਤੋਂ

OpenAI- ਅਨੁਕੂਲ REST API। ਇੱਕ ਕੁੰਜੀ ਬਣਾਓ ਅਤੇ ਇਸ ਮਾਡਲ ਨੂੰ ਸਕਿੰਟਾਂ ਵਿੱਚ ਕਾਲ ਕਰੋ।

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
API ਡੌਕੂਮੈਂਟੇਸ਼ਨ API ਕੁੰਜੀ ਲਵੋ

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

faster-whisper large-v3 ਬੋਲੀ ਆਡੀਓ ਨੂੰ ਪਾਠ ਵਿੱਚ ਤਬਦੀਲ ਕਰਦਾ ਹੈ। MP3, WAV, M4A, ਜਾਂ ਵੀਡਿਓ ਫਾਇਲ ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ faster-whisper large-v3 ਪੂਰੀ ਤਬਦੀਲ ਅਤੇ ਚੋਣਵੀਂ SRT/VTT ਸਬਟਾਈਟਲ ਨੂੰ ਟਾਈਮ-ਸਟੈਂਪ ਨਾਲ ਵਾਪਸ ਕਰ ਦੇਵੇਗਾ।

faster-whisper large-v3 ਕਈ ਭਾਸ਼ਾਵਾਂ ਨੂੰ ਹੈਂਡਲ ਕਰਦਾ ਹੈ - Whisper-ਫੈਮਿਲੀ ਮਾਡਲ 90+, Parakeet ~25, ਹੋਰ ਵੱਖਰੇ ਹਨ। "ਆਟੋ-ਖੋਜ" ਚੁਣੋ ਜਾਂ ਸਭ ਤੋਂ ਵੱਧ ਸਹੀ ਲਈ ਭਾਸ਼ਾ ਦਿਓ।

ਸ਼ਬਦ-ਗਲਤੀ ਦਰ ਸਾਫ਼ ਅੰਗਰੇਜ਼ੀ ਆਡੀਓ ਉੱਤੇ 5-10% ਹੈ, ਝੁਰੜੀਆਂ ਜਾਂ ਜ਼ੋਰਦਾਰ ਆਡੀਓ ਉੱਤੇ 10-20% ਹੈ। ਇੱਕੋ ਢਾਂਚੇ ਦੇ ਵੱਡੇ ਵੇਰੀਐਂਟ ਸਖਤ ਮਾਮਲਿਆਂ ਉੱਤੇ ਬਹੁਤ ਵਧੀਆ ਕੰਮ ਕਰਦੇ ਹਨ - ਜਦੋਂ ਆਡੀਓ ਗਿੱਲਾ ਹੋਵੇ ਤਾਂ ਵੱਡਾ ਚੁਣੋ।

ਹਾਂ — ਹਰੇਕ ਸੈਗਮੈਂਟ ਵਿੱਚ ਸ਼ੁਰੂ/ਅਖੀਰ ਟਾਈਮ-ਸਟੈਂਪ ਸ਼ਾਮਲ ਹਨ। SRT ਜਾਂ VTT ਵਾਂਗ ਐਕਸਪੋਰਟ ਕਰੋ ਅਤੇ ਟਾਈਮ ਮੈਪ ਸਿੱਧਾ ਆਪਣੇ ਵਿਡੀਓ ਉੱਤੇ ਦਿਓ।

faster-whisper large-v3 ਪਹਿਲਾਂ ਤੁਹਾਡੀ ਰੋਜ਼ਾਨਾ ਮੁਫ਼ਤ ਪੁਲ ਦੇ ਵਿਰੁੱਧ ਸਾਡੇ ਆਪਣੇ GPUs ਉੱਤੇ ਚੱਲਦਾ ਹੈ; $5 → 200,000 ਭੁਗਤਾਨ ਟੋਕਨ ਬਾਅਦ ਵਿੱਚ। ਪ੍ਰਤੀ ਮਿੰਟ ~500 ਟੋਕਨ ਦੇ ਬਾਰੇ ਵਿੱਚ।

MP3, WAV, M4A, FLAC, OGG, ਅਤੇ ਵੀਡਿਓ (MP4, MOV, WebM) — ਅਸੀਂ ਆਡੀਓ ਐਕਸਟਰੈਕਟ ਕਰਦੇ ਹਾਂ। ਵੱਧ ਤੋਂ ਵੱਧ 500 MB ਪ੍ਰਤੀ ਅੱਪਲੋਡ। ਲੰਬੀਆਂ ਫਾਇਲਾਂ? /audio/cut/ ਨਾਲ ਵੰਡੋ ਜਾਂ /v1/stt/batch/ ਵਰਤੋਂ।

ਸਪੀਕਰ ਡਾਇਰੀਜ਼ੇਸ਼ਨ ਇੱਕ ਵੱਖਰਾ ਪਾਸ ਹੈ - /transcribe/ ਉੱਤੇ "diarize" ਬਦਲੋ । faster-whisper large-v3 ਟਰਾਂਸਕਰੀਪਸ਼ਨ ਨੂੰ ਹੈਂਡਲ ਕਰਦਾ ਹੈ; ਡਾਇਰੀਜ਼ੇਸ਼ਨ ਹਰੇਕ ਸੈਗਮੈਂਟ ਨੂੰ ਸਪੀਕਰ 1 / ਸਪੀਕਰ2/ ਆਦਿ ਨਾਲ ਲੇਬਲ ਕਰਦਾ ਹੈ ।

ਹਾਂ — /batch/ ਆਡੀਓ ਫਾਇਲਾਂ ਦਾ ਫੋਲਡਰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ। ਹਰੇਕ ਟਰਾਂਸਕਰੀਪਟ ਅਸਲੀ ਫਾਇਲ ਨਾਂ ਨਾਲ /account/?tab=history ਵਿੱਚ ਪਹੁੰਚਦੀ ਹੈ। ਫੋਲਡਰ-ਲੜੀ ਸੰਭਾਲਣ ਲਈ API ਵਰਤੋਂ।

ਹਾਂ — ਆਪਣੇ ਆਡੀਓ ਨੂੰ /v1/stt/transcribe/ ਨਾਲ POST ਕਰੋ ਜਿਸ ਦਾ ਮਾਡਲ ਹੈ "faster-whisper large-v3" । ਪਾਠ + ਸੈਗਮੈਂਟ + ਸ਼ਬਦ-ਲੇਵਲ ਟਾਈਮ-ਸਟੈਂਪ ਨਾਲ JSON ਵਾਪਸ ਕਰੋ । /api/ ਵਿੱਚ ਪੂਰਾ ਹਵਾਲਾ ਹੈ ।

ਸਵੈ-ਹੋਸਟ ਮਾਡਲ ਸਾਡੇ GPU ਉੱਤੇ ਆਡੀਓ ਰੱਖਦੇ ਹਨ; ਪ੍ਰੀਮੀਅਮ ਇੱਕ DPA ਨਾਲ ਪਾਸ ਹੁੰਦਾ ਹੈ। ਸਾਂਝ-ਵਿੰਡੋ ਤੋਂ ਬਾਅਦ ਆਡੀਓ ਹਟਾ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ (24 ਘੰਟੇ ਅਣਜਾਣ,7ਦਿਨ ਲਾਗਇਨ)। ਅਸੀਂ ਤੁਹਾਡੇ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ।

ਹਾਂ — Free.ai ਟਰਾਂਸਕਰੀਪਟ ਦਾ ਵਪਾਰਕ ਵਰਤੋਂ ਦਿੰਦਾ ਹੈ। ਤੁਹਾਨੂੰ ਆਪਣੇ ਅੱਪਲੋਡ ਕੀਤੇ ਆਡੀਓ ਲਈ ਅਧਿਕਾਰ ਲੋੜੀਦੇ ਹਨ (ਆਪਣੀ ਆਪਣੀ ਰਿਕਾਰਡਿੰਗ, ਲਾਈਸੈਂਸਿਤ ਸਮੱਗਰੀ ਜਾਂ ਮਨਜ਼ੂਰੀ ਨਾਲ ਸਮੱਗਰੀ)।

ਰੀਅਲ-ਟਾਈਮ ਫੈਕਟਰ ਲਗਭਗ 0.05-0.2× ਹੈ — 60 ਮਿੰਟ ਦਾ ਪੋਡਕਾਸਟ3-12 ਮਿੰਟ ਵਿੱਚ ਟਰਾਂਸਕਰੀਪਟ ਹੁੰਦਾ ਹੈ। ਪ੍ਰੀਮੀਅਮ ਮਾਡਲ ਅਕਸਰ ਤੇਜ਼ ਹੁੰਦੇ ਹਨ। ਟੈਬ ਨੂੰ ਬੰਦ ਕਰਨ ਲਈ ਕਤਾਰ ਬਟਨ ਵਰਤੋਂ।

Free.ai ਪਸੰਦ ਹੈ? ਆਪਣੇ ਦੋਸਤਾਂ ਨੂੰ ਦੱਸੋ!

ਇਹ ਪੇਜ਼ ਰੇਟਿੰਗ