Question 1

faster-whisper large-v3 ਕੀ ਕਰਦਾ ਹੈ?

Accepted Answer

faster-whisper large-v3 ਬੋਲੀ ਆਡੀਓ ਨੂੰ ਪਾਠ ਵਿੱਚ ਤਬਦੀਲ ਕਰਦਾ ਹੈ। MP3, WAV, M4A, ਜਾਂ ਵੀਡਿਓ ਫਾਇਲ ਅੱਪਲੋਡ ਕਰੋ ਅਤੇ faster-whisper large-v3 ਪੂਰੀ ਤਬਦੀਲ ਅਤੇ ਚੋਣਵੀਂ SRT/VTT ਸਬਟਾਈਟਲ ਨੂੰ ਟਾਈਮ-ਸਟੈਂਪ ਨਾਲ ਵਾਪਸ ਕਰ ਦੇਵੇਗਾ।

Question 2

ਕਿੰਨੀਆਂ ਭਾਸ਼ਾਵਾਂ ਲਈ faster-whisper large-v3 ਸਹਾਇਕ ਹੈ?

Accepted Answer

faster-whisper large-v3 ਕਈ ਭਾਸ਼ਾਵਾਂ ਨੂੰ ਹੈਂਡਲ ਕਰਦਾ ਹੈ - Whisper-ਫੈਮਿਲੀ ਮਾਡਲ 90+, Parakeet ~25, ਹੋਰ ਵੱਖਰੇ ਹਨ। "ਆਟੋ-ਖੋਜ" ਚੁਣੋ ਜਾਂ ਸਭ ਤੋਂ ਵੱਧ ਸਹੀ ਲਈ ਭਾਸ਼ਾ ਦਿਓ।

Question 3

faster-whisper large-v3 ਕਿੰਨਾ ਸਹੀ ਹੈ?

Accepted Answer

ਸ਼ਬਦ-ਗਲਤੀ ਦਰ ਸਾਫ਼ ਅੰਗਰੇਜ਼ੀ ਆਡੀਓ ਉੱਤੇ 5-10% ਹੈ, ਝੁਰੜੀਆਂ ਜਾਂ ਜ਼ੋਰਦਾਰ ਆਡੀਓ ਉੱਤੇ 10-20% ਹੈ। ਇੱਕੋ ਢਾਂਚੇ ਦੇ ਵੱਡੇ ਵੇਰੀਐਂਟ ਸਖਤ ਮਾਮਲਿਆਂ ਉੱਤੇ ਬਹੁਤ ਵਧੀਆ ਕੰਮ ਕਰਦੇ ਹਨ - ਜਦੋਂ ਆਡੀਓ ਗਿੱਲਾ ਹੋਵੇ ਤਾਂ ਵੱਡਾ ਚੁਣੋ।

Question 4

ਕੀ faster-whisper large-v3 ਵਿੱਚ ਟਾਈਮ-ਸਟੈਂਪ ਸ਼ਾਮਲ ਹਨ?

Accepted Answer

ਹਾਂ — ਹਰੇਕ ਸੈਗਮੈਂਟ ਵਿੱਚ ਸ਼ੁਰੂ/ਅਖੀਰ ਟਾਈਮ-ਸਟੈਂਪ ਸ਼ਾਮਲ ਹਨ। SRT ਜਾਂ VTT ਵਾਂਗ ਐਕਸਪੋਰਟ ਕਰੋ ਅਤੇ ਟਾਈਮ ਮੈਪ ਸਿੱਧਾ ਆਪਣੇ ਵਿਡੀਓ ਉੱਤੇ ਦਿਓ।

Question 5

faster-whisper large-v3 ਪ੍ਰਤੀ ਮਿੰਟ ਕਿੰਨੀ ਕੀਮਤ ਹੈ?

Accepted Answer

faster-whisper large-v3 ਪਹਿਲਾਂ ਤੁਹਾਡੀ ਰੋਜ਼ਾਨਾ ਮੁਫ਼ਤ ਪੁਲ ਦੇ ਵਿਰੁੱਧ ਸਾਡੇ ਆਪਣੇ GPUs ਉੱਤੇ ਚੱਲਦਾ ਹੈ; $5 → 200,000 ਭੁਗਤਾਨ ਟੋਕਨ ਬਾਅਦ ਵਿੱਚ। ਪ੍ਰਤੀ ਮਿੰਟ ~500 ਟੋਕਨ ਦੇ ਬਾਰੇ ਵਿੱਚ।

Question 6

ਕੀ ਆਡੀਓ ਫਾਰਮੈਟ ਮੈਂ faster-whisper large-v3 ਉੱਤੇ ਅੱਪਲੋਡ ਕਰ ਸਕਦਾ ਹਾਂ?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, ਅਤੇ ਵੀਡਿਓ (MP4, MOV, WebM) — ਅਸੀਂ ਆਡੀਓ ਐਕਸਟਰੈਕਟ ਕਰਦੇ ਹਾਂ। ਵੱਧ ਤੋਂ ਵੱਧ 500 MB ਪ੍ਰਤੀ ਅੱਪਲੋਡ। ਲੰਬੀਆਂ ਫਾਇਲਾਂ? /audio/cut/ ਨਾਲ ਵੰਡੋ ਜਾਂ /v1/stt/batch/ ਵਰਤੋਂ।

Question 7

ਕੀ faster-whisper large-v3 ਵੱਖ ਵੱਖ ਸਪੀਕਰ ਪਛਾਣ ਸਕਦਾ ਹੈ?

Accepted Answer

ਸਪੀਕਰ ਡਾਇਰੀਜ਼ੇਸ਼ਨ ਇੱਕ ਵੱਖਰਾ ਪਾਸ ਹੈ - /transcribe/ ਉੱਤੇ "diarize" ਬਦਲੋ । faster-whisper large-v3 ਟਰਾਂਸਕਰੀਪਸ਼ਨ ਨੂੰ ਹੈਂਡਲ ਕਰਦਾ ਹੈ; ਡਾਇਰੀਜ਼ੇਸ਼ਨ ਹਰੇਕ ਸੈਗਮੈਂਟ ਨੂੰ ਸਪੀਕਰ 1 / ਸਪੀਕਰ2/ ਆਦਿ ਨਾਲ ਲੇਬਲ ਕਰਦਾ ਹੈ ।

Question 8

ਕੀ ਮੈਂ faster-whisper large-v3 ਨਾਲ ਬੈਚ ਟਰਾਂਸਕਰੀਪਟ ਕਰ ਸਕਦਾ ਹਾਂ?

Accepted Answer

ਹਾਂ — /batch/ ਆਡੀਓ ਫਾਇਲਾਂ ਦਾ ਫੋਲਡਰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ। ਹਰੇਕ ਟਰਾਂਸਕਰੀਪਟ ਅਸਲੀ ਫਾਇਲ ਨਾਂ ਨਾਲ /account/?tab=history ਵਿੱਚ ਪਹੁੰਚਦੀ ਹੈ। ਫੋਲਡਰ-ਲੜੀ ਸੰਭਾਲਣ ਲਈ API ਵਰਤੋਂ।

Question 9

ਕੀ faster-whisper large-v3 ਲਈ ਕੋਈ API ਹੈ?

Accepted Answer

ਹਾਂ — ਆਪਣੇ ਆਡੀਓ ਨੂੰ /v1/stt/transcribe/ ਨਾਲ POST ਕਰੋ ਜਿਸ ਦਾ ਮਾਡਲ ਹੈ "faster-whisper large-v3" । ਪਾਠ + ਸੈਗਮੈਂਟ + ਸ਼ਬਦ-ਲੇਵਲ ਟਾਈਮ-ਸਟੈਂਪ ਨਾਲ JSON ਵਾਪਸ ਕਰੋ । /api/ ਵਿੱਚ ਪੂਰਾ ਹਵਾਲਾ ਹੈ ।

Question 10

ਜਦੋਂ ਮੈਂ faster-whisper large-v3 ਨਾਲ ਟਰਾਂਸਕਰੀਪਟ ਕਰਾਂ ਤਾਂ ਪ੍ਰਾਈਵੇਸੀ ਬਾਰੇ ਕੀ?

Accepted Answer

ਸਵੈ-ਹੋਸਟ ਮਾਡਲ ਸਾਡੇ GPU ਉੱਤੇ ਆਡੀਓ ਰੱਖਦੇ ਹਨ; ਪ੍ਰੀਮੀਅਮ ਇੱਕ DPA ਨਾਲ ਪਾਸ ਹੁੰਦਾ ਹੈ। ਸਾਂਝ-ਵਿੰਡੋ ਤੋਂ ਬਾਅਦ ਆਡੀਓ ਹਟਾ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ (24 ਘੰਟੇ ਅਣਜਾਣ,7ਦਿਨ ਲਾਗਇਨ)। ਅਸੀਂ ਤੁਹਾਡੇ ਇੰਪੁੱਟ ਉੱਤੇ ਟਰੇਨਿੰਗ ਨਹੀਂ ਦਿੰਦੇ।

Question 11

ਕੀ faster-whisper large-v3 ਆਉਟਪੁੱਟ ਵਪਾਰਕ ਵਰਤੋਂ ਲਈ ਸੁਰੱਖਿਅਤ ਹੈ?

Accepted Answer

ਹਾਂ — Free.ai ਟਰਾਂਸਕਰੀਪਟ ਦਾ ਵਪਾਰਕ ਵਰਤੋਂ ਦਿੰਦਾ ਹੈ। ਤੁਹਾਨੂੰ ਆਪਣੇ ਅੱਪਲੋਡ ਕੀਤੇ ਆਡੀਓ ਲਈ ਅਧਿਕਾਰ ਲੋੜੀਦੇ ਹਨ (ਆਪਣੀ ਆਪਣੀ ਰਿਕਾਰਡਿੰਗ, ਲਾਈਸੈਂਸਿਤ ਸਮੱਗਰੀ ਜਾਂ ਮਨਜ਼ੂਰੀ ਨਾਲ ਸਮੱਗਰੀ)।

Question 12

faster-whisper large-v3 ਕਿੰਨਾ ਸਮਾਂ ਲੈਂਦਾ ਹੈ?

Accepted Answer

ਰੀਅਲ-ਟਾਈਮ ਫੈਕਟਰ ਲਗਭਗ 0.05-0.2× ਹੈ — 60 ਮਿੰਟ ਦਾ ਪੋਡਕਾਸਟ3-12 ਮਿੰਟ ਵਿੱਚ ਟਰਾਂਸਕਰੀਪਟ ਹੁੰਦਾ ਹੈ। ਪ੍ਰੀਮੀਅਮ ਮਾਡਲ ਅਕਸਰ ਤੇਜ਼ ਹੁੰਦੇ ਹਨ। ਟੈਬ ਨੂੰ ਬੰਦ ਕਰਨ ਲਈ ਕਤਾਰ ਬਟਨ ਵਰਤੋਂ।

faster-whisper large-v3

API ਰਾਹੀਂ ਵਰਤੋਂ

ਇਸੇ ਤਰ੍ਹਾਂ ਦੇ ਮਾਡਲ

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ

faster-whisper large-v3

API ਰਾਹੀਂ ਵਰਤੋਂ

ਇਸੇ ਤਰ੍ਹਾਂ ਦੇ ਮਾਡਲ

ਅਕਸਰ ਪੁੱਛੇ ਜਾਂਦੇ ਸਵਾਲ