faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 ھەر بىرىگە توكى minute

ئاۋاز ياكى سىن ھۆججىتىنى چۈشۈرىدۇ ياكى URL نى ئاستىغا قويىدۇ

~500 ھەر بىرىگە توكى minute

faster-whisper large-v3 a سۆزدىن-ماقالە تىپى OpenAI / SYSTRAN تەرىپىدىن ياسالغان. {best} نىڭ ئەڭ كۈچلۈكى. Free.ai GPU لاردا ئۆز-ئۆزىنى باشقۇرىدۇ — كۈندىلىك توكى توپىڭىزغا قارشى ھەقسىز ئىشلەيدۇ (500 توكى ھەر مىنۇتتا). MIT بويىچە ئېلان قىلىنغان — Free.ai گە تىجارەت قىلىشقا رۇخسەت قىلىنغان.

API ئارقىلىق ئىشلىتىش

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
API پۈتۈكلىرى API ئاچقۇچىنى ئېلىش

كۆپ سورالغان سوئاللار

faster-whisper large-v3 سۆزلەنگەن ئاۋازنى تېكىستكە ئايلاندۇرۇپ بېرىدۇ. MP3، WAV، M4A ياكى سىن ھۆججىتىنى يۈكلەپ بېرىپ faster-whisper large-v3 نىڭ ۋاقتىنى كۆرسىتىپ، تولۇق ئاۋازنى ۋە تاللاشقا بولىدىغان SRT/VTT قىستۇرمىسىنى قايتۇرۇپ بېرىدۇ.

faster-whisper large-v3 نۇرغۇن تىللارنى قوللايدۇ — Whisper-family model 90+ نى قوللايدۇ، Parakeet ~25 نى قوللايدۇ، باشقا تىللار ئۆزگىرىشچان. ئەڭ توغرا بولۇشى ئۈچۈن «ئۆزلۈكىدىن بايقاش» نى تاللاڭ ياكى تىلنى كۆرسىتىڭ.

سۆز خاتالىق نىسبىتى 5-10% بولغاندا، ئاۋازلىق ئىنگىلىزچە، 10-20% بولغاندا ئاۋازلىق ياكى ئاۋازلىق ئاۋازلىق. ئوخشاش قۇرۇلما چوڭ نۇسخىلىرى بەكرەك ياخشى ئىشلەيدۇ - ئاۋازلىق بەك قىيىن بولسا چوڭ نۇسخىنى تاللاڭ.

ئۇنداق — ھەر بىر بۆلەككە باشلىنىش/ئاخىرلىنىش ۋاقىت بەلگىسى كىرگۈزۈلگەن. SRT ياكى VTT شەكلىدە ئېكسپورت قىلسىڭىز، ۋاقىت بەلگىسى توغرا سىنغا كىرگۈزۈلىدۇ.

faster-whisper large-v3 سىزنىڭ كۈندىلىك ھەقسىز توپىڭىزغا قارشى ئالدى بىلەن بىزنىڭ GPU لىرىمىزدا ئىشلەيدۇ؛ $5 → 200،000 پۇللۇق توكىندىن كېيىن. ھەر مىنۇتتا ~500 توكىندىن كۆپرەك.

MP3، WAV، M4A، FLAC، OGG، ھەمدە سىن (MP4، MOV، WebM) — ئاۋازنى چىقىرىۋېتىمىز. ھەر قېتىم يوللاشتا ئەڭ كۆپ 500 ميگابايت. ئۇزۇن ھۆججەتلەرنى /audio/cut/ ياكى /v1/stt/batch/ بىلەن ئايرىۋېتىش كېرەكمۇ؟

faster-whisper large-v3 نىڭ قوللىشى بىلەن تەرجىمە قىلىنىدۇ؛ diarization ھەر بىر بۆلەكنى Speaker 1 / Speaker 2 / قاتارلىقلار بىلەن چەكلەيدۇ.

ھەئە — /batch/ ئۈن ھۆججەتلىرىنى قوزغاتىدۇ. ھەر بىر قوزغاتقۇچ /account/?tab=history غا ئەسلى ھۆججەت نامى بىلەن چۈشىدۇ. مۇندەرىجە دەرەخىنى ساقلاش ئۈچۈن API نى ئىشلىتىڭ.

ئۇنداق — ئۈنىڭىزنى /v1/stt/transcribe/ غا POST قىلىپ، model="faster-whisper large-v3" نى قويۇڭ. تېكىست + قىسمى + سۆز دەرىجىسىدىكى ۋاقىت بەلگىسى بىلەن JSON نى قايتۇرىدۇ. /api/ نىڭ تولۇق ئىزاھاتى بار.

ئۆز-ئۆزىنى باشقۇرىدىغان مودىللار ئۈننى گرافىكىلىق بىرلىككە كەلتۈرگۈچتە ساقلايدۇ؛ ئالىي دەرىجىلىكلەر DPA ئارقىلىق ئۆتۈپ كېتىدۇ. ئۈن ھەمبەھىرلەش كۆزنەكىدىن كېيىن يوقىلىدۇ (24 سائەت بىخەتەر، 7 كۈن كىرگەندىن كېيىن). بىز سىزنىڭ كىرگۈزگەن ئۇچۇرلىرىڭىزنى تەربىيەلەمەيمىز.

ھەئە — Free.ai نىڭ يازمىلىرىنى تىجارەت قىلىشقا بولىدۇ. ئۈننى كۆچۈرۈش ھوقۇقى (ئۆزىڭىزنىڭ يازمىلىرى، ئىجازەتنامە بىلەن يازمىلارنى كۆچۈرۈش ھوقۇقى ياكى ئىجازەت بىلەن يازمىلارنى كۆچۈرۈش ھوقۇقى) سىزگە كېرەك.

60 مىنۇتلۇق پودكاستى 3-12 مىنۇت ئىچىدە يېزىلغان. Premium تىپىدىكى پروگرامما كۆپىنچە تېزرەك تاماملايدۇ. بەت بېتىنى تاقايدىغان بولساق، ئالدىنقى قاتارغا قويغۇچنى ئىشلىتىمىز.

Free.ai نى ياخشى كۆرەمسىز؟ دوستلىرىڭىزغا ئېيتىپ بېرىڭلار!

بۇ بەت