Fal Speech-to-Text

Free.ai · stt · ~500 ھەر بىرىگە توكى minute

ئاۋاز ياكى سىن ھۆججىتىنى چۈشۈرىدۇ ياكى URL نى ئاستىغا قويىدۇ

~500 ھەر بىرىگە توكى minute
بىزنىڭ GPU لىرىمىزدا ھەقسىز ئىشلەيدۇ. يېڭىلاش Fal Speech-to-Text →

Fal Speech-to-Text a سۆزدىن-ماقالە تىپى نىڭ بىر قىسمى. 500 توكىلارنى ھەر مىنۇتتا (50% لىق ماركاپنى ئۈستۈنكى قىممەتتىن) ئارقىلىق يوللىنىدۇ.

API ئارقىلىق ئىشلىتىش

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/speech-to-text","audio_url":"https://..."}'
API پۈتۈكلىرى API ئاچقۇچىنى ئېلىش

كۆپ سورالغان سوئاللار

Fal Speech-to-Text سۆزلەنگەن ئاۋازنى تېكىستكە ئايلاندۇرۇپ بېرىدۇ. MP3، WAV، M4A ياكى سىن ھۆججىتىنى يۈكلەپ بېرىپ Fal Speech-to-Text نىڭ ۋاقتىنى كۆرسىتىپ، تولۇق ئاۋازنى ۋە تاللاشقا بولىدىغان SRT/VTT قىستۇرمىسىنى قايتۇرۇپ بېرىدۇ.

Fal Speech-to-Text نۇرغۇن تىللارنى قوللايدۇ — Whisper-family model 90+ نى قوللايدۇ، Parakeet ~25 نى قوللايدۇ، باشقا تىللار ئۆزگىرىشچان. ئەڭ توغرا بولۇشى ئۈچۈن «ئۆزلۈكىدىن بايقاش» نى تاللاڭ ياكى تىلنى كۆرسىتىڭ.

سۆز خاتالىق نىسبىتى 5-10% بولغاندا، ئاۋازلىق ئىنگىلىزچە، 10-20% بولغاندا ئاۋازلىق ياكى ئاۋازلىق ئاۋازلىق. ئوخشاش قۇرۇلما چوڭ نۇسخىلىرى بەكرەك ياخشى ئىشلەيدۇ - ئاۋازلىق بەك قىيىن بولسا چوڭ نۇسخىنى تاللاڭ.

ئۇنداق — ھەر بىر بۆلەككە باشلىنىش/ئاخىرلىنىش ۋاقىت بەلگىسى كىرگۈزۈلگەن. SRT ياكى VTT شەكلىدە ئېكسپورت قىلسىڭىز، ۋاقىت بەلگىسى توغرا سىنغا كىرگۈزۈلىدۇ.

Fal Speech-to-Text بىر ئالاھىدە تىپتىكى يېزىق ئۆزگەرتىش ماشىنىسى. ھەر مىنۇتتا ~500-1,500 توكىۇن. $1 = 750,000 توكىۇن.

MP3، WAV، M4A، FLAC، OGG، ھەمدە سىن (MP4، MOV، WebM) — ئاۋازنى چىقىرىۋېتىمىز. ھەر قېتىم يوللاشتا ئەڭ كۆپ 500 ميگابايت. ئۇزۇن ھۆججەتلەرنى /audio/cut/ ياكى /v1/stt/batch/ بىلەن ئايرىۋېتىش كېرەكمۇ؟

Fal Speech-to-Text نىڭ قوللىشى بىلەن تەرجىمە قىلىنىدۇ؛ diarization ھەر بىر بۆلەكنى Speaker 1 / Speaker 2 / قاتارلىقلار بىلەن چەكلەيدۇ.

ھەئە — /batch/ ئۈن ھۆججەتلىرىنى قوزغاتىدۇ. ھەر بىر قوزغاتقۇچ /account/?tab=history غا ئەسلى ھۆججەت نامى بىلەن چۈشىدۇ. مۇندەرىجە دەرەخىنى ساقلاش ئۈچۈن API نى ئىشلىتىڭ.

ئۇنداق — ئۈنىڭىزنى /v1/stt/transcribe/ غا POST قىلىپ، model="Fal Speech-to-Text" نى قويۇڭ. تېكىست + قىسمى + سۆز دەرىجىسىدىكى ۋاقىت بەلگىسى بىلەن JSON نى قايتۇرىدۇ. /api/ نىڭ تولۇق ئىزاھاتى بار.

ئۆز-ئۆزىنى باشقۇرىدىغان مودىللار ئۈننى گرافىكىلىق بىرلىككە كەلتۈرگۈچتە ساقلايدۇ؛ ئالىي دەرىجىلىكلەر DPA ئارقىلىق ئۆتۈپ كېتىدۇ. ئۈن ھەمبەھىرلەش كۆزنەكىدىن كېيىن يوقىلىدۇ (24 سائەت بىخەتەر، 7 كۈن كىرگەندىن كېيىن). بىز سىزنىڭ كىرگۈزگەن ئۇچۇرلىرىڭىزنى تەربىيەلەمەيمىز.

ھەئە — Free.ai نىڭ يازمىلىرىنى تىجارەت قىلىشقا بولىدۇ. ئۈننى كۆچۈرۈش ھوقۇقى (ئۆزىڭىزنىڭ يازمىلىرى، ئىجازەتنامە بىلەن يازمىلارنى كۆچۈرۈش ھوقۇقى ياكى ئىجازەت بىلەن يازمىلارنى كۆچۈرۈش ھوقۇقى) سىزگە كېرەك.

60 مىنۇتلۇق پودكاستى 3-12 مىنۇت ئىچىدە يېزىلغان. Premium تىپىدىكى پروگرامما كۆپىنچە تېزرەك تاماملايدۇ. بەت بېتىنى تاقايدىغان بولساق، ئالدىنقى قاتارغا قويغۇچنى ئىشلىتىمىز.

Free.ai نى ياخشى كۆرەمسىز؟ دوستلىرىڭىزغا ئېيتىپ بېرىڭلار!

بۇ بەت