faster-whisper large-v3

Free.ai (self-hosted) · stt · ~500 Токен minute

Аудио эсвэл видео файлыг буцаах эсвэл URL-ийг доошоо байрлуулах

~500 Токен minute

faster-whisper large-v3 нь a ярианаас-мэдээлэл-рүү загвар-ийн OpenAI / SYSTRAN-ээр бүтээсэн хэсэг юм. 1995 онд "Best of" цомог гаргажээ. Free.ai GPU дээр өөрийн хосттой — таны өдөр тутмын токен нөөц (500 токен минут)-ийн эсрэг үнэгүй ажиллана. MIT-ийн дор хэвлэгдсэн — Free.ai дээр худалдааны зорилгоор ашиглах зөвшөөрөлтэй.

API- ээр ашиглах

OpenAI-тай нийцтэй REST API. Алгаалгын түлхүүр үүсгэж секундэд энэ загварыг дуудна.

curl -X POST https://api.free.ai/v1/stt/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"faster-whisper-large-v3","audio_url":"https://..."}'
Хяналт API түлхүүрийг авах

Заримдаа асуудаг асуултууд

faster-whisper large-v3 нь яриаг текст болгон хөрвүүлдэг. MP3, WAV, M4A, эсвэл видео файлыг татаж аваад faster-whisper large-v3 нь бүрэн хөрвүүлэлтийг болон сонгох боломжтой SRT/VTT субтитрүүдийг цагны тэмдэгтэй хамт буцаана.

faster-whisper large-v3 нь олон тооны хэлийг дэмждэг. Whisper-ийн төрөл нь 90+ хэлийг дэмждэг, Parakeet нь ~25 хэлийг дэмждэг, бусад нь өөр өөр байдаг. "авто-шинжилгээ"-г сонгох эсвэл хамгийн нарийн хэлийг заах.

Англи хэлний үгийн алдааны хувь нь цэвэр Англи хэлний аудиод 5-10%, чимээ ихтэй эсвэл өнгөлөг аудиод 10-20% байдаг. Ижил бүтэцтэй том хувилбарууд хатуу утгатай тохиолдолд илүү сайн ажилладаг - дууны чанар муутай үед том хувилбарыг сонгоно.

Тийм ээ — бүх хэсгүүд эхлэх/ дуусах цагийг агуулдаг. SRT эсвэл VTT хэлбэрээр экспортлох ба цагийг шууд видеонд оруулах.

faster-whisper large-v3 нь бидний өөрийн GPU дээр өдөр тутмын үнэгүй нөөцтэй тэмцэж эхлэх ба дараа нь $5 → 200,000 төлбөртэй жетоноор тоглоно. минутанд ~500 жетоноор тоглоно.

MP3, WAV, M4A, FLAC, OGG, мөн видео (MP4, MOV, WebM) — аудиог татаж авна. Нэг өргөтгөлд 500 МБ хүртэл. Хэт урт файлууд? /audio/cut/ эсвэл /v1/stt/batch/ ашиглан хуваана уу.

Хөгжмийн зохиолчдын диариз нь тусгай дамжуулалт юм — /transcribe/ дээр "diarize" -ийг идэвхжүүл. faster-whisper large-v3 нь орчуулгыг хариуцна; диариз нь бүрэлдэхүүн хэсгүүдийг 1-р хөгжимчин / 2-р хөгжимчин / гэх мэтээр тэмдэглэнэ.

Тийм ээ — /batch/ нь аудио файлын хавтсыг хүлээн авдаг. Бүх бичлэгүүд /account/?tab=history-д ордог. Бусад файлуудыг хадгалахдаа API-г ашиглана уу.

Тийм — Аудио файлаа /v1/stt/transcribe/ руу POST хийж "faster-whisper large-v3" загварыг ашиглана. JSON текст + хэсгүүд + үгийн түвшний цаг хугацааны тэмдэглэгээг буцаана. /api/ нь бүрэн холбоостой.

Өөрийн сервертэй загварууд дууг GPU дээр хадгална; Premium нь DPA-г ашиглан дууг дамжуулна. Хөгжим хуваалцах цонхны дараа дууг устгана (24 цаг аноним, 7 хоног бүртгэлтэй). Бид таны оруулсан мэдээллийг ашиглахгүй.

Тийм — Free.ai нь бичлэгийг худалдааны зорилгоор ашиглах эрхийг олгоно. Та өөрийн өргөтгсөн аудио файлын эрхийг (өөрөө бичсэн, лицензтэй материал, эсвэл зөвшөөрөлтэй агуулга) авах шаардлагатай.

Үнэгүй хувилбар нь 60 минутын подкастыг 3-12 минутад бичнэ. Үнэтэй хувилбар нь илүү хурдан дуусна. Хуудасыг хаахын тулд хүлээх товчийг дарна уу.

Free.ai-ыг хайрладаг уу? Найзуудаа хэлж өгөөрэй!

Энэ хуудсыг үнэл