hind pulsuz transkripsiya

hind audio və videonu AI ilə mətnə çevir. Tez, dəqiq və pulsuz.

İşə Gəlməsi

  1. _Get Free.ai transkriptoru
  2. hind audio və ya video faylı yüklə
  3. Bizim AI hind-i avtomatik olaraq aşkar edib onu transkriptləşdirir
  4. Transkripsiyanı mətn və ya SRT subtitle olaraq yüklə

hind transkripsiya xüsusiyyəti

  • faster-whisper tərəfindən dəstəklənir (MIT lisenziyalıdır)
  • hind dilini avtomatik aşkarla
  • MP3, WAV, MP4, M4A, FLAC və daha çoxunu dəstəkləyir
  • Zaman damğaları və altyazılar ixracatı (SRT)
  • Fayl ölçüsü limiti yoxdur
  • Xüsusi və təhlükəsiz -- fayllar işləmədən sonra silinir

Dil Məlumatları

Dilhind
ISO koduhi
Modeldaha sürətli pıçıldaşma
QiymətPulsuz

FAQ

Whisper large-v3-turbo hind-i düzgün idarə edir - 7-15% söz səhv dərəcəsi benchmark audioda. Adlı obyektlər, nömrələr və sıx texniki sözlüklər üzərində bəzi dəyişikliklər gözləyin; transkriptin böyük hissəsi düzgün olacaq.(Tier B, 7-15% word error rate on benchmark sets — biz marketinq iddialarından daha çox doğru WER tierlərini yayımlayırıq.)

Bəli — hind transkripsiya əvvəlcə günlük pulsuz tokenlərinizi alır. Audio bir dəqiqədə 50 tokenə başa gəlir, buna görə də anonim günlük pool gündəlik bir neçə saat audionu əhatə edir. Giriş etmiş hesablar daha böyük bir pool və 10,000 qeydiyyat tokenini alır. Bundan sonra, $1 750,000 token (~250 saat audio) alır.

Hindi səsi şəhər danışıqlarında tez-tez İngilis dili ilə (Hinglish) qarışdırılır. Whisper qarışığı idarə edir və İngilis sözlərini latın əlifbasında və Hindi sözlərini Devanagari əlifbasında eyni transkriptdə transkriptləşdirir. Kəndli danışıqlarda ağır regional lüğət C səviyyəli dəqiqliyə çata bilər.

MP3, WAV, M4A, FLAC, OGG, OPUS və WEBM formatları doğrudan qəbul edilir. Video üçün (MP4, MOV, MKV) səs-təkrarını Whisper-ə göndərmədən əvvəl server tərəfində çıxarırıq - siz heç nəyi öz əlinizlə çevirməyə ehtiyacınız yoxdur. Mənbə dili ilə bağlı olaraq eyni boru kəməri, hind də daxil olmaqla.

Anonim yükləmələr hər fayl üçün təxminən 500 MB-a qədərdir. Giriş edilmiş hesablar 2 GB-a qədərdir. Uzunluğu məhdudlaşdırmaq mümkün deyil - uzun fayllar avtomatik olaraq parçalanır (30 saniyəlik pəncərələr üst-üstə düşür) və tək bir transkriptə davamlı vaxt damğaları ilə birləşdirilir. Bir neçə saatlıq hind qeydləri (podkastlar, tam dərslər, görüşlər) yaxşı işləyir.

Bəli — hər bir hind transkripti üçün səsləndiricinin diarizasiyası ön qurğulu olaraq işə salınıb. Çıxış 1-ci / 2-ci / 3-cü səsləndirici kimi vaxt damğaları ilə segmentləşdirilir, buna görə də müsahibələr, panel müzakirələri və çox tərəfli görüşlər etiketlənmiş olaraq geri gəlir. Diarizasiya ayrı bir model üzərində işləyir və bütün dəstəklədiyimiz dillərdə eyni şəkildə işləyir.

Bəli — URL-i YouTube üçün /transcribe/youtube/ və ya podcast axınları üçün /transcribe/podcast/-ə yapışdırın (Apple, Spotify, RSS). Audionu yükləyirik, language=hi ilə Whisper-dən keçiririk və vaxt işarə və səsləndirici etiketləri ilə transkripti geri qaytarırıq. Tipik hind məzmunu: WhatsApp səsli qeydləri, YouTube vloqları və qısa videolar ən çox yayılmış hind iş yükləridir — URL-ni /transcribe/youtube/-ə yapışdır və ya səsi doğrudan yüklə.

Whisper-in audionun bir dəqiqəsi üçün 50 token dəyəri var, buna görə də bir saatlıq qeyd ~3,000 token dəyərindədir. $1 750,000 token satın alır, bu da dollar başına təxminən 250 saat audioya bərabərdir. Çox istifadəçi heç nə xərcləmir - günlük pulsuz pul qısa kliplər, səsli qeydlər və birdəfəlik podcastlar üçündür.

Bəli — həm segment səviyyəli (hər ~10-30 saniyədə) həm də söz səviyyəli vaxt damğaları mövcuddur. Söz səviyyəsi VTT/SRT altyazıları ixrac etmək üçün ön qurğudur, buna görə də altyazılar sətir-sətir sinxronlaşdırılır. API-də tələbin bədənində timestamps="word"-u təyin et. hind transkriptləri Devanagari yazısı (UTF-8) ilə geri qaytarılır.

Bəli. Audionu (multipart/form-data, sahənin adı "file") language=hi ilə /v1/transcribe/-ə POST et - ya da Whisper-in avtomatik aşkarlamasına imkan vermək üçün dil parametrini burax. Transkript, segmentlər, vaxt damğaları və səsləndirici etiketləri ilə JSON geri qaytarır. Tam istinad və SDK parçaları /api/-dədir.

Bəli — transkripsiya bitdikdən sonra, Tərcümə düyməsini basın və ya mətni /translate/-ə yapışdırın. hind dəstəklədiyimiz hər hansı bir dillə uyğun gəlir (200+). Toplantı protokolları üçün transkripsiya /summarize/-ə göndərilir; dublaj üçün isə /voice/tts/-ə göndərilir ki, audio məqsəd dili ilə göstərilsin.

Whisper yüz minlərlə saat real səslə təlim edilmişdir, buna görə də arxa plan səsini və hind üzərindəki telefon keyfiyyətli qeydləri qəbul edir. Ən yaxşı nəticələr üçün təmiz səs (mikrofon, musiqi yataqsız) təmin edin - bu səviyyədə səs əsas xəta dərəcəsini artırır.Əgər transkript istifadə edilməmiş halda geri gəlsə, contact@free.ai ünvanına faylla birlikdə e-poçt göndərin — biz sizə tokenləri geri qaytaracağıq və başqa bir motorun sizin audionuzu daha yaxşı idarə edə biləcəyini görəcəyik.

Free.ai-i sevirsiniz? Dostlarınıza deyin!

Bu səhifəni qiymətləndir