hindia libre Transkribapena

Transkribatu hindia audio eta bideo testu bihurtzeko AI-rekin. Azkarra, zehatza eta doakoa.

Nola funtzionatzen duen

  1. Joan hona Free.ai transkribatzailea
  2. Igo zure hindia audio- edo bideo-fitxategia
  3. Gure AIk automatikoki detektatzen du hindia eta transkribatzen du
  4. Deskargatu zure transkribapena testu edo SRT azpititulu gisa

hindia transkribapen-eginbideak

  • faster-whisper-ek garatua (MIT lizentzia)
  • hindia hizkuntzaren detekzio automatikoa
  • MP3, WAV, MP4, M4A, FLAC eta beste batzuk onartzen ditu
  • Denbora-zigilu eta azpitituluen esportazioa (SRT)
  • Fitxategi-tamaina mugarik ez ordaindutako planetan
  • Pribatua eta segurua -- fitxategiak prozesatu ondoren ezabatu egiten dira

Hizkuntzaren xehetasunak

Hizkuntzahindia
ISO kodeahi
AI modeloaazkarrago-xuxurlatu
PrezioaLibre

Hizkuntza gehiago

Ikusi hizkuntza guztiak

Galdera ohikoenak

Whisper large-v3-turbo-k hindia ondo kudeatzen du — %7-15 hitzen errore-tasa audio-erreferentzian. Noizean behin ordezkapenak espero daitezke entitate izendunetan, zenbakietan eta hiztegi tekniko dentsoan; transkribapenaren gehiengoa zuzena izango da.(Ikus: B, 7-15% word error rate benchmark multzoetan — WER maila zintzoa argitaratzen dugu, ez merkataritza-eskaerak.)

Bai — hindia transkribapenak zure eguneroko token libreen multzoa erabiliko du lehenik. Audioak minutuko 50 token inguru balio ditu, beraz, eguneroko multzo anonimoak eguneko audio-ordu batzuk estaltzen ditu. Saioa hasita duten kontuek multzo handiagoa lortzen dute, eta 10.000 erregistro-token. Hori gaindituta, $1-k 750.000 token erosten ditu (~250 ordu audio).

Hindiko audioak sarritan kode-nahasketa egiten du ingelesarekin (Hinglish) hizkera hiritarra denean. Whisper-ek nahasketa kudeatzen du eta ingelesezko hitzak latinezko idazkeran eta hindiko hitzak Devanagari-n transkripzio berean transkripzio berean. Eskualdeko hizkera astunarekin landa hizkera C-maila-ko zehaztasunera jaitsi daiteke.

MP3, WAV, M4A, FLAC, OGG, OPUS eta WEBM zuzenean onartzen dira. Bideoetarako (MP4, MOV, MKV) audio-pista zerbitzaritik erauzten dugu Whisper-era bidali aurretik — ez duzu ezer bihurtu behar. Kanalizazio bera, iturburu-hizkuntza edozein dela ere, hindia barne.

Karga anonimoen muga fitxategi bakoitzeko 500 MB ingurukoa da. Saioa hasita dauden kontuek 2 GB-raino igo dezakete. Iraupena ez da muga gogorra - fitxategi luzeak automatikoki zatitu egiten dira (30 segundoko leihoak gainezka eginez) eta transkribapen bakar batean elkartzen dira denbora-zigilu jarraituekin. Ordu askoko hindia grabazioak (podcast-ak, hitzaldi osoak, bilerak) ondo funtzionatzen dute.

Bai — hizlarien diarizazioa aktibatuta dago lehenespenez hindia transkribapen guztietan. Irteera segmentatuta dago 1. hizlaria / 2. hizlaria / 3. hizlaria bezala, denbora-zigiluekin, beraz elkarrizketak, panel-eztabaidak eta alderdi anitzeko bilerak etiketatuta itzultzen dira. Diarizazioa eredu bereizi batean exekutatzen da eta berdin funtzionatzen du onartzen ditugun hizkuntza guztietan.

Bai — itsatsi URLa /transcribe/youtube/-n YouTube-n edo /transcribe/podcast/-n podcast-en iturrietan (Apple, Spotify, RSS). Audioa deskargatzen dugu, Whisper-en bidez exekutatzen dugu language=hi erabiliz, eta transkribapena itzultzen dugu denbora-zigiluekin eta hizlariaren etiketekin. hindia-ren eduki tipikoa: WhatsApp ahots-oharrak, YouTube vlogak eta bideo laburrak dira hindia lan-karga ohikoenak — itsatsi URL bat /transcribe/youtube/-n edo igo audioa zuzenean.

Whisper-ek 50 token inguru balio ditu audio-minutu bakoitzeko, ordubeteko grabazio batek ~3.000 token balio ditu. $1-k 750.000 token erosten ditu, eta horrek dolar bakoitzeko 250 orduko audioa suposatzen du. Erabiltzaile gehienek ez dute ezer gastatzen — eguneroko doako biltegiak klip laburrak, ahots-oharrak eta behin-behineko podcastak hartzen ditu.

Bai — segmentu-mailako (~10-30 segundoro) eta hitz-mailako denbora-zigiluak erabilgarri daude. Hitze-maila lehenetsia da VTT/SRT azpitituluak esportatzeko, beraz, azpitituluak lerroka sinkronizatzen dira. APIan, ezarri timestamps="word" eskaeraren gorputzean. hindia transkripzioak Devanagari idazkeran itzultzen dira (UTF-8).

Bai. POST audioa (zati anitzekoa/formulario-datuak, eremu-izena "fitxategia") /v1/transcribe/-ra language=hi -rekin — edo utzi hizkuntza-parametroa bazter Whisper-ek automatikoki detektatzen uzteko. JSON itzultzen du transkribapenarekin, segmentuekin, ordu-zigiluekin eta hizlariaren etiketekin. Erreferentzia osoa eta SDK-ren zatiak /api/-n.

Bai — transkribapena amaitu ondoren, egin klik Itzultzean edo itsatsi testua /translate/-en. hindia bikoteak onartzen ditugun beste hizkuntza guztiekin (200+). Bilera-aktak egiteko, transkribapena /summarize/-en bidez igorri behar da; bikoizteko, bidali /voice/tts/-ra, helburuko hizkuntzan audioa errendatzeko.

Whisper ehunka mila orduko benetako audioan trebatuta dago, beraz, atzeko planoko zaratak eta telefono-kalitatearen grabazioak onartzen ditu hindia-en. Emaitza onenak lortzeko, audio garbia eman (aurikularraren mikrofonoa, musika-oherarik ez) — maila honetan zaratak oinarrizko errore-tasa handitzen du.Transkripzio bat erabilgaitza bada, bidali email bat contact@free.ai helbidera fitxategiarekin — tokenak itzuliko ditugu eta beste motor batek zure audioa hobeto kudeatzen duen begiratuko dugu.

Free.ai maite duzu?

Balioetsi orrialde hau