gaztelania libre Transkribapena

Transkribatu gaztelania audio eta bideo testu bihurtzeko AI-rekin. Azkarra, zehatza eta doakoa.

Nola funtzionatzen duen

  1. Joan hona Free.ai transkribatzailea
  2. Igo zure gaztelania audio- edo bideo-fitxategia
  3. Gure AIk automatikoki detektatzen du gaztelania eta transkribatzen du
  4. Deskargatu zure transkribapena testu edo SRT azpititulu gisa

gaztelania transkribapen-eginbideak

  • faster-whisper-ek garatua (MIT lizentzia)
  • gaztelania hizkuntzaren detekzio automatikoa
  • MP3, WAV, MP4, M4A, FLAC eta beste batzuk onartzen ditu
  • Denbora-zigilu eta azpitituluen esportazioa (SRT)
  • Fitxategi-tamaina mugarik ez ordaindutako planetan
  • Pribatua eta segurua -- fitxategiak prozesatu ondoren ezabatu egiten dira

Hizkuntzaren xehetasunak

Hizkuntzagaztelania
ISO kodeaes
AI modeloaazkarrago-xuxurlatu
PrezioaLibre

Hizkuntza gehiago

Ikusi hizkuntza guztiak

Galdera ohikoenak

Whisper large-v3-turbo-k gaztelania-en zehaztasun maila gorenean amaitzen du —hitzen errore-tasa %7tik behera erreferentzia-balio estandarretan. Praktikan, horrek esan nahi du estudioko audio garbia ia perfektua dela, eta elkarrizketa-audioa erabilgarria dela garbiketa minimoarekin.(Ikus: A, under 7% word error rate benchmark multzoetan — WER maila zintzoa argitaratzen dugu, ez merkataritza-eskaerak.)

Bai — gaztelania transkribapenak zure eguneroko token libreen multzoa erabiliko du lehenik. Audioak minutuko 50 token inguru balio ditu, beraz, eguneroko multzo anonimoak eguneko audio-ordu batzuk estaltzen ditu. Saioa hasita duten kontuek multzo handiagoa lortzen dute, eta 10.000 erregistro-token. Hori gaindituta, $1-k 750.000 token erosten ditu (~250 ordu audio).

Gaztelaniazko (Espainia), mexikar, argentinar (rioplatense), Karibeko eta Andeetako aldaerak hartzen ditu barne. Whisper nahasketa batean trebatu zen eta bost hizkuntzak eredu berean kudeatzen ditu — language=es pasatu besterik ez duzu egin behar, eta transkribapenak audioan dagoen edozein dialekto islatuko du (voseo eta seseo barne).

MP3, WAV, M4A, FLAC, OGG, OPUS eta WEBM zuzenean onartzen dira. Bideoetarako (MP4, MOV, MKV) audio-pista zerbitzaritik erauzten dugu Whisper-era bidali aurretik — ez duzu ezer bihurtu behar. Kanalizazio bera, iturburu-hizkuntza edozein dela ere, gaztelania barne.

Karga anonimoen muga fitxategi bakoitzeko 500 MB ingurukoa da. Saioa hasita dauden kontuek 2 GB-raino igo dezakete. Iraupena ez da muga gogorra - fitxategi luzeak automatikoki zatitu egiten dira (30 segundoko leihoak gainezka eginez) eta transkribapen bakar batean elkartzen dira denbora-zigilu jarraituekin. Ordu askoko gaztelania grabazioak (podcast-ak, hitzaldi osoak, bilerak) ondo funtzionatzen dute.

Bai — hizlarien diarizazioa aktibatuta dago lehenespenez gaztelania transkribapen guztietan. Irteera segmentatuta dago 1. hizlaria / 2. hizlaria / 3. hizlaria bezala, denbora-zigiluekin, beraz elkarrizketak, panel-eztabaidak eta alderdi anitzeko bilerak etiketatuta itzultzen dira. Diarizazioa eredu bereizi batean exekutatzen da eta berdin funtzionatzen du onartzen ditugun hizkuntza guztietan.

Bai — itsatsi URLa /transcribe/youtube/-n YouTube-n edo /transcribe/podcast/-n podcast-en iturrietan (Apple, Spotify, RSS). Audioa deskargatzen dugu, Whisper-en bidez exekutatzen dugu language=es erabiliz, eta transkribapena itzultzen dugu denbora-zigiluekin eta hizlariaren etiketekin. gaztelania-ren eduki tipikoa: podcastak, hitzaldiak, elkarrizketak eta YouTubeko eduki luzeak gaztelania-n dira ikusten ditugun lan-karga ohikoenak.

Whisper-ek 50 token inguru balio ditu audio-minutu bakoitzeko, ordubeteko grabazio batek ~3.000 token balio ditu. $1-k 750.000 token erosten ditu, eta horrek dolar bakoitzeko 250 orduko audioa suposatzen du. Erabiltzaile gehienek ez dute ezer gastatzen — eguneroko doako biltegiak klip laburrak, ahots-oharrak eta behin-behineko podcastak hartzen ditu.

Bai — segmentu-mailako (~10-30 segundoro) eta hitz-mailako denbora-zigiluak erabilgarri daude. Hitze-maila lehenetsia da VTT/SRT azpitituluak esportatzeko, beraz, azpitituluak lerroka sinkronizatzen dira. APIan, ezarri timestamps="word" eskaeraren gorputzean. gaztelania transkripzioak UTF-8 estandarrean itzultzen dira, hizkuntzaren ortografia arruntarekin.

Bai. POST audioa (zati anitzekoa/formulario-datuak, eremu-izena "fitxategia") /v1/transcribe/-ra language=es -rekin — edo utzi hizkuntza-parametroa bazter Whisper-ek automatikoki detektatzen uzteko. JSON itzultzen du transkribapenarekin, segmentuekin, ordu-zigiluekin eta hizlariaren etiketekin. Erreferentzia osoa eta SDK-ren zatiak /api/-n.

Bai — transkribapena amaitu ondoren, egin klik Itzultzean edo itsatsi testua /translate/-en. gaztelania bikoteak onartzen ditugun beste hizkuntza guztiekin (200+). Bilera-aktak egiteko, transkribapena /summarize/-en bidez igorri behar da; bikoizteko, bidali /voice/tts/-ra, helburuko hizkuntzan audioa errendatzeko.

Whisper 680.000 orduko benetako munduko audio zaratatsuan trebatu da, beraz, gaztelania transkribapena atzeko planoko zaratari, musika-oheei eta telefono-kalitatearen grabazioei aurre egiteko gai da. Mozketa larriak edo gainezkatutako bozgorailu anitzek oraindik ere kalte egingo diote zehaztasunari.Transkripzio bat erabilgaitza bada, bidali email bat contact@free.ai helbidera fitxategiarekin — tokenak itzuliko ditugu eta beste motor batek zure audioa hobeto kudeatzen duen begiratuko dugu.

Free.ai maite duzu?

Balioetsi orrialde hau