Free urdú Transcripció

Grava l' àudio urdú i el vídeo al text amb IA. Ràpid, precís i lliure.

Com funciona

  1. Vés a la Free.ai Transcriber
  2. Puja el fitxer urdú d' àudio o vídeo
  3. La nostra IA detecta automàticament urdú i la transcrivi automàticament
  4. Descarrega la vostra transcripció com a text o subtítols de l' SRT

Característiques urdú Transcripció

  • Powered by whisper més ràpid (Jussed MIT)
  • Detecció automàtica de l' idioma urdú
  • Suport MP3, WAV, MP4, M4A, FLAC, i més
  • Marques de temps i exportació de subtítols (RT)
  • No hi ha límits de mida de fitxer en els plans pagats
  • Els fitxers privats i assegurats s' esborraran després de processar- los

Detalls de l' idioma

Idiomaurdú
Codi ISOur
Model IALlong-whisperCity name (optional, probably does not need a translation)
PreuLliure

PMF

urdú és un llenguatge de codi mitjana per a Whisper identificador granv3-turbo terres en la banda d' error de la paraula 15- 25%. El gist de la transcripció és fiable; espera que els errors amb el nom dels tipus, hi ha errors ocasionals de codi, i el foc de curta velocitat errònia. Pla d' un pas humà per a la sortida de publicació.(Tier C, 15-25% word error rate en els conjunts de referència 61, publiquem els corbatas honests WEP en comptes de les reclamacions de màrqueting.)

Sí, "2002 urdú dibuixa una transcripció de la vostra piscina diària. Els costos d' àudio són uns 50 fitxes per minut, de manera que la piscina anònima cobreix unes poques hores d' àudio per dia. Els comptes amb signe tenen una piscina més de 10.000 fitxes de signes. Pass, 11, compra 750.000 fitxes (~2 hores d' àudio).

Les transcripcions urdú es retornen en el seu guió natiu de dreta a esquerra i es mostren correctament en qualsevol visor amb cura RTL (brows, Words, Google Docs).

MP3, WAV, M4A, FLAC, OGGG, OPUS i WBM s' accepten directament. Per a vídeo (MP4, MOV, MKV) que extractes el servidor de seguiment d' àudio abans d' enviar- lo a Whisper RODUL no necessitareu convertir- vos res. El mateix canonades independentment del llenguatge font, incloent urdú.

Les pujades anònima a més de 500 MB per fitxer. Els comptes signats van a 2 GB. La durada no és un límit dur, el fitxer s' excloguen automàticament (30 segons les finestres amb sobreposen) i s' han tornat a cosir en una sola transcripció amb marques de temps continues. Multi- hora urdú gravadores (podes, lliçons completes, treball).

Per omissió, l' altaveu de l' altaveu de l' altaveu de l' altaveu està en qüestió per a cada transcripció urdú. La sortida està segmentada com a ponent 1 / Presidenta 2 / Presidenta 3 amb segells de temps, així que entrevistes, debats del plafó i reunions multi- partit tornen a ser etiquetades. Diarització s' executa en un model separat i treballa el mateix en totes les llengües que donem suport.

Sí, bibliography enganxa l' URL a / trancrib/tube/ per YouTube o / trancrisc/ a través de fonts de podcasts (Apple, bookmarkify, RSS). El baixem a través de l' àudio Whisper amb el llenguatge=ur, i retornem la transcripció amb marques de temps i etiquetes Orador. Típic urdú contingut: WhatsApp apunta a les notes, YouTube vlogs, i el vídeo de forma curta són els carregadors més comuns de urdú que enganxa un URL a / trancribe/tube / o carrega directament l' àudio.

Whisper costa unes 50 fitxes per minut d' àudio, així que una gravació d' una hora és ~0. 000 fitxes. 11 dòlars compren 750.000 fitxes, que funciona aproximadament 250 hores d' àudio per dòlar. La majoria d' usuaris mai gasten res que la piscina pugui cobrir fragments curts, notes i podcasts d' una sola veu.

Sí, "2002 tant el nivell de segment (cada ~10- 30 segons) i estan disponibles marques de temps de paraula. El nivell de paraula és el valor per omissió per a l' exportació als subtítols VT/ SRT de manera que els títols sincronitzaen la línia de línia. En el conjunt de marques de l' API set=" word" en el cos de sol· licitud. Les transcripcions urdú es retornen en el seu guió natiu de dreta a esquerra i es mostren correctament en qualsevol visor amb cura RTL (brows, Words, Google Docs).

Sí. POST d' àudio (multipart/form- data, nom de camp "fitxer") a / v1/ trancrib / amb el llenguatge=ur o ometre el paràmetre de l' idioma per a permetre la detecció automàtica Whisper. Retorna JSON amb els segments de transcripcions, marques de temps i etiquetes d' altaveu complet i retalls SDK a / a / api/.

Sí, la transcripció una vegada ha acabat, feu clic a la traducció o enganxant el text a / traduir /. urdú parells amb qualsevol altre idioma que recol· acceptem (200+). Per a una reunió, introduïu la transcripció a través de / summarize /; per a dubbing- la enviar a /voice/ tts/ per a renderitzar l' àudio en el llenguatge de destí.

El robustaitat del soroll del Whisper encara s' aplica a urdú, però en aquest indicador d' precisió qualsevol compost de soroll extra a la taxa d' error de base de referència. Neteja l' àudio d' inici d' inici dóna resultats molt millors que les gravacions del telèfon o del portàtil.Si una transcripció torna inusable, el contacte de correu@ free.ai amb el fitxer MrYZIGER reem les fitxes i veurem si un motor diferent gestiona millor l' àudio.

Like this tool? Share it!

Valora aquesta pàgina