гаитии креолӣ озод

Тағйири гаитии креолӣ аудио ва видео ба матн бо AI. Суръат, дақиқ ва ройгон.

Чӣ тавр кор мекунад

  1. Гузаштан ба Free.ai Транскриптор
  2. Бор кардани гаитии креолӣ файли аудиоӣ ё видеоӣ
  3. ДИИ мо гаитии креолӣ-ро ба таври худкор муайян мекунад ва онро нусхабардорӣ мекунад
  4. Боргирии нусхаи шумо ҳамчун матн ё зерсарлавҳаҳои SRT

гаитии креолӣ Хусусиятҳои тарҷума

  • Бо истифода аз faster-whisper (бо иҷозатномаи MIT)
  • Муайянкунии худкори гаитии креолӣ забон
  • MP3, WAV, MP4, M4A, FLAC ва ғайраро дастгирӣ мекунад
  • Содироти вақт ва зерсарлавҳаҳо (SRT)
  • Бе маҳдудияти андозаи файл дар нақшаҳои пардохтшуда
  • Шахсӣ ва бехатар -- файлҳо баъди коркарди нобуд карда мешаванд

Тафсилоти забон

Забонҳогаитии креолӣ
Коди ISOht
Намунаи AIФазои фаврӣ
& НархОзод

Забонҳои иловагӣ

Намоиши ҳамаи забонҳо

Саволҳои зиёд

гаитии креолӣ забони камтар-манбаъ барои Whisper аст — large-v3-turbo дар болои 25% хатои калима қарор дорад, баъзан хеле боло. Ин нусха барои ҷустуҷӯ ва gist фоиданок аст, аммо набояд ҳамчун нашри омода ба назар гирифта шавад. Агар барои гаитии креолӣ муҳаррики дақиқи баланд дастрас бошад, мо онро ба таври худкор ворид мекунем. (Tier D, over 25% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Бале — гаитии креолӣ дар аввал аз захираи ҳаррӯзаи ройгони шумо истифода мебарад. Садо тақрибан 50 токен дар як дақиқа арзиш дорад, бинобар ин захираи ҳаррӯзаи беном чанд соат аудиоро дар як рӯз фаро мегирад. Ҳисобҳои воридшуда захираи калонтарро ба иловаи 10,000 токенҳои сабти ном мегиранд. Баъд аз ин, $1 750,000 токенҳоро (~250 соат аудио) харидорӣ мекунад.

гаитии креолӣ транскриптҳо дар стандарти UTF-8 бо орфографияи оддии забон бармегарданд.

MP3, WAV, M4A, FLAC, OGG, OPUS ва WEBM бевосита қабул карда мешаванд. Барои видео (MP4, MOV, MKV) мо шиори аудиоро аз тарафи сервер пеш аз фиристодан ба Whisper бароварда мекунем — шумо лозим нест, ки худатон чизе табдил диҳед. Яке аз каналҳо новобаста аз забони сарчашма, аз ҷумла гаитии креолӣ.

Андозаи файли беному нишон дар 500 МБ барои ҳар як файл маҳдуд аст. Ҳисобҳои воридшуда то 2 ГБ мераванд. Маҳдудияти дарозии файлҳо вуҷуд надорад - файлҳои дароз ба таври худкор ба қисмҳо ҷудо карда мешаванд (30 сония тирезаҳо бо ҳамроҳшавӣ) ва ба як нусхаи ягона бо нишонаҳои вақти пайваста пайваст карда мешаванд. Сабтҳои бисёрсоатаи гаитии креолӣ (подкастҳо, дарсҳои пурра, вохӯриҳо) хуб кор мекунанд.

Да, диаризация оратора по умолчанию включена для каждого гаитии креолӣ транскрипта. Вывод делится на сегменты как оратора 1 / оратора 2 / оратора 3 с временными метками, так что интервью, дискуссии и многосторонние встречи возвращаются с метками. Диаризация работает на отдельном моделе и работает одинаково на всех языках, которые мы поддерживаем.

Да — URL-ро ба /transcribe/youtube/ барои YouTube ё /transcribe/podcast/ барои подкастҳо (Apple, Spotify, RSS) ҷойгир кунед. Мо аудиоро боргирӣ мекунем, онро тавассути Whisper бо language=ht иҷро мекунем ва транскриптро бо нишонаҳои вақт ва нишонаҳои сухангӯ бармегардонем. Мӯҳтавои гаитии креолӣ оддӣ: лексияҳо, мусоҳибаҳо, ёддоштҳои овозӣ ва мундариҷаи YouTube дар гаитии креолӣ ҳама кор мекунанд — URL-ро ба /transcribe/youtube/ гузоред ё файлро бевосита бор кунед.

Whisper тақрибан 50 токенро дар як дақиқаи аудио сарф мекунад, бинобар ин сабти яксоата ~3000 токенро ташкил медиҳад. $1 750,000 токенро харидорӣ мекунад, ки тақрибан 250 соат аудиоро дар як доллар ташкил медиҳад. Бисёре аз истифодабарандагон ҳеҷ гоҳ чизе сарф намекунанд — захираи рӯзонаи ройгон клипҳои кӯтоҳ, хотираҳои овозӣ ва подкастҳои якдафъаинаро дар бар мегирад.

Бале — ҳам дар сатҳи сегмент (ҳар ~10-30 сония) ва ҳам дар сатҳи калима аломатҳои вақт дастрасанд. Сатҳи калима пешфарзи содироти зерсарлавҳаҳои VTT/SRT мебошад, бинобар ин сарлавҳаҳо сатҳ ба сатҳ синхронизатсия мешаванд. Дар API аломатҳои вақтро дар шакли "word" дар бадани дархост гузоред. гаитии креолӣ транскриптҳо дар стандарти UTF-8 бо орфографияи оддии забон бармегарданд.

Бале. POST аудио (multipart/form-data, field name "file") ба /v1/transcribe/ бо language=ht — ё параметри забонро барои иҷозат додани Whisper-и худмуайянкунӣ гузоред. JSON-ро бо транскрипт, сегментҳо, аломатҳои вақт ва нишонаҳои баландгӯяк бармегардонад. Истинодҳои пурра ва ҷузъҳои SDK дар /api/.

Ҳа — вақте ки тарҷума ба итмом расид, тугмаи Тарҷума ё матнро ба /translate/ ҷойгир кунед. гаитии креолӣ бо ҳамаи забонҳои дигаре, ки мо дастгирӣ мекунем (200+) ҳамроҳ мешавад. Барои протоколҳои вохӯриҳо, транскриптро тавассути /summarize/ фиристед; барои дубляж онро ба /voice/tts/ фиристед, то садоро ба забони ҳадафӣ баргардонед.

Whisper-и машқдиҳии садо дар ин сатҳ камтар кӯмак мекунад - маҳдудият миқдори гаитии креолӣ-и аудиои Whisper-ро дар вақти машқ дидааст, на садо. Аудиои студияи тоза ҳанӯз ҳам аз аудиои садо баландтар аст, аммо ҳеҷ яке ба дақиқии шумо дар забони дорои захираҳои баланд нахоҳад расид.Агар шумо хоҳед, ки файли худро дар компютери худ нигоҳ доред, шумо метавонед онро дар компютери худ зеркашӣ кунед ва онро дар компютери худ истифода баред.

Шумо Free.ai- ро дӯст медоред? Ба дӯстонатон бигӯед!

Ин саҳифаро баҳо диҳед