Free тибетська Транзифікація

Перелік звукових та відеофайлів тибетська на текст комп' ютерним комп' ютером. Швидкий, точний і безкоштовний.

Як це працює

  1. Перейти до Free.ai Trancesser
  2. Вивантажити ваш звуковий або відеофайл тибетська
  3. Наш комп' ютер автоматично виявляє тибетська і переписує його
  4. Звантажити ваш запис як текст або субтитри SRT

тибетська Можливості написання скриптів

  • Прискорений швидшим шепотінням (видаваною ліцензією MIT)
  • Автоматичне визначення мови тибетська
  • Підтримка MP3, WAV, MP4, M4A, FLAC тощо
  • Часові штампи і експортування субтитрів (SRT)
  • Немає обмежень на розмір файлів у оплачуваних планах
  • Закритий і безпечний -- файли буде вилучено після обробки

Подробиці про мову

Моватибетська
Код ISObo
Модель комп' ютерашвидше - шепіння
ЦінаВільно

Більше мов

Перегляд Всі мови

ЧаП

тибетська - це менш кодована мова для Whisper # велика- v3- турбома розташована вище 25% частоти помилок слів, іноді вище. Запис корисний для пошуку і gist, але його не слід вважати видавничою. Якщо рушій вищої якості стане доступним для тибетська ми автоматично прокручуємо його.(Tier D, over 25% word error rate на лавочці встановлюється ♫ Ми радше представляємо чесних WER tiers, ніж маркетингових заяв.)

Так — тибетська транскрипція спочатку використовує ваш щоденний вільний резерв. Звук коштує близько 50 жетонів за хвилину, отже анонімний щоденний резерв покриває декілька годин звуку на день. Облікові записи, які ввійшли до системи, отримують більший резерв плюс 10 000 підписних жетонів. Після цього $1 купує 750 000 жетонів (~250 годин звуку).

тибетська трансляції буде повернуто у стандартному UTF- 8 зі звичайною орфографією мови.

MP3, WAV, M4A, FLAC, OGG, OPUS і WEBM приймаються безпосередньо. Для відео (MP4, MOV, MKV) ми вилучаємо звуковий сервер доріжки, перш ніж надсилати його до Whisper # вам не потрібно перетворювати нічого самостійно. Те саме прохідне повідомлення незалежно від мови початкових кодів, зокрема тибетська.

Анонімні вивантаження з розміром приблизно 500 МБ на файл. Підписано рахунки збільшуються до 2 ГБ. Тривалість - це не пауза довготи файлів (30- секундне вікно з перекриттям) і з' єднується назад до одного запису з неперервними часовими штампами. Записи з декількома годинами тибетська (податок, повних лекцій, зустрічей) працюють добре.

Так, speak diarization виконується типово для кожного запису тибетська. Вивід складається з частин мови 1 / speaker 2 / speak 3 з часовими штампами, отже інтерв' ємування, обговорення на панелі, і зустрічі з декількома частинами повертаються з міткою. Dia Розвиток працює на окремій моделі і працює однаково між усіма мовами, які ми підтримуємо.

Так, якщо ви бажаєте вказати адресу URL у / tranocate/ youtube / для YouTube або / trancess/ tpodcast / для подач трансляції (Apple, Spotify, RSS). Ми звантажили звуковий файл, запустили його за допомогою мови Whisper=bo, а потім повернули трансляцію з часовими штампами і мітками гучного зв' язку. Типовий вміст тибетська: лекції, інтерв'ю, ноти голосу і зміст YouTube у тибетська Всі роботи ведь вставити URL до / tranocate/ youtube / або вивантажити файл напряму.

Whisper коштує близько 50 марок за хвилину аудіо, отже одногодинний запис - це ~3,000 марок. $1 купує 750 000 жетонів, які працюють приблизно 250 годин аудіо на долар. Більшість користувачів ніколи не витрачають нічого на безкоштовний пакетний пакет, ноти для голосів і однооступні трансляції.

Так, обидва частини рівня (кожен ~10- 30 секунд) і часові штампи рівня слова. Рівень слова є типовим для експорту субтитрів VTT/ SRT так, щоб підписи синхронізували рядок за рядками. На API встановлено часові штампи=" у тілі запиту. тибетська трансляції буде повернуто у стандартному UTF- 8 зі звичайною орфографією мови.

Yes. POST audio (multipart/form-data, field name "file") to /v1/transcribe/ with language=bo — or omit the language parameter to let Whisper auto-detect. Returns JSON with the transcript, segments, timestamps, and speaker labels. Full reference and SDK snippets at /api/.

Так, після завершення трансляції натисніть кнопку Перекласти або вставити текст у / translate /. тибетська пар з будь- якою іншою мовою, яку ми підтримуємо (200+). Для того, щоб за декілька хвилин зустрічі програма надсилала трансляцію через / summize /; для тюленя надішліть її до файла / yes/ tts /, щоб передати звукові дані мовою призначення.

Whisper's noise training helps less at this tier — the bottleneck is the amount of тибетська audio Whisper saw during training, not noise. Clean studio audio still beats noisy audio, but neither will reach the accuracy you would get on a high-resource language.Якщо трансляція повертається непридатною для використання, електронна пошта контакт@ free.ai з файлом } Ми перебудуємо записи і подивимося, чи буде інший рушій краще працювати з вашим звуком.

Love this tool? Share it!

Оцінити цю сторінку