Phiên âm Tiếng La-tinh miễn phí

Phiên dịch Tiếng La-tinh âm thanh và video thành văn bản với AI. Nhanh, chính xác và miễn phí.

Nó hoạt động thế nào?

  1. Đi tới Free.ai Transcriber
  2. Tải lên tập tin âm thanh hoặc video Tiếng La-tinh của bạn
  3. AI của chúng tôi tự động phát hiện Tiếng La-tinh và phiên âm nó
  4. Tải bản ghi của bạn dưới dạng văn bản hoặc phụ đề SRT

Tiếng La-tinh Tính năng phiên âm

  • Được cung cấp bởi faster-whisper (giấy phép MIT)
  • Tự động phát hiện ngôn ngữ Tiếng La-tinh
  • Hỗ trợ MP3, WAV, MP4, M4A, FLAC, và nhiều hơn
  • Xuất khẩu dấu thời gian và phụ đề (SRT)
  • Không giới hạn kích thước tập tin trên các gói trả tiền
  • Độc lập và an toàn -- tập tin sẽ bị xoá sau khi xử lý

Chi tiết ngôn ngữ

Ngôn ngữTiếng La-tinh
Mã ISOla
Mô hình AINhanh hơn thì thầm
GiáTự do

Nhiều ngôn ngữ hơn

Xem tất cả ngôn ngữ

Câu hỏi thường gặp

Tiếng La-tinh là một ngôn ngữ ít nguồn cho Whisper — large-v3-turbo có tỷ lệ lỗi từ trên 25%, đôi khi còn cao hơn. Bản ghi có ích cho việc tìm kiếm và ghi chú nhưng không nên coi là sẵn sàng xuất bản. Nếu một động cơ chính xác hơn có sẵn cho Tiếng La-tinh chúng tôi sẽ tự động gắn nó vào.(Tier D, over 25% word error rate on benchmark sets — chúng tôi công bố các cấp WER trung thực hơn là tuyên bố tiếp thị.)

Có — Tiếng La-tinh transcription rút từ nguồn token miễn phí hàng ngày của bạn trước. Âm thanh tốn khoảng 50 token mỗi phút, vì vậy nguồn ẩn danh hàng ngày bao gồm vài giờ âm thanh mỗi ngày. Tài khoản đăng nhập nhận được một nguồn lớn hơn cộng với 10.000 token đăng ký. Sau đó, $1 mua 750.000 token (~250 giờ âm thanh).

Tiếng La-tinh transcripts được trả về trong UTF-8 tiêu chuẩn với chính tả bình thường của ngôn ngữ.

MP3, WAV, M4A, FLAC, OGG, OPUS, và WEBM được chấp nhận trực tiếp. Đối với video (MP4, MOV, MKV) chúng tôi trích xuất các đoạn âm thanh bên máy chủ trước khi gửi nó đến Whisper — bạn không cần phải tự chuyển đổi bất cứ thứ gì. Cùng một đường ống bất kể ngôn ngữ nguồn, bao gồm Tiếng La-tinh.

Tải lên ẩn danh giới hạn khoảng 500 MB mỗi tập tin. Tài khoản đăng nhập lên đến 2 GB. Thời gian không phải là giới hạn cứng — các tập tin dài sẽ được chia nhỏ tự động (cửa sổ 30 giây với chồng chéo) và ghép lại thành một bản ghi duy nhất với dấu thời gian liên tục. Các bản ghi Tiếng La-tinh nhiều giờ (podcast, bài giảng đầy đủ, cuộc họp) hoạt động tốt.

Vâng — mặc định, việc ghi lại các người nói được bật cho mỗi bản ghi âm Tiếng La-tinh. Kết quả được phân chia thành Người nói 1 / Người nói 2 / Người nói 3 với dấu thời gian, vì vậy các cuộc phỏng vấn, thảo luận, và các cuộc họp đa bên sẽ được đánh dấu. Việc ghi lại được chạy trên một mô hình riêng và hoạt động giống nhau trên tất cả các ngôn ngữ chúng tôi hỗ trợ.

Có — dán URL vào /transcribe/youtube/ cho YouTube hoặc /transcribe/podcast/ cho podcast (Apple, Spotify, RSS). Chúng tôi tải về âm thanh, chạy nó qua Whisper với language=la, và trả lại bản ghi với dấu thời gian và nhãn người nói. Nội dung Tiếng La-tinh điển hình: bài giảng, phỏng vấn, ghi chú âm thanh, và nội dung YouTube trong Tiếng La-tinh đều hoạt động — dán một URL vào /transcribe/youtube/ hoặc tải lên tập tin trực tiếp.

Whisper có giá khoảng 50 token mỗi phút âm thanh, vì vậy một giờ ghi âm là ~ 3.000 token. $ 1 mua 750.000 token, tương đương khoảng 250 giờ âm thanh mỗi đô la. Hầu hết người dùng không bao giờ tiêu tốn gì cả - nguồn miễn phí hàng ngày bao gồm các đoạn phim ngắn, ghi chú giọng nói và podcast một lần.

Có — cả dấu thời gian cấp đoạn (mỗi ~10-30 giây) và cấp từ đều có sẵn. Mặc định là cấp từ cho xuất nhập phụ đề VTT/SRT vì vậy phụ đề đồng bộ hóa từng dòng. Trên API đặt timestamps="word" trong cơ thể yêu cầu. Tiếng La-tinh transcripts được trả về trong UTF-8 tiêu chuẩn với chính tả bình thường của ngôn ngữ.

Có. POST âm thanh (multipart/form-data, field name "file") to /v1/transcribe/ with language=la — hoặc bỏ qua tham số ngôn ngữ để cho phép Whisper tự động phát hiện. Trả lại JSON với bản dịch, các phân đoạn, dấu thời gian, và nhãn loa. Tất cả tham chiếu và đoạn SDK tại /api/.

Có — khi phiên dịch hoàn tất, nhấn vào Translate hoặc dán văn bản vào /translate/. Tiếng La-tinh kết hợp với mọi ngôn ngữ khác chúng tôi hỗ trợ (200+). Đối với các bản ghi của cuộc họp, gửi phiên dịch qua /summarize/; cho việc lồng tiếng, gửi nó đến /voice/tts/ để tạo âm thanh bằng ngôn ngữ mục tiêu.

Luyện tập nhiễu của Whisper giúp ít ở cấp này — cổ chai là số lượng âm thanh Tiếng La-tinh Whisper thấy trong quá trình luyện tập, không phải nhiễu. Âm thanh studio sạch vẫn đánh bại âm thanh nhiễu, nhưng cả hai đều không đạt được độ chính xác bạn sẽ có trên một ngôn ngữ có nguồn tài nguyên cao.Nếu một bản ghi lại trở lại không thể sử dụng, gửi email contact@free.ai với tập tin — chúng tôi sẽ hoàn lại tiền và xem xem một engine khác có xử lý âm thanh của bạn tốt hơn không.

Love this tool? Share it!

Đánh giá trang này