Question 1

Phiên âm Whisper của Tiếng La-tinh chính xác như thế nào?

Accepted Answer

Tiếng La-tinh là một ngôn ngữ ít nguồn cho Whisper — large-v3-turbo có tỷ lệ lỗi từ trên 25%, đôi khi còn cao hơn. Bản ghi có ích cho việc tìm kiếm và ghi chú nhưng không nên coi là sẵn sàng xuất bản. Nếu một động cơ chính xác hơn có sẵn cho Tiếng La-tinh chúng tôi sẽ tự động gắn nó vào.(Tier D, over 25% word error rate on benchmark sets — chúng tôi công bố các cấp WER trung thực hơn là tuyên bố tiếp thị.)

Question 2

Tiếng La-tinh có dịch âm thanh thành văn bản miễn phí không?

Accepted Answer

Có — Tiếng La-tinh transcription rút từ nguồn token miễn phí hàng ngày của bạn trước. Âm thanh tốn khoảng 50 token mỗi phút, vì vậy nguồn ẩn danh hàng ngày bao gồm vài giờ âm thanh mỗi ngày. Tài khoản đăng nhập nhận được một nguồn lớn hơn cộng với 10.000 token đăng ký. Sau đó, $1 mua 750.000 token (~250 giờ âm thanh).

Question 3

Phiên bản Tiếng La-tinh sử dụng kiểu chữ và chính tả nào?

Accepted Answer

Tiếng La-tinh transcripts được trả về trong UTF-8 tiêu chuẩn với chính tả bình thường của ngôn ngữ.

Question 4

Các định dạng âm thanh nào được hỗ trợ cho phiên dịch Tiếng La-tinh?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, và WEBM được chấp nhận trực tiếp. Đối với video (MP4, MOV, MKV) chúng tôi trích xuất các đoạn âm thanh bên máy chủ trước khi gửi nó đến Whisper — bạn không cần phải tự chuyển đổi bất cứ thứ gì. Cùng một đường ống bất kể ngôn ngữ nguồn, bao gồm Tiếng La-tinh.

Question 5

Một tập tin âm thanh Tiếng La-tinh có thể dài bao nhiêu?

Accepted Answer

Tải lên ẩn danh giới hạn khoảng 500 MB mỗi tập tin. Tài khoản đăng nhập lên đến 2 GB. Thời gian không phải là giới hạn cứng — các tập tin dài sẽ được chia nhỏ tự động (cửa sổ 30 giây với chồng chéo) và ghép lại thành một bản ghi duy nhất với dấu thời gian liên tục. Các bản ghi Tiếng La-tinh nhiều giờ (podcast, bài giảng đầy đủ, cuộc họp) hoạt động tốt.

Question 6

Có phải bản ghi Tiếng La-tinh xác định các người nói khác nhau không?

Accepted Answer

Vâng — mặc định, việc ghi lại các người nói được bật cho mỗi bản ghi âm Tiếng La-tinh. Kết quả được phân chia thành Người nói 1 / Người nói 2 / Người nói 3 với dấu thời gian, vì vậy các cuộc phỏng vấn, thảo luận, và các cuộc họp đa bên sẽ được đánh dấu. Việc ghi lại được chạy trên một mô hình riêng và hoạt động giống nhau trên tất cả các ngôn ngữ chúng tôi hỗ trợ.

Question 7

Tôi có thể phiên dịch một video hay podcast của Tiếng La-tinh trên YouTube không?

Accepted Answer

Có — dán URL vào /transcribe/youtube/ cho YouTube hoặc /transcribe/podcast/ cho podcast (Apple, Spotify, RSS). Chúng tôi tải về âm thanh, chạy nó qua Whisper với language=la, và trả lại bản ghi với dấu thời gian và nhãn người nói. Nội dung Tiếng La-tinh điển hình: bài giảng, phỏng vấn, ghi chú âm thanh, và nội dung YouTube trong Tiếng La-tinh đều hoạt động — dán một URL vào /transcribe/youtube/ hoặc tải lên tập tin trực tiếp.

Question 8

Một giờ nghe nhạc của Tiếng La-tinh có giá bao nhiêu tiền?

Accepted Answer

Whisper có giá khoảng 50 token mỗi phút âm thanh, vì vậy một giờ ghi âm là ~ 3.000 token. $ 1 mua 750.000 token, tương đương khoảng 250 giờ âm thanh mỗi đô la. Hầu hết người dùng không bao giờ tiêu tốn gì cả - nguồn miễn phí hàng ngày bao gồm các đoạn phim ngắn, ghi chú giọng nói và podcast một lần.

Question 9

Tôi có thể lấy dấu thời gian ở cấp từ cho âm thanh Tiếng La-tinh không?

Accepted Answer

Có — cả dấu thời gian cấp đoạn (mỗi ~10-30 giây) và cấp từ đều có sẵn. Mặc định là cấp từ cho xuất nhập phụ đề VTT/SRT vì vậy phụ đề đồng bộ hóa từng dòng. Trên API đặt timestamps="word" trong cơ thể yêu cầu. Tiếng La-tinh transcripts được trả về trong UTF-8 tiêu chuẩn với chính tả bình thường của ngôn ngữ.

Question 10

Có một API cho phiên âm Tiếng La-tinh không?

Accepted Answer

Có. POST âm thanh (multipart/form-data, field name "file") to /v1/transcribe/ with language=la — hoặc bỏ qua tham số ngôn ngữ để cho phép Whisper tự động phát hiện. Trả lại JSON với bản dịch, các phân đoạn, dấu thời gian, và nhãn loa. Tất cả tham chiếu và đoạn SDK tại /api/.

Question 11

Tôi có thể dịch bản ghi âm của Tiếng La-tinh sang một ngôn ngữ khác không?

Accepted Answer

Có — khi phiên dịch hoàn tất, nhấn vào Translate hoặc dán văn bản vào /translate/. Tiếng La-tinh kết hợp với mọi ngôn ngữ khác chúng tôi hỗ trợ (200+). Đối với các bản ghi của cuộc họp, gửi phiên dịch qua /summarize/; cho việc lồng tiếng, gửi nó đến /voice/tts/ để tạo âm thanh bằng ngôn ngữ mục tiêu.

Question 12

Nếu âm thanh của Tiếng La-tinh có tiếng ồn hoặc chất lượng thấp thì sao?

Accepted Answer

Luyện tập nhiễu của Whisper giúp ít ở cấp này — cổ chai là số lượng âm thanh Tiếng La-tinh Whisper thấy trong quá trình luyện tập, không phải nhiễu. Âm thanh studio sạch vẫn đánh bại âm thanh nhiễu, nhưng cả hai đều không đạt được độ chính xác bạn sẽ có trên một ngôn ngữ có nguồn tài nguyên cao.Nếu một bản ghi lại trở lại không thể sử dụng, gửi email contact@free.ai với tập tin — chúng tôi sẽ hoàn lại tiền và xem xem một engine khác có xử lý âm thanh của bạn tốt hơn không.

Ngôn ngữ	Tiếng La-tinh
Mã ISO	`la`
Mô hình AI	Nhanh hơn thì thầm
Giá	Tự do

Phiên âm Tiếng La-tinh miễn phí

Nó hoạt động thế nào?

Tiếng La-tinh Tính năng phiên âm

Chi tiết ngôn ngữ

Nhiều ngôn ngữ hơn

Câu hỏi thường gặp