Phiên âm Tiếng Tây Ban Nha miễn phí
Phiên dịch Tiếng Tây Ban Nha âm thanh và video thành văn bản với AI. Nhanh, chính xác và miễn phí.
Nó hoạt động thế nào?
- Đi tới Free.ai Transcriber
- Tải lên tập tin âm thanh hoặc video Tiếng Tây Ban Nha của bạn
- AI của chúng tôi tự động phát hiện Tiếng Tây Ban Nha và phiên âm nó
- Tải bản ghi của bạn dưới dạng văn bản hoặc phụ đề SRT
Tiếng Tây Ban Nha Tính năng phiên âm
- ✓Được cung cấp bởi faster-whisper (giấy phép MIT)
- ✓Tự động phát hiện ngôn ngữ Tiếng Tây Ban Nha
- ✓Hỗ trợ MP3, WAV, MP4, M4A, FLAC, và nhiều hơn
- ✓Xuất khẩu dấu thời gian và phụ đề (SRT)
- ✓Không giới hạn kích thước tập tin trên các gói trả tiền
- ✓Độc lập và an toàn -- tập tin sẽ bị xoá sau khi xử lý
Chi tiết ngôn ngữ
| Ngôn ngữ | Tiếng Tây Ban Nha |
| Mã ISO | es |
| Mô hình AI | Nhanh hơn thì thầm |
| Giá | Tự do |
Nhiều ngôn ngữ hơn
Xem tất cả ngôn ngữCâu hỏi thường gặp
Whisper large-v3-turbo nằm trong nhóm chính xác cao nhất trên Tiếng Tây Ban Nha — dưới 7% tỷ lệ lỗi từ trên các tiêu chuẩn tiêu chuẩn. Trong thực tế, điều đó có nghĩa là âm thanh studio sạch sẽ trở lại gần như hoàn hảo, và âm thanh trò chuyện có thể sử dụng với việc dọn dẹp tối thiểu.(Tier A, under 7% word error rate on benchmark sets — chúng tôi công bố các cấp WER trung thực hơn là tuyên bố tiếp thị.)
Có — Tiếng Tây Ban Nha transcription rút từ nguồn token miễn phí hàng ngày của bạn trước. Âm thanh tốn khoảng 50 token mỗi phút, vì vậy nguồn ẩn danh hàng ngày bao gồm vài giờ âm thanh mỗi ngày. Tài khoản đăng nhập nhận được một nguồn lớn hơn cộng với 10.000 token đăng ký. Sau đó, $1 mua 750.000 token (~250 giờ âm thanh).
Tiếng Tây Ban Nha bao gồm Castilian (Tây Ban Nha), Mexico, Argentina (rioplatense), Caribbean, và Andean. Whisper được huấn luyện trên một hỗn hợp và xử lý tất cả năm trong cùng một mô hình - chỉ cần truyền language=es và bản ghi sẽ phản ánh bất kỳ phương ngữ nào trong âm thanh (bao gồm voseo và seseo).
MP3, WAV, M4A, FLAC, OGG, OPUS, và WEBM được chấp nhận trực tiếp. Đối với video (MP4, MOV, MKV) chúng tôi trích xuất các đoạn âm thanh bên máy chủ trước khi gửi nó đến Whisper — bạn không cần phải tự chuyển đổi bất cứ thứ gì. Cùng một đường ống bất kể ngôn ngữ nguồn, bao gồm Tiếng Tây Ban Nha.
Tải lên ẩn danh giới hạn khoảng 500 MB mỗi tập tin. Tài khoản đăng nhập lên đến 2 GB. Thời gian không phải là giới hạn cứng — các tập tin dài sẽ được chia nhỏ tự động (cửa sổ 30 giây với chồng chéo) và ghép lại thành một bản ghi duy nhất với dấu thời gian liên tục. Các bản ghi Tiếng Tây Ban Nha nhiều giờ (podcast, bài giảng đầy đủ, cuộc họp) hoạt động tốt.
Vâng — mặc định, việc ghi lại các người nói được bật cho mỗi bản ghi âm Tiếng Tây Ban Nha. Kết quả được phân chia thành Người nói 1 / Người nói 2 / Người nói 3 với dấu thời gian, vì vậy các cuộc phỏng vấn, thảo luận, và các cuộc họp đa bên sẽ được đánh dấu. Việc ghi lại được chạy trên một mô hình riêng và hoạt động giống nhau trên tất cả các ngôn ngữ chúng tôi hỗ trợ.
Có — dán URL vào /transcribe/youtube/ cho YouTube hoặc /transcribe/podcast/ cho podcast (Apple, Spotify, RSS). Chúng tôi tải về âm thanh, chạy nó qua Whisper với language=es, và trả lại bản ghi với dấu thời gian và nhãn người nói. Nội dung Tiếng Tây Ban Nha điển hình: podcasts, lectures, interviews, and long-form YouTube content in Tiếng Tây Ban Nha are the commonest workloads we see.
Whisper có giá khoảng 50 token mỗi phút âm thanh, vì vậy một giờ ghi âm là ~ 3.000 token. $ 1 mua 750.000 token, tương đương khoảng 250 giờ âm thanh mỗi đô la. Hầu hết người dùng không bao giờ tiêu tốn gì cả - nguồn miễn phí hàng ngày bao gồm các đoạn phim ngắn, ghi chú giọng nói và podcast một lần.
Có — cả dấu thời gian cấp đoạn (mỗi ~10-30 giây) và cấp từ đều có sẵn. Mặc định là cấp từ cho xuất nhập phụ đề VTT/SRT vì vậy phụ đề đồng bộ hóa từng dòng. Trên API đặt timestamps="word" trong cơ thể yêu cầu. Tiếng Tây Ban Nha transcripts được trả về trong UTF-8 tiêu chuẩn với chính tả bình thường của ngôn ngữ.
Có. POST âm thanh (multipart/form-data, field name "file") to /v1/transcribe/ with language=es — hoặc bỏ qua tham số ngôn ngữ để cho phép Whisper tự động phát hiện. Trả lại JSON với bản dịch, các phân đoạn, dấu thời gian, và nhãn loa. Tất cả tham chiếu và đoạn SDK tại /api/.
Có — khi phiên dịch hoàn tất, nhấn vào Translate hoặc dán văn bản vào /translate/. Tiếng Tây Ban Nha kết hợp với mọi ngôn ngữ khác chúng tôi hỗ trợ (200+). Đối với các bản ghi của cuộc họp, gửi phiên dịch qua /summarize/; cho việc lồng tiếng, gửi nó đến /voice/tts/ để tạo âm thanh bằng ngôn ngữ mục tiêu.
Whisper được huấn luyện trên 680K giờ âm thanh trong thế giới thực, vì vậy phiên âm Tiếng Tây Ban Nha rất mạnh mẽ với tiếng ồn nền, giường âm nhạc, và ghi âm chất lượng điện thoại. Cắt ghép nghiêm trọng hoặc nhiều loa chồng chéo vẫn sẽ làm giảm độ chính xác.Nếu một bản ghi lại trở lại không thể sử dụng, gửi email contact@free.ai với tập tin — chúng tôi sẽ hoàn lại tiền và xem xem một engine khác có xử lý âm thanh của bạn tốt hơn không.