Phiên âm Tiếng Ba Tư miễn phí
Phiên dịch Tiếng Ba Tư âm thanh và video thành văn bản với AI. Nhanh, chính xác và miễn phí.
Nó hoạt động thế nào?
- Đi tới Free.ai Transcriber
- Tải lên tập tin âm thanh hoặc video Tiếng Ba Tư của bạn
- AI của chúng tôi tự động phát hiện Tiếng Ba Tư và phiên âm nó
- Tải bản ghi của bạn dưới dạng văn bản hoặc phụ đề SRT
Tiếng Ba Tư Tính năng phiên âm
- ✓Được cung cấp bởi faster-whisper (giấy phép MIT)
- ✓Tự động phát hiện ngôn ngữ Tiếng Ba Tư
- ✓Hỗ trợ MP3, WAV, MP4, M4A, FLAC, và nhiều hơn
- ✓Xuất khẩu dấu thời gian và phụ đề (SRT)
- ✓Không giới hạn kích thước tập tin trên các gói trả tiền
- ✓Độc lập và an toàn -- tập tin sẽ bị xoá sau khi xử lý
Chi tiết ngôn ngữ
| Ngôn ngữ | Tiếng Ba Tư |
| Mã ISO | fa |
| Mô hình AI | Nhanh hơn thì thầm |
| Giá | Tự do |
Nhiều ngôn ngữ hơn
Xem tất cả ngôn ngữCâu hỏi thường gặp
Tiếng Ba Tư là một ngôn ngữ trung bình cho Whisper — large-v3-turbo nằm trong khoảng lỗi từ 15-25%. Tổng thể của bản ghi là đáng tin cậy; chờ đợi lỗi tên thực thể, thỉnh thoảng lỗi chuyển mã, và lỗi phát âm ngắn. Kế hoạch một lượt người cho kết quả xuất bản chất lượng.(Tier C, 15-25% word error rate on benchmark sets — chúng tôi công bố các cấp WER trung thực hơn là tuyên bố tiếp thị.)
Có — Tiếng Ba Tư transcription rút từ nguồn token miễn phí hàng ngày của bạn trước. Âm thanh tốn khoảng 50 token mỗi phút, vì vậy nguồn ẩn danh hàng ngày bao gồm vài giờ âm thanh mỗi ngày. Tài khoản đăng nhập nhận được một nguồn lớn hơn cộng với 10.000 token đăng ký. Sau đó, $1 mua 750.000 token (~250 giờ âm thanh).
Các bản ghi Tiếng Ba Tư được trả về trong kịch bản từ phải sang trái bản địa của chúng và hiển thị chính xác trong bất kỳ trình xem RTL-aware nào (trình duyệt, Word, Google Docs).
MP3, WAV, M4A, FLAC, OGG, OPUS, và WEBM được chấp nhận trực tiếp. Đối với video (MP4, MOV, MKV) chúng tôi trích xuất các đoạn âm thanh bên máy chủ trước khi gửi nó đến Whisper — bạn không cần phải tự chuyển đổi bất cứ thứ gì. Cùng một đường ống bất kể ngôn ngữ nguồn, bao gồm Tiếng Ba Tư.
Tải lên ẩn danh giới hạn khoảng 500 MB mỗi tập tin. Tài khoản đăng nhập lên đến 2 GB. Thời gian không phải là giới hạn cứng — các tập tin dài sẽ được chia nhỏ tự động (cửa sổ 30 giây với chồng chéo) và ghép lại thành một bản ghi duy nhất với dấu thời gian liên tục. Các bản ghi Tiếng Ba Tư nhiều giờ (podcast, bài giảng đầy đủ, cuộc họp) hoạt động tốt.
Vâng — mặc định, việc ghi lại các người nói được bật cho mỗi bản ghi âm Tiếng Ba Tư. Kết quả được phân chia thành Người nói 1 / Người nói 2 / Người nói 3 với dấu thời gian, vì vậy các cuộc phỏng vấn, thảo luận, và các cuộc họp đa bên sẽ được đánh dấu. Việc ghi lại được chạy trên một mô hình riêng và hoạt động giống nhau trên tất cả các ngôn ngữ chúng tôi hỗ trợ.
Có — dán URL vào /transcribe/youtube/ cho YouTube hoặc /transcribe/podcast/ cho podcast (Apple, Spotify, RSS). Chúng tôi tải về âm thanh, chạy nó qua Whisper với language=fa, và trả lại bản ghi với dấu thời gian và nhãn người nói. Nội dung Tiếng Ba Tư điển hình: các đoạn clip tin tức, thuyết giảng, bài giảng, và phỏng vấn chính trị trong Tiếng Ba Tư là những công việc phổ biến nhất; dán URL YouTube vào /transcribe/youtube/ hoặc tải lên tập tin.
Whisper có giá khoảng 50 token mỗi phút âm thanh, vì vậy một giờ ghi âm là ~ 3.000 token. $ 1 mua 750.000 token, tương đương khoảng 250 giờ âm thanh mỗi đô la. Hầu hết người dùng không bao giờ tiêu tốn gì cả - nguồn miễn phí hàng ngày bao gồm các đoạn phim ngắn, ghi chú giọng nói và podcast một lần.
Có — cả dấu thời gian cấp đoạn (mỗi ~10-30 giây) và cấp từ đều có sẵn. Mặc định là cấp từ cho xuất nhập phụ đề VTT/SRT vì vậy phụ đề đồng bộ hóa từng dòng. Trên API đặt timestamps="word" trong cơ thể yêu cầu. Các bản ghi Tiếng Ba Tư được trả về trong kịch bản từ phải sang trái bản địa của chúng và hiển thị chính xác trong bất kỳ trình xem RTL-aware nào (trình duyệt, Word, Google Docs).
Có. POST âm thanh (multipart/form-data, field name "file") to /v1/transcribe/ with language=fa — hoặc bỏ qua tham số ngôn ngữ để cho phép Whisper tự động phát hiện. Trả lại JSON với bản dịch, các phân đoạn, dấu thời gian, và nhãn loa. Tất cả tham chiếu và đoạn SDK tại /api/.
Có — khi phiên dịch hoàn tất, nhấn vào Translate hoặc dán văn bản vào /translate/. Tiếng Ba Tư kết hợp với mọi ngôn ngữ khác chúng tôi hỗ trợ (200+). Đối với các bản ghi của cuộc họp, gửi phiên dịch qua /summarize/; cho việc lồng tiếng, gửi nó đến /voice/tts/ để tạo âm thanh bằng ngôn ngữ mục tiêu.
Tính bền vững của tiếng ồn của Whisper vẫn áp dụng trên Tiếng Ba Tư, nhưng ở cấp độ chính xác này, bất kỳ tiếng ồn nào thêm vào sẽ làm tăng tỉ lệ lỗi cơ sở. Âm thanh của tai nghe sạch sẽ cho kết quả tốt hơn đáng kể so với ghi âm từ điện thoại hoặc micro máy tính xách tay.Nếu một bản ghi lại trở lại không thể sử dụng, gửi email contact@free.ai với tập tin — chúng tôi sẽ hoàn lại tiền và xem xem một engine khác có xử lý âm thanh của bạn tốt hơn không.