मोफत फारसी प्रत
फारसी ऑडिओ व व्हिडीओला AI सह पाठ्य मध्ये रूपांतरित करा. जलद, अचूक व मोफत.
हे काम कसे चालते?
- याकडे जा Free.ai प्रतलेखक
- तुमचे फारसी ऑडिओ किंवा व्हिडीओ फाइल अपलोड करा
- आमचे AI फारसी आपोआप शोधते व ते लिहिते
- पाठ्य किंवा SRT उपशीर्षक म्हणून तुमचे ट्रान्सक्रिप्ट डाउनलोड करा
फारसी ट्रांसक्रिप्शन वैशिष्ट्ये
- ✓faster- whisper द्वारे चालविले जाते (MIT परवानाकृत)
- ✓फारसी भाषा आपोआप शोधा
- ✓MP3, WAV, MP4, M4A, FLAC, व इतर समर्थन पुरविते
- ✓टाइमस्टॅम्प व उपशीर्षक एक्सपोर्ट (SRT)
- ✓विनामूल्य योजनांवर फाइल आकार मर्यादा नाही
- ✓खाजगी व सुरक्षित -- प्रक्रिया केल्यावर फाइल नष्ट केले जातात
भाषा तपशील
| भाषाName | फारसी |
| ISO कोड | fa |
| एआय मॉडेल | वेगवान- विशीस्पर |
| किंमत | मोकळे |
अधिक भाषाName
सर्व भाषा पहावारंवार विचारले जाणारे प्रश्न
फारसी ही Whisper साठी मध्य-स्रोत भाषा आहे - मोठी-v3-टर्बो 15-25% शब्द त्रुटी दर बँडमध्ये उतरते. मुद्रणाचे मुख्य भाग विश्वासार्ह आहेत; नावाचा-घटक त्रुटी, काही वेळा कोड-स्विचिंग त्रुटी, आणि कमी-उच्चारण त्रुटीची अपेक्षा करा. प्रकाशन-गुणवत्तेच्या आऊटपुटसाठी मानवी पासची योजना करा. (Tier C, 15-25% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)
होय — फारसी ट्रान्सक्रिप्शन प्रथम तुमच्या रोजच्या मोफत टोकन पूलमधून काढते. ऑडिओची किंमत प्रति मिनिट सुमारे 50 टोकन आहे, म्हणून बेनामी रोजच्या पूलमध्ये दररोज काही तास ऑडिओ समाविष्ट आहे. लॉगइन खाते मोठे पूल मिळवते आणि 10,000 साइनअप टोकन. त्यापुढे, $1 ने 750,000 टोकन (~250 तास ऑडिओ) खरेदी केले जाते.
फारसी transcripts त्यांच्या मूळ उजवीकडून डावीकडे स्क्रिप्टमध्ये परत येते आणि कोणत्याही RTL-जाणता प्रदर्शक (ब्राउझर्स, वर्ड, गुगल डॉक्स) मध्ये योग्यरित्या दर्शविते.
MP3, WAV, M4A, FLAC, OGG, OPUS, व WEBM थेट स्वीकारले जातात. व्हिडीओ (MP4, MOV, MKV) साठी आम्ही ऑडिओ ट्रॅक सर्वर-साईड एक्सट्रॅक्ट करतो ते व्हिस्परला पाठविण्यापूर्वी — तुम्हाला स्वतः काहीही रूपांतरित करण्याची गरज नाही. स्त्रोत भाषा नव्हे, फारसी सह समान पाईपलाईन.
बेनामी अपलोड मर्यादा सुमारे 500 MB प्रति फाइल आहे. दाखल झालेले खाते2GB पर्यंत जाऊ शकते. कालावधी हा कठोर मर्यादा नाही - लांब फाइल स्वचलितपणे खंडीत केले जातात (30 सेकंदाच्या ओव्हरलेपसह चौकट) आणि एकत्रितपणे एकत्रित केले जातात एकत्रित वेळ स्टॅम्पसह. बहु-तास फारसी रेकॉर्डिंग (पोडकास्ट, पूर्ण व्याख्याने, बैठकी) चांगले काम करते.
होय - स्पीकर डायराइजेशन प्रत्येक फारसी ट्रान्सक्रिप्टसाठी मुलभूतरित्या चालू आहे. आऊटपुट स्पीकर 1 / स्पीकर2/ स्पीकर3याप्रमाणे वेळचिन्हांसह विभागले जाते, म्हणून मुलाखती, पॅनेल चर्चा आणि बहु-पक्ष बैठकी परत लेबल केले जातात. डायराइजेशन वेगळ्या मॉडेलवर चालते आणि आम्ही समर्थन देणाऱ्या सर्व भाषांमधून समान कार्य करते.
होय — यूट्यूबसाठी URL /transcribe/youtube/ मध्ये किंवा पॉडकास्ट फीड्ससाठी /transcribe/podcast/ मध्ये चिकटवा (ॲपल, स्पॉटीफाई, RSS). आम्ही ऑडिओ डाउनलोड करतो, language=fa द्वारे Whisper द्वारे चालवतो, आणि टाइमस्टॅम्प आणि स्पीकर लेबलसह ट्रान्सक्रिप्ट परत करतो. सामान्य फारसी सामग्री: फारसी मध्ये बातमी क्लिप्स, उपदेश, व्याख्याने आणि राजकीय मुलाखती सर्वात सामान्य कार्यभार आहेत; YouTube URL /transcribe/youtube/ मध्ये चिकटवा किंवा फाइल अपलोड करा.
व्हीस्परची किंमत प्रति मिनिट ऑडिओसाठी सुमारे ५० टोकन आहे, म्हणून एक तासाच्या रेकॉर्डिंगसाठी ~३,००० टोकन लागते. $१ ने ७५०,००० टोकन खरेदी केले जातात, जे दर डॉलरसाठी सुमारे ५० तास ऑडिओ तयार करतात.
होय — दोन्ही खंड-स्तरीय (प्रत्येक ~10-30 सेकंद) व शब्द-स्तरीय टाइमस्टॅम्प उपलब्ध आहेत. शब्द-स्तरीय VTT/SRT उपशीर्षक एक्सपोर्ट करीता मुलभूत आहे जेणेकरून शीर्षक लाइन-ब-लाइन समक्रमित होते. API वर विनंतीच्या मुख्य भागात timestamps="word" निश्चित करा. फारसी transcripts त्यांच्या मूळ उजवीकडून डावीकडे स्क्रिप्टमध्ये परत येते आणि कोणत्याही RTL-जाणता प्रदर्शक (ब्राउझर्स, वर्ड, गुगल डॉक्स) मध्ये योग्यरित्या दर्शविते.
होय. POST ऑडिओ (multipart/form-data, क्षेत्र नाव "file") to /v1/transcribe/ with language=fa — किंवा Whisper ला स्वचलितपणे शोधू देण्यासाठी भाषा परिमाण सोडून द्या. JSON मध्ये transcript, segments, timestamps, आणि speaker labels सोबत परत येते. पूर्ण संदर्भ आणि SDK स्निपेट /api/ येथे आहे.
होय — एकदा अनुवाद पूर्ण झाल्यानंतर, अनुवादित करा वर क्लिक करा किंवा /translate/ मध्ये पाठ्य चिकटवा. फारसी आम्ही समर्थन देणाऱ्या सर्व इतर भाषांशी जोडले जाते (200+). बैठकीच्या मिनिटांसाठी /summarize/ द्वारे /voice/tts/ ला पाठवा.
Whisper चे शोर स्थिरता अजूनही फारसी वर लागू होते, पण या अचूकतेच्या स्तरावर कोणत्याही अतिरिक्त शोरमुळे बेसलाइन त्रुटी दर वाढतो. स्वच्छ हेडसेट ऑडिओ फोन किंवा लॅपटॉप-माइक रेकॉर्डिंगपेक्षा चांगले परिणाम देते.जर एक प्रत वापरण्यायोग्य नसेल तर, contact@free.ai या ईमेलवर फाइल पाठवा - आम्ही टोकन परत देऊ आणि तुमच्या ऑडिओला वेगळ्या इंजिनने चांगले हाताळले आहे का हे बघू.