Question 1

याचा अर्थ असा की, याचा वापर फारसी साठी Whisper transcription किती अचूक आहे?

Accepted Answer

फारसी ही Whisper साठी मध्य-स्रोत भाषा आहे - मोठी-v3-टर्बो 15-25% शब्द त्रुटी दर बँडमध्ये उतरते. मुद्रणाचे मुख्य भाग विश्वासार्ह आहेत; नावाचा-घटक त्रुटी, काही वेळा कोड-स्विचिंग त्रुटी, आणि कमी-उच्चारण त्रुटीची अपेक्षा करा. प्रकाशन-गुणवत्तेच्या आऊटपुटसाठी मानवी पासची योजना करा. (Tier C, 15-25% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)

Question 2

फारसी ऑडिओ-टू-टेक्स्ट ट्रान्सक्रिप्शन मोफत आहे का?

Accepted Answer

होय — फारसी ट्रान्सक्रिप्शन प्रथम तुमच्या रोजच्या मोफत टोकन पूलमधून काढते. ऑडिओची किंमत प्रति मिनिट सुमारे 50 टोकन आहे, म्हणून बेनामी रोजच्या पूलमध्ये दररोज काही तास ऑडिओ समाविष्ट आहे. लॉगइन खाते मोठे पूल मिळवते आणि 10,000 साइनअप टोकन. त्यापुढे, $1 ने 750,000 टोकन (~250 तास ऑडिओ) खरेदी केले जाते.

Question 3

फारसी ट्रान्सक्रिप्ट कोणत्या स्क्रिप्ट आणि वर्णमाला वापरते?

Accepted Answer

फारसी transcripts त्यांच्या मूळ उजवीकडून डावीकडे स्क्रिप्टमध्ये परत येते आणि कोणत्याही RTL-जाणता प्रदर्शक (ब्राउझर्स, वर्ड, गुगल डॉक्स) मध्ये योग्यरित्या दर्शविते.

Question 4

फारसी मुद्रणासाठी कोणते ऑडिओ स्वरूप समर्थित आहे?

Accepted Answer

MP3, WAV, M4A, FLAC, OGG, OPUS, व WEBM थेट स्वीकारले जातात. व्हिडीओ (MP4, MOV, MKV) साठी आम्ही ऑडिओ ट्रॅक सर्वर-साईड एक्सट्रॅक्ट करतो ते व्हिस्परला पाठविण्यापूर्वी — तुम्हाला स्वतः काहीही रूपांतरित करण्याची गरज नाही. स्त्रोत भाषा नव्हे, फारसी सह समान पाईपलाईन.

Question 5

फारसी ऑडिओ फाइल किती लांब असू शकते?

Accepted Answer

बेनामी अपलोड मर्यादा सुमारे 500 MB प्रति फाइल आहे. दाखल झालेले खाते2GB पर्यंत जाऊ शकते. कालावधी हा कठोर मर्यादा नाही - लांब फाइल स्वचलितपणे खंडीत केले जातात (30 सेकंदाच्या ओव्हरलेपसह चौकट) आणि एकत्रितपणे एकत्रित केले जातात एकत्रित वेळ स्टॅम्पसह. बहु-तास फारसी रेकॉर्डिंग (पोडकास्ट, पूर्ण व्याख्याने, बैठकी) चांगले काम करते.

Question 6

फारसी मुद्रणाने वेगवेगळ्या वक्त्यांची ओळख पटते का?

Accepted Answer

होय - स्पीकर डायराइजेशन प्रत्येक फारसी ट्रान्सक्रिप्टसाठी मुलभूतरित्या चालू आहे. आऊटपुट स्पीकर 1 / स्पीकर2/ स्पीकर3याप्रमाणे वेळचिन्हांसह विभागले जाते, म्हणून मुलाखती, पॅनेल चर्चा आणि बहु-पक्ष बैठकी परत लेबल केले जातात. डायराइजेशन वेगळ्या मॉडेलवर चालते आणि आम्ही समर्थन देणाऱ्या सर्व भाषांमधून समान कार्य करते.

Question 7

मी फारसी युट्यूब व्हिडिओ किंवा पॉडकास्टचे भाषांतर करू शकतो का?

Accepted Answer

होय — यूट्यूबसाठी URL /transcribe/youtube/ मध्ये किंवा पॉडकास्ट फीड्ससाठी /transcribe/podcast/ मध्ये चिकटवा (ॲपल, स्पॉटीफाई, RSS). आम्ही ऑडिओ डाउनलोड करतो, language=fa द्वारे Whisper द्वारे चालवतो, आणि टाइमस्टॅम्प आणि स्पीकर लेबलसह ट्रान्सक्रिप्ट परत करतो. सामान्य फारसी सामग्री: फारसी मध्ये बातमी क्लिप्स, उपदेश, व्याख्याने आणि राजकीय मुलाखती सर्वात सामान्य कार्यभार आहेत; YouTube URL /transcribe/youtube/ मध्ये चिकटवा किंवा फाइल अपलोड करा.

Question 8

फारसी ऑडिओचा एक तास किती टोकनमध्ये खर्च होतो?

Accepted Answer

व्हीस्परची किंमत प्रति मिनिट ऑडिओसाठी सुमारे ५० टोकन आहे, म्हणून एक तासाच्या रेकॉर्डिंगसाठी ~३,००० टोकन लागते. $१ ने ७५०,००० टोकन खरेदी केले जातात, जे दर डॉलरसाठी सुमारे ५० तास ऑडिओ तयार करतात.

Question 9

फारसी ऑडिओसाठी शब्द-स्तरीय टाइमस्टॅम्प मिळवता येतील का?

Accepted Answer

होय — दोन्ही खंड-स्तरीय (प्रत्येक ~10-30 सेकंद) व शब्द-स्तरीय टाइमस्टॅम्प उपलब्ध आहेत. शब्द-स्तरीय VTT/SRT उपशीर्षक एक्सपोर्ट करीता मुलभूत आहे जेणेकरून शीर्षक लाइन-ब-लाइन समक्रमित होते. API वर विनंतीच्या मुख्य भागात timestamps="word" निश्चित करा. फारसी transcripts त्यांच्या मूळ उजवीकडून डावीकडे स्क्रिप्टमध्ये परत येते आणि कोणत्याही RTL-जाणता प्रदर्शक (ब्राउझर्स, वर्ड, गुगल डॉक्स) मध्ये योग्यरित्या दर्शविते.

Question 10

फारसी लिप्यंतरणासाठी एक API आहे का?

Accepted Answer

होय. POST ऑडिओ (multipart/form-data, क्षेत्र नाव "file") to /v1/transcribe/ with language=fa — किंवा Whisper ला स्वचलितपणे शोधू देण्यासाठी भाषा परिमाण सोडून द्या. JSON मध्ये transcript, segments, timestamps, आणि speaker labels सोबत परत येते. पूर्ण संदर्भ आणि SDK स्निपेट /api/ येथे आहे.

Question 11

फारसी चं अनुवाद मी दुसऱ्या भाषेत करू शकतो का?

Accepted Answer

होय — एकदा अनुवाद पूर्ण झाल्यानंतर, अनुवादित करा वर क्लिक करा किंवा /translate/ मध्ये पाठ्य चिकटवा. फारसी आम्ही समर्थन देणाऱ्या सर्व इतर भाषांशी जोडले जाते (200+). बैठकीच्या मिनिटांसाठी /summarize/ द्वारे /voice/tts/ ला पाठवा.

Question 12

फारसी ऑडिओ आवाजयुक्त किंवा कमी दर्जाचे असल्यास काय करावे?

Accepted Answer

Whisper चे शोर स्थिरता अजूनही फारसी वर लागू होते, पण या अचूकतेच्या स्तरावर कोणत्याही अतिरिक्त शोरमुळे बेसलाइन त्रुटी दर वाढतो. स्वच्छ हेडसेट ऑडिओ फोन किंवा लॅपटॉप-माइक रेकॉर्डिंगपेक्षा चांगले परिणाम देते.जर एक प्रत वापरण्यायोग्य नसेल तर, contact@free.ai या ईमेलवर फाइल पाठवा - आम्ही टोकन परत देऊ आणि तुमच्या ऑडिओला वेगळ्या इंजिनने चांगले हाताळले आहे का हे बघू.

भाषाName	फारसी
ISO कोड	`fa`
एआय मॉडेल	वेगवान- विशीस्पर
किंमत	मोकळे

मोफत फारसी प्रत

हे काम कसे चालते?

फारसी ट्रांसक्रिप्शन वैशिष्ट्ये

भाषा तपशील

अधिक भाषाName

वारंवार विचारले जाणारे प्रश्न