मोफत अरबी प्रत
अरबी ऑडिओ व व्हिडीओला AI सह पाठ्य मध्ये रूपांतरित करा. जलद, अचूक व मोफत.
हे काम कसे चालते?
- याकडे जा Free.ai प्रतलेखक
- तुमचे अरबी ऑडिओ किंवा व्हिडीओ फाइल अपलोड करा
- आमचे AI अरबी आपोआप शोधते व ते लिहिते
- पाठ्य किंवा SRT उपशीर्षक म्हणून तुमचे ट्रान्सक्रिप्ट डाउनलोड करा
अरबी ट्रांसक्रिप्शन वैशिष्ट्ये
- ✓faster- whisper द्वारे चालविले जाते (MIT परवानाकृत)
- ✓अरबी भाषा आपोआप शोधा
- ✓MP3, WAV, MP4, M4A, FLAC, व इतर समर्थन पुरविते
- ✓टाइमस्टॅम्प व उपशीर्षक एक्सपोर्ट (SRT)
- ✓विनामूल्य योजनांवर फाइल आकार मर्यादा नाही
- ✓खाजगी व सुरक्षित -- प्रक्रिया केल्यावर फाइल नष्ट केले जातात
भाषा तपशील
| भाषाName | अरबी |
| ISO कोड | ar |
| एआय मॉडेल | वेगवान- विशीस्पर |
| किंमत | मोकळे |
अधिक भाषाName
सर्व भाषा पहावारंवार विचारले जाणारे प्रश्न
Whisper large-v3-turbo अरबी चांगल्या प्रकारे हाताळते - बेंचमार्क ऑडिओवर ७-१५% शब्द त्रुटी दर. नावाप्रमाणे संस्था, संख्या आणि घट्ट तांत्रिक शब्दकोशावर काही वेळा बदल होण्याची अपेक्षा करा; प्रत पूर्णपणे बरोबर असेल. (Tier B, 7-15% word error rate on benchmark sets — we publish honest WER tiers rather than marketing claims.)
होय — अरबी ट्रान्सक्रिप्शन प्रथम तुमच्या रोजच्या मोफत टोकन पूलमधून काढते. ऑडिओची किंमत प्रति मिनिट सुमारे 50 टोकन आहे, म्हणून बेनामी रोजच्या पूलमध्ये दररोज काही तास ऑडिओ समाविष्ट आहे. लॉगइन खाते मोठे पूल मिळवते आणि 10,000 साइनअप टोकन. त्यापुढे, $1 ने 750,000 टोकन (~250 तास ऑडिओ) खरेदी केले जाते.
अरबी मुलभूतरित्या आधुनिक मानक अरबी (MSA) स्तरावर हाताळले जाते. इजिप्तियन, लेव्हेंटाइन, गल्फ, व Maghrebi संवादी भाषण ओळखले जाते पण MSA वर्णलेखनात लिहिले जाते - Whisper रोमनाइज करत नाही किंवा बोली- विशिष्ट वर्णलेखन राखून ठेवत नाही. शुद्ध MSA बातमी/ व्याख्यान ऑडिओ करीता स्तर-B अचूकता अपेक्षा करा; भारी Maghrebi किंवा इजिप्तियन संवादी ते कमी करते.
MP3, WAV, M4A, FLAC, OGG, OPUS, व WEBM थेट स्वीकारले जातात. व्हिडीओ (MP4, MOV, MKV) साठी आम्ही ऑडिओ ट्रॅक सर्वर-साईड एक्सट्रॅक्ट करतो ते व्हिस्परला पाठविण्यापूर्वी — तुम्हाला स्वतः काहीही रूपांतरित करण्याची गरज नाही. स्त्रोत भाषा नव्हे, अरबी सह समान पाईपलाईन.
बेनामी अपलोड मर्यादा सुमारे 500 MB प्रति फाइल आहे. दाखल झालेले खाते2GB पर्यंत जाऊ शकते. कालावधी हा कठोर मर्यादा नाही - लांब फाइल स्वचलितपणे खंडीत केले जातात (30 सेकंदाच्या ओव्हरलेपसह चौकट) आणि एकत्रितपणे एकत्रित केले जातात एकत्रित वेळ स्टॅम्पसह. बहु-तास अरबी रेकॉर्डिंग (पोडकास्ट, पूर्ण व्याख्याने, बैठकी) चांगले काम करते.
होय - स्पीकर डायराइजेशन प्रत्येक अरबी ट्रान्सक्रिप्टसाठी मुलभूतरित्या चालू आहे. आऊटपुट स्पीकर 1 / स्पीकर2/ स्पीकर3याप्रमाणे वेळचिन्हांसह विभागले जाते, म्हणून मुलाखती, पॅनेल चर्चा आणि बहु-पक्ष बैठकी परत लेबल केले जातात. डायराइजेशन वेगळ्या मॉडेलवर चालते आणि आम्ही समर्थन देणाऱ्या सर्व भाषांमधून समान कार्य करते.
होय — यूट्यूबसाठी URL /transcribe/youtube/ मध्ये किंवा पॉडकास्ट फीड्ससाठी /transcribe/podcast/ मध्ये चिकटवा (ॲपल, स्पॉटीफाई, RSS). आम्ही ऑडिओ डाउनलोड करतो, language=ar द्वारे Whisper द्वारे चालवतो, आणि टाइमस्टॅम्प आणि स्पीकर लेबलसह ट्रान्सक्रिप्ट परत करतो. सामान्य अरबी सामग्री: अरबी मध्ये बातमी क्लिप्स, उपदेश, व्याख्याने आणि राजकीय मुलाखती सर्वात सामान्य कार्यभार आहेत; YouTube URL /transcribe/youtube/ मध्ये चिकटवा किंवा फाइल अपलोड करा.
व्हीस्परची किंमत प्रति मिनिट ऑडिओसाठी सुमारे ५० टोकन आहे, म्हणून एक तासाच्या रेकॉर्डिंगसाठी ~३,००० टोकन लागते. $१ ने ७५०,००० टोकन खरेदी केले जातात, जे दर डॉलरसाठी सुमारे ५० तास ऑडिओ तयार करतात.
होय — दोन्ही खंड-स्तरीय (प्रत्येक ~10-30 सेकंद) व शब्द-स्तरीय टाइमस्टॅम्प उपलब्ध आहेत. शब्द-स्तरीय VTT/SRT उपशीर्षक एक्सपोर्ट करीता मुलभूत आहे जेणेकरून शीर्षक लाइन-ब-लाइन समक्रमित होते. API वर विनंतीच्या मुख्य भागात timestamps="word" निश्चित करा. अरबी transcripts त्यांच्या मूळ उजवीकडून डावीकडे स्क्रिप्टमध्ये परत येते आणि कोणत्याही RTL-जाणता प्रदर्शक (ब्राउझर्स, वर्ड, गुगल डॉक्स) मध्ये योग्यरित्या दर्शविते.
होय. POST ऑडिओ (multipart/form-data, क्षेत्र नाव "file") to /v1/transcribe/ with language=ar — किंवा Whisper ला स्वचलितपणे शोधू देण्यासाठी भाषा परिमाण सोडून द्या. JSON मध्ये transcript, segments, timestamps, आणि speaker labels सोबत परत येते. पूर्ण संदर्भ आणि SDK स्निपेट /api/ येथे आहे.
होय — एकदा अनुवाद पूर्ण झाल्यानंतर, अनुवादित करा वर क्लिक करा किंवा /translate/ मध्ये पाठ्य चिकटवा. अरबी आम्ही समर्थन देणाऱ्या सर्व इतर भाषांशी जोडले जाते (200+). बैठकीच्या मिनिटांसाठी /summarize/ द्वारे /voice/tts/ ला पाठवा.
व्हिस्परला वास्तविक ऑडिओच्या हजारो तासांच्या प्रशिक्षणावर प्रशिक्षण दिले जाते, म्हणून ते पार्श्वभूमी आवाज आणि अरबी वरील फोन-गुणवत्तेचे रेकॉर्डिंग सहन करते. सर्वोत्तम परिणामांसाठी, स्वच्छ ऑडिओ पुरवा (हेडसेट मायक, संगीत बेड नाही) - या स्तरावर आवाजाने आधारभूत त्रुटी दर वाढविले जाते.जर एक प्रत वापरण्यायोग्य नसेल तर, contact@free.ai या ईमेलवर फाइल पाठवा - आम्ही टोकन परत देऊ आणि तुमच्या ऑडिओला वेगळ्या इंजिनने चांगले हाताळले आहे का हे बघू.