મુક્ત કતલાન લખાણ
AI સાથે કતલાન ઓડિયો અને વિડિયોને લખાણમાં રૂપાંતરિત કરો. ઝડપી, ચોક્કસ અને મુક્ત.
તે કેવી રીતે કામ કરે છે
- આમાં જાઓ Free.ai ટ્રાન્સક્રિપ્ટર
- તમારી કતલાન ઓડિયો અથવા વિડિયો ફાઈલને અપલોડ કરો
- અમારું AI આપમેળે કતલાન શોધે છે અને તેને લખે છે
- તમારી ટ્રાન્સક્રિપ્ટને લખાણ અથવા SRT ઉપશીર્ષકો તરીકે ડાઉનલોડ કરો
કતલાન લખાણની લક્ષણો
- ✓faster-whisper (MIT લાઇસન્સ થયેલ) દ્દારા શક્તિ
- ✓આપોઆપ કતલાન ભાષા શોધ
- ✓MP3, WAV, MP4, M4A, FLAC, અને વધુને આધાર આપે છે
- ✓સમયસમાચાર અને ઉપશીર્ષક નિકાસ (SRT)
- ✓ચૂકવેલ યોજનાઓ પર ફાઇલ માપ મર્યાદા નથી
- ✓ખાનગી અને સુરક્ષિત -- ફાઇલો પ્રક્રિયા કર્યા પછી કાઢી નાખવામાં આવે છે
ભાષા વિગતો
| ભાષા | કતલાન |
| ISO કોડ | ca |
| એઆઈ મોડેલ | ઝડપી-વિસ્મય |
| કિંમત | મુક્ત |
વધુ ભાષાઓ
બધી ભાષાઓ જુઓવારંવાર પૂછાતા પ્રશ્નો
Whisper large-v3-turbo એ કતલાન પર તેની ટોચની ચોકસાઈ સ્તરમાં સ્થિર થાય છે — પ્રમાણભૂત બેન્ચમાર્કો પર ૭% શબ્દ ભૂલ દર નીચે. વ્યવહારમાં એનો અર્થ એ થાય કે સાફ સ્ટુડિયો ઓડિયો નજીક-સર્વશ્રેષ્ઠ પાછું આવે છે, અને સંવાદાત્મક ઓડિયો ન્યૂનતમ સાફસફાઈ સાથે વાપરી શકાય છે.(બેન્કમાર્ક સેટ્સ પર સ્તરો A, under 7% word error rate - અમે માર્કેટિંગ દાવાઓની જગ્યાએ ઇમાનદાર WER સ્તરો પ્રકાશિત કરીએ છીએ.)
હા — કતલાન ટ્રાન્સક્રિપ્શન તમારી રોજિંદી મુક્ત ટોકન પુલમાંથી પહેલેથી જ ખેંચે છે. ઓડિયો દર મિનિટે 50 ટોકનનો ખર્ચ કરે છે, તેથી અનામિક રોજિંદા પુલ દિવસમાં ઓડિયોના થોડા કલાકોને આવરી લે છે. પ્રવેશેલ ખાતાઓ મોટું પુલ મેળવે છે અને 10,000 સબમિટ ટોકન પણ. તે પછી, $1 750,000 ટોકન ખરીદે છે (~250 કલાક ઓડિયો).
કતલાન ટ્રાન્સક્રિપ્ટ્સ એ ભાષાની સામાન્ય જોડણી સાથે પ્રમાણભૂત UTF-8 માં પાછા મળે છે.
MP3, WAV, M4A, FLAC, OGG, OPUS, અને WEBM સીધા સ્વીકારવામાં આવે છે. વિડિયો (MP4, MOV, MKV) માટે અમે તેને વિસ્પરમાં મોકલતા પહેલા ઓડિયો ટ્રેક સર્વર-બાજુને કાઢી નાખીએ છીએ - તમારે કંઈક બદલવાની જરૂર નથી. સ્ત્રોત ભાષાને અવગણીને સરખી પાઇપલાઇન, કતલાન સમાવેશ થાય છે.
અનામિક અપલોડ મર્યાદા ફાઈલ દીઠ લગભગ ૫૦૦ MB છે. પ્રવેશેલ ખાતાઓ ૨ GB સુધી જાય છે. સમયગાળાની કોઈ મર્યાદા નથી - લાંબી ફાઈલો આપમેળે ચીપાઈ જાય છે (30-સેકન્ડ વિન્ડો ઓવરલેપ સાથે) અને સતત સમયસમાપ્તિ સાથે એક જ ટ્રાન્સક્રિપ્ટમાં પાછા સ્ટીચ થયેલ છે. ઘણાં કલાકના કતલાન રેકોર્ડિંગો (પોડકાસ્ટ, સંપૂર્ણ લેકચરો, મંત્રણાઓ) સારી રીતે કામ કરે છે.
હા — સ્પીકર ડીયરાઇઝેશન દરેક કતલાન ટ્રાન્સક્રિપ્ટ માટે મૂળભૂત રીતે ચાલુ છે. આઉટપુટ સ્પીકર ૧ / સ્પીકર ૨ / સ્પીકર ૩ તરીકે સમયસમાચાર સાથે વિભાજિત થયેલ છે, તેથી ઇન્ટરવ્યુ, પેનલ ચર્ચાઓ, અને બહુપક્ષીય બેઠકો લેબલ થયેલ પાછા આવે છે. ડીયરાઇઝેશન અલગ મોડેલ પર ચાલે છે અને અમે આધાર આપતા બધા ભાષાઓ પર એકસરખું કામ કરે છે.
હા — YouTube માટે URL ને /transcribe/youtube/ માં ચોંટાડો અથવા પોડકાસ્ટ ફીડ્સ (Apple, Spotify, RSS) માટે /transcribe/podcast/ માં. અમે ઓડિયો ડાઉનલોડ કરીએ છીએ, તેને language=ca સાથે Whisper માંથી ચલાવીએ છીએ, અને સમયસમાચારો અને સ્પીકર લેબલ્સ સાથે ટ્રાન્સક્રિપ્ટને પાછું આપીએ છીએ. સામાન્ય કતલાન સમાવિષ્ટો: કતલાન માં લેકચરો, ઇન્ટરવ્યુ, અવાજ નોંધો, અને YouTube સમાવિષ્ટો બધા કામ કરે છે — URL ને /transcribe/youtube/ માં ચોંટાડો અથવા ફાઇલ સીધી અપલોડ કરો.
Whisper ઓડિયો માટે દર મિનિટે 50 ટોકન ખર્ચે છે, એટલે એક કલાકની રેકોર્ડિંગ ~3,000 ટોકન છે. $1 750,000 ટોકન ખરીદે છે, જે ડોલર પ્રતિ ઓડિયો માટે લગભગ 250 કલાક સુધી કામ કરે છે. મોટાભાગના વપરાશકર્તાઓ કદી કંઈ ખર્ચ કરતા નથી - મુક્ત રોજિંદા પુલ ટૂંકા ક્લિપ્સ, અવાજ નોંધો, અને એકવાર પોડકાસ્ટ્સને આવરી લે છે.
હા — બંને સેગમેન્ટ-સ્તર (દરેક ~10-30 સેકન્ડો) અને શબ્દ-સ્તર સમયસમાચારો ઉપલબ્ધ છે. શબ્દ-સ્તર VTT/SRT ઉપશીર્ષક નિકાસ માટે મૂળભૂત છે તેથી ઉપશીર્ષકો લીટી-અને-લીટી સુમેળ કરે છે. API પર સૂચના શરીરમાં સમયસમાચારો "શબ્દ" સુયોજિત કરો. કતલાન ટ્રાન્સક્રિપ્ટ્સ એ ભાષાની સામાન્ય જોડણી સાથે પ્રમાણભૂત UTF-8 માં પાછા મળે છે.
હા. /v1/transcribe/ માં POST ઓડિયો (બહુભાગી/ફોર્મ-માહિતી, ક્ષેત્ર નામ "ફાઇલ") language=ca સાથે — અથવા Whisper ને આપોઆપ શોધવા દેવા માટે ભાષા પરિમાણને અવગણો. ટ્રાન્સક્રિપ્ટ, સેગમેન્ટ્સ, સમયસમાચારો, અને સ્પીકર લેબલ સાથે JSON ને પાછું આપે છે. સંપૂર્ણ સંદર્ભ અને SDK સ્નિપેટો /api/ માં.
હા — એકવાર અનુવાદ પૂરો થાય, અનુવાદ પર ક્લિક કરો અથવા લખાણને /translate/ માં ચોંટાડો. કતલાન આપણે આધાર આપતી દરેક અન્ય ભાષા સાથે જોડાય છે (200+). મંત્રણા મિનિટ માટે /summarize/ માંથી અનુવાદને પાઇપ કરો; ડબિંગ માટે લક્ષ્ય ભાષામાં ઓડિયો રેન્ડર કરવા માટે તેને /voice/tts/ માં મોકલો.
Whisper એ 680K કલાકના ધુમાડાવાળા વાસ્તવિક-વિશ્વ ઓડિયો પર તાલીમ આપેલ છે, તેથી કતલાન ટ્રાન્સક્રિપ્શન પાશ્વ ભાગના ધુમાડા, સંગીત બેડ્સ, અને ફોન-ગુણવત્તા રેકોર્ડિંગ માટે મજબૂત છે. ગંભીર ક્લિપિંગ અથવા ઘણાં ઓવરલેપિંગ સ્પીકર હજુ પણ ચોકસાઈને નુકસાન પહોંચાડશે.જો ટ્રાન્સક્રિપ્ટ વાપરવા યોગ્ય ન હોય તો ફાઈલ સાથે contact@free.ai ને ઇમેલ કરો — અમે ટોકન પાછા આપીશું અને જોઇશું કે શું અલગ એન્જિન તમારી ઓડિયો સારી રીતે સંભાળે છે.