મુક્ત કેંટોનીઝ લખાણ

AI સાથે કેંટોનીઝ ઓડિયો અને વિડિયોને લખાણમાં રૂપાંતરિત કરો. ઝડપી, ચોક્કસ અને મુક્ત.

તે કેવી રીતે કામ કરે છે

  1. આમાં જાઓ Free.ai ટ્રાન્સક્રિપ્ટર
  2. તમારી કેંટોનીઝ ઓડિયો અથવા વિડિયો ફાઈલને અપલોડ કરો
  3. અમારું AI આપમેળે કેંટોનીઝ શોધે છે અને તેને લખે છે
  4. તમારી ટ્રાન્સક્રિપ્ટને લખાણ અથવા SRT ઉપશીર્ષકો તરીકે ડાઉનલોડ કરો

કેંટોનીઝ લખાણની લક્ષણો

  • faster-whisper (MIT લાઇસન્સ થયેલ) દ્દારા શક્તિ
  • આપોઆપ કેંટોનીઝ ભાષા શોધ
  • MP3, WAV, MP4, M4A, FLAC, અને વધુને આધાર આપે છે
  • સમયસમાચાર અને ઉપશીર્ષક નિકાસ (SRT)
  • ચૂકવેલ યોજનાઓ પર ફાઇલ માપ મર્યાદા નથી
  • ખાનગી અને સુરક્ષિત -- ફાઇલો પ્રક્રિયા કર્યા પછી કાઢી નાખવામાં આવે છે

ભાષા વિગતો

ભાષાકેંટોનીઝ
ISO કોડyue
એઆઈ મોડેલઝડપી-વિસ્મય
કિંમતમુક્ત

વધુ ભાષાઓ

બધી ભાષાઓ જુઓ

વારંવાર પૂછાતા પ્રશ્નો

કેંટોનીઝ એ Whisper માટે ઓછા-સ્ત્રોત ભાષા છે - large-v3-turbo 25% શબ્દ ભૂલ દર ઉપર બેસે છે, ક્યારેક સારી રીતે ઉપર. ટ્રાન્સક્રિપ્ટ શોધ અને gist માટે ઉપયોગી છે પરંતુ પ્રકાશન-સજ્જ તરીકે નહિં ગણવી જોઈએ. જો કેંટોનીઝ માટે ઉચ્ચ-સચોટતા એન્જિન ઉપલબ્ધ થાય તો અમે તેને આપોઆપ વાયર કરીએ છીએ.(બેન્કમાર્ક સેટ્સ પર સ્તરો D, over 25% word error rate - અમે માર્કેટિંગ દાવાઓની જગ્યાએ ઇમાનદાર WER સ્તરો પ્રકાશિત કરીએ છીએ.)

હા — કેંટોનીઝ ટ્રાન્સક્રિપ્શન તમારી રોજિંદી મુક્ત ટોકન પુલમાંથી પહેલેથી જ ખેંચે છે. ઓડિયો દર મિનિટે 50 ટોકનનો ખર્ચ કરે છે, તેથી અનામિક રોજિંદા પુલ દિવસમાં ઓડિયોના થોડા કલાકોને આવરી લે છે. પ્રવેશેલ ખાતાઓ મોટું પુલ મેળવે છે અને 10,000 સબમિટ ટોકન પણ. તે પછી, $1 750,000 ટોકન ખરીદે છે (~250 કલાક ઓડિયો).

કેંટોનીઝ ટ્રાન્સક્રિપ્ટ્સ એ ભાષાની સામાન્ય જોડણી સાથે પ્રમાણભૂત UTF-8 માં પાછા મળે છે.

MP3, WAV, M4A, FLAC, OGG, OPUS, અને WEBM સીધા સ્વીકારવામાં આવે છે. વિડિયો (MP4, MOV, MKV) માટે અમે તેને વિસ્પરમાં મોકલતા પહેલા ઓડિયો ટ્રેક સર્વર-બાજુને કાઢી નાખીએ છીએ - તમારે કંઈક બદલવાની જરૂર નથી. સ્ત્રોત ભાષાને અવગણીને સરખી પાઇપલાઇન, કેંટોનીઝ સમાવેશ થાય છે.

અનામિક અપલોડ મર્યાદા ફાઈલ દીઠ લગભગ ૫૦૦ MB છે. પ્રવેશેલ ખાતાઓ ૨ GB સુધી જાય છે. સમયગાળાની કોઈ મર્યાદા નથી - લાંબી ફાઈલો આપમેળે ચીપાઈ જાય છે (30-સેકન્ડ વિન્ડો ઓવરલેપ સાથે) અને સતત સમયસમાપ્તિ સાથે એક જ ટ્રાન્સક્રિપ્ટમાં પાછા સ્ટીચ થયેલ છે. ઘણાં કલાકના કેંટોનીઝ રેકોર્ડિંગો (પોડકાસ્ટ, સંપૂર્ણ લેકચરો, મંત્રણાઓ) સારી રીતે કામ કરે છે.

હા — સ્પીકર ડીયરાઇઝેશન દરેક કેંટોનીઝ ટ્રાન્સક્રિપ્ટ માટે મૂળભૂત રીતે ચાલુ છે. આઉટપુટ સ્પીકર ૧ / સ્પીકર ૨ / સ્પીકર ૩ તરીકે સમયસમાચાર સાથે વિભાજિત થયેલ છે, તેથી ઇન્ટરવ્યુ, પેનલ ચર્ચાઓ, અને બહુપક્ષીય બેઠકો લેબલ થયેલ પાછા આવે છે. ડીયરાઇઝેશન અલગ મોડેલ પર ચાલે છે અને અમે આધાર આપતા બધા ભાષાઓ પર એકસરખું કામ કરે છે.

હા — YouTube માટે URL ને /transcribe/youtube/ માં ચોંટાડો અથવા પોડકાસ્ટ ફીડ્સ (Apple, Spotify, RSS) માટે /transcribe/podcast/ માં. અમે ઓડિયો ડાઉનલોડ કરીએ છીએ, તેને language=yue સાથે Whisper માંથી ચલાવીએ છીએ, અને સમયસમાચારો અને સ્પીકર લેબલ્સ સાથે ટ્રાન્સક્રિપ્ટને પાછું આપીએ છીએ. સામાન્ય કેંટોનીઝ સમાવિષ્ટો: કેંટોનીઝ માં લેકચરો, ઇન્ટરવ્યુ, અવાજ નોંધો, અને YouTube સમાવિષ્ટો બધા કામ કરે છે — URL ને /transcribe/youtube/ માં ચોંટાડો અથવા ફાઇલ સીધી અપલોડ કરો.

Whisper ઓડિયો માટે દર મિનિટે 50 ટોકન ખર્ચે છે, એટલે એક કલાકની રેકોર્ડિંગ ~3,000 ટોકન છે. $1 750,000 ટોકન ખરીદે છે, જે ડોલર પ્રતિ ઓડિયો માટે લગભગ 250 કલાક સુધી કામ કરે છે. મોટાભાગના વપરાશકર્તાઓ કદી કંઈ ખર્ચ કરતા નથી - મુક્ત રોજિંદા પુલ ટૂંકા ક્લિપ્સ, અવાજ નોંધો, અને એકવાર પોડકાસ્ટ્સને આવરી લે છે.

હા — બંને સેગમેન્ટ-સ્તર (દરેક ~10-30 સેકન્ડો) અને શબ્દ-સ્તર સમયસમાચારો ઉપલબ્ધ છે. શબ્દ-સ્તર VTT/SRT ઉપશીર્ષક નિકાસ માટે મૂળભૂત છે તેથી ઉપશીર્ષકો લીટી-અને-લીટી સુમેળ કરે છે. API પર સૂચના શરીરમાં સમયસમાચારો "શબ્દ" સુયોજિત કરો. કેંટોનીઝ ટ્રાન્સક્રિપ્ટ્સ એ ભાષાની સામાન્ય જોડણી સાથે પ્રમાણભૂત UTF-8 માં પાછા મળે છે.

હા. /v1/transcribe/ માં POST ઓડિયો (બહુભાગી/ફોર્મ-માહિતી, ક્ષેત્ર નામ "ફાઇલ") language=yue સાથે — અથવા Whisper ને આપોઆપ શોધવા દેવા માટે ભાષા પરિમાણને અવગણો. ટ્રાન્સક્રિપ્ટ, સેગમેન્ટ્સ, સમયસમાચારો, અને સ્પીકર લેબલ સાથે JSON ને પાછું આપે છે. સંપૂર્ણ સંદર્ભ અને SDK સ્નિપેટો /api/ માં.

હા — એકવાર અનુવાદ પૂરો થાય, અનુવાદ પર ક્લિક કરો અથવા લખાણને /translate/ માં ચોંટાડો. કેંટોનીઝ આપણે આધાર આપતી દરેક અન્ય ભાષા સાથે જોડાય છે (200+). મંત્રણા મિનિટ માટે /summarize/ માંથી અનુવાદને પાઇપ કરો; ડબિંગ માટે લક્ષ્ય ભાષામાં ઓડિયો રેન્ડર કરવા માટે તેને /voice/tts/ માં મોકલો.

Whisper નો ઊંઘાટ તાલીમ આ સ્તર પર ઓછી મદદ કરે છે - બોટલનેક કેંટોનીઝ ઓડિયો Whisper એ તાલીમ દરમિયાન જોયું છે, ઊંઘાટ નથી. સાફ સ્ટુડિયો ઓડિયો હજુ પણ ઊંઘાટ ઓડિયો ને હરાવે છે, પરંતુ કોઈપણ ચોકસાઈ સુધી પહોંચશે નહિં કે જે તમે ઉચ્ચ-સ્ત્રોત ભાષા પર મેળવશો.જો ટ્રાન્સક્રિપ્ટ વાપરવા યોગ્ય ન હોય તો ફાઈલ સાથે contact@free.ai ને ઇમેલ કરો — અમે ટોકન પાછા આપીશું અને જોઇશું કે શું અલગ એન્જિન તમારી ઓડિયો સારી રીતે સંભાળે છે.

Free.ai ને પ્રેમ છે? તમારા મિત્રોને કહો!

આ પાનાંને દર આપો