Қазақ тілі
टाइप करा किंवा Kazakh मजकूर पेस्ट करा आणि तो बोलताना ऐका — हे सर्व तुमच्या ब्राउझरमध्ये, कोणत्याही साइनअपशिवाय. व्हॉइस मॉडेल एकदा (~110 MB) डाउनलोड केले जाते आणि स्थानिकरित्या कॅश केले जाते, त्यामुळे नंतरचे रन तात्काळ असतात आणि ऑफलाइन काम करतात.
पेस्ट किंवा टाइप करा कोणताही Kazakh मजकूर — विरामचिन्हे आणि ओळींचे ब्रेक जतन केले जातात.
पहिल्या क्लिकवर ~110 MB आवाज मॉडेल तुमच्या ब्राउझरमध्ये डाउनलोड होते. त्यानंतर, संश्लेषण ताबडतोब होते.
ऑडिओ इनलाइन प्ले करा किंवा WAV फाईल म्हणून जतन करा. ऑडिओ कधीही तुमच्या डिव्हाइसच्या बाहेर जात नाही.
सिंथेसिस पूर्णपणे तुमच्या ब्राउझरमध्ये WebAssembly वापरून चालते. एकमेव नेटवर्क विनंत्या Piper voice model आणि ONNX runtime प्राप्त करण्यासाठी आहेत — दोन्ही सार्वजनिक, स्थिर साधने आहेत. आम्ही तुमचा मजकूर पाहत नाही आणि आम्ही तयार केलेले ऑडिओही पाहत नाही.
वरील विनामूल्य इन-ब्राउझर साधन मसुदे आणि पूर्वावलोकनांसाठी छान आहे, परंतु Piper चे आवाज स्पष्टपणे कृत्रिम वाटतात. Subformer चे सशुल्क Voice Synthesis नैसर्गिक, प्रसारण-गुणवत्तेचे ऑडिओ (वैकल्पिक व्हॉइस क्लोनिंगसह) तयार करण्यासाठी Chatterbox आणि Gemini TTS वापरते.
Subformer Voice Synthesis वापरून पाहा