Қазақ тілі
ჩაწერეთ ან ჩასვით Kazakh ტექსტი და მოისმინეთ იგი — ყველაფერი თქვენს ბრაუზერში, რეგისტრაციის გარეშე. ხმოვანი მოდელი გადმოწერილია მხოლოდ ერთხელ (~110 MB) და ქეშში შენახულია ადგილობრივად, ამიტომ შემდგომი გაშვებები მომენტალურია და მუშაობს ოფლაინშიც.
ჩასვით ან შეიყვანეთ ნებისმიერი Kazakh ტექსტი — პუნქტუაცია და ახალი ხაზები შენარჩუნებულია.
პირველ დაწკაპუნებაზე ~110 MB ზომის ხმის მოდელი ჩაიტვირთება თქვენს ბრაუზერში. ამის შემდეგ სინთეზი დაუყოვნებლივ მოხდება.
ჩაუშვით აუდიო პირდაპირ ან შეინახეთ იგი WAV ფაილად. აუდიო არასოდეს ტოვებს თქვენს მოწყობილობას.
სინთეზი მთლიანად ხდება თქვენს ბრაუზერში WebAssembly-ის გამოყენებით. ერთადერთი ქსელური მოთხოვნები არის Piper-ის ხმოვანი მოდელის და ONNX runtime-ის ჩამოტვირთვა — ორივე საჯარო, სტატიკური რესურსია. ჩვენ არ ვხედავთ თქვენს ტექსტს და არ ვხედავთ გენერირებულ აუდიოს.
ზემოთ მოცემული უფასო ბრაუზერული ინსტრუმენტი შესანიშნავია დრაფტებისა და პრევიუებისთვის, მაგრამ Piper-ის ხმები აშკარად სინთეტიკურია. Subformer-ის გადახდილი Voice Synthesis იყენებს Chatterbox-სა და Gemini TTS-ს ბუნებრივი, მაუწყებლური ხარისხის აუდიოს მისაღწევად და მოიცავს არჩევით ხმის კლონირებას.
ცადეთ Subformer Voice Synthesis