فارسی
Внесете или залепете Farsi текст и слушнете го изговорот — сето тоа во вашиот прелистувач, без регистрација. Моделот на гласот се презема еднаш (~60 MB) и се кешира локално, така што понатамошните извршувања се моментални и работат офлајн.
Залепете или напишете кој било Farsi текст — интерпункцијата и пресеците на редови се зачувани.
При првото кликнување се презема моделот на глас од околу 60 MB во вашиот прелистувач. Потоа синтезата е моментална.
Пуштете го аудиото вградено или зачувајте го како WAV датотека. Аудиото никогаш не го напушта вашиот уред.
Синтезата се извршува целосно во вашиот прелистувач користејќи WebAssembly. Единствените мрежни барања се за преземање на Piper voice model и ONNX runtime — двете се јавни, статични ресурси. Не го гледаме вашиот текст и не го гледаме генерираното аудио.
Бесплатната алатка во прелистувачот погоре е одлична за нацрти и прегледи, но Piper гласовите звучат забележливо вештачки. Платената Voice Synthesis на Subformer користи Chatterbox и Gemini TTS за природен, броадкаст-студиски квалитет на звук со опционално клонирање на глас.
Испробајте Subformer Voice Synthesis