Ištraukite paprastą tekstinį dialogą iš WebVTT subtitrų failo – švarus transkriptas, be laiko žymių ir be metaduomenų.
WebVTT failai dažnai gaunami tiesiogiai iš YouTube automatinio subtitravimo, transliacijų atsisiuntimų ar interneto vaizdo įrankių. Jie puikūs atkūrimui, bet netvarkingi skaitymui: WEBVTT antraštė, pasirenkami NOTE blokai, STYLE apibrėžimai, regionų aprašymai ir kiekvieno cue identifikatoriai užgriozdina tikrąją kalbą. Šis puslapis pašalina visa tai ir palieka tik žodžius.
Analizuojame VTT, pašaliname header / NOTE / STYLE / REGION skyrius, tada einame per kiekvieną cue ir išmetame laiko žymėjimo eilutes. Lieka dialogas, išsaugotas cue tvarka. Patogu AI santraukų darbo eigoms, tinklaraščio transkriptų juodraščiams ir importavimui į scenarijaus ar užrašų įrankius. Viskas vyksta jūsų naršyklėje; joks VTT nėra įkeltas.
WebVTT (.vtt) yra modernus subtitrų formatas, kurį naudoja HTML5 vaizdo įrašai, YouTube ir transliavimo platformos. Jis palaiko stilius, regionus ir metaduomenis, kurių SRT negali talpinti.
Paprastas UTF-8 tekstinis failas be formatavimo. Atidaromas kiekviename redaktoriuje bet kuriame įrenginyje. Puikiai tinka perduoti kitiems įrankiams, paieškai naudojant grep ir maitinti LLM.
Nutempkite VTT ant aukščiau esančio konverterio, arba spustelėkite laukelį, kad pasirinktumėte iš savo įrenginio.
Iš anksto parinkome TXT kaip išvesties formatą. Pakeiskite jį iš išskleidžiamo sąrašo, jei norite kito formato.
Spustelėkite Konvertuoti ir palaukite, kol progreso juosta baigs. Atsisiųskite TXT, kai jis bus paruoštas.
Pašalinkite cue numerius ir laiko žymes iš SRT failo, kad liktų tik dialogas kaip paprastas tekstas - puikiai tinka transkriptams.
Konvertuoti WebVTT subtitrus į SRT - formatą, kurį supranta kiekvienas vaizdo leistuvas ir redaktorius visame pasaulyje.
Ištraukite paprastą tekstą iš PDF naršyklėje - puikiai tinka paieškai, citavimui arba pateikimui AI įrankiams. Nereikia įkelti.