Přepisy FAQ - Často kladené otázky

Proč se generují titulky?

Titulky zlepšují přístupnost pro neslyšící, sluchově postižené a lidi mluvící jiným jazykem a činí obsah přístupnějším pro všechny. Pomáhají také vyhledávačům snadněji najít obsah, což zvyšuje jeho dosah.

Textualizace mluveného slova je také základem pro mnoho dalších budoucích aplikací, které na tom staví a kterým pokládáme základy. Patří mezi ně vylepšení funkce vyhledávání, doporučení obsahu, usnadnění nebo částečná automatizace klíčových slov, automatické překlady a mnoho dalšího.

Proč vytváříte titulky automaticky?

Automatické vytváření zjednodušuje proces a šetří čas. Ruční proces přepisu nebo vytváření titulků je časově náročný a vyžaduje spoustu zdrojů, protože pro každý jazyk a každou epizodu jsou potřeba lidé, aby převedli mluvený obsah na text.

Jak vznikají titulky?

Titulky jsou generovány pomocí Whisper AI, algoritmu převodu řeči na text vyvinutého společností Google. Je schopen převádět mluvené slovo na text ve více než 50 jazycích a je open source, tj. je open source a lze jej volně používat. Vzhledem k tomu, že trénování takového algoritmu je velmi nákladné, musíme se stejně jako mnoho dalších spoléhat na existující technologie, jako je Whisper AI.

Algoritmus převádí takzvané fonémy (jazykové zvuky) na písmena, slabiky a nakonec slova. Ke zlepšení rozpoznávání nebo zvýšení srozumitelnosti pro čtenáře se používá řada různých metod. Například filtruje gramatické poruchy řečového toku, jako je „Er“ a „Ah“, nebo převádí určité výrazy nářečí na obecněji srozumitelné.

K rozpoznání a reprodukci určitých termínů, které se používají pouze v určitém jazyce nebo dialektové oblasti, se navíc používají takzvané „glosáře“. Protože jsou tyto glosáře také více trénované s německými výrazy, kterými se mluví v Německu, jsou méně schopné rozeznat rakouské výrazy jako „Nationalrat“, „Bezirkshauptmannschaft“ nebo vlastní jména jako „Freistadt“. V takových situacích proto mohou být termíny přepsány nesprávně, i když byly jasně formulovány, pokud termín není v glosáři zahrnut. Například město „Freistadt“ se někdy stává „Freistaat“.

Algoritmus je neustále vylepšován a lze předpokládat, že i kvalita pro rakouskou němčinu se bude dále zlepšovat.

Jak dlouho trvá vytvoření titulků?

Tvorba titulků obvykle zabere asi šestinu až třetinu celkové doby trvání zvuku. Délka závisí na množství řeči nebo hudby, mluveném jazyce (jazycích) a způsobu, jakým postavy mluví. V průměru trvá jeden hodinový soubor cca. 10–20 minut na automatický přepis.

Proč nemám vliv na to, zda a kdy budou vytvořeny titulky?

Tvorba probíhá na pozadí a vyžaduje velký počítačový výkon, což je časově i finančně náročné. Nejprve přepíšeme celou databázi, především kvůli vylepšení funkce vyhledávání. Nové soubory se přepisují pouze v případě, že již byly zvařejněny, aby se ušetřily zdroje a čas. Jakmile bude celá databáze přepsána – což trvá více než rok – zvážíme, zda vám poskytneme větší kontrolu nad procesem přepisu.

Proč jsou přepisy důležité pro funkci vyhledávání?

Mnoho příspěvků v cba má málo popisného textu nebo klíčových slov. Lze je však nalézt pouze v případě, že jsou k dispozici dostatečné textové informace. Za tímto účelem o přepisy obohatíme náš vyhledávací index a v dalším kroku dokážeme vyfiltrovat i smysluplná klíčová slova a nabídnout je tak ke klíčovému slovu. Tento proces vede nejen k přesnějším výsledkům vyhledávání, ale také k lepší rovnováze: nyní lze zveřejnit i obsah z archivu, o kterém dříve nebyly k dispozici žádné nebo jen velmi málo textových informací.

Proč jsou v titulcích chyby? Na čem závisí správný přepis?

Správný přepis závisí na řadě faktorů

Whisper AI používá tzv. jazykový model pro převod zvuků na text. K pochopení specifického způsobu mluvy, jako je dialekt, potřebuje taková technologie mnoho informací o tom, jak lidé v daném dialektu mluví. Tréninková data jsou často dostupná v různé míře v závislosti na jazyku a dialektové oblasti. Výsledkem je, že tyto algoritmy bývají trénovány například s německými jazykovými variacemi, což znamená, že sisovná němčina je rozpoznána mnohem lépe než například některé dialekty.

Kromě způsobu mluvy závisí kvalita přepisu především na kvalitě zvuku. „Washy“ nebo tlumený zvuk, ořezávání/zkreslení, dozvuk a dokonce i přenosová rychlost (např. kompresní poměr MP3) mohou výrazně zhoršit kvalitu, a proto vést k chybám v titulcích.

Tyto chyby však můžete opravit ručně pomocí editoru titulků.

Mohu upravit automaticky generované titulky?

Ano, automaticky vytvořené titulky lze upravit v editoru titulků, abyste se ujistili, že jsou správné. Jak jej používat, můžete zjistit zde.

Mohu si stáhnout titulky nebo přepis?

Ano, pomocí editoru titulků můžete exportovat a stáhnout jak titulky jako soubor WebVTT, tak celý přepis jako text.