Užitečné rady

Rozpoznávání textu ve více jazycích


Texty a dokumenty ve více jazycích jsou v dnešní době již spíše standardem než výjimkou. Máme spoustu mezinárodní korespondence, intenzivně také pracujeme s různými texty a dokumenty v jiných jazycích. Zcela běžně se stává, že text je napsán ve více než jednom jazyce. Noviny a časopisy, zejména se zaměřením na konkrétní obory, vědecké knihy a učebnice; ve dvou jazycích se často vyhotovují také právní dokumenty v zahraničním obchodě apod...

Při použití FineReader 11 si ve většině případů ani nemusíte všimnout, zda to byl jeden vícejazyčný dokument nebo dva v různých jazycích, zpracované po sobě - software to naprosto správně zvládá ve výchozím nastavení. Stejně je však užitečné vědět, jaká jazyková nastavení ve FineReaderu existují a jak je použít pro získání co nejrychlejšího a nejpřesnějšího výsledku.

Nejlepších výsledků lze dosáhnout dodržením následujících doporučení:

Aplikace FineReader při instalaci ověří vaše jazyková nastavení pro Windows, a tím definuje výchozí seznam jazyků rozpoznávání zahrnutých do seznamu „Automatický výběr“. Přesto se však po dokončení instalace doporučuje zkontrolovat, zda seznam obsahuje jazyky, s nimiž obvykle pracujete, a v případě potřeby je opravit. Nezadávejte zde příliš mnoho jazyků, odstraňte ty zbytečné, pokud takové existují - zvyšují dobu převodu a mohou snížit přesnost rozpoznávání.



„Nástroje“ -> „Možnosti“, Jazykový editor Tip: Chcete-li zkontrolovat seznam „Automatický výběr“, přejděte do nabídky „Nástroje“ -> „Možnosti“ a na kartě Dokument klepněte na tlačítko „Upravit jazyky“. Pro provedení změn v seznamu klikněte na tlačítko „Zadat“ na pravé straně.


Pokud máte dost velký dokument jen s jednou nebo několika vložkami v jiném jazyce, který není ve vašem seznamu Automatický výběr, mohlo by být užitečné nastavit potřebný jazyk rozpoznávání pro tyto vložky individuálně, namísto změny nastavení výchozího „Jazyka dokumentu“. Je to lepší proto, že nenarušíte výchozí hlavní jazyková nastavení, a přesnost rozpoznávání může být vyšší.

Vlastnosti oblasti Tip: Pro nastavení jazyka rozpoznávání pro některou oblast jednotlivě ji vyberte kliknutím (nebo kliknutím a přidržením tlačítka Shift vyberte několik oblastí stejného typu) a požadovaný jazyk oblasti nastavte pomocí voliče na kartě Vlastnosti oblasti ve spodní části okna Obraz.


Při převodu dokumentu, který je napsán v pro vás neobvyklém jazyce (jazycích), nezapomeňte před zpracováním tohoto dokumentu jazyk automatické volby vypnout ručním zadáním požadovaných jazyků rozpoznávání.

Jazykový editor Tip: Pro odstranění jazyka dokumentu ze seznamu nebo pro jeho přidání během rozpoznávání vícejazyčných dokumentů stačí jeho název ze seznamu vymazat nebo jej připsat. Může to být rychlejší než procházet seznam dostupných jazyků a zaškrtávat příslušné políčko.

Pohled dovnitř: jak automatické rozpoznávání jazyka funguje?

Pro zjištění jazyka rozpoznávání dokumentu aplikace FineReader nejprve provede rychlé předběžné rozpoznávání textu. Potom, s použitím informací z vestavěných slovníků pro všechny jazyky v seznamu „Automatický výběr“, FineReader pro každou oblast textu v dokumentu definuje aktuální seznam jazyků ze slov, které se v této oblasti nacházejí. Následně proběhne opakované rozpoznání dokumentu, tentokrát pečlivější, a s použitím pouze těch jazyků, které byly v předchozí fázi nalezeny jako rozpoznaná jazyková nastavení. Jinými slovy je to stejné, jako kdybyste si prohlédli celý dokument, zkontrolovali jazyk(y) v každé jeho části, a pro každou textovou oblast nastavili požadovaný jazyk ručně. Takový přístup umožňuje získat nejvyšší kvalitu rozpoznávání, jen si však představte - jak dlouho by totéž trvalo ručně, nikoli automaticky!

Výhody: