Jak dosáhnout nejlepších výsledků při vytěžování faktur

Osvědčené postupy pro maximální přesnost vytěžování faktur. Od kvality vstupních dokumentů po efektivní korekci dat.

Jak dosáhnout nejlepších výsledků při vytěžování faktur

AI vytěžování faktur funguje skvěle, ale není dokonalé. Přesnost závisí na mnoha faktorech — kvalitě vstupu, formátu souboru, struktuře faktury. V tomto článku vám ukážeme praktické tipy, jak maximalizovat přesnost a minimalizovat ruční opravy.

Článek je určený pro uživatele, kteří už s MIKISI pracují a chtějí zlepšit své výsledky. Pokud teprve začínáte, podívejte se nejdřív na průvodce nastavením.

Obsah

Kvalita vstupu je základ

Zlaté pravidlo vytěžování: garbage in, garbage out. Pokud AI dostane rozmazanou fotku s prstem přes roh, nedosáhne stejných výsledků jako s čistým PDF.

Hierarchie kvality vstupů (od nejlepší po nejhorší):

  1. Nativní PDF z e-mailu — obsahuje textovou vrstvu, OCR téměř není potřeba
  2. Sken do PDF — kvalitní obraz, stabilní podmínky
  3. Fotka za dobrého osvětlení — čitelná, ale závislá na podmínkách
  4. Sken kopie — degradace kvality při každém kopírování
  5. Fotka za špatného osvětlení — stíny, rozmazání, šum

Rozdíl mezi prvním a posledním bodem může být až 30 % v přesnosti vytěžování. Investice do lepšího vstupu se vyplatí.

💡 Tip: Pokud dostáváte faktury e-mailem jako PDF přílohy, použijte přímo tyto soubory. Netiskněte je a neskenujte zpátky — zbytečně ztrácíte kvalitu.

Formáty souborů — který zvolit

PDF — preferovaný formát

PDF může obsahovat textovou vrstvu (u faktur z e-mailu obvykle ano). V tom případě MIKISI čte text přímo bez nutnosti OCR — výsledky jsou téměř 100% přesné. Pokud PDF textovou vrstvu nemá (naskenovaný dokument), použije se OCR.

JPG — univerzální fotky

Standardní formát pro fotky z telefonu. Komprese může zhoršit kvalitu textu, ale pro běžné faktury je dostatečná. Doporučujeme rozlišení alespoň 1920×1080 pixelů.

PNG — bezztrátová kvalita

Lepší kvalita než JPG (bez kompresních artefaktů), ale větší soubory. Vhodné pro skeny nebo snímky obrazovky. MIKISI podporuje bez problémů.

HEIC — fotky z iPhone

Moderní formát Apple. MIKISI ho podporuje, ale doporučujeme v nastavení iPhone přepnout na „Nejkompatibilnější" (JPG), pokud máte problémy.

TIFF — profesionální skeny

Nejvyšší kvalita, ale největší soubory. Typicky výstup z profesionálních skenerů. MIKISI podporuje, ale pro běžné použití je zbytečný.

Formát Kvalita Velikost Doporučení
PDF (textové) Nejlepší Malá Vždy preferovat
PDF (sken) Dobrá Střední Běžné použití
PNG Dobrá Velká Snímky obrazovky
JPG Dostatečná Malá Fotky z telefonu
HEIC Dobrá Malá iPhone (s rezervou)

Jak správně fotit faktury

Pokud nemáte skener a musíte faktury fotit telefonem, dodržujte tyto zásady:

Osvětlení:

Pozice:

Zaostření:

📌 Důležité: Většina moderních telefonů má režim „Dokument" nebo „Sken" v aplikaci fotoaparátu. Tento režim automaticky upravuje kontrast a perspektivu — výsledky jsou výrazně lepší než běžná fotka.

Problematické typy faktur

Některé typy faktur jsou pro AI náročnější. Tady je přehled a jak s nimi zacházet:

Rukou psané údaje

AI rozpoznávání rukopisu je stále výrazně horší než tištěného textu. Pokud má faktura ručně dopsané údaje (číslo, poznámka), počítejte s nutností ruční kontroly. Vždy ověřte vytěžené hodnoty.

Kopie kopií

Každé kopírování degraduje kvalitu. Třetí kopie faktury může být prakticky nečitelná. Pokud je to možné, požádejte o originál nebo digitální verzi.

Barevné pozadí

Některé firmy používají faktury s barevným pozadím nebo vodoznakem. Může to snížit kontrast textu. MIKISI má automatické předzpracování, ale u extrémních případů může přesnost klesnout.

Nestandardní layout

Faktury s velmi neobvyklou strukturou (tabulka místo standardního formátu, více stránek s pokračujícími položkami) mohou způsobit problémy. AI se snaží pochopit strukturu, ale u skutečně exotických formátů může chybovat.

Cizojazyčné faktury

MIKISI je optimalizované pro české faktury. Slovenské a anglické zvládá dobře. U jiných jazyků (němčina, polština) může být přesnost nižší — zejména u specifických polí jako formát datumu nebo čísla účtu.

Optimalizace workflow

Kromě kvality vstupu můžete zlepšit výsledky i nastavením workflow:

Dávkové zpracování

Nahrávejte faktury v dávkách a kontrolujte je pohromadě. Je efektivnější zkontrolovat 20 faktur najednou než jednotlivě během dne. Vaše oči si „naladí" a chyby si všimnete rychleji.

E-mailový sběr

Nastavte přesměrování faktur na vaši MIKISI e-mailovou adresu. Faktury z e-mailu jsou typicky v PDF s textovou vrstvou — nejlepší možná kvalita. A ušetříte si ruční nahrávání.

Prioritizace kontroly

Zaměřte kontrolu na faktury s validačními upozorněními (oranžový vykřičník). Faktury se zelenými fajfkami prošly všemi kontrolami — pravděpodobnost chyby je nízká.

Konzistence dodavatelů

Pokud máte možnost, požádejte stálé dodavatele o konzistentní formát faktur. Ideálně PDF z jejich fakturačního systému. Čím konzistentnější vstupy, tím konzistentnější výsledky.

Opravy a učení systému

MIKISI se učí z vašich oprav. Když opravíte chybně vytěženou hodnotu, systém si to zapamatuje a příště bude přesnější. Ale je třeba opravovat správně:

Opravujte přesně:

Kontrolujte všechna pole:

Hlaste systematické problémy:

Často kladené otázky

Kolik chyb je normálních?

U kvalitních PDF vstupů očekávejte přesnost 95–98 %. To znamená 2–5 faktur ze 100, které vyžadují opravu. U nekvalitních fotek může přesnost klesnout na 80–90 %. Sledujte své statistiky v dashboardu a porovnávejte s průměrem.

Má smysl investovat do skeneru?

Pokud zpracováváte hodně papírových faktur, kvalitní dokumentový skener se vyplatí. Automatický podavač, oboustranné skenování, přímý export do PDF. Investice 5 000–15 000 Kč se vrátí na ušetřeném čase a lepší přesnosti.

Můžu vytěžovat faktury z e-mailu automaticky?

Ano, MIKISI má funkci e-mailového sběru. V nastavení najdete unikátní e-mailovou adresu. Faktury poslané na tuto adresu se automaticky zpracují. Nastavte přesměrování u dodavatelů nebo pravidlo ve vašem e-mailovém klientu.

Co dělat s vícestránkovými fakturami?

MIKISI zvládá vícestránkové PDF. Všechny stránky se zpracují jako jeden doklad. U fotek musíte nahrát každou stránku zvlášť — v tom případě doporučujeme spojit do jednoho PDF předem (můžete použít online nástroje nebo Adobe Acrobat).

Proč někdy AI „halucinuje" hodnoty?

Velké jazykové modely občas generují hodnoty, které na faktuře nejsou — zejména u polí, která očekávají, ale nenašly. Proto máme validační vrstvu, která většinu halucinací zachytí. Pokud něco přesto proklouzne, opravte hodnotu a systém se z toho naučí.

Shrnutí

Nejlepších výsledků dosáhnete kvalitními vstupy — preferujte PDF z e-mailu, při focení dbejte na osvětlení a zaostření. Nastavte e-mailový sběr pro automatické zpracování. Kontrolu zaměřte na faktury s validačními upozorněními. Opravujte přesně — systém se z oprav učí. U systematických problémů nás kontaktujte, můžeme vyladit rozpoznávání.

Máte problémy s konkrétním typem faktur?

Napište nám na [email protected] a pošlete ukázku. Podíváme se, jestli můžeme zlepšit rozpoznávání pro váš případ.

Zpět na blog