Jak dosáhnout nejlepších výsledků při vytěžování faktur
AI vytěžování faktur funguje skvěle, ale není dokonalé. Přesnost závisí na mnoha faktorech — kvalitě vstupu, formátu souboru, struktuře faktury. V tomto článku vám ukážeme praktické tipy, jak maximalizovat přesnost a minimalizovat ruční opravy.
Článek je určený pro uživatele, kteří už s MIKISI pracují a chtějí zlepšit své výsledky. Pokud teprve začínáte, podívejte se nejdřív na průvodce nastavením.
Obsah
- Kvalita vstupu je základ
- Formáty souborů — který zvolit
- Jak správně fotit faktury
- Problematické typy faktur
- Optimalizace workflow
- Opravy a učení systému
- Často kladené otázky
Kvalita vstupu je základ
Zlaté pravidlo vytěžování: garbage in, garbage out. Pokud AI dostane rozmazanou fotku s prstem přes roh, nedosáhne stejných výsledků jako s čistým PDF.
Hierarchie kvality vstupů (od nejlepší po nejhorší):
- Nativní PDF z e-mailu — obsahuje textovou vrstvu, OCR téměř není potřeba
- Sken do PDF — kvalitní obraz, stabilní podmínky
- Fotka za dobrého osvětlení — čitelná, ale závislá na podmínkách
- Sken kopie — degradace kvality při každém kopírování
- Fotka za špatného osvětlení — stíny, rozmazání, šum
Rozdíl mezi prvním a posledním bodem může být až 30 % v přesnosti vytěžování. Investice do lepšího vstupu se vyplatí.
💡 Tip: Pokud dostáváte faktury e-mailem jako PDF přílohy, použijte přímo tyto soubory. Netiskněte je a neskenujte zpátky — zbytečně ztrácíte kvalitu.
Formáty souborů — který zvolit
PDF — preferovaný formát
PDF může obsahovat textovou vrstvu (u faktur z e-mailu obvykle ano). V tom případě MIKISI čte text přímo bez nutnosti OCR — výsledky jsou téměř 100% přesné. Pokud PDF textovou vrstvu nemá (naskenovaný dokument), použije se OCR.
JPG — univerzální fotky
Standardní formát pro fotky z telefonu. Komprese může zhoršit kvalitu textu, ale pro běžné faktury je dostatečná. Doporučujeme rozlišení alespoň 1920×1080 pixelů.
PNG — bezztrátová kvalita
Lepší kvalita než JPG (bez kompresních artefaktů), ale větší soubory. Vhodné pro skeny nebo snímky obrazovky. MIKISI podporuje bez problémů.
HEIC — fotky z iPhone
Moderní formát Apple. MIKISI ho podporuje, ale doporučujeme v nastavení iPhone přepnout na „Nejkompatibilnější" (JPG), pokud máte problémy.
TIFF — profesionální skeny
Nejvyšší kvalita, ale největší soubory. Typicky výstup z profesionálních skenerů. MIKISI podporuje, ale pro běžné použití je zbytečný.
| Formát | Kvalita | Velikost | Doporučení |
|---|---|---|---|
| PDF (textové) | Nejlepší | Malá | Vždy preferovat |
| PDF (sken) | Dobrá | Střední | Běžné použití |
| PNG | Dobrá | Velká | Snímky obrazovky |
| JPG | Dostatečná | Malá | Fotky z telefonu |
| HEIC | Dobrá | Malá | iPhone (s rezervou) |
Jak správně fotit faktury
Pokud nemáte skener a musíte faktury fotit telefonem, dodržujte tyto zásady:
Osvětlení:
- Denní světlo je nejlepší — rovnoměrné, bez ostrých stínů
- Vyhněte se přímému slunci — vytváří přeexponovaná místa
- Blesk používejte opatrně — může způsobit odlesky
- Stín z ruky = nečitelný text
Pozice:
- Foťte kolmo shora — minimalizujete perspektivní zkreslení
- Celá faktura v záběru — okraje jsou často důležité
- Podložte na rovnou plochu — pomačkaný papír = rozmazaný text
Zaostření:
- Klepněte na displej pro zaostření na text
- Počkejte, než fotoaparát zaostří — nespěchejte
- Stabilizujte ruce — opřete se o stůl nebo použijte stativ
📌 Důležité: Většina moderních telefonů má režim „Dokument" nebo „Sken" v aplikaci fotoaparátu. Tento režim automaticky upravuje kontrast a perspektivu — výsledky jsou výrazně lepší než běžná fotka.
Problematické typy faktur
Některé typy faktur jsou pro AI náročnější. Tady je přehled a jak s nimi zacházet:
Rukou psané údaje
AI rozpoznávání rukopisu je stále výrazně horší než tištěného textu. Pokud má faktura ručně dopsané údaje (číslo, poznámka), počítejte s nutností ruční kontroly. Vždy ověřte vytěžené hodnoty.
Kopie kopií
Každé kopírování degraduje kvalitu. Třetí kopie faktury může být prakticky nečitelná. Pokud je to možné, požádejte o originál nebo digitální verzi.
Barevné pozadí
Některé firmy používají faktury s barevným pozadím nebo vodoznakem. Může to snížit kontrast textu. MIKISI má automatické předzpracování, ale u extrémních případů může přesnost klesnout.
Nestandardní layout
Faktury s velmi neobvyklou strukturou (tabulka místo standardního formátu, více stránek s pokračujícími položkami) mohou způsobit problémy. AI se snaží pochopit strukturu, ale u skutečně exotických formátů může chybovat.
Cizojazyčné faktury
MIKISI je optimalizované pro české faktury. Slovenské a anglické zvládá dobře. U jiných jazyků (němčina, polština) může být přesnost nižší — zejména u specifických polí jako formát datumu nebo čísla účtu.
Optimalizace workflow
Kromě kvality vstupu můžete zlepšit výsledky i nastavením workflow:
Dávkové zpracování
Nahrávejte faktury v dávkách a kontrolujte je pohromadě. Je efektivnější zkontrolovat 20 faktur najednou než jednotlivě během dne. Vaše oči si „naladí" a chyby si všimnete rychleji.
E-mailový sběr
Nastavte přesměrování faktur na vaši MIKISI e-mailovou adresu. Faktury z e-mailu jsou typicky v PDF s textovou vrstvou — nejlepší možná kvalita. A ušetříte si ruční nahrávání.
Prioritizace kontroly
Zaměřte kontrolu na faktury s validačními upozorněními (oranžový vykřičník). Faktury se zelenými fajfkami prošly všemi kontrolami — pravděpodobnost chyby je nízká.
Konzistence dodavatelů
Pokud máte možnost, požádejte stálé dodavatele o konzistentní formát faktur. Ideálně PDF z jejich fakturačního systému. Čím konzistentnější vstupy, tím konzistentnější výsledky.
Opravy a učení systému
MIKISI se učí z vašich oprav. Když opravíte chybně vytěženou hodnotu, systém si to zapamatuje a příště bude přesnější. Ale je třeba opravovat správně:
Opravujte přesně:
- Opravte hodnotu na přesně to, co je na faktuře
- Nepoužívejte zkratky nebo upravené formáty
- Pokud hodnota na faktuře chybí, nechte pole prázdné
Kontrolujte všechna pole:
- Neopravujte jen IČO a částku — zkontrolujte i ostatní pole
- Chyba v méně důležitém poli (třeba poznámka) může signalizovat problém
Hlaste systematické problémy:
- Pokud se stejná chyba opakuje u více faktur od jednoho dodavatele, dejte nám vědět
- Můžeme vyladit rozpoznávání pro specifické formáty
Často kladené otázky
Kolik chyb je normálních?
U kvalitních PDF vstupů očekávejte přesnost 95–98 %. To znamená 2–5 faktur ze 100, které vyžadují opravu. U nekvalitních fotek může přesnost klesnout na 80–90 %. Sledujte své statistiky v dashboardu a porovnávejte s průměrem.
Má smysl investovat do skeneru?
Pokud zpracováváte hodně papírových faktur, kvalitní dokumentový skener se vyplatí. Automatický podavač, oboustranné skenování, přímý export do PDF. Investice 5 000–15 000 Kč se vrátí na ušetřeném čase a lepší přesnosti.
Můžu vytěžovat faktury z e-mailu automaticky?
Ano, MIKISI má funkci e-mailového sběru. V nastavení najdete unikátní e-mailovou adresu. Faktury poslané na tuto adresu se automaticky zpracují. Nastavte přesměrování u dodavatelů nebo pravidlo ve vašem e-mailovém klientu.
Co dělat s vícestránkovými fakturami?
MIKISI zvládá vícestránkové PDF. Všechny stránky se zpracují jako jeden doklad. U fotek musíte nahrát každou stránku zvlášť — v tom případě doporučujeme spojit do jednoho PDF předem (můžete použít online nástroje nebo Adobe Acrobat).
Proč někdy AI „halucinuje" hodnoty?
Velké jazykové modely občas generují hodnoty, které na faktuře nejsou — zejména u polí, která očekávají, ale nenašly. Proto máme validační vrstvu, která většinu halucinací zachytí. Pokud něco přesto proklouzne, opravte hodnotu a systém se z toho naučí.
Shrnutí
Nejlepších výsledků dosáhnete kvalitními vstupy — preferujte PDF z e-mailu, při focení dbejte na osvětlení a zaostření. Nastavte e-mailový sběr pro automatické zpracování. Kontrolu zaměřte na faktury s validačními upozorněními. Opravujte přesně — systém se z oprav učí. U systematických problémů nás kontaktujte, můžeme vyladit rozpoznávání.
Máte problémy s konkrétním typem faktur?
Napište nám na [email protected] a pošlete ukázku. Podíváme se, jestli můžeme zlepšit rozpoznávání pro váš případ.