Jak funguje AI při zpracování faktur — Od fotky k datům

Podívejte se pod kapotu moderního vytěžování faktur. Jak AI čte text z obrázku, rozpoznává strukturu dokumentu a extrahuje data.

Jak funguje AI při zpracování faktur — Od fotky k datům

Vyfotíte fakturu nebo účtenku telefonem (nevíte jaký je rozdíl mezi paragonem, účtenkou a fakturou?), nahrajete do aplikace — a za okamžik máte všechna data vytěžená a připravená pro import do účetního systému. IČO, částka, datum splatnosti, variabilní symbol. Všechno správně, bez přepisování. Zní to jako magie, ale je za tím konkrétní technologie. Pojďme si vysvětlit, jak to vlastně funguje.

V tomto článku vám ukážeme cestu faktury od vstupu až po export dat. Rozebereme tři klíčové technologie: OCR (optické rozpoznávání znaků), velké jazykové modely a validační pravidla. Vysvětlíme, proč kombinace těchto přístupů funguje lépe než každý zvlášť. A na konci odpovíme na časté otázky o přesnosti, bezpečnosti a omezeních AI.

Článek je určený pro všechny, kdo chtějí pochopit, co se děje „pod kapotou" moderních nástrojů pro vytěžování faktur. Nebudeme zacházet do matematických detailů neuronových sítí — zaměříme se na praktické pochopení procesu.

Obsah

Cesta faktury — od vstupu k datům

Celý proces zpracování faktury lze rozdělit do pěti kroků. Každý krok řeší jiný problém a používá jinou technologii:

Krok Co se děje Technologie
1. Vstup Nahrání souboru (PDF, JPG, PNG) Upload API
2. Předzpracování Úprava obrázku (rotace, kontrast) Image processing
3. OCR Rozpoznání textu z obrázku Tesseract / Cloud OCR
4. AI analýza Extrakce strukturovaných dat GPT-4 Vision
5. Validace Kontrola a oprava dat Business rules + API
💡 Tip: Rychlost zpracování závisí na kvalitě vstupu. Čisté PDF se zpracuje rychleji než rozmazaná fotka. Pokud chcete nejrychlejší výsledky, posílejte faktury v původním digitálním formátu (PDF z e-mailu), ne skeny nebo fotky.

Pojďme si jednotlivé kroky rozebrat podrobněji.

OCR — jak počítač čte text z obrázku

OCR (Optical Character Recognition) je technologie stará přes 100 let — první pokusy o strojové čtení textu sahají do roku 1914. Moderní OCR používá neuronové sítě a dosahuje přesnosti přes 99 % na kvalitním textu.

Princip je jednoduchý: OCR analyzuje obrázek pixel po pixelu, hledá tvary, které odpovídají písmenům. Rozpozná „A" jako dva šikmé čáry spojené vodorovnou čarou. Rozpozná „8" jako dvě propojené smyčky. Každý znak má svůj vizuální „otisk".

Moderní OCR engine (například Google Cloud Vision, Amazon Textract nebo open-source Tesseract) umí:

📌 Důležité: Samotné OCR vám dá jen „surový" text — blob všech slov z faktury v pořadí, jak je engine přečetl. OCR neví, že „12345678" je IČO a „15.02.2026" je datum. K tomu potřebujete další vrstvu — AI analýzu.

Předzpracování obrázku před OCR výrazně zlepšuje výsledky. MIKISI automaticky provádí:

Díky těmto úpravám dokáže systém zpracovat i nekvalitní fotky z telefonu — pomačkaný papír, stíny, špatné osvětlení.

AI analýza — jak AI rozumí struktuře

OCR přečte text, ale nerozumí mu. Vidí „Celkem k úhradě: 12 100 Kč", ale neví, že to je finální částka faktury. Tady nastupuje AI — konkrétně velké jazykové modely (LLM).

AI byla natrénována na obrovském množství textu z internetu — včetně milionů faktur, účetních dokumentů a finančních formulářů. Díky tomu „zná" typickou strukturu české faktury. Ví, že IČO má 8 číslic, že datum splatnosti bývá po datu vystavení, že DPH se počítá ze základu.

MIKISI používá AI, která umí zpracovat nejen text, ale i obrázky. To má dvě výhody:

  1. Vizuální kontext — AI vidí, kde na faktuře je která informace (hlavička, tabulka, patička)
  2. Záložní čtení — když OCR něco přehlédne, AI to může přečíst přímo z obrázku
Příklad: Faktura má v hlavičce dvě IČO — dodavatele a odběratele. Klasické OCR obě přečte, ale neví, které je které. AI pochopí z kontextu (pozice na stránce, popisky „Dodavatel" a „Odběratel"), které IČO patří komu.

AI analýza funguje v několika krocích:

1. Identifikace typu dokumentu

Je to faktura, dobropis, zálohová faktura, účtenka? Každý typ má jiná pole a jinou strukturu.

2. Lokalizace klíčových polí

Kde na dokumentu je IČO? Kde je celková částka? Kde jsou položky? AI hledá typické vzory a popisky.

3. Extrakce hodnot

Vytažení konkrétních hodnot z identifikovaných polí. „IČO: 12345678" → IČO = 12345678.

4. Normalizace formátu

Převod na jednotný formát. „15. února 2026" → 2026-02-15. „12 100,- Kč" → 12100.00.

Výstupem je strukturovaný JSON objekt se všemi vytěženými údaji — připravený pro validaci a export.

Validace — kontrola správnosti dat

AI není neomylná. I ona může udělat chybu — přehlédnout číslo, zaměnit dvě podobné hodnoty, špatně interpretovat neobvyklý formát. Proto je klíčová validace — automatická kontrola, že vytěžená data dávají smysl.

MIKISI používá 17 validačních pravidel, která kontrolují:

Pravidlo Co kontroluje Příklad chyby
Formát IČO 8 číslic, kontrolní součet IČO má 7 číslic
Existence v ARES IČO existuje v registru Firma neexistuje
Formát DIČ CZ + 8–10 číslic Chybí prefix CZ
Kontrola DPH Základ × sazba = DPH DPH nesedí o 1 Kč
Součet položek Položky = celková částka Chybí jedna položka
Datum logika Splatnost ≥ vystavení Splatnost před vystavením
Formát účtu Platný český bankovní účet Neexistující kód banky

Když validace najde problém, systém se pokusí o automatickou opravu. Například:

⚠️ Pozor: Automatická oprava funguje jen u jednoznačných případů. Pokud je nejasné, co je správně, systém označí pole jako „vyžaduje kontrolu" a nechá rozhodnutí na uživateli.

Validace proti externím registrům (ARES, registr plátců DPH) je klíčová pro kontrolní hlášení. MIKISI automaticky ověří, že dodavatel existuje a je (nebo není) plátcem DPH — to pomáhá odhalit podvodné faktury nebo překlepy v IČO.

Proč kombinace OCR + AI funguje nejlépe

Na trhu existují tři přístupy k vytěžování faktur:

  1. Pouze OCR — rychlé, ale bez porozumění struktuře
  2. Pouze AI (end-to-end) — rozumí struktuře, ale náročnější na zdroje
  3. OCR + AI kombinace — rychlost OCR + inteligence AI

MIKISI používá třetí přístup a zde je proč:

Rychlost: Klasické OCR je extrémně rychlé — zpracuje stránku za zlomek sekundy. Posílat celý obrázek do AI by bylo náročnější. OCR udělá „hrubou práci" rychle, AI pak zpracuje extrahovaný text.

Přesnost: OCR engine (třeba Tesseract nebo Google Cloud Vision) je optimalizovaný přesně na čtení textu — dělá to spolehlivěji než obecný model AI. Ale OCR nerozumí kontextu. AI zase rozumí kontextu, ale občas „přehlédne" detail. Kombinace obou přístupů kompenzuje slabiny každého.

Náklady: Díky kombinaci můžeme nabídnout zpracování za jednotky korun na doklad, což je výrazně ekonomičtější než čisté AI řešení.

💡 Tip: Některé konkurenční služby používají „čisté" AI řešení (posílají celý obrázek do GPT-4 nebo Claude). Funguje to, ale je to náročnější na zdroje. Pro běžné faktury je kombinace OCR + AI optimální volbou.

Výjimkou jsou velmi nekvalitní vstupy (rozmazané fotky, rukou psané dokumenty) — tam může end-to-end AI přístup fungovat lépe, protože AI umí „domýšlet" nečitelná místa z kontextu. MIKISI proto pro problematické dokumenty automaticky přepíná do režimu, kdy se více spoléhá na AI.

Omezení AI — kdy systém chybuje

AI není všemocná. Je důležité znát omezení, abyste věděli, kdy musíte výsledky pečlivěji kontrolovat:

Rukou psané dokumenty

Rozpoznávání ručního písma je stále výrazně horší než tištěný text. Pokud máte fakturu s ručně dopsanými údaji, počítejte s nižší přesností. AI se zlepšuje, ale stále nedosahuje lidské úrovně čtení rukopisu.

Nestandardní formáty

AI se učila na typických fakturách. Neobvyklé layouty (faktura ve formě tabulky, faktura bez standardních popisků) mohou způsobit problémy. Čím více se faktura liší od běžného vzoru, tím vyšší riziko chyby.

Velmi nízká kvalita obrázku

Rozmazané fotky, nízké rozlišení, silné přeexponování — to vše zhoršuje výsledky. OCR potřebuje čitelné písmeny. Pokud člověk stěží přečte text, AI to neudělá lépe.

Cizojazyčné faktury

MIKISI je optimalizované pro české faktury. Slovenské a anglické zvládá dobře, ale exotické jazyky (arabština, čínština, japonština) mohou být problematické — jak pro OCR, tak pro AI analýzu.

Faktury s více stranami

Pokud faktura má položky na více stranách, systém musí správně spojit data. To je složitější než zpracování jednostránkového dokumentu a občas se stane, že se položka ztratí.

📌 Důležité: Žádný systém není 100% přesný. Vždy si nechte čas na kontrolu výsledků, zejména u důležitých dokladů.

Bezpečnost a ochrana dat

Faktury obsahují citlivá firemní data — IČO, částky, bankovní účty, někdy i osobní údaje. Je logické se ptát: kam ta data putují a kdo k nim má přístup?

Zpracování u MIKISI:

Co se týče GPT-4:

MIKISI používá OpenAI API s vypnutým ukládáním dat pro trénování. Vaše faktury se nepřidávají do trénovacích dat OpenAI. Data jsou zpracována, vrácen výsledek a smazána. OpenAI má certifikace SOC 2 a dodržuje GDPR.

💡 Tip: Pokud máte velmi přísné požadavky na bezpečnost (banky, zdravotnictví, státní správa), ptejte se poskytovatelů na konkrétní certifikace, lokaci serverů a politiku zpracování dat. Ne všechny služby jsou stejné.

Pro firmy s požadavkem na on-premise řešení existují i self-hosted alternativy — ale jsou výrazně dražší a složitější na provoz. Pro většinu malých a středních firem je cloudové řešení dostatečně bezpečné.

Často kladené otázky

Může AI přečíst razítko nebo podpis na faktuře?

Částečně. OCR dokáže rozpoznat text v razítku (název firmy, IČO), pokud je čitelný. Podpisy jsou problematické — AI je vnímá jako grafiku, ne text. Pro účetní zpracování ale podpis většinou nepotřebujete digitalizovat — stačí, že je na původním dokumentu.

Jak AI pozná, která částka je ta „správná"?

Na faktuře bývá více částek — základ DPH, DPH, celkem bez DPH, celkem s DPH. AI hledá popisky („Celkem k úhradě", „Částka celkem", „Total") a kontextové vodítka (největší částka, částka v patičce). Pokud jsou na faktuře nejednoznačné údaje, systém označí pole k manuální kontrole.

Co když dodavatel používá úplně nestandardní fakturu?

AI si poradí s většinou nestandardních formátů díky pochopení kontextu. Pokud jde o skutečně exotický formát (faktura jako e-mail, faktura v tabulce Excelu), přesnost klesá. V takových případech doporučujeme požádat dodavatele o standardní PDF fakturu — je to běžný požadavek.

Učí se AI z mých oprav?

Záleží na poskytovateli. U MIKISI se systém učí ze souhrnných vzorců (ne z konkrétních dat jednotlivých uživatelů) a zlepšuje rozpoznávání specifických formátů. Pokud opakovaně opravujete stejnou chybu, můžete nás kontaktovat — pravděpodobně jde o systematický problém, který můžeme vyřešit.

Jaké formáty souborů MIKISI podporuje?

Podporujeme PDF, JPG, PNG, TIFF a HEIC (fotky z iPhone). PDF je preferovaný formát — obsahuje přímo textovou vrstvu, takže OCR nemusí „hádat" z obrázku. U skenů a fotek kvalita závisí na rozlišení a osvětlení.

Shrnutí

AI zpracování faktur kombinuje tři technologie: OCR pro čtení textu, velké jazykové modely (GPT-4) pro pochopení struktury a validační pravidla pro kontrolu správnosti. Omezení zahrnují ruční písmo, nestandardní formáty a velmi nekvalitní vstupy. Data jsou chráněna šifrováním a zpracovávána v souladu s GDPR. Pro většinu firem je AI vytěžování bezpečné a ekonomicky výhodné řešení.

Chcete vidět AI v akci?

Vyzkoušejte MIKISI na vlastní faktuře. Nahrajte dokument, sledujte, jak AI vytěží data, a exportujte do Pohody. 10 dokladů měsíčně zdarma.

Vyzkoušet zdarma

Máte technické dotazy? Napište na [email protected] — rádi vysvětlíme detaily.

Zpět na blog