Jak funguje AI při zpracování faktur — Od fotky k datům
Vyfotíte fakturu nebo účtenku telefonem (nevíte jaký je rozdíl mezi paragonem, účtenkou a fakturou?), nahrajete do aplikace — a za okamžik máte všechna data vytěžená a připravená pro import do účetního systému. IČO, částka, datum splatnosti, variabilní symbol. Všechno správně, bez přepisování. Zní to jako magie, ale je za tím konkrétní technologie. Pojďme si vysvětlit, jak to vlastně funguje.
V tomto článku vám ukážeme cestu faktury od vstupu až po export dat. Rozebereme tři klíčové technologie: OCR (optické rozpoznávání znaků), velké jazykové modely a validační pravidla. Vysvětlíme, proč kombinace těchto přístupů funguje lépe než každý zvlášť. A na konci odpovíme na časté otázky o přesnosti, bezpečnosti a omezeních AI.
Článek je určený pro všechny, kdo chtějí pochopit, co se děje „pod kapotou" moderních nástrojů pro vytěžování faktur. Nebudeme zacházet do matematických detailů neuronových sítí — zaměříme se na praktické pochopení procesu.
Obsah
- Cesta faktury — od vstupu k datům
- OCR — jak počítač čte text z obrázku
- AI analýza — jak AI rozumí struktuře
- Validace — kontrola správnosti dat
- Proč kombinace OCR + AI funguje nejlépe
- Omezení AI — kdy systém chybuje
- Bezpečnost a ochrana dat
- Často kladené otázky
Cesta faktury — od vstupu k datům
Celý proces zpracování faktury lze rozdělit do pěti kroků. Každý krok řeší jiný problém a používá jinou technologii:
| Krok | Co se děje | Technologie |
|---|---|---|
| 1. Vstup | Nahrání souboru (PDF, JPG, PNG) | Upload API |
| 2. Předzpracování | Úprava obrázku (rotace, kontrast) | Image processing |
| 3. OCR | Rozpoznání textu z obrázku | Tesseract / Cloud OCR |
| 4. AI analýza | Extrakce strukturovaných dat | GPT-4 Vision |
| 5. Validace | Kontrola a oprava dat | Business rules + API |
💡 Tip: Rychlost zpracování závisí na kvalitě vstupu. Čisté PDF se zpracuje rychleji než rozmazaná fotka. Pokud chcete nejrychlejší výsledky, posílejte faktury v původním digitálním formátu (PDF z e-mailu), ne skeny nebo fotky.
Pojďme si jednotlivé kroky rozebrat podrobněji.
OCR — jak počítač čte text z obrázku
OCR (Optical Character Recognition) je technologie stará přes 100 let — první pokusy o strojové čtení textu sahají do roku 1914. Moderní OCR používá neuronové sítě a dosahuje přesnosti přes 99 % na kvalitním textu.
Princip je jednoduchý: OCR analyzuje obrázek pixel po pixelu, hledá tvary, které odpovídají písmenům. Rozpozná „A" jako dva šikmé čáry spojené vodorovnou čarou. Rozpozná „8" jako dvě propojené smyčky. Každý znak má svůj vizuální „otisk".
Moderní OCR engine (například Google Cloud Vision, Amazon Textract nebo open-source Tesseract) umí:
- Rozpoznat různé fonty — od Times New Roman po ručně psané písmo
- Zvládat různé jazyky — včetně češtiny s háčky a čárkami
- Číst různé orientace — otočený text, text pod úhlem
- Ignorovat šum — skvrny, přeškrtnutí, vodoznaky
📌 Důležité: Samotné OCR vám dá jen „surový" text — blob všech slov z faktury v pořadí, jak je engine přečetl. OCR neví, že „12345678" je IČO a „15.02.2026" je datum. K tomu potřebujete další vrstvu — AI analýzu.
Předzpracování obrázku před OCR výrazně zlepšuje výsledky. MIKISI automaticky provádí:
- Deskew — narovnání šikmo naskenovaného dokumentu
- Denoising — odstranění šumu a zrnění
- Binarizace — převod na černobílý obraz pro lepší kontrast
- Detekce orientace — otočení faktury správným směrem
Díky těmto úpravám dokáže systém zpracovat i nekvalitní fotky z telefonu — pomačkaný papír, stíny, špatné osvětlení.
AI analýza — jak AI rozumí struktuře
OCR přečte text, ale nerozumí mu. Vidí „Celkem k úhradě: 12 100 Kč", ale neví, že to je finální částka faktury. Tady nastupuje AI — konkrétně velké jazykové modely (LLM).
AI byla natrénována na obrovském množství textu z internetu — včetně milionů faktur, účetních dokumentů a finančních formulářů. Díky tomu „zná" typickou strukturu české faktury. Ví, že IČO má 8 číslic, že datum splatnosti bývá po datu vystavení, že DPH se počítá ze základu.
MIKISI používá AI, která umí zpracovat nejen text, ale i obrázky. To má dvě výhody:
- Vizuální kontext — AI vidí, kde na faktuře je která informace (hlavička, tabulka, patička)
- Záložní čtení — když OCR něco přehlédne, AI to může přečíst přímo z obrázku
Příklad: Faktura má v hlavičce dvě IČO — dodavatele a odběratele. Klasické OCR obě přečte, ale neví, které je které. AI pochopí z kontextu (pozice na stránce, popisky „Dodavatel" a „Odběratel"), které IČO patří komu.
AI analýza funguje v několika krocích:
1. Identifikace typu dokumentu
Je to faktura, dobropis, zálohová faktura, účtenka? Každý typ má jiná pole a jinou strukturu.
2. Lokalizace klíčových polí
Kde na dokumentu je IČO? Kde je celková částka? Kde jsou položky? AI hledá typické vzory a popisky.
3. Extrakce hodnot
Vytažení konkrétních hodnot z identifikovaných polí. „IČO: 12345678" → IČO = 12345678.
4. Normalizace formátu
Převod na jednotný formát. „15. února 2026" → 2026-02-15. „12 100,- Kč" → 12100.00.
Výstupem je strukturovaný JSON objekt se všemi vytěženými údaji — připravený pro validaci a export.
Validace — kontrola správnosti dat
AI není neomylná. I ona může udělat chybu — přehlédnout číslo, zaměnit dvě podobné hodnoty, špatně interpretovat neobvyklý formát. Proto je klíčová validace — automatická kontrola, že vytěžená data dávají smysl.
MIKISI používá 17 validačních pravidel, která kontrolují:
| Pravidlo | Co kontroluje | Příklad chyby |
|---|---|---|
| Formát IČO | 8 číslic, kontrolní součet | IČO má 7 číslic |
| Existence v ARES | IČO existuje v registru | Firma neexistuje |
| Formát DIČ | CZ + 8–10 číslic | Chybí prefix CZ |
| Kontrola DPH | Základ × sazba = DPH | DPH nesedí o 1 Kč |
| Součet položek | Položky = celková částka | Chybí jedna položka |
| Datum logika | Splatnost ≥ vystavení | Splatnost před vystavením |
| Formát účtu | Platný český bankovní účet | Neexistující kód banky |
Když validace najde problém, systém se pokusí o automatickou opravu. Například:
- IČO má 7 číslic → doplnění úvodní nuly (často chybí při ručním psaní)
- DIČ bez prefixu → přidání „CZ" pro české firmy
- DPH nesedí o haléře → zaokrouhlení podle účetních pravidel
⚠️ Pozor: Automatická oprava funguje jen u jednoznačných případů. Pokud je nejasné, co je správně, systém označí pole jako „vyžaduje kontrolu" a nechá rozhodnutí na uživateli.
Validace proti externím registrům (ARES, registr plátců DPH) je klíčová pro kontrolní hlášení. MIKISI automaticky ověří, že dodavatel existuje a je (nebo není) plátcem DPH — to pomáhá odhalit podvodné faktury nebo překlepy v IČO.
Proč kombinace OCR + AI funguje nejlépe
Na trhu existují tři přístupy k vytěžování faktur:
- Pouze OCR — rychlé, ale bez porozumění struktuře
- Pouze AI (end-to-end) — rozumí struktuře, ale náročnější na zdroje
- OCR + AI kombinace — rychlost OCR + inteligence AI
MIKISI používá třetí přístup a zde je proč:
Rychlost: Klasické OCR je extrémně rychlé — zpracuje stránku za zlomek sekundy. Posílat celý obrázek do AI by bylo náročnější. OCR udělá „hrubou práci" rychle, AI pak zpracuje extrahovaný text.
Přesnost: OCR engine (třeba Tesseract nebo Google Cloud Vision) je optimalizovaný přesně na čtení textu — dělá to spolehlivěji než obecný model AI. Ale OCR nerozumí kontextu. AI zase rozumí kontextu, ale občas „přehlédne" detail. Kombinace obou přístupů kompenzuje slabiny každého.
Náklady: Díky kombinaci můžeme nabídnout zpracování za jednotky korun na doklad, což je výrazně ekonomičtější než čisté AI řešení.
💡 Tip: Některé konkurenční služby používají „čisté" AI řešení (posílají celý obrázek do GPT-4 nebo Claude). Funguje to, ale je to náročnější na zdroje. Pro běžné faktury je kombinace OCR + AI optimální volbou.
Výjimkou jsou velmi nekvalitní vstupy (rozmazané fotky, rukou psané dokumenty) — tam může end-to-end AI přístup fungovat lépe, protože AI umí „domýšlet" nečitelná místa z kontextu. MIKISI proto pro problematické dokumenty automaticky přepíná do režimu, kdy se více spoléhá na AI.
Omezení AI — kdy systém chybuje
AI není všemocná. Je důležité znát omezení, abyste věděli, kdy musíte výsledky pečlivěji kontrolovat:
Rukou psané dokumenty
Rozpoznávání ručního písma je stále výrazně horší než tištěný text. Pokud máte fakturu s ručně dopsanými údaji, počítejte s nižší přesností. AI se zlepšuje, ale stále nedosahuje lidské úrovně čtení rukopisu.
Nestandardní formáty
AI se učila na typických fakturách. Neobvyklé layouty (faktura ve formě tabulky, faktura bez standardních popisků) mohou způsobit problémy. Čím více se faktura liší od běžného vzoru, tím vyšší riziko chyby.
Velmi nízká kvalita obrázku
Rozmazané fotky, nízké rozlišení, silné přeexponování — to vše zhoršuje výsledky. OCR potřebuje čitelné písmeny. Pokud člověk stěží přečte text, AI to neudělá lépe.
Cizojazyčné faktury
MIKISI je optimalizované pro české faktury. Slovenské a anglické zvládá dobře, ale exotické jazyky (arabština, čínština, japonština) mohou být problematické — jak pro OCR, tak pro AI analýzu.
Faktury s více stranami
Pokud faktura má položky na více stranách, systém musí správně spojit data. To je složitější než zpracování jednostránkového dokumentu a občas se stane, že se položka ztratí.
📌 Důležité: Žádný systém není 100% přesný. Vždy si nechte čas na kontrolu výsledků, zejména u důležitých dokladů.
Bezpečnost a ochrana dat
Faktury obsahují citlivá firemní data — IČO, částky, bankovní účty, někdy i osobní údaje. Je logické se ptát: kam ta data putují a kdo k nim má přístup?
Zpracování u MIKISI:
- Přenos přes HTTPS — všechna data jsou šifrovaná během přenosu
- Ukládání v EU — servery jsou v evropských datových centrech (Německo)
- Minimalizace dat — po zpracování můžete původní soubor smazat, zachová se jen strukturovaný výstup
- Žádné sdílení — vaše data se nepoužívají k trénování AI modelů třetích stran
Co se týče GPT-4:
MIKISI používá OpenAI API s vypnutým ukládáním dat pro trénování. Vaše faktury se nepřidávají do trénovacích dat OpenAI. Data jsou zpracována, vrácen výsledek a smazána. OpenAI má certifikace SOC 2 a dodržuje GDPR.
💡 Tip: Pokud máte velmi přísné požadavky na bezpečnost (banky, zdravotnictví, státní správa), ptejte se poskytovatelů na konkrétní certifikace, lokaci serverů a politiku zpracování dat. Ne všechny služby jsou stejné.
Pro firmy s požadavkem na on-premise řešení existují i self-hosted alternativy — ale jsou výrazně dražší a složitější na provoz. Pro většinu malých a středních firem je cloudové řešení dostatečně bezpečné.
Často kladené otázky
Může AI přečíst razítko nebo podpis na faktuře?
Částečně. OCR dokáže rozpoznat text v razítku (název firmy, IČO), pokud je čitelný. Podpisy jsou problematické — AI je vnímá jako grafiku, ne text. Pro účetní zpracování ale podpis většinou nepotřebujete digitalizovat — stačí, že je na původním dokumentu.
Jak AI pozná, která částka je ta „správná"?
Na faktuře bývá více částek — základ DPH, DPH, celkem bez DPH, celkem s DPH. AI hledá popisky („Celkem k úhradě", „Částka celkem", „Total") a kontextové vodítka (největší částka, částka v patičce). Pokud jsou na faktuře nejednoznačné údaje, systém označí pole k manuální kontrole.
Co když dodavatel používá úplně nestandardní fakturu?
AI si poradí s většinou nestandardních formátů díky pochopení kontextu. Pokud jde o skutečně exotický formát (faktura jako e-mail, faktura v tabulce Excelu), přesnost klesá. V takových případech doporučujeme požádat dodavatele o standardní PDF fakturu — je to běžný požadavek.
Učí se AI z mých oprav?
Záleží na poskytovateli. U MIKISI se systém učí ze souhrnných vzorců (ne z konkrétních dat jednotlivých uživatelů) a zlepšuje rozpoznávání specifických formátů. Pokud opakovaně opravujete stejnou chybu, můžete nás kontaktovat — pravděpodobně jde o systematický problém, který můžeme vyřešit.
Jaké formáty souborů MIKISI podporuje?
Podporujeme PDF, JPG, PNG, TIFF a HEIC (fotky z iPhone). PDF je preferovaný formát — obsahuje přímo textovou vrstvu, takže OCR nemusí „hádat" z obrázku. U skenů a fotek kvalita závisí na rozlišení a osvětlení.
Shrnutí
AI zpracování faktur kombinuje tři technologie: OCR pro čtení textu, velké jazykové modely (GPT-4) pro pochopení struktury a validační pravidla pro kontrolu správnosti. Omezení zahrnují ruční písmo, nestandardní formáty a velmi nekvalitní vstupy. Data jsou chráněna šifrováním a zpracovávána v souladu s GDPR. Pro většinu firem je AI vytěžování bezpečné a ekonomicky výhodné řešení.
Chcete vidět AI v akci?
Vyzkoušejte MIKISI na vlastní faktuře. Nahrajte dokument, sledujte, jak AI vytěží data, a exportujte do Pohody. 10 dokladů měsíčně zdarma.
Máte technické dotazy? Napište na [email protected] — rádi vysvětlíme detaily.