Náš přístup v MIKISI — Proč jsme zvolili AI bez šablon

Pohled do zákulisí MIKISI: proč jsme se rozhodli pro AI přístup bez šablon, jak funguje naše technologie a jaké výhody to přináší uživatelům.

Náš přístup v MIKISI — Proč jsme zvolili AI bez šablon

Když jsme začínali budovat MIKISI, stáli jsme před zásadním rozhodnutím: jakou technologii použít pro vytěžování faktur? Na trhu existovaly osvědčené přístupy — OCR se šablonami, manuální zpracování s pomocnými nástroji, specializované enterprise platformy. Rozhodli jsme se jít jinou cestou.

V tomto článku vám vysvětlíme, proč jsme zvolili kombinaci OCR a AI bez šablon, jak náš technologický stack funguje a jaké výhody tento přístup přináší. Půjdeme do technických detailů, ale srozumitelně — abyste pochopili, co se děje „pod kapotou", když nahrajete fakturu do MIKISI.

Pokud vás zajímá základní přehled o vytěžování faktur, začněte článkem Úvod do vytěžování faktur.

Obsah

Proč ne šablony

Šablonový přístup funguje skvěle v určitých scénářích: máte 5 hlavních dodavatelů, jejich faktury se nemění, objemy jsou vysoké. Nastavíte šablonu jednou a funguje měsíce bez zásahu.

Ale my jsme viděli jinou realitu. Účetní kanceláře zpracovávají faktury od stovek různých firem. Malé firmy mají desítky dodavatelů, kteří se mění. Každý dodavatel má jiný formát faktury. A dodavatelé své faktury občas mění — nový design, jiné umístění údajů.

Šablonový přístup v této situaci selhává:

Chtěli jsme nástroj, který funguje „out of the box". Nahrajete fakturu — jakoukoliv fakturu — a systém ji zpracuje. Bez předchozího nastavování, bez vytváření šablon, bez učení systému.

💡 Naše filozofie: Uživatel by neměl být IT specialista. Měl by nahrát fakturu a dostat data. Veškerá komplexita by měla být skrytá pod kapotou.

Náš technologický stack

MIKISI kombinuje tři hlavní technologie:

Vrstva Technologie Účel
OCR Google Cloud Vision + Tesseract Čtení textu z obrázku/PDF
AI analýza AI model Porozumění struktuře, extrakce dat
Validace Vlastní pravidla + ARES API Kontrola správnosti, automatické opravy

Každá vrstva řeší jiný problém. OCR čte text rychle a levně. AI rozumí kontextu a struktuře. Validace zajišťuje, že data dávají smysl. Kombinace těchto vrstev dosahuje lepších výsledků než kterákoliv vrstva samostatně. Podrobnosti o tom, jak AI zpracování funguje, najdete v článku Jak funguje AI při zpracování faktur.

OCR vrstva — čtení textu

První krok zpracování faktury je převod obrázku na text. Používáme dvě OCR technologie:

Google Cloud Vision

Cloudová služba od Google s velmi vysokou přesností rozpoznávání. Zvládá různé fonty, jazyky (včetně češtiny s háčky a čárkami), a dokonce částečně i rukopis. Je to naše primární OCR engine.

Tesseract (záložní)

Open-source OCR engine. Používáme ho jako zálohu a pro specifické případy, kde Cloud Vision selhává. Tesseract běží lokálně, takže nezávisíme na dostupnosti cloudové služby.

Předzpracování obrázku:

Než obrázek pošleme do OCR, provedeme sérii úprav:

Tyto úpravy výrazně zlepšují kvalitu OCR, zejména u fotek z telefonu nebo nekvalitních skenů.

AI analýza — porozumění struktuře

OCR nám dá text, ale neví, co který text znamená. Vidí „12345678", ale neví, že to je IČO. Tady nastupuje AI model.

AI je multimodální model — umí zpracovat jak text, tak obrázky. Posíláme mu:

  1. Původní obrázek faktury (pro vizuální kontext)
  2. Text z OCR (pro přesné hodnoty)
  3. Strukturovaný prompt s instrukcemi

Model analyzuje fakturu a vrací strukturovaná data v JSON formátu:

{
  "supplier_ico": "12345678",
  "supplier_name": "Firma s.r.o.",
  "invoice_number": "FV-2026-0042",
  "date_issued": "2026-02-15",
  "date_due": "2026-03-01",
  "total_amount": 12100.00,
  "currency": "CZK",
  ...
}

Proč AI?

17 validačních pravidel

AI není neomylná. Proto máme třetí vrstvu — validaci. 17 pravidel kontroluje, že vytěžená data dávají smysl:

Formátová pravidla:

Kalkulační pravidla:

Externí validace:

Automatické opravy:

Některé chyby umíme opravit automaticky:

📌 Důležité: Automatické opravy provádíme jen u jednoznačných případů. Pokud je situace nejednoznačná, označíme pole k ruční kontrole — raději necháme rozhodnout člověka.

Více o bezpečnosti a ochraně dat najdete v článku Bezpečnost dat při zpracování faktur.

Proč kombinace funguje

Každá technologie má své slabiny. OCR nerozumí kontextu. AI může „halucinovat" — vymyslet si hodnotu, která na faktuře není. Validace nezachytí všechny chyby.

Ale když je zkombinujete, slabiny se navzájem kompenzují:

Výsledkem je systém, který je přesnější než kterákoliv jeho součást samostatně.

Výhody našeho přístupu

Pro uživatele:

Pro nás jako vývojáře:

Pro český trh:

Často kladené otázky

Proč nepoužíváte jen AI bez OCR?

Mohli bychom posílat obrázky přímo do AI. Ale OCR je rychlejší a levnější pro čtení textu. AI pak řeší jen to, co umí nejlépe — porozumění kontextu. Kombinace je efektivnější.

Co když AI model není dostupný?

Máme fallback mechanismy. Pokud OpenAI API není dostupné, zpracování se zařadí do fronty a dokončí se, jakmile je služba obnovena. Kritická infrastruktura (OCR, validace) běží nezávisle.

Jak řešíte ochranu dat?

Data posíláme do OpenAI API s vypnutým ukládáním pro trénování. Vaše faktury se nepřidávají do trénovacích dat. Servery MIKISI jsou v EU. Dodržujeme GDPR.

Učí se váš systém z mých faktur?

Ze souhrnných vzorců ano — například pokud vidíme, že určitý formát datumu je častý, zlepšíme jeho rozpoznávání. Z konkrétních dat jednotlivých uživatelů ne — vaše faktury zůstávají vaše.

Plánujete přidat šablony jako doplněk?

Zvažujeme to pro specifické případy — například když má zákazník dodavatele s extrémně nestandardním formátem, kde AI opakovaně selhává. Ale jako primární přístup zůstáváme u AI bez šablon.

Shrnutí

MIKISI kombinuje OCR pro čtení textu, AI model pro porozumění struktuře a 17 validačních pravidel pro kontrolu správnosti. Tento přístup bez šablon funguje na jakoukoliv fakturu bez předchozího nastavení. Slabiny jednotlivých technologií se navzájem kompenzují, výsledkem je systém přesnější než kterákoliv jeho součást samostatně. Pro uživatele to znamená jednoduchost — nahrajete fakturu, dostanete data.

Chcete začít s MIKISI? Přečtěte si praktický návod Jak začít s MIKISI.

Vyzkoušejte náš přístup

10 dokladů měsíčně zdarma. Nahrajte fakturu a uvidíte, jak to funguje.

Zaregistrovat se zdarma

Máte technické dotazy? Napište na [email protected].

Zpět na blog