Obsah
Prezentace UIlabu: Sémantické učení legislativy
Jak to udělat, aby nejen UI rozuměla české legislativě
Tvorba a implementace sémantického jazykového modelu legislativy
Michal Rada
UIlab, Zákony pro lidi, EGdílna, Česká zemědělská univerzita
předmluva...
Za touto zjednodušenou prezentací jsou další dost technické a odborné zdroje, se kterými vás nebudeme teď zatěžovat.
Pokud máte o tuto problematiku zájem, můžeme si k tomu udělat klidně separátní schůzku.
Proč UI dává špatné odpovědi?
Když se pokusíte zeptat se umělé inteligence na něco z legislativy, výsledek je otřesný.
🫱 Příklad: Můžu si ve smlouvě podle občanského zákoníku sjednat výpověď z nájmu na 24 hodin?
> Odpověď: vypíše něco o chránění práv nájemce, ale připustí, že to jde ve smlouvě sjednat, pokud s tím obě strany souhlasí.
Další nesrovnalosti jsou třeba: Zákon č. 111/2024 o základním registru obyvatel, Vyhláška o základních registrech, apod.
Kde je problém?
UI funguje na principu takzvaných trénovaných modelů, tedy
- Co si přečte, to se snaží zahrnout
- Snaží se o maximální míru kreativity, pokud není omezena
- Využívá Sémantické indexy a Zdroje pro trénování
…tedy pro UI není ve výchozím stavu rozdíl mezi Občanským zákoníkem a Pohádkou o Červené Karkulce
Tři druhy UI
Umělou inteligenci jako takovou můžeme rozdělit podle toho, jak funguje - respektive z jakých dat je trénována a pro jaké typy úloh:
- Generalizovaná umělá inteligence (GUI): UI trénovaná na velkém množství obecných da
- Trénovaná umělá inteligence (TUI): UI jež je trénovaná na odborných datech pro jednu oblast nebo jeden typ výsledků
- Specializovaná umělá inteligence (SUI): UI jež je speciálně trénovaná na specifické a tedy neobecné úkoly a způsoby práce
…my pro správnou interpretaci potřebujeme TUI trénovanou a schopnou porozumět legislativě
S čím má UI v právu pracovat
- Přikázání (zdroj)
- Zákony, právní předpisy, ustanovení, závazné předpisy
- Pohádka (opravy)
- Judikáty, výklady, stanoviska soudů, metodiky
- Produkt (výsledek)
- Smlouvy, právní texty, právní stanoviska
Práce s přikázáním (legislativa)
Legislativa, respektive právní předpisy mají svá specifika a to zejména
- Musí se číst a chápat komplexně
- Nejedná se o jeden dokument, ale o všechny dokumenty různě propojené
- Nejde číst zhora dolů
- Obsahuje různé kličky, pasti, těžko pochopitelné texty a dost složitý jazyk
- Jenže z ní všechno pochází, je to naprostý základ
Důležité je právě to, že legislativa má vlastní specifický jazyk jako třeba kmen lidojedů v Africe.
Práce s opravami (judikáty, výklady)
Druhým důležitým zdrojem jsou judikáty a výklady, které jsou vlastně opravami a vysvětleními k legislativě
- Judikáty a výklady nesmí měnit samotnou legislativu a pouze ji vykládá a zpřesňuje
- Tím zpřesňuje určitý kontext zaměřený na konkrétní detaily
- Je v odkazování důležitá podobně jako samotné právní předpisy
Práce s produkty (smlouvy, právní texty)
Úkoly pro UI v souvislosti s tvorbou a analýzou právních textů jsou různé
- Tvorba textů založených na legislativě
- Analýza textů a porovnávání s legislativou
- Vyhledávání a zpracování informací z textů na základě legislativy
- Analýza judikátů a výkladů a jejich dopadu při praktickém využití legislativy
- Porovnávání textů a jejich souvislostí bez nutnosti vazby na legislativu
Pro všechny kromě posledního musí ale UI správně rozumět legislativnímu základu i podrobnostem
Co je to SLM a EBNM
Abychom mohli komukoliv včetně UI vysvětlit jak chápat legislativu, musíme vytvořit a naučit základní pravidla.
Extended Backus–Naur form je standard pro definici jazyků a pravidel, Semantic language modelnazyk.
Výhoda UI je její dynamické myšlení. Historicky se musely SLM modely programovat do datových struktur a ručně tagovat, UI umí SLM pochopit a učit se podle něj.
Podklad pro SLM model
Třídy obsahu
Jako vstupní zdroje
- Předpis
- Rodina předpisu (Předpis, Prováděcí předpisy, Předpisy a ustanovení jež zmiňuje)
Jako vstupní data:
- Dokument obsahující Fragmenty
- Metadata předpisu
- Ustanovení (spojené fragmenty celého ustanovení)
- Fragment ustanovení (třeba písmeno, bod, odstavec)
Třídy sémantické ontologie
- Pojem + jeho Definice (ne každý ji má)
- Činnost či událost a nebo Úkon
- Konstatace a to
- Souborná konstatace
- Rozdílová konstatace
- Podmínka (pokud je složená, tak…)
- Souborná podmínka
- Rozdílová podmínka