{{tag>prezentace}}
~~SLIDESHOW~~
# Prezentace UIlabu: Sémantické učení legislativy
Jak to udělat, aby nejen UI rozuměla české legislativě
Tvorba a implementace sémantického jazykového modelu legislativy
Michal Rada
UIlab, Zákony pro lidi, EGdílna, Česká zemědělská univerzita
## předmluva...
Za touto zjednodušenou prezentací jsou další dost technické a odborné zdroje, se kterými vás nebudeme teď zatěžovat.
Pokud máte o tuto problematiku zájem, můžeme si k tomu udělat klidně separátní schůzku.
## Proč UI dává špatné odpovědi?
Když se pokusíte zeptat se umělé inteligence na něco z legislativy, výsledek je otřesný.
> 🫱 Příklad: Můžu si ve smlouvě podle občanského zákoníku sjednat výpověď z nájmu na 24 hodin?
> Odpověď: vypíše něco o chránění práv nájemce, ale připustí, že to jde ve smlouvě sjednat, pokud s tím obě strany souhlasí.
Další nesrovnalosti jsou třeba: Zákon č. 111/2024 o základním registru obyvatel, Vyhláška o základních registrech, apod.
## Kde je problém?
UI funguje na principu takzvaných trénovaných modelů, tedy
- Co si přečte, to se snaží zahrnout
- Snaží se o maximální míru kreativity, pokud není omezena
- Využívá Sémantické indexy a Zdroje pro trénování
...tedy pro UI není ve výchozím stavu rozdíl mezi Občanským zákoníkem a Pohádkou o Červené Karkulce
## Tři druhy UI
{{page>rozdeleni-ui-podle-fungovani&noheader}}
...my pro správnou interpretaci potřebujeme TUI trénovanou a schopnou porozumět legislativě
## S čím má UI v právu pracovat
1. Přikázání (zdroj)
- Zákony, právní předpisy, ustanovení, závazné předpisy
2. Pohádka (opravy)
- Judikáty, výklady, stanoviska soudů, metodiky
3. Produkt (výsledek)
- Smlouvy, právní texty, právní stanoviska
## Práce s přikázáním (legislativa)
Legislativa, respektive právní předpisy mají svá specifika a to zejména
- Musí se číst a chápat komplexně
- Nejedná se o jeden dokument, ale o všechny dokumenty různě propojené
- Nejde číst zhora dolů
- Obsahuje různé kličky, pasti, těžko pochopitelné texty a dost složitý jazyk
- Jenže z ní všechno pochází, je to naprostý základ
Důležité je právě to, že legislativa má vlastní specifický jazyk jako třeba kmen lidojedů v Africe.
## Práce s opravami (judikáty, výklady)
Druhým důležitým zdrojem jsou judikáty a výklady, které jsou vlastně opravami a vysvětleními k legislativě
- Judikáty a výklady nesmí měnit samotnou legislativu a pouze ji vykládá a zpřesňuje
- Tím zpřesňuje určitý kontext zaměřený na konkrétní detaily
- Je v odkazování důležitá podobně jako samotné právní předpisy
## Práce s produkty (smlouvy, právní texty)
Úkoly pro UI v souvislosti s tvorbou a analýzou právních textů jsou různé
- Tvorba textů založených na legislativě
- Analýza textů a porovnávání s legislativou
- Vyhledávání a zpracování informací z textů na základě legislativy
- Analýza judikátů a výkladů a jejich dopadu při praktickém využití legislativy
- Porovnávání textů a jejich souvislostí bez nutnosti vazby na legislativu
Pro všechny kromě posledního musí ale UI správně rozumět legislativnímu základu i podrobnostem
## Co je to SLM a EBNM
Abychom mohli komukoliv včetně UI vysvětlit jak chápat legislativu, musíme vytvořit a naučit základní pravidla.
[Extended Backus–Naur form](https://en.wikipedia.org/wiki/Extended_Backus%E2%80%93Naur_form) je standard pro definici jazyků a pravidel, [Semantic language model](https://arxiv.org/abs/2310.07815)nazyk.
Výhoda UI je její dynamické myšlení. Historicky se musely SLM modely programovat do datových struktur a ručně tagovat, UI umí SLM pochopit a učit se podle něj.
## Podklad pro SLM model
![Diagram sémantiky legislativy](https://www.mermaidchart.com/raw/986b09ec-d02e-4a00-bcf4-1e47223e43c2?theme=light&version=v0.1&format=png)
[rodící se dokumentace SLM](https://github.com/egdilna/slm-legislativa/blob/main/dokumentace.md)
## Třídy obsahu
Jako vstupní zdroje
- Předpis
- Rodina předpisu (Předpis, Prováděcí předpisy, Předpisy a ustanovení jež zmiňuje)
Jako vstupní data:
- Dokument obsahující Fragmenty
- Metadata předpisu
- Ustanovení (spojené fragmenty celého ustanovení)
- Fragment ustanovení (třeba písmeno, bod, odstavec)
## Třídy sémantické ontologie
* Pojem + jeho Definice (ne každý ji má)
* Činnost či událost a nebo Úkon
* Konstatace a to
* Souborná konstatace
* Rozdílová konstatace
* Podmínka (pokud je složená, tak...)
* Souborná podmínka
* Rozdílová podmínka