{{tag>prezentace}} ~~SLIDESHOW~~ # Prezentace UIlabu: Sémantické učení legislativy Jak to udělat, aby nejen UI rozuměla české legislativě Tvorba a implementace sémantického jazykového modelu legislativy Michal Rada UIlab, Zákony pro lidi, EGdílna, Česká zemědělská univerzita ## předmluva... Za touto zjednodušenou prezentací jsou další dost technické a odborné zdroje, se kterými vás nebudeme teď zatěžovat. Pokud máte o tuto problematiku zájem, můžeme si k tomu udělat klidně separátní schůzku. ## Proč UI dává špatné odpovědi? Když se pokusíte zeptat se umělé inteligence na něco z legislativy, výsledek je otřesný. > 🫱 Příklad: Můžu si ve smlouvě podle občanského zákoníku sjednat výpověď z nájmu na 24 hodin? > Odpověď: vypíše něco o chránění práv nájemce, ale připustí, že to jde ve smlouvě sjednat, pokud s tím obě strany souhlasí. Další nesrovnalosti jsou třeba: Zákon č. 111/2024 o základním registru obyvatel, Vyhláška o základních registrech, apod. ## Kde je problém? UI funguje na principu takzvaných trénovaných modelů, tedy - Co si přečte, to se snaží zahrnout - Snaží se o maximální míru kreativity, pokud není omezena - Využívá Sémantické indexy a Zdroje pro trénování ...tedy pro UI není ve výchozím stavu rozdíl mezi Občanským zákoníkem a Pohádkou o Červené Karkulce ## Tři druhy UI {{page>rozdeleni-ui-podle-fungovani&noheader}} ...my pro správnou interpretaci potřebujeme TUI trénovanou a schopnou porozumět legislativě ## S čím má UI v právu pracovat 1. Přikázání (zdroj) - Zákony, právní předpisy, ustanovení, závazné předpisy 2. Pohádka (opravy) - Judikáty, výklady, stanoviska soudů, metodiky 3. Produkt (výsledek) - Smlouvy, právní texty, právní stanoviska ## Práce s přikázáním (legislativa) Legislativa, respektive právní předpisy mají svá specifika a to zejména - Musí se číst a chápat komplexně - Nejedná se o jeden dokument, ale o všechny dokumenty různě propojené - Nejde číst zhora dolů - Obsahuje různé kličky, pasti, těžko pochopitelné texty a dost složitý jazyk - Jenže z ní všechno pochází, je to naprostý základ Důležité je právě to, že legislativa má vlastní specifický jazyk jako třeba kmen lidojedů v Africe. ## Práce s opravami (judikáty, výklady) Druhým důležitým zdrojem jsou judikáty a výklady, které jsou vlastně opravami a vysvětleními k legislativě - Judikáty a výklady nesmí měnit samotnou legislativu a pouze ji vykládá a zpřesňuje - Tím zpřesňuje určitý kontext zaměřený na konkrétní detaily - Je v odkazování důležitá podobně jako samotné právní předpisy ## Práce s produkty (smlouvy, právní texty) Úkoly pro UI v souvislosti s tvorbou a analýzou právních textů jsou různé - Tvorba textů založených na legislativě - Analýza textů a porovnávání s legislativou - Vyhledávání a zpracování informací z textů na základě legislativy - Analýza judikátů a výkladů a jejich dopadu při praktickém využití legislativy - Porovnávání textů a jejich souvislostí bez nutnosti vazby na legislativu Pro všechny kromě posledního musí ale UI správně rozumět legislativnímu základu i podrobnostem ## Co je to SLM a EBNM Abychom mohli komukoliv včetně UI vysvětlit jak chápat legislativu, musíme vytvořit a naučit základní pravidla. [Extended Backus–Naur form](https://en.wikipedia.org/wiki/Extended_Backus%E2%80%93Naur_form) je standard pro definici jazyků a pravidel, [Semantic language model](https://arxiv.org/abs/2310.07815)nazyk. Výhoda UI je její dynamické myšlení. Historicky se musely SLM modely programovat do datových struktur a ručně tagovat, UI umí SLM pochopit a učit se podle něj. ## Podklad pro SLM model ![Diagram sémantiky legislativy](https://www.mermaidchart.com/raw/986b09ec-d02e-4a00-bcf4-1e47223e43c2?theme=light&version=v0.1&format=png) [rodící se dokumentace SLM](https://github.com/egdilna/slm-legislativa/blob/main/dokumentace.md) ## Třídy obsahu Jako vstupní zdroje - Předpis - Rodina předpisu (Předpis, Prováděcí předpisy, Předpisy a ustanovení jež zmiňuje) Jako vstupní data: - Dokument obsahující Fragmenty - Metadata předpisu - Ustanovení (spojené fragmenty celého ustanovení) - Fragment ustanovení (třeba písmeno, bod, odstavec) ## Třídy sémantické ontologie * Pojem + jeho Definice (ne každý ji má) * Činnost či událost a nebo Úkon * Konstatace a to * Souborná konstatace * Rozdílová konstatace * Podmínka (pokud je složená, tak...) * Souborná podmínka * Rozdílová podmínka