Diskriminácia
Diskriminácia v AI označuje nespravodlivé alebo nerovné zaobchádzanie s jednotlivcami alebo skupinami na základe chránených charakteristík, ako sú rasa, pohlavi...
Diskriminačné modely sú AI modely, ktoré sa učia rozhodovaciu hranicu medzi triedami pre úlohy ako klasifikácia a regresia a vynikajú v aplikáciách, ako je detekcia spamu a rozpoznávanie obrázkov.
Diskriminačný AI model je typ modelu strojového učenia používaný predovšetkým na úlohy klasifikácie a regresie. Tieto modely sa sústreďujú na modelovanie rozhodovacej hranice medzi rôznymi triedami v dátovej množine. Namiesto pochopenia spôsobu, akým sú dáta generované (ako to robia generatívne modely), sa diskriminačné modely učia podmienené pravdepodobnostné rozdelenie (P(y|x)), kde (y) predstavuje popisku alebo triedu a (x) pozorované dáta či vlastnosti.
Jednoduchšie povedané, diskriminačné modely sa snažia rozlíšiť medzi rôznymi triedami učením vzťahu medzi vstupnými dátami a výstupnými popiskami. Odpovedajú na otázku: „Na základe týchto vstupných dát, do ktorej triedy najpravdepodobnejšie patria?“
Diskriminačné modely pracujú tak, že sa učia hranicu, ktorá oddeľuje rôzne triedy v dátach. Robia to priamym odhadom podmienenej pravdepodobnosti (P(y|x)) bez zohľadnenia toho, ako boli dáta generované. Tento prístup im umožňuje zamerať sa na rozdiely medzi triedami, čím sú veľmi efektívne pri klasifikačných úlohach.
Jadrom diskriminačných modelov je podmienené pravdepodobnostné rozdelenie (P(y|x)). Modelovaním tohto rozdelenia diskriminačné modely predpovedajú pravdepodobnosť popisky (y) vzhľadom na pozorované dáta (x).
Napríklad, pri binárnej klasifikácii, kde chceme roztriediť e-maily na „spam“ alebo „nie spam“, sa diskriminačný model naučí (P(spam|vlastnosti e-mailu)). Zameriava sa na hľadanie rozhodovacej hranice, ktorá najlepšie oddeľuje spamové e-maily od tých ne-spamových na základe extrahovaných vlastností.
Kľúčovým pojmom v diskriminačných modeloch je rozhodovacia hranica. Táto hranica definuje oblasti vo vlastnostnom priestore, kde model priraďuje rôzne triedy. Diskriminačné modely sa túto hranicu učia optimalizovaním svojich parametrov tak, aby minimalizovali chyby klasifikácie alebo maximalizovali pravdepodobnosť správnych predpovedí.
Viacero algoritmov strojového učenia patrí medzi diskriminačné modely. Medzi najpoužívanejšie patria:
Logistická regresia je štatistický model využívaný na binárne klasifikačné úlohy. Modeluje pravdepodobnosť, že daný vstup (x) patrí do určitej triedy (y) pomocou logistickej funkcie:
P(y=1|x) = 1 / (1 + e^{-(β₀ + β₁x₁ + β₂x₂ + … + βₙxₙ)})
Koeficienty β sa učia počas trénovania modelu na čo najlepšie prispôsobenie dátam.
Podporné vektorové stroje sú silné klasifikátory, ktoré hľadajú hyperrovinu najlepšie oddeľujúcu dáta do rôznych tried. Maximalizujú margin medzi bodmi rôznych tried, čo napomáha lepšej generalizácii.
Rozhodovacie stromy sú modely, ktoré využívajú stromovú štruktúru rozhodnutí na klasifikáciu dát. Každý vnútorný uzol reprezentuje vlastnosť, každá vetva rozhodovaciu podmienku a každý list výstup alebo triedu.
Náhodné lesy sú ansámblové modely, ktoré počas učenia vytvárajú viaceré rozhodovacie stromy a výsledkom je najčastejšia trieda (pri klasifikácii) jednotlivých stromov. Zlepšujú presnosť predikcií a obmedzujú preučenie.
Umelé neurónové siete pozostávajú zo vzájomne prepojených uzlov (neurónov), ktoré dokážu zachytiť zložité, nelineárne vzťahy v dátach. Sú veľmi úspešné napríklad pri rozpoznávaní obrazu a reči.
Diskriminačné modely sa vďaka schopnosti priamo modelovať rozhodovaciu hranicu medzi triedami široko používajú v rôznych aplikáciách. Sú obzvlášť účinné tam, kde je hlavným cieľom presná klasifikácia alebo predikcia na základe pozorovaných dát.
Diskriminačné modely vynikajú v klasifikačných úlohách, kde je cieľom priradiť vstupné dáta jednej z vopred definovaných kategórií.
Aj keď sa diskriminačné modely najčastejšie spájajú s klasifikáciou, môžu byť použité aj na regresné úlohy, kde je cieľom predpovedať spojitú výstupnú premennú na základe vstupných vlastností.
V NLP sa diskriminačné modely používajú na úlohy ako:
Diskriminačné modely sú zásadné pri úlohách počítačového videnia, ako napríklad:
Kým diskriminačné modely sa zameriavajú na modelovanie (P(y|x)), generatívne modely odhadujú spoločné pravdepodobnostné rozdelenie (P(x, y)) a dokážu generovať nové vzorky dát. Snažia sa modelovať spôsob, akým sú dáta generované, čo je užitočné napríklad pri generovaní obrázkov alebo augmentácii dát.
Aspekt | Diskriminačné modely | Generatívne modely |
---|---|---|
Zameranie | Rozhodovacia hranica medzi triedami | Základné rozdelenie dát |
Požiadavka na dáta | Označené dáta | Môžu využívať neoznačené dáta |
Príklady algoritmov | Logistická regresia, SVM, neurónové siete | Naivný Bayes, GANy, Skryté Markovove modely |
Využitie | Klasifikácia, regresia | Generovanie dát, imputácia chýbajúcich dát |
Generatívna schopnosť | Nedokáže generovať nové dáta | Dokáže generovať nové vzorky dát |
V oblasti AI automatizácie a chatbotov zohrávajú diskriminačné modely kľúčovú úlohu v presnom porozumení a reakcii systémov na vstupy používateľov.
Chatboty využívajú diskriminačné modely na klasifikáciu zámerov používateľa na základe jeho správ. Modelovaním pravdepodobnosti zámeru dokáže chatbot určiť, čo chce používateľ dosiahnuť (napr. „rezervovať let“, „zistiť počasie“).
Identifikácia kľúčových entít vo vstupoch používateľa, ako sú dátumy, lokality alebo mená, je nevyhnutná pre presné odpovede. Diskriminačné modely môžu byť trénované na rozpoznávanie a klasifikáciu týchto entít v texte.
Porozumenie sentimentu v správach používateľov pomáha prispôsobiť odpovede. Diskriminačné modely dokážu klasifikovať správy podľa toho, či vyjadrujú pozitívny, negatívny alebo neutrálny postoj.
Predikciou najvhodnejšej ďalšej akcie vzhľadom na aktuálny stav konverzácie diskriminačné modely pomáhajú riadiť tok dialógu v chatbotoch tak, aby bola komunikácia súvislá a kontextuálne vhodná.
Diskriminačné modely v posledných rokoch výrazne získali na popularite, pričom výskum sa zameriava na riešenie výziev týkajúcich sa férovosti, zaujatosti a etického riadenia AI systémov.
„Putting AI Ethics into Practice: The Hourglass Model of Organizational AI Governance“ od Matti Mäntymäki a kol. (2023) predstavuje rámec riadenia pomáhajúci organizáciám implementovať etické princípy AI a zosúladiť sa s pripravovaným európskym AI aktom. Model kladie dôraz na riadenie na rôznych úrovniach a zabezpečuje zodpovedný vývoj AI systémov počas ich životného cyklu (arXiv:2301.03131).
„Implications of the AI Act for Non-Discrimination Law and Algorithmic Fairness“ od Luca Deck a kol. (2024) rozoberá, ako môže AI akt preklenúť priepasť medzi algoritmickou férovosťou a antidiskriminačným právom zameraním sa na detekciu a korekciu zaujatosti už v štádiu návrhu AI modelov, čím sa zvyšuje férovosť a zodpovednosť (arXiv:2406.2689).
„Speciesist bias in AI“ od Thilo Hagendorffa a kol. (2022) upozorňuje na často prehliadanú zaujatosti voči zvieratám v AI systémoch. Práca skúma, ako sú speciesistické vzorce zakorenené v AI aplikáciách v dôsledku zaujatých dátových množín a poukazuje na širšie dôsledky férovosti presahujúce ľudské zaujatosti (arXiv:2202.2222).
Diskriminačný AI model je model strojového učenia používaný najmä na úlohy klasifikácie a regresie. Zameriava sa na učenie rozhodovacej hranice medzi triedami modelovaním podmienenej pravdepodobnosti P(y|x), priamo prepájajúc vstupné dáta s popiskami.
Diskriminačné modely sa učia rozhodovaciu hranicu modelovaním P(y|x), so zameraním na klasifikáciu alebo regresiu. Generatívne modely naopak modelujú spoločnú pravdepodobnosť P(x, y), čo im umožňuje generovať nové vzorky dát a pochopiť rozdelenie dát.
Medzi bežné diskriminačné modely patria logistická regresia, podporné vektorové stroje (SVM), rozhodovacie stromy, náhodné lesy a neurónové siete.
Široko sa používajú pri detekcii spamu, rozpoznávaní obrázkov, analýze sentimentu, predikcii cien nehnuteľností, predpovedaní akciového trhu, spracovaní prirodzeného jazyka a v chatbotov na klasifikáciu zámerov a rozpoznávanie entít.
Diskriminačné modely ponúkajú vysokú presnosť klasifikácie, flexibilitu pri modelovaní zložitých vzťahov, efektívnosť vďaka tomu, že nemodelujú celé rozdelenie dát, a odolnosť voči odľahlým hodnotám.
Vyžadujú označené dáta na trénovanie, sú náchylné na preučenie pri zložitých modeloch a nedokážu generovať nové vzorky dát, čo obmedzuje ich použitie pri úlohách syntézy dát.
Inteligentné chatboty a AI nástroje pod jednou strechou. Prepojte intuitívne bloky a premeňte svoje nápady na automatizované Flows.
Diskriminácia v AI označuje nespravodlivé alebo nerovné zaobchádzanie s jednotlivcami alebo skupinami na základe chránených charakteristík, ako sú rasa, pohlavi...
Základný AI model je veľkorozmerný model strojového učenia trénovaný na obrovskom množstve dát, prispôsobiteľný širokej škále úloh. Základné modely priniesli re...
Deterministický model je matematický alebo výpočtový model, ktorý pre danú sadu vstupných podmienok produkuje jediný, jednoznačný výstup, čím poskytuje predvída...