Strojno učenje

Gradnja dreves

Zgradi odločitveno drevo za napovedovanje ciljne spremenljivke, izbira najboljšega atributa z (razmerjem) informacijskega prispevka:

(Binarizacija atributov)
I
Za vsak atribut Gain, Ires (in GainRatio, I)
Deliš po najvišjem Gainu
Ponavljaš rekurzivno

Zgradi regresijsko drevo:

Za vsak zvezen atribut poskusi vse delitve, za vsak zvezni atribut 1 delitev
Za vsako delitev izračunaj MSE in Ires(A)
Od vseh izberemo tisto delitev z najmanjšim Ires
Ponavljaš rekurzivno

Ovrednotenje dreves/primerov

Ovrednoti kvaliteto drevesa s testno množico:

Vse primere spusti po drevesu, štej TP, TN, FP, FN
Računaš po formulah

Ovrednoti klasifikacijsko točnost z x-kratnim prečnim / leave-one-out preverjanjem:

Za vsako testno skupino / vsak primer naredi drevo (iz ostalih skupin)
Za vsako drevo se s testnimi primeri spusti po drevesu, štej TP, TN, FP, FN
Računaš po formulah

Oceni kvaliteto napovedi k-NN z x-kratnim prečnim / leave-one-out preverjanjem:

(Normalizacija atributov)
Medsebojne razdalje med primeri (tabela)
Za vsak primer vzemi k najbližjih sosedov (ne iz istega bloka)
Napoved bo povprečje njihovih vrednosti, kvadratna napaka (vrednost-napoved)^2, kvadratne napake znotraj skupin povprečiš
Izračunaj MSE_CV / MSE_LOO = (vsota povprečnih kvadratnih napak skupin oz. primerov) / št. primerov

Rezanje dreves

Odločitveno drevo reži z REP (, rezalna množica):

(Vse primere spusti po drevesu) - šteješ [#pravilnih, napačnih] klasifikacij
Od vključno staršev listov drevesa navzgor - št. napačnih v listih poddrevesa $\geq$ št. napačnih v vozlišču → reži

Odločitveno drevo reži z MEP, _ ocena verjetnosti:

Od listov navzgor, računaš statične in vzvratne napake - upoštevaj oceno verjetnosti
Pri staršu statična $<$ vzvratna → reži

Naivni Bayes

Klasificiraj primer z naivnim Bayesom, _ ocena verjetnosti:

Za vse vrednosti ciljnega razreda: h(ciljni/atributi primerov) npr. DA, NE ali A, B, C
Višji h normaliziraj v verjetnost

Nomogram

Naredi nomogram po naivnem Bayesu za ciljni razred, _ ocena verjetnosti, _ logaritem:

Za vsak atribut izračunaj za vse možne vrednosti atributa točke(Ciljni razred/vrednost)
Nariši

kNN in regresija

Klasificiraj primer z k-NN, _ razdalja:

(Normalizacija vrednosti - isti max, min na učnih in testnih podatkih)
Za vse primere izračunaj razdaljo do iskanega primera
Vzemi jih k najbližjih - klasificiraj kot njihov večinski razred

Lokalna utežena regresija, utež, _razdalja:

(Normalizacija vrednosti - isti max, min na učnih in testnih podatkih)
Za vse primere izračunaj razdaljo do iskanega primera, iz nje pa utež po dani formuli
Izračunaj uteženo vsoto - napoved

Razvrščanje

Gručenje s k-voditelji (k-means), _ razdalja, začetni primeri:

Centroidi gruč: povprečja atributov
Razdalje primerov do centroidov + prerazporedi
Ponavljaj dokler se ne ustalijo

Dendrogram, hierarhično gručenje, _ razdalja, _ povezanost:

(Normalizacija atributov)
Medsebojne razdalje med primeri (tabela)
Primera z najmanjšo medsebojno razdaljo poveži - povezanost upoštevaj pri računanju novih vrednosti
Ponavljaj, dokler nimaš 1 skupine

Preiskovanje

Tabela: (meja), razvita, generirana, vrsta

Neinformirani preiskovalni algoritmi

BFS: razvij najbolj plitvo nerazvito vozlišče $\to$ FIFO vrsta razvijanja, končamo ob razvitju konca
DFS: razvij najglobje nerazvito vozlišče $\to$ LIFO sklad, končamo ob razvitju konca
Iterativno poglabljanje: DFS po iteracijah globine, končamo ob razvitju konca
Dvosmerno iskanje: vzporedna BFS iz vsake strani, končamo ob sklenitvi poti
Cenovno-optimalno iskanje: BFS, razvij vozlišče z najmanjšo dosedanjo skupno ceno poti $\to$ fronta v prioritetni vrsti, končamo ob generaciji konca

Informirani preiskovalni algoritmi

$f (n)$ … cenilna funkcija, $h (n)$ … hevristika, $g (n)$ … znana cena poti
Požrešno iskanje: $f (n) = h (n)$
A*: $f (n) = g (n) + h (n)$
IDA*: iterativno poglabljanje dokler je $f (n) \leq m e ja$

Lokalno preiskovanje

Plezanje na hrib:

(Naključna začetna rešitev)
Generiramo sosednje rešitve (vse možne postavitve ob zamenjavi 2 elementov)
Izberemo najbolje ocenjeno
Ponavljamo dokler niso vse sosednje rešitve slabše od trenutne

Simulirano ohlajanje:

(Naključna začetna rešitev)
Naključno izberemo sosednjo rešitev
$e^{\frac{Δ E}{t}} > nak l j u \overset{c}{ˇ} n o g e n er i r an o \overset{s}{ˇ} t e v i l o m e d 0 in 1$ $\to$ vzemi novo, sicer ohrani staro
Zmanjšaj temperaturo $t$
Ponavljaj dokler $t > 0$

Lokalno preiskovanje v snopu:

Hranimo k aktualnih stanj, izbiramo k optimalnih sosedov
Ocenjujemo kakovost cele generacije

Preiskovanje stanj

MINIMAX:
3. Izriši drevo vseh potez
4. Ovrednoti končna stanja (liste)
5. Ovrednoti stanja navzgor glede na to, kdo je na vrsti - MIN bo vzel najmanjšo oceno od otrok, MAX največjo

Alfa-beta rezanje:
6. Začetno vozlišče: $[α, β] = [- \infty, \infty]$
7. Na vsakem koraku prenašamo $[α, β]$ v globino
8. Ob vračanju posodabljamo $[α, β]$ glede na najdene vrednosti
- MAX posodablja le $α$ (najvišji že najdeni maksimum)
- MIN posodablja le $β$ (najnižji že najdeni minimum)il67ujkjk8zhji
9. V nekem vozlišču $α \geq β$ $\to$ prekinemo preiskovanje ostalih poddreves

Prostor stanj

Nariši prostor verjetnih stanj in prehodov, najdi pot do cilja z _ preiskovalnim algoritmom

Regresiranje ciljev

Preiskovanje iz začetnega do ciljnega stanja z _ preiskovalnim algoritmom, definicije akcij ki jih vzemamo v _ vrstnem redu:
10. Stanje: […]
11. Cilji: […], vzamemo prvega ki še ni narejen (če so vsi narejeni končamo)
12. Najdemo akcijo ki vzpostavi ta cilj, v akciji imamo lahko spremenljivke
13. Za vse možne vrednosti spremenljivke zpišemo tabelo možnosti akcij in predpogojev
14. Tabelo uredimo po št. neizpolnjenih predpogojev
15. V plan dodamo prvo akcijo kjer $c i l ji \cap d e l = 0$ , $re g res i r ani c i l ji = c i l ji \cup p re d p o g o ji (A) - a dd (A)$
16. Ponavljamo dokler ne dosežemo ciljev začetnega stanja ali omejitve dolžine plana, v slednjem primeru se vrnemo in poskusimo naslednjo možnost

Razporejanje opravil

Razporejanje opravil:

Nariši graf z vejitvijo
Od začetka proti koncu vozliščem določi ES
Od konca proti začetku vozliščem določi LS
Vsem vozliščem določi rezervo

Upoštevanje resursov:

Graf, ES, LS in rezerve
Na vsaki iteraciji dodeli najbolj zgodnji možen začetek akciji z najmanjšo časovno rezervo in izpolnjeni predhodniki
Ponavljaj dokler ne obdelaš vseh vozlišč

Bayesovske mreže

Poišči množice vozlišč, ki d-ločujejo pare vozlišč:

Poišči vse preproste poti med parom vozlišč
Za vsako vozlišče na poti najdi množico $E$ , ki d-ločuje
Množice $E$ za vozlišča nato združi v unijo
Ponovi za vse poti
Množice $E$ za poti združi s presekom

Poenostavi pogojni del v izrazu:

Za vse pare $x$ - $a$ gledaš, da mora biti množica ostalih danih pogojnih vozlišč v $E$
Če sta $x$ in $a$ po definiciji pogojno odvisna (povezana), $a$ ne moremo dati ven
$a$ lahko damo ven ( $x$ je neodvisen od $a$ ), če je množica ostalih danih pogojnih vozlišč element $E$

Ali sta vozlišči pogojno neodvisni pri danih znanih vozliščih:

Dana znana vozlišča (če jih ni mora biti prazna množica) morajo biti v $E$
Da/ne, utemeljitev iz grafa

Ali velja $P (x / y, z, w) = P (x / y)$ :

2 možnosti
- Za vse pare $x$ - $a$ gledaš, da morajo biti ostala dana pogojna vozlišča v $E$
- Vse poti med $x$ in $z$ morajo biti zaprte, poznamo $y$
Da/ne, utemeljitev iz grafa - če da je $x$ pogojno odvisen od $a$ , zato $a$ ne moremo odstraniti

SubNotes

Explorer

Postopki