Strojno učenje
Gradnja dreves
Zgradi odločitveno drevo za napovedovanje ciljne spremenljivke, izbira najboljšega atributa z (razmerjem) informacijskega prispevka:
- (Binarizacija atributov)
- I
- Za vsak atribut Gain, Ires (in GainRatio, I)
- Deliš po najvišjem Gainu
- Ponavljaš rekurzivno
Zgradi regresijsko drevo:
- Za vsak zvezen atribut poskusi vse delitve, za vsak zvezni atribut 1 delitev
- Za vsako delitev izračunaj MSE in Ires(A)
- Od vseh izberemo tisto delitev z najmanjšim Ires
- Ponavljaš rekurzivno
Ovrednotenje dreves/primerov
Ovrednoti kvaliteto drevesa s testno množico:
- Vse primere spusti po drevesu, štej TP, TN, FP, FN
- Računaš po formulah
Ovrednoti klasifikacijsko točnost z x-kratnim prečnim / leave-one-out preverjanjem:
- Za vsako testno skupino / vsak primer naredi drevo (iz ostalih skupin)
- Za vsako drevo se s testnimi primeri spusti po drevesu, štej TP, TN, FP, FN
- Računaš po formulah
Oceni kvaliteto napovedi k-NN z x-kratnim prečnim / leave-one-out preverjanjem:
- (Normalizacija atributov)
- Medsebojne razdalje med primeri (tabela)
- Za vsak primer vzemi k najbližjih sosedov (ne iz istega bloka)
- Napoved bo povprečje njihovih vrednosti, kvadratna napaka (vrednost-napoved)^2, kvadratne napake znotraj skupin povprečiš
- Izračunaj MSE_CV / MSE_LOO = (vsota povprečnih kvadratnih napak skupin oz. primerov) / št. primerov
Rezanje dreves
Odločitveno drevo reži z REP (, rezalna množica):
- (Vse primere spusti po drevesu) - šteješ [#pravilnih, napačnih] klasifikacij
- Od vključno staršev listov drevesa navzgor - št. napačnih v listih poddrevesa št. napačnih v vozlišču → reži
Odločitveno drevo reži z MEP, _ ocena verjetnosti:
- Od listov navzgor, računaš statične in vzvratne napake - upoštevaj oceno verjetnosti
- Pri staršu statična vzvratna → reži
Naivni Bayes
Klasificiraj primer z naivnim Bayesom, _ ocena verjetnosti:
- Za vse vrednosti ciljnega razreda: h(ciljni/atributi primerov) npr. DA, NE ali A, B, C
- Višji h normaliziraj v verjetnost
Nomogram
Naredi nomogram po naivnem Bayesu za ciljni razred, _ ocena verjetnosti, _ logaritem:
- Za vsak atribut izračunaj za vse možne vrednosti atributa točke(Ciljni razred/vrednost)
- Nariši
kNN in regresija
Klasificiraj primer z k-NN, _ razdalja:
- (Normalizacija vrednosti - isti max, min na učnih in testnih podatkih)
- Za vse primere izračunaj razdaljo do iskanega primera
- Vzemi jih k najbližjih - klasificiraj kot njihov večinski razred
Lokalna utežena regresija, utež, _razdalja:
- (Normalizacija vrednosti - isti max, min na učnih in testnih podatkih)
- Za vse primere izračunaj razdaljo do iskanega primera, iz nje pa utež po dani formuli
- Izračunaj uteženo vsoto - napoved
Razvrščanje
Gručenje s k-voditelji (k-means), _ razdalja, začetni primeri:
- Centroidi gruč: povprečja atributov
- Razdalje primerov do centroidov + prerazporedi
- Ponavljaj dokler se ne ustalijo
Dendrogram, hierarhično gručenje, _ razdalja, _ povezanost:
- (Normalizacija atributov)
- Medsebojne razdalje med primeri (tabela)
- Primera z najmanjšo medsebojno razdaljo poveži - povezanost upoštevaj pri računanju novih vrednosti
- Ponavljaj, dokler nimaš 1 skupine
Preiskovanje
Tabela: (meja), razvita, generirana, vrsta
Neinformirani preiskovalni algoritmi
BFS: razvij najbolj plitvo nerazvito vozlišče FIFO vrsta razvijanja, končamo ob razvitju konca
DFS: razvij najglobje nerazvito vozlišče LIFO sklad, končamo ob razvitju konca
Iterativno poglabljanje: DFS po iteracijah globine, končamo ob razvitju konca
Dvosmerno iskanje: vzporedna BFS iz vsake strani, končamo ob sklenitvi poti
Cenovno-optimalno iskanje: BFS, razvij vozlišče z najmanjšo dosedanjo skupno ceno poti fronta v prioritetni vrsti, končamo ob generaciji konca
Informirani preiskovalni algoritmi
… cenilna funkcija, … hevristika, … znana cena poti
Požrešno iskanje:
A*:
IDA*: iterativno poglabljanje dokler je
Lokalno preiskovanje
Plezanje na hrib:
- (Naključna začetna rešitev)
- Generiramo sosednje rešitve (vse možne postavitve ob zamenjavi 2 elementov)
- Izberemo najbolje ocenjeno
- Ponavljamo dokler niso vse sosednje rešitve slabše od trenutne
Simulirano ohlajanje:
- (Naključna začetna rešitev)
- Naključno izberemo sosednjo rešitev
- vzemi novo, sicer ohrani staro
- Zmanjšaj temperaturo
- Ponavljaj dokler
Lokalno preiskovanje v snopu:
- Hranimo k aktualnih stanj, izbiramo k optimalnih sosedov
- Ocenjujemo kakovost cele generacije
Preiskovanje stanj
MINIMAX:
3. Izriši drevo vseh potez
4. Ovrednoti končna stanja (liste)
5. Ovrednoti stanja navzgor glede na to, kdo je na vrsti - MIN bo vzel najmanjšo oceno od otrok, MAX največjo
Alfa-beta rezanje:
6. Začetno vozlišče:
7. Na vsakem koraku prenašamo v globino
8. Ob vračanju posodabljamo glede na najdene vrednosti
- MAX posodablja le (najvišji že najdeni maksimum)
- MIN posodablja le (najnižji že najdeni minimum)il67ujkjk8zhji
9. V nekem vozlišču prekinemo preiskovanje ostalih poddreves
Prostor stanj
Nariši prostor verjetnih stanj in prehodov, najdi pot do cilja z _ preiskovalnim algoritmom
Regresiranje ciljev
Preiskovanje iz začetnega do ciljnega stanja z _ preiskovalnim algoritmom, definicije akcij ki jih vzemamo v _ vrstnem redu:
10. Stanje: […]
11. Cilji: […], vzamemo prvega ki še ni narejen (če so vsi narejeni končamo)
12. Najdemo akcijo ki vzpostavi ta cilj, v akciji imamo lahko spremenljivke
13. Za vse možne vrednosti spremenljivke zpišemo tabelo možnosti akcij in predpogojev
14. Tabelo uredimo po št. neizpolnjenih predpogojev
15. V plan dodamo prvo akcijo kjer ,
16. Ponavljamo dokler ne dosežemo ciljev začetnega stanja ali omejitve dolžine plana, v slednjem primeru se vrnemo in poskusimo naslednjo možnost
Razporejanje opravil
Razporejanje opravil:
- Nariši graf z vejitvijo
- Od začetka proti koncu vozliščem določi ES
- Od konca proti začetku vozliščem določi LS
- Vsem vozliščem določi rezervo
Upoštevanje resursov:
- Graf, ES, LS in rezerve
- Na vsaki iteraciji dodeli najbolj zgodnji možen začetek akciji z najmanjšo časovno rezervo in izpolnjeni predhodniki
- Ponavljaj dokler ne obdelaš vseh vozlišč
Bayesovske mreže
Poišči množice vozlišč, ki d-ločujejo pare vozlišč:
- Poišči vse preproste poti med parom vozlišč
- Za vsako vozlišče na poti najdi množico , ki d-ločuje
- Množice za vozlišča nato združi v unijo
- Ponovi za vse poti
- Množice za poti združi s presekom
Poenostavi pogojni del v izrazu:
- Za vse pare - gledaš, da mora biti množica ostalih danih pogojnih vozlišč v
Če sta in po definiciji pogojno odvisna (povezana), ne moremo dati ven - lahko damo ven ( je neodvisen od ), če je množica ostalih danih pogojnih vozlišč element
Ali sta vozlišči pogojno neodvisni pri danih znanih vozliščih:
- Dana znana vozlišča (če jih ni mora biti prazna množica) morajo biti v
- Da/ne, utemeljitev iz grafa
Ali velja :
- 2 možnosti
- Za vse pare - gledaš, da morajo biti ostala dana pogojna vozlišča v
- Vse poti med in morajo biti zaprte, poznamo
- Da/ne, utemeljitev iz grafa - če da je pogojno odvisen od , zato ne moremo odstraniti