Nenadzorovano učenje: učni primeri niso označeni (atributi brez ciljne spremenljivke) porazdelitev primerov v smiselne skupine - učenje vzorcev v podatkih
Bolj subjektivno, a velikokrat ne moremo pridobiti označenih primerov

Gručenje: iskanje homogenih podskupin v učnih podatkih

Hierarhično gručenje

Neznano št. iskanih gruč
Pristopa: združevalni - od listov (najmanjših gruč) proti korenu (enotni gruči) / delilni - obratno
Lastnosti:

  • Normalizacija atributov
  • Časovna zahtevnost: združevanje + deljenje

Merjenje razdalj

Med učnimi primeri: znane mere razdalj
Med učnim primerom in gručo / med gručami:

  • razdalja med najbližjima primeroma - enojna povezanost (single linkage)
  • razdalja med najbolj oddaljenima primeroma - popolna povezanost (complete linkage)
  • povprečna razdalja med vsemi primeri - povprečna povezanost (average linkage)

Metoda voditeljev (k-means gručenje)

Znano želeno št. gruč =

  1. Naključno priredi učne primere eni od gruč
  2. V vsaki gruči izračunaj centroid: srednja točka po vrednosti atributov vseh primerov gruče
  3. Spremeni pripadnost vseh primerov glede na najbližji centroid

Ponavljaj 2/3 do konvergence
Lastnosti:

  • ne najdemo globalnega optimuma (odvisno od inicializacije)
  • občutljivost na šum
  • težka objektivna evalvacija