Nenadzorovano učenje: učni primeri niso označeni (atributi brez ciljne spremenljivke) porazdelitev primerov v smiselne skupine - učenje vzorcev v podatkih
Bolj subjektivno, a velikokrat ne moremo pridobiti označenih primerov
Gručenje: iskanje homogenih podskupin v učnih podatkih
Hierarhično gručenje
Neznano št. iskanih gruč
Pristopa: združevalni - od listov (najmanjših gruč) proti korenu (enotni gruči) / delilni - obratno
Lastnosti:
- Normalizacija atributov
- Časovna zahtevnost: združevanje + deljenje

Merjenje razdalj
Med učnimi primeri: znane mere razdalj
Med učnim primerom in gručo / med gručami:
- razdalja med najbližjima primeroma - enojna povezanost (single linkage)
- razdalja med najbolj oddaljenima primeroma - popolna povezanost (complete linkage)
- povprečna razdalja med vsemi primeri - povprečna povezanost (average linkage)

Metoda voditeljev (k-means gručenje)
Znano želeno št. gruč =
- Naključno priredi učne primere eni od gruč
- V vsaki gruči izračunaj centroid: srednja točka po vrednosti atributov vseh primerov gruče
- Spremeni pripadnost vseh primerov glede na najbližji centroid
Ponavljaj 2/3 do konvergence
Lastnosti:
- ne najdemo globalnega optimuma (odvisno od inicializacije)
- občutljivost na šum
- težka objektivna evalvacija
