Ľudia a stroje organizujú svet veľmi odlišnými spôsobmi. Ľudia sú dobrí v spájaní malých súborov údajov do väčších vzorov: Vajcia, čokoláda, maslo, cukor a múka? Znie to ako zmes sušienok. Počítače sú na druhej strane dobré pri triedení obrovských súborov údajov do klastrov bez dohľadu: Všetky tieto ingrediencie sa objavujú v receptoch na sladkosti. Môžu však bojovať s detailmi: Počkaj, čo robí táto Tootsie Roll v mojom koláčiku? Nový model strojového učenia z MIT má za cieľ odstrániť túto medzeru.
Ak doteraz vedci požiadali počítač, aby triedil dátové body bez dozoru, najlepšie, čo mohli urobiť, bolo hodiť podobne vyzerajúce veci na veľkú hromadu – proces známy ako modelovanie tém. The model MIT požiada počítač, aby obmedzil veľkosť každej kôpky a zorganizoval ju podľa prototypu. Inými slovami, algoritmus s väčšou pravdepodobnosťou hodí Tootsie Rolls na samostatnú hromadu od sušienky, pretože sa neobjavujú v najtypickejšom príklade receptu na sušienky.
![Algoritmus spája dátové body dohromady podľa vzájomnej podobnosti a podľa reprezentatívneho príkladu. Na tomto obrázku sú spoločné podobnosti pre každú súpravu zakrúžkované modrou farbou a prototyp je umiestnený vľavo.](/f/cc13ca04fb65a886e305ff4c69e53b7b.jpg)
Strojové učenie a triedenie
Príklad z tlačová správa ilustruje, aký rozdiel môže spôsobiť:
Aby výskumníci Julie Shah a Been Kim otestovali, aký úžitok môžu mať ľudia z vývoja, vložili recepty na jedlo do starého systému modelovania tém a svojho nového prototypového softvéru. Starší tematický model vypľul zoznam ingrediencií, zatiaľ čo nový algoritmus našiel typickejší príklad receptu. Ich testované subjekty boli 86 percent úspešné pri varení jedál podľa typického receptu, ale iba 71 percent zo zoznamu ingrediencií.
Čo sa teda stane, keď myslenie na počítači vyzerá trochu viac ako ľudské? Momentálne o 15 percent viac študentov Cambridge grad dostáva sušienky.
Správy MIT