Page 57

• Μάθηση χωρίς επίβλεψη (Unsupervised Learning): Τα δεδομένα δεν έχουν ετι-

κέτες (labels) αφήνοντας έτσι τον αλγόριθμο ML να μάθει από τα δεδομένα

εξερευνώντας διάφορα μοτίβα.

• Εκμάθηση δια ανταμοιβής (Reinforcement Learning): Ο πράκτορας αλληλε-

πιδρά με ένα δυναμικό περιβάλλον στο οποίο πρέπει να εκτελέσει ένα συ-

γκεκριμένο στόχο. Το μοντέλο πράκτορας «αμείβεται» ή «τιμωρείται» για τις

αποφάσεις που πήρε προκειμένου να φτάσει στον στόχο του. Ένα παράδειγμα

εφαρμογής είναι η αυτόματη πλοήγηση ενός οχήματος αποφυγής εμποδίων.

Γενικότερα, οι αλγόριθμοι ML ομαδοποιούνται και ανάλογα με την ομοιότητα

τους σε σχέση με την λειτουργία που εκτελούν.

Στη Εικόνα 2.5 απεικονίζεται το διάγραμμα Venn των διαφόρων αλγοριθμικών

κατηγοριών ML.

Εικόνα. 2.5: Διάγραμμα Venn των διαφόρων κατηγοριών μηχανικής μάθησης