background image

εκπαίδευσής. Την δεκαετία του 1990 χρησιμοποιήθηκαν για τη λύση του προβλήμα-

τος της αναγνώρισης εικόνων. Τα τελευταία χρόνια το ενδιαφέρον της επιστημονικής

κοινότητας έχει στραφεί έντονα στα νευρωνικά δίκτυα λόγω της προόδου στον σχε-

διασμό υλικού, της μετάβασης σε ολοένα και μικρότερες λιθογραφίες ολοκλήρωσης

επεξεργαστών, της ανάπτυξης νέων μηχανισμών παραλληλοποίησης, της αύξησης

του μέγεθος της μνήμης, καθώς και της αφθονίας των διαθέσιμων δεδομένων. Στον

τομέα της μηχανικής όρασης έχει σημειωθεί σημαντική πρόοδος στους αλγορίθμους

που χρησιμοποιούν CNN και πλέον μέθοδοι όπως YOLO [38] και Faster R-CNN [39]

βρίσκονται στο επίκεντρο.

Ο τρόπος λειτουργίας δεν διαφέρει με αυτόν που παρουσιάστηκε προηγουμένως,

δηλαδή αποτελούνται από πολλά επίπεδα, όπου το κάθε επίπεδο αποτελείται από

έναν αριθμό νευρώνων οι οποίοι έχουν σαν παραμέτρους εκμάθησης τα βάρη τους

w

i

j

την τιμή πόλωσης

b

i

. To σήμα εισόδου εισέρχεται σε κάθε νευρώνα εκτελείται

μία πράξη εσωτερικού γινομένου και μπορεί να εφαρμοστεί στο αποτέλεσμα μία

μη γραμμική συνάρτηση. Το τελευταίο επίπεδο των CNN είναι πλήρες συνδεδεμένο

και έχει μία συνάρτηση σφάλματος. Η διαφορά μεταξύ των μοντέλων CNN και των

ANN έγκειται στο γεγονός ότι τα δεδομένα εισόδου των CNN είναι εικόνες.

Στα CNN η τελική πληροφορία δομείται από μικρότερα τμήματα πληροφορίας

τα οποία ενώνονται σταδιακά σε κάθε επίπεδο. Για παράδειγμα, σε ένα μοντέλο

CNN το πρώτο επίπεδο προσπαθεί να εντοπίσει ακμές, το δεύτερο επίπεδο παίρνει

την πληροφορία των ακμών και προσπαθεί να εντοπίσει περιγράμματα κ.λπ.

Εάν υποθέσουμε ότι θέλουμε να εισάγουμε μια εικόνα σε ένα δίκτυο CNN, το

οποίο έχει οριστεί να δέχεται εικόνες ανάλυσης 32x32 και έχοντας υπόψιν ότι κάθε

εικονοστοιχείo που υπάρχει στην εικόνα χαρακτηρίζεται από 3 τιμές στο χρωματικό

μοντέλο RGB, τότε το επίπεδο εισόδου θα έχει διαστάσεις 32x32x3 εισάγοντας έτσι

την έννοια του βάθους.

50