background image

κάθε φορά και ούτω καθεξής. Μικρή ολίσθηση οδηγεί σε μεγαλύτερη έξοδο και

αντίστροφα. Επίσης, σε ορισμένες περιπτώσεις, το φίλτρο δεν ταιριάζει τέλεια στην

εικόνα εισόδου και για να μη χαθούν τυχόν χαρακτηριστικά που βρίσκονται κοντά

στο πλαίσιο της εικόνας, είτε εφαρμόζεται γέμισμα (padding), συνήθως με μηδενικά

(zero padding) στο περίγραμμα της, είτε αγνοείται αυτό το σημείο της εικόνας οπού

το φίλτρο δεν ταίριαξε τέλεια. Αυτό καλείται έγκυρο padding (valid padding) στο

οποίο κρατείται μόνο το ωφέλιμο σημείο της εικόνας. Τόσο το padding, όσο και το

depth και το stride αποτελούν υπερπαραμέτρους του δικτύου.

Συνοψίζοντας τη διαδικασία που αναλύθηκε δοθέντος μιας εισόδου με μέγεθος

W

1

× H

1

× D

1

εφαρμόζοντας Ν αριθμό φίλτρων μεγέθους K

× K × D

1

με βήμα μετα-

τόπισης (stride) S και γέμισμα (padding) P, ο παραγόμενος όγκος θα έχει μέγεθος

W

2

× H

2

× D

2

.

W

1

=

W

1

− K + 2P

+ 1

(2.6)

H

2

=

H

1

− K + 2P

+ 1

(2.7)

D

1

K

(2.8)

Στο επόμενο στάδιο της διαδικασίας οι χάρτες χαρακτηριστικών περνάνε από τις

συναρτήσεις ενεργοποίησης. Στα συνελικτικά νευρωνικά δίκτυα χρησιμοποιούνται

οι ReLU και η παραλλαγή της Leaky ReLU.

Επίπεδο Συγκέντρωσης (Pooling Layer)

Το επίπεδο συγκέντρωσης τοποθετείται μετά το επίπεδο συνέλιξης. Η κύρια χρη-

σιμότητά του έγκειται στη μείωση των διαστάσεων του όγκου δεδομένων και κατά

επέκταση των παραμέτρων και της πολυπλοκότητας του για το επόμενο επίπεδο

συνέλιξης. Δεν επηρεάζει τη διάσταση βάθους του όγκου των δεδομένων. Η λει-

τουργία που εκτελείται από αυτό το επίπεδο ονομάζεται επίσης «down sampling»

(μείωση δειγματοληψίας), καθώς η μείωση του μεγέθους οδηγεί και σε απώλεια

πληροφοριών. Ωστόσο, μια τέτοια απώλεια είναι επωφελής για το δίκτυο για δύο

λόγους:

54