background image

κ.α. Πριν όμως την εφαρμογή των μορφολογικών χειριστών, εφαρμόζονται φίλτρα

εξομάλυνση της εικόνας όπως η κατωφλίωση (thresholding), το Γκαουσιανό θόλωμα

(Gaussian blur) κ.α. Εκτός από την απομάκρυνση του θορύβου σκοπός των τεχνικών

αυτών είναι η βελτιστοποίηση της οπτικής εμφάνισης μιας εικόνας, έτσι όπως την

αντιλαμβάνεται το ανθρώπινο μάτι. Επιπροσθέτως, γεμίζουν τα κενά της εικόνας

με σκοπό να μην υπάρχουν «λευκά» διαστήματα ανάμεσα στα pixel που αποτελούν

το περίγραμμά (contour) τους.

Οι παρακάτω τεχνικές που αναλύονται αποτελούν μέρος των εργαλείων που χρη-

σιμοποιήθηκαν στη παρούσα εργασία. Συγκεκριμένα, εφαρμόστηκαν στη λειτουργία

εντοπισμού αντικειμένων βάση του χρώματος και του σχήματος καθώς και για τον

εντοπισμό γενικού τύπου αντικειμένων. Η λειτουργία εντοπισμού γενικού τύπου

αντικειμένων, αναπτύχθηκε έτσι ώστε να είναι δυνατή η εύρεση της γωνίας θέσης

των αντικειμένων που ανήκουν στην λίστα που αναγνωρίζονται από τον αλγόριθμο

Yolo, καθώς και των αντικειμένων που φέρουν ετικέτα QR code.

Φίλτρο διάβρωσης εικόνας (erosion)

Η διάβρωση είναι ένας από τους δύο βασικούς τελεστές στον τομέα της μορ-

φολογικών χειριστών, ο άλλος είναι η διαστολή. Συνήθως εφαρμόζεται σε δυαδικές

εικόνες, αλλά υπάρχουν εκδόσεις που λειτουργούν σε εικόνες κλίμακας του γκρι.

Η βασική ιδέα της διάβρωσης είναι η αφαίρεση των νέων στοιχείων που εισά-

γονται στην εικόνα και ανήκουν σε άλλα αντικείμενα, κρατώντας πάντα το λευκό

σε πρώτο πλάνο. Ουσιαστικά, διαβρώνει τα όρια του αντικειμένου προσκηνίου προ-

σπαθώντας πάντα να διατηρήσει το προσκήνιο σε λευκό. Αρχικά χρειάζεται δύο

εισόδους, την αρχική εικόνα και δομικό στοιχείο ή πυρήνας (kernel). Έπειτα ο πυ-

ρήνας σαρώνει την εικόνα pixel προς pixel και εκτελείται η ακόλουθη μεταβολή

τιμών:

Ένα pixel στην αρχική εικόνα είτε φέρει την τιμή 1 είτε 0, θα πάρει την τιμή 1

μόνο εάν όλα τα pixels κάτω από το kernel είναι 1, αλλιώς γίνεται μηδέν (διαβρώ-

νεται).

105