background image

τείνει μία καθολική διαδικασία εκπαίδευσης. Με τον τρόπο αυτόν, το υπολογιστικό

κόστος υπολογισμού χαρακτηριστικών διαμοιράζεται μεταξύ των περιοχών. Όσον

αφορά το Faster R-CNN, αυτό αντικαθιστά τους αλγορίθμους πρότασης περιοχών

με ένα μικρό CNN το οποίο ονομάζεται Δίκτυο πρότασης περιοχών και υπολογίζει

τις υποψήφιες προς αναγνώριση περιοχές σαφώς ταχύτερα.

Yolo

Ο YOLO παίρνει το όνομά του από την φράση You Only Look Once (Κοιτάς

Μόνο Μία Φορά) λόγω του γεγονότος ότι χρησιμοποιεί ένα πλήρες συνδεδεμένο

νευρωνικό δίκτυο που με ένα πέρασμα ελέγχει την εικόνα για αντικείμενα, στα

οποία έχει εκπαιδευτεί να αναγνωρίζει. Ο Yolo σε αντίθεση με τα άλλα συστήματα,

δεν χρησιμοποιεί τις περιοχές ενδιαφέροντος ώστε να τις τροφοδοτήσει σε ένα συ-

νελικτικό δίκτυο, αλλά τεμαχίζει την εικόνα σε κελιά (cells), που στο σύνολό τους

δημιουργούν ένα πλέγμα (grid), με S

×S κελιά τα οποία χρησιμοποιούνται κατά την

διαδικασία της εκπαίδευσης. Ουσιαστικά, αντιμετωπίζει την ανίχνευση σαν μια δια-

δικασία παλινδρόμησης σε χωρικά διαχωρισμένα πλαίσια οριοθέτησης (bounding

boxes) και σχετικές πιθανότητες κλάσης. Οι ικανότητες του επιπλέον της ταχύτητας

και της ακρίβειας, είναι και ο ταυτόχρονος εντοπισμός πολλών διαφορετικών αντι-

κειμένων σε μία εικόνα και ο εντοπισμός τους στο χώρο.

Ο YOLO v3 είναι μια βελτίωση σε σχέση με τα προηγούμενα δίκτυα ανίχνευσης

YOLO. Σε σύγκριση με προηγούμενες εκδόσεις, διαθέτει ανίχνευση πολλαπλής κλί-

μακας, ισχυρότερο δίκτυο εξαγωγής χαρακτηριστικών και ορισμένες αλλαγές στη

λειτουργία απώλειας.

Ένα Πλήρες Συνελικτικό Νευρωνικό Δίκτυο

Ο YOLO v3 χρησιμοποιεί μόνο συνελικτικά στρώματα, καθιστώντας τον ένα πλή-

ρως συνδεδεμένο συνελικτικό δίκτυο. Οι συγγραφείς στη δημοσίευση του αλγορίθ-

μου παρουσιάζουν μια νέα, βαθύτερη αρχιτεκτονική του εξαγωγέα χαρακτηριστι-

κών που ονομάζεται Darknet-53. Όπως υποδηλώνει το όνομά του, το Darknet-53

60