background image

Εάν εξεταστεί η περίπτωση που υπάρχουν (B

×(5+C)) εισαγωγές στο χάρτη χα-

ρακτηριστικών (με το B να αντιπροσωπεύει τον αριθμό των πλαισίων οριοθέτησης

που μπορεί να προβλέψει κάθε κελί), κάθε ένα από αυτά τα κουτιά οριοθέτησης

Β μπορεί να ειδικεύεται στην ανίχνευση ενός συγκεκριμένου είδους αντικειμένου.

Κάθε ένα από τα κουτιά οριοθέτησης έχει (5 + C) ιδιότητες, οι οποίες περιγράφουν

τις συντεταγμένες κέντρου του, τις διαστάσεις, τη βαθμολογία αντικειμενικότητας

και τη τάξη C εμπιστοσύνης για την πρόβλεψη. Ο αλγόριθμος YOLO v3 προβλέπει

3 κουτιά οριοθέτησης για κάθε κελί. Αυτό σημαίνει ότι κάθε κελί που ανήκει στο

χάρτη χαρακτηριστικών μπορεί να προβλέπει ένα αντικείμενο μέσω ενός από τα

οριοθετημένα πλαίσια εάν το κέντρο του αντικειμένου βρίσκεται στην περιοχή αυ-

τού του κελιού. Αυτό συνδέεται με το πως έχει εκπαιδευτεί ο YOLO v3 όπου μόνο

ένα πλαίσιο οριοθέτησης είναι υπεύθυνο για την ανίχνευση οποιουδήποτε αντικει-

μένου.

Αρχικά για να μπορέσει να εξακριβωθεί σε ποιο κελί ανήκει αυτό το πλαίσιο οριο-

θέτησης διαιρείται η εικόνα εισόδου σε ένα πλέγμα διαστάσεων ίσο με εκείνο του

τελικού χάρτη χαρακτηριστικών. Στο παρακάτω παράδειγμα πρόκειται για εικόνα

εισόδου διαστάσεων 640 x 640 και το stride του δικτύου είναι 42. Εφαρμόζοντας

τις εξισώσεις 2.62.7, 2.8 που αναλύθηκε πριν προκύπτει πίνακας χαρακτηριστικών

μεγέθους 15 x 15 άρα και η εικόνα θα χωριστεί σε 15 x 15 κελιά.

63