background image

27 

 

2.3.1 Ψηφιακή Επεξεργασία Εικόνας 

Υποσύνολο  της  μηχανικής  όρασης  που  χειρίζεται  δισδιάστατες  απεικονίσεις  είναι  η 

Ψηφιακή Επεξεργασία Εικόνας. Η εικόνα μπορεί να ορίζεται ως μία δισδιάστατη συνάρτηση 

𝑓(𝑥, 𝑦), όπου x και y είναι συντεταγμένες και το πλάτος του 𝑓 σε οποιοδήποτε ζεύγος (𝑥, 𝑦) 

λέγεται ένταση για το εκάστοτε σημείο της εικόνας. Όταν οι τιμές του x και y είναι διακριτές 

ποσότητες έχουμε μία ψηφιακή εικόνα. Όλα τα εικονοστοιχεία στην ψηφιακή εικόνα έχουν 

συγκεκριμένη  τοποθεσία  και  τιμή  και  κάθε  συνάρτηση  αξιοποιεί  τα  δεδομένα  αυτά.  Η 

επεξεργασία μίας ψηφιακής εικόνας χωρίζεται σε τρία επίπεδα [38]:  

1.  Χαμηλού  επιπέδου  θεωρείται  η  προεπεξεργασία  της  εικόνας  όπως  η  μείωση 

του θορύβου. Η είσοδος και έξοδος είναι πάντα εικόνες.  

2.  Η επεξεργασία μεσαίου επιπέδου περιέχει εργασίες όπως τμηματοποίηση της 

εικόνας και αναγνώριση αντικειμένων. Η είσοδος συνήθως είναι εικόνα αλλά 

οι έξοδοι συχνά είναι χαρακτηριστικά της εικόνας.  

3.  Υψηλού  επιπέδου  χαρακτηρίζεται  η  ομαδοποίηση  αντικειμένων  και  η 

εξαγωγή δεδομένων από αυτά.  

 

2.3.1.1 Μετατροπή χρωματικού μοντέλου 

 

Μία  από  τις  βασικότερες  συναρτήσεις  χαμηλού  επιπέδου  είναι  αυτή  της  αλλαγής 

χρωματικού μοντέλου για μία φωτογραφία. Ως χρωματικό μοντέλο ορίζεται ένα αφαιρετικό 

μαθηματικό μοντέλο που περιγράφει τα χρώματα ως σύνολα τιμών με συγκεκριμένο εύρος. 

Για παράδειγμα, ένα από τα πιο γνωστά χρωματικά μοντέλα είναι το RGB (Red Green Blue) 

κατά το οποίο όλα τα χρώματα κωδικοποιούνται βάσει συνδυασμού κόκκινου, πράσινου και 

μπλε. Σε αυτό το μοντέλο, το χρώμα αναπαριστάται ως μία τριάδα αριθμών με εύρος από το 0 

έως το 255 και δημιουργείται με την αποτύπωση της έντασης των βασικών χρωμάτων και την 

υπέρθεση τους [Εικόνα 2.3][39]. 

Για  ορισμένες  συναρτήσεις  μεσαίου  επιπέδου  είναι  απαραίτητη  η  μετατροπή  του 

χρωματικού  μοντέλου  σε  κλίμακες  του  γκρι  (Grayscale).  Αυτό  είναι  εφικτό  με  τη 

σταθμισμένη  μέθοδο  (γνωστή  και  ως  μέθοδος  φωτεινότητας)  η  οποία  λαμβάνει  υπόψη  την 

ανθρώπινη  αντίληψη  του  μήκους  κύματος  των  χρωμάτων  και  ειδικά  το  γεγονός  ότι  το 

ανθρώπινο μάτι είναι πιο ευαίσθητο στο πράσινο χρώμα.  

𝑹𝑮𝑩[𝑨] 𝒕𝒐 𝑮𝒓𝒂𝒚: 𝒀 ← 𝟎. 𝟐𝟗𝟗 ⋅ 𝑹 + 𝟎. 𝟓𝟖𝟕 ⋅ 𝑮 + 𝟎. 𝟏𝟏𝟒 ⋅ 𝑩 

(2.1)