background image

καλύπτουν πολλές διαφορετικές εφαρμογές στους τομείς της οπτικής επεξεργασίας

βίντεο και εικόνας, όπως ιατρικές εφαρμογές, ασφάλειας, κλειστού κυκλώματος

παρακολούθησης, ρομποτική, ρύθμισης κάμερας, διεπαφή χρήστη και υπολογιστή.

Μιας και η τεχνητή όραση μαζί με την εκπαίδευση μηχανής τα τελευταία χρόνια

είναι αλληλένδετες δεν θα γινόταν να μην υπήρχε και η παρουσία της δεύτερης

στις διαθέσιμες βιβλιοθήκες που παρέχει η OpenCV. H γενικής χρήσης βιβλιοθήκη

εκπαίδευσης μηχανής (MLL, Machine Learning Library) στοχεύει στην αναγνώριση

προτύπων μέσω στατιστικών υπολογισμών και ομαδοποίησης. Η MLL είναι πολύ

χρήσιμη για έργα όρασης τα οποία αποτελούν τη βασική αποστολή του OpenCV,

αλλά γενικά χρησιμοποιείται για οποιοδήποτε πρόβλημα εκπαίδευσης μηχανής.

Στόχοι της βιβλιοθήκης είναι η παροχή απλών τεχνικών τεχνητής όρασης και η απο-

τελεσματική εκμετάλλευση των υπολογιστικών πόρων με έμφαση στις εφαρμογές

πραγματικού χρόνου. Η δομή της OpenCV αποτελείται κυρίως από 5 συστατικά

μέρη όπως παρουσιάζονται στην εικόνα 2.4

Εικόνα. 2.4: Σύνδεση του πεδίου της όρασης μηχανής με άλλα επιστημονικά πεδία

Αναλύοντας τα επιμέρους τμήματα που συνθέτουν τη βιβλιοθήκη OpenCV, το

πρώτο δομικό μέρος με την ονομασία CV, αναπαριστά τους βασικούς αλγορίθμους

για επεξεργασία εικόνας καθώς και υψηλού προγραμματιστικού επιπέδου για μη-

χανική όραση. Το δεύτερο, MLL αναπαριστά τη βιβλιοθήκη μηχανικής μάθησης που

περιλαμβάνει εργαλεία για ομαδοποίηση και πολλούς στατικούς ταξινομητές. Το

τρίτο, HighGUI, αναπαριστά τις ρουτίνες εισόδου-εξόδου συμπεριλαμβανομένου της

38