background image

1.6

Αντικείμενο Διπλωματικής Εργασίας

Η παρούσα διπλωματική εργασία, αφορά την ανάπτυξη ενός ρομποτικού βρα-

χίονα φωνητικής αλληλεπίδρασης, με στόχο την ανίχνευση και αναγνώριση αντικει-

μένων, την συλλογή και παράδοση αυτών στον χρήστη. Αυτό το εγχείρημα έχει ως

στόχο να συνδυάσει την όραση μηχανής και τη φωνητική αλληλεπίδραση με την

ανάπτυξη ενός ρομποτικού συστήματος που θα ενεργεί βάση των εντολών που θα

δέχεται από τον χρήστη. Η ιδιαιτερότητα έγκειται αφενός στην άμεση και φιλική

προς στο χρήστη επικοινωνία και αφετέρου στο ευρύτατο πλήθος αναγνώρισης αντι-

κειμένων που δύναται να εντοπίσει.

Το ρομποτικό αυτό σύστημα, βασίζεται στον ρομποτικό βραχίονα Niryo-One με

την προσθήκη USB κάμερας (Logitech C922) στη περιοχή του τελικού εργαλείο δρά-

σης (end effector) η οποία βρίσκεται τοποθετημένη σε βάση που έχει σχεδιαστεί

ειδικά για αυτή. Προκειμένου να υλοποιηθούν οι στόχοι που έχουν τεθεί για το εν

λόγο σύστημα, αναπτύχθηκε κατάλληλο λογισμικό το οποίο υποστηρίζει την ανα-

γνώριση του σχήματος και χρώματος των αντικειμένων καθώς και την αναγνώριση

του είδους για όσα αντικείμενα έχει εκπαιδευτεί το σύστημα. Ταυτόχρονα είναι

δυνατός ο εντοπισμός και η αναγνώριση QR code. Με τη λειτουργία ανίχνευσης των

QR code, επιτυγχάνεται κατά πρώτων η διεύρυνση του πλήθος των αντικειμένων

που μπορούν να εντοπιστούν και κατά δεύτερον η προσαρμοστικότητα του εντοπι-

σμού και της αναγνώρισης στις ανάγκες του χρήστη. Το μόνο που απαιτείται είναι ο

χρήστης να εκτυπώσει τα QR code και να τα τοποθετήσει στα αντικείμενα που επι-

θυμεί. Η θέση όλων τον αντικειμένων εκφράζεται με συντεταγμένες στον x, y άξονα

που πρόκειται για τις σχετικές θέσεις στον ωφέλιμο χώρο του ρομπότ σε σχέση με

την θέση της κάμερας. Κατά την έναρξη λειτουργίας, ο χρήστης ενημερώνεται μέσω

ενός ηχητικού μηνύματος από τον ρομποτικό βραχίονα για τις διαθέσιμες γλώσσες

που μπορεί να επιλέξει για τη συνέχεια της επικοινωνίας. Προς το παρόν υποστηρί-

ζεται η Ελληνική και η Αγγλική. Αφού επιλεχθεί η γλώσσα, το σύστημα ενημερώνει

το χρήστη για την διαθεσιμότητα του και περιμένει την επιλογή λειτουργίας που θα

του αναθέσει για εκτέλεση ο χρήστης.

22