Please use this identifier to cite or link to this item: https://olympias.lib.uoi.gr/jspui/handle/123456789/29167
Full metadata record
DC FieldValueLanguage
dc.contributor.authorChaysri, Piyabhumen
dc.date.accessioned2018-10-23T09:11:29Z-
dc.date.available2018-10-23T09:11:29Z-
dc.identifier.urihttps://olympias.lib.uoi.gr/jspui/handle/123456789/29167-
dc.identifier.urihttp://dx.doi.org/10.26268/heal.uoi.2873-
dc.rightsDefault License-
dc.subjectReinforcement learningen
dc.subjectMini-robotsen
dc.subjectNavigationen
dc.subjectMultiagent systemen
dc.titleMultiple mini-robots navigation using reinforcement learningen
dc.titleΠλοήγηση Πολλαπλών μίνι-ρόμποτ με χρήση reinforcement learningel
heal.typemasterThesis-
heal.type.enMaster thesisen
heal.type.elΜεταπτυχιακή εργασίαel
heal.classificationReinforcement learningen
heal.dateAvailable2018-10-23T09:12:29Z-
heal.languageen-
heal.accessfree-
heal.recordProviderΠανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικήςel
heal.publicationDate2018-
heal.bibliographicCitationΒιβλιογραφία: σ. 57el
heal.abstractReinforcement Learning is a machine learning approach for constructing intelligent agents and solving control problems. The agent learns by interacting with its environment over a period of time, without relying on exemplary supervision or complete model of the environment. The task is to discover a target in the presence of obstacles by maximizing the reward signal received and constructing appropriate value functions. In this work we focus on the navigation of mini robotic vehicles, which are equipped with two vibration motors. These mini robots are used in a simulated environment for medical applications under a microscope. A reinforcement learning multi-agent system is introduced for navigation of multiple mini robots in unknown environments. The goal is to build appropriate decision (navigation) rules for every robot in order to reach their target, and at the same time to maintain (sub) optimal navigation paths by avoiding other mobile robots. We assume that the robots start from different locations, they all share the same map and they are moving simultaneously. An appropriate reward function is used that takes into account the existence of other mini robots in its neighborhood at every step. The reinforcement learning agents were created on-line using the Q-learning algorithm. The system has been implemented in ROS (Robot Operating System) environment and has been evaluated through various noisy cases and variable number of robots.en
heal.abstractΗ ενισχυτική μάθηση, Reinfoecement Learning (RL), είναι μια κατηγορία της μηχανικής μάθησης που χρησιμοποιηθεί για την κατασκευή τους ευφυείς πράκτορες και λύνει τα προβλήματα έλεγχου. Ένας πράκτορας μαθαίνει από την αλληλεπίδραση με το περιβάλλον του χωρίς υποδειγματικό επιβλέποντα ή μοντέλο του περιβάλλοντος. Η διεργασία είναι να βρεθεί τον στόχο το οποίο βρίσκεται ανάμεσα εμπόδια από τη μεγιστοποίηση της ανταμοιβής, χτίζοντας τις κατάλληλες συναρτήσεις αξίας. Η εργασία πραγματεύεται την αυτόνομη πλοήγηση μίνι-ρομποτικών συστημάτων, τα οποία εξοπλισμένα με δύο μικρές κινητήρες δόνησης. Τα οποία είναι πλατφόρμα μικρομετατοπίσεων με φυγοκεντρικούς ενέργειας. Αυτά τα τα μίνι-ρομπότ χρησιμοποιούνται σε προσομοιώσεις περιβάλλοντα για ιατρικές εφαρμογές υπό μικροσκόπιο. Παρουσιάζεται η ενισχυτική μάθηση πολλαπλών πρακτόρων συστημάτων για την πλοήγηση μίνι-ρομποτικών συστημάτων σε άγνωστα περιβάλλοντος. Ο στόχος είναι να χτίζει κατάλληλη πολιτική αποφάσεών (πλοήγηση) σε κάθε ρομπότ (πράκτορα) για να φτάνουν στους στόχους τους. Παράλληλα, να διατηρούν (υπό) βέλτιστα μονοπάτια και αποφεύγον άλλα ρομπότ τα οποία κυκλοφορούν μέσα στο ίδιο περιβάλλον. Υποθέτουμε ότι κάθε ρομπότ ξεκινούν από διαφορετικές θέσεις όμως μοιράζουν ίδιο χάρτη (χώρο διεργασία) και κινούνται ταυτόχρονα. Χρησιμοποιείται κατάλληλη συνάρτηση ανταμοιβής ή οποία αναγνωρίζει γειτονικά ρομπότ σε κάθε βήμα. Ο πράκτορας ενισχυτικής μάθησης δημιουργείταιαπευθείας(on-line) χρησιμοποιώντας αλγόριθμο Q-learning και συμμετέχει σε πολλαπλούς πράκτορες συστημάτων. Παρουσιάσουμε και την χρήση του ε-greedy στο Q-learning. Το οποίο είναι μια μέθοδο εξερεύνησης στο περιβάλλον με την πιθανότητα εξερεύνησης. Χρησιμοποιείται το κατάλληλο παράμετρο της πιθανότητας εξερεύνησης και μπορεί να κατάληξει στην βέλτιστη πολιτική. Κάθε ρομπότ (κάθε πράκτορες) έχουν τον δικό τους στόχο και δουλεύουν σε συνεργατική περιβάλλον. Το σύστημα έχει υλοποιηθεί μέσω ROS (Robot Operating System) και έχει αξιολογηθεί με πολλαπλές θορυβώδες περιπτώσεις και πολλαπλά ρομπότ.el
heal.advisorNameΜπλέκας, Κωνσταντίνοςel
heal.committeeMemberNameΛύκας, Αριστείδηςel
heal.committeeMemberNameΒλάχος, Κωνσταντίνοςel
heal.committeeMemberNameΜπλέκας, Κωνσταντίνοςel
heal.academicPublisherΠανεπιστήμιο Ιωαννίνων. Πολυτεχνική Σχολή. Τμήμα Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικήςel
heal.academicPublisherIDuoi-
heal.numberOfPages57 σ.-
heal.fullTextAvailabilitytrue-
Appears in Collections:Διατριβές Μεταπτυχιακής Έρευνας (Masters) - ΜΥ

Files in This Item:
File Description SizeFormat 
Μ.Ε. CHAYSRI PIYABHUM 2018.pdf8.23 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons