| _version_ |
1828462313693249536
|
| author |
Χαλβατζάκης, Νικόλαος Εμμανουήλ
Τσακουμάκης, Μιχαήλ
|
| author2 |
Χαραλαμπίδης, Ιωάννης
|
| author_facet |
Χαραλαμπίδης, Ιωάννης
Χαλβατζάκης, Νικόλαος Εμμανουήλ
Τσακουμάκης, Μιχαήλ
|
| author_sort |
Χαλβατζάκης, Νικόλαος Εμμανουήλ
|
| collection |
DSpace
|
| description |
Σκοπός της διπλωματικής εργασία είναι η υλοποίηση ενός συστήματος το οποίο θα παρέχει την δυνατότητα εκπαίδευσης δύο State of the Art αλγορίθμων στον τομέα της βαθιάς ενισχυτικής μάθησης καθώς και η εφαρμογή των αλγορίθμων για την εκπαίδευση αγωνιστικών οχημάτων με στόχο την ελαχιστοποίηση του χρόνου για την ολοκλήρωση γύρου σε μία αγωνιστική πίστα, σε περιβάλλον που μπορεί να δημιουργηθεί από διάφορα δομικά στοιχεία που παρέχουμε από την εφαρμογή. Η βασική μεθοδολογία μας είναι η δημιουργία ενός νευρωνικού δικτύου ικανό να οδηγεί αυτόνομα ένα αγωνιστικό αυτοκίνητο χωρίς να του έχουμε γνωστοποιήσει τη δυναμική του οχήματος καθώς και την ελαχιστοποίηση του χρόνου που χρειάζεται για την ολοκλήρωση της κούρσας. Παρέχοντας του μόνο την πληροφορία των ενεργειών που μπορεί να πάρει καθώς και ένα διάνυσμα παρατηρήσεων θα μελετήσουμε τους αλγορίθμους SAC και PPO, θα συγκρίνουμε τις αποδόσεις μεταξύ τους και με τις αποδόσεις ανθρώπων-χειριστών μέσω πειραμάτων που θα μας αποδείξουν την ικανότητα των αλγορίθμων να ελαχιστοποιούν τον χρόνο που χρειάζεται για την ολοκλήρωση γύρων και την προσαρμοστικότητα τους σε διαφορετικές καταστάσεις, όπως διαφορετικές κούρσες και ρυθμίσεις του οχήματος. Από τα πειράματα μας
συμπεράναμε πως και οι δύο αλγόριθμοι έχουν τα δυνατά σημεία και τις αδυναμίες τους. Συγκεκριμένα ο PPO είναι πολύ πιο συντηρητικός στην οδήγηση του ενώ ο SAC πολύ πιο αποδοτικός και έχει αποδόσεις πιο κοντά στις ανθρώπινες αλλά δεν έχει την ίδια σταθερότητα στις αποδόσεις σε πίστες που δεν έχει εκπαιδευτεί.
|
| id |
oai:hellanicus.lib.aegean.gr:11610-23553
|
| institution |
Hellanicus
|
| language |
el_GR
|
| publishDate |
2022
|
| record_format |
dspace
|
| spelling |
oai:hellanicus.lib.aegean.gr:11610-235532022-04-15T13:22:03Z Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον Deep reinforcement learning for autonomous racing in a customizable virtual environment Χαλβατζάκης, Νικόλαος Εμμανουήλ Τσακουμάκης, Μιχαήλ Χαραλαμπίδης, Ιωάννης βαθιά ενισχυτική μάθηση αυτόνομη οδήγηση deep reinforcement learning autonomous driving Machine learning Driver assistance systems Automated vehicles Σκοπός της διπλωματικής εργασία είναι η υλοποίηση ενός συστήματος το οποίο θα παρέχει την δυνατότητα εκπαίδευσης δύο State of the Art αλγορίθμων στον τομέα της βαθιάς ενισχυτικής μάθησης καθώς και η εφαρμογή των αλγορίθμων για την εκπαίδευση αγωνιστικών οχημάτων με στόχο την ελαχιστοποίηση του χρόνου για την ολοκλήρωση γύρου σε μία αγωνιστική πίστα, σε περιβάλλον που μπορεί να δημιουργηθεί από διάφορα δομικά στοιχεία που παρέχουμε από την εφαρμογή. Η βασική μεθοδολογία μας είναι η δημιουργία ενός νευρωνικού δικτύου ικανό να οδηγεί αυτόνομα ένα αγωνιστικό αυτοκίνητο χωρίς να του έχουμε γνωστοποιήσει τη δυναμική του οχήματος καθώς και την ελαχιστοποίηση του χρόνου που χρειάζεται για την ολοκλήρωση της κούρσας. Παρέχοντας του μόνο την πληροφορία των ενεργειών που μπορεί να πάρει καθώς και ένα διάνυσμα παρατηρήσεων θα μελετήσουμε τους αλγορίθμους SAC και PPO, θα συγκρίνουμε τις αποδόσεις μεταξύ τους και με τις αποδόσεις ανθρώπων-χειριστών μέσω πειραμάτων που θα μας αποδείξουν την ικανότητα των αλγορίθμων να ελαχιστοποιούν τον χρόνο που χρειάζεται για την ολοκλήρωση γύρων και την προσαρμοστικότητα τους σε διαφορετικές καταστάσεις, όπως διαφορετικές κούρσες και ρυθμίσεις του οχήματος. Από τα πειράματα μας συμπεράναμε πως και οι δύο αλγόριθμοι έχουν τα δυνατά σημεία και τις αδυναμίες τους. Συγκεκριμένα ο PPO είναι πολύ πιο συντηρητικός στην οδήγηση του ενώ ο SAC πολύ πιο αποδοτικός και έχει αποδόσεις πιο κοντά στις ανθρώπινες αλλά δεν έχει την ίδια σταθερότητα στις αποδόσεις σε πίστες που δεν έχει εκπαιδευτεί. The main objective of this thesis is the implementation of a system that will provide us the ability to train two State of the Art algorithms in Deep Reinforcement Learning as well as the application of those algorithms for the training of autonomous driving agents that require to minimize the lap time of a circuit track, in an environment that can be build from building blocks that we will provide in our application. Our methodology’s goal is to build a neural network that is able to navigate a racing car autonomously without prior knowledge of the vehicle’s dynamics while minimizing the lap time of a given track. We achieve that by providing the controller with the knowledge of its actions space and its vector observation space. Hence, we will analyze and study the two algorithms, PPO and SAC according to their performance, as well as compare it with a sample of human-drivers through different experiments. Those experiments will show us the ability of the algorithms to minimize the lap time as well as their robustness in different situations, like different tracks that they weren’t trained before or different vehicle settings. Our experiments show that both algorithms have their strengths and weaknesses. Specifically, PPO seems to be more timid in its driving, whereas SAC is able to achieve performance similar to our human-drivers sample, but it’s not as stable in maps that it wasn’t trained in. 2022-04-07T07:57:59Z 2022-04-07T07:57:59Z 2021-10-27 http://hdl.handle.net/11610/23553 el_GR Default License 115 σ. application/pdf Σάμος
|
| spellingShingle |
βαθιά
ενισχυτική
μάθηση
αυτόνομη
οδήγηση
deep
reinforcement
learning
autonomous
driving
Machine learning
Driver assistance systems
Automated vehicles
Χαλβατζάκης, Νικόλαος Εμμανουήλ
Τσακουμάκης, Μιχαήλ
Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
|
| title |
Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
|
| title_full |
Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
|
| title_fullStr |
Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
|
| title_full_unstemmed |
Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
|
| title_short |
Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
|
| title_sort |
ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
|
| topic |
βαθιά
ενισχυτική
μάθηση
αυτόνομη
οδήγηση
deep
reinforcement
learning
autonomous
driving
Machine learning
Driver assistance systems
Automated vehicles
|
| url |
http://hdl.handle.net/11610/23553
|
| work_keys_str_mv |
AT chalbatzakēsnikolaosemmanouēl anaptyxēpraktoraautonomēsodēgēsēsmebathiaenischytikēmathēsēgiatonelenchoagōnistikouochēmatosseprosarmosimoeikonikopsēphiakoperiballon
AT tsakoumakēsmichaēl anaptyxēpraktoraautonomēsodēgēsēsmebathiaenischytikēmathēsēgiatonelenchoagōnistikouochēmatosseprosarmosimoeikonikopsēphiakoperiballon
AT chalbatzakēsnikolaosemmanouēl deepreinforcementlearningforautonomousracinginacustomizablevirtualenvironment
AT tsakoumakēsmichaēl deepreinforcementlearningforautonomousracinginacustomizablevirtualenvironment
|