Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον

Σκοπός της διπλωματικής εργασία είναι η υλοποίηση ενός συστήματος το οποίο θα παρέχει την δυνατότητα εκπαίδευσης δύο State of the Art αλγορίθμων στον τομέα της βαθιάς ενισχυτικής μάθησης καθώς και η εφαρμογή των αλγορίθμων για την εκπαίδευση αγωνιστικών οχημάτων με στόχο την ελαχιστοποίηση του χρόνο...

Πλήρης περιγραφή

Αποθηκεύτηκε σε:

Λεπτομέρειες βιβλιογραφικής εγγραφής
Κύριοι συγγραφείς:	Χαλβατζάκης, Νικόλαος Εμμανουήλ, Τσακουμάκης, Μιχαήλ
Άλλοι συγγραφείς:	Χαραλαμπίδης, Ιωάννης
Γλώσσα:	el_GR
Δημοσίευση:	2022
Θέματα:	βαθιά ενισχυτική μάθηση αυτόνομη οδήγηση deep reinforcement learning autonomous driving Machine learning Driver assistance systems Automated vehicles
Διαθέσιμο Online:	http://hdl.handle.net/11610/23553
Ετικέτες:	Προσθήκη ετικέτας Δεν υπάρχουν, Καταχωρήστε ετικέτα πρώτοι!

_version_	1828462313693249536
author	Χαλβατζάκης, Νικόλαος Εμμανουήλ Τσακουμάκης, Μιχαήλ
author2	Χαραλαμπίδης, Ιωάννης
author_facet	Χαραλαμπίδης, Ιωάννης Χαλβατζάκης, Νικόλαος Εμμανουήλ Τσακουμάκης, Μιχαήλ
author_sort	Χαλβατζάκης, Νικόλαος Εμμανουήλ
collection	DSpace
description	Σκοπός της διπλωματικής εργασία είναι η υλοποίηση ενός συστήματος το οποίο θα παρέχει την δυνατότητα εκπαίδευσης δύο State of the Art αλγορίθμων στον τομέα της βαθιάς ενισχυτικής μάθησης καθώς και η εφαρμογή των αλγορίθμων για την εκπαίδευση αγωνιστικών οχημάτων με στόχο την ελαχιστοποίηση του χρόνου για την ολοκλήρωση γύρου σε μία αγωνιστική πίστα, σε περιβάλλον που μπορεί να δημιουργηθεί από διάφορα δομικά στοιχεία που παρέχουμε από την εφαρμογή. Η βασική μεθοδολογία μας είναι η δημιουργία ενός νευρωνικού δικτύου ικανό να οδηγεί αυτόνομα ένα αγωνιστικό αυτοκίνητο χωρίς να του έχουμε γνωστοποιήσει τη δυναμική του οχήματος καθώς και την ελαχιστοποίηση του χρόνου που χρειάζεται για την ολοκλήρωση της κούρσας. Παρέχοντας του μόνο την πληροφορία των ενεργειών που μπορεί να πάρει καθώς και ένα διάνυσμα παρατηρήσεων θα μελετήσουμε τους αλγορίθμους SAC και PPO, θα συγκρίνουμε τις αποδόσεις μεταξύ τους και με τις αποδόσεις ανθρώπων-χειριστών μέσω πειραμάτων που θα μας αποδείξουν την ικανότητα των αλγορίθμων να ελαχιστοποιούν τον χρόνο που χρειάζεται για την ολοκλήρωση γύρων και την προσαρμοστικότητα τους σε διαφορετικές καταστάσεις, όπως διαφορετικές κούρσες και ρυθμίσεις του οχήματος. Από τα πειράματα μας συμπεράναμε πως και οι δύο αλγόριθμοι έχουν τα δυνατά σημεία και τις αδυναμίες τους. Συγκεκριμένα ο PPO είναι πολύ πιο συντηρητικός στην οδήγηση του ενώ ο SAC πολύ πιο αποδοτικός και έχει αποδόσεις πιο κοντά στις ανθρώπινες αλλά δεν έχει την ίδια σταθερότητα στις αποδόσεις σε πίστες που δεν έχει εκπαιδευτεί.
id	oai:hellanicus.lib.aegean.gr:11610-23553
institution	Hellanicus
language	el_GR
publishDate	2022
record_format	dspace
spelling	oai:hellanicus.lib.aegean.gr:11610-235532022-04-15T13:22:03Z Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον Deep reinforcement learning for autonomous racing in a customizable virtual environment Χαλβατζάκης, Νικόλαος Εμμανουήλ Τσακουμάκης, Μιχαήλ Χαραλαμπίδης, Ιωάννης βαθιά ενισχυτική μάθηση αυτόνομη οδήγηση deep reinforcement learning autonomous driving Machine learning Driver assistance systems Automated vehicles Σκοπός της διπλωματικής εργασία είναι η υλοποίηση ενός συστήματος το οποίο θα παρέχει την δυνατότητα εκπαίδευσης δύο State of the Art αλγορίθμων στον τομέα της βαθιάς ενισχυτικής μάθησης καθώς και η εφαρμογή των αλγορίθμων για την εκπαίδευση αγωνιστικών οχημάτων με στόχο την ελαχιστοποίηση του χρόνου για την ολοκλήρωση γύρου σε μία αγωνιστική πίστα, σε περιβάλλον που μπορεί να δημιουργηθεί από διάφορα δομικά στοιχεία που παρέχουμε από την εφαρμογή. Η βασική μεθοδολογία μας είναι η δημιουργία ενός νευρωνικού δικτύου ικανό να οδηγεί αυτόνομα ένα αγωνιστικό αυτοκίνητο χωρίς να του έχουμε γνωστοποιήσει τη δυναμική του οχήματος καθώς και την ελαχιστοποίηση του χρόνου που χρειάζεται για την ολοκλήρωση της κούρσας. Παρέχοντας του μόνο την πληροφορία των ενεργειών που μπορεί να πάρει καθώς και ένα διάνυσμα παρατηρήσεων θα μελετήσουμε τους αλγορίθμους SAC και PPO, θα συγκρίνουμε τις αποδόσεις μεταξύ τους και με τις αποδόσεις ανθρώπων-χειριστών μέσω πειραμάτων που θα μας αποδείξουν την ικανότητα των αλγορίθμων να ελαχιστοποιούν τον χρόνο που χρειάζεται για την ολοκλήρωση γύρων και την προσαρμοστικότητα τους σε διαφορετικές καταστάσεις, όπως διαφορετικές κούρσες και ρυθμίσεις του οχήματος. Από τα πειράματα μας συμπεράναμε πως και οι δύο αλγόριθμοι έχουν τα δυνατά σημεία και τις αδυναμίες τους. Συγκεκριμένα ο PPO είναι πολύ πιο συντηρητικός στην οδήγηση του ενώ ο SAC πολύ πιο αποδοτικός και έχει αποδόσεις πιο κοντά στις ανθρώπινες αλλά δεν έχει την ίδια σταθερότητα στις αποδόσεις σε πίστες που δεν έχει εκπαιδευτεί. The main objective of this thesis is the implementation of a system that will provide us the ability to train two State of the Art algorithms in Deep Reinforcement Learning as well as the application of those algorithms for the training of autonomous driving agents that require to minimize the lap time of a circuit track, in an environment that can be build from building blocks that we will provide in our application. Our methodology’s goal is to build a neural network that is able to navigate a racing car autonomously without prior knowledge of the vehicle’s dynamics while minimizing the lap time of a given track. We achieve that by providing the controller with the knowledge of its actions space and its vector observation space. Hence, we will analyze and study the two algorithms, PPO and SAC according to their performance, as well as compare it with a sample of human-drivers through different experiments. Those experiments will show us the ability of the algorithms to minimize the lap time as well as their robustness in different situations, like different tracks that they weren’t trained before or different vehicle settings. Our experiments show that both algorithms have their strengths and weaknesses. Specifically, PPO seems to be more timid in its driving, whereas SAC is able to achieve performance similar to our human-drivers sample, but it’s not as stable in maps that it wasn’t trained in. 2022-04-07T07:57:59Z 2022-04-07T07:57:59Z 2021-10-27 http://hdl.handle.net/11610/23553 el_GR Default License 115 σ. application/pdf Σάμος
spellingShingle	βαθιά ενισχυτική μάθηση αυτόνομη οδήγηση deep reinforcement learning autonomous driving Machine learning Driver assistance systems Automated vehicles Χαλβατζάκης, Νικόλαος Εμμανουήλ Τσακουμάκης, Μιχαήλ Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
title	Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
title_full	Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
title_fullStr	Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
title_full_unstemmed	Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
title_short	Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
title_sort	ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον
topic	βαθιά ενισχυτική μάθηση αυτόνομη οδήγηση deep reinforcement learning autonomous driving Machine learning Driver assistance systems Automated vehicles
url	http://hdl.handle.net/11610/23553
work_keys_str_mv	AT chalbatzakēsnikolaosemmanouēl anaptyxēpraktoraautonomēsodēgēsēsmebathiaenischytikēmathēsēgiatonelenchoagōnistikouochēmatosseprosarmosimoeikonikopsēphiakoperiballon AT tsakoumakēsmichaēl anaptyxēpraktoraautonomēsodēgēsēsmebathiaenischytikēmathēsēgiatonelenchoagōnistikouochēmatosseprosarmosimoeikonikopsēphiakoperiballon AT chalbatzakēsnikolaosemmanouēl deepreinforcementlearningforautonomousracinginacustomizablevirtualenvironment AT tsakoumakēsmichaēl deepreinforcementlearningforautonomousracinginacustomizablevirtualenvironment

Ανάπτυξη πράκτορα αυτόνομης οδήγησης με βαθιά ενισχυτική μάθηση για τον έλεγχο αγωνιστικού οχήματος σε προσαρμόσιμο εικονικό ψηφιακό περιβάλλον

Παρόμοια τεκμήρια