Επιβλέπων:
Παναγιώτης Κόκκινος, Επίκουρος Καθηγητής
Περιγραφή:
Στα πλαίσια της πτυχιακής θα αναπτυχθούν μηχανισμοί πολύ-πρακτόρων για την πολύ-παραγοντική βελτιστοποίηση υποδομών όπως δίκτυα δεδομένων και υπολογιστικά νέφη.
Πηγές:
- Yang, J., Borovikov, I., & Zha, H. (2019). Hierarchical cooperative multi-agent reinforcement learning with skill discovery. arXiv preprint arXiv:1912.03558.
- https://github.com/011235813/hierarchical-marl