Επιβλέπων:

Παναγιώτης Κόκκινος, Επίκουρος Καθηγητής

Περιγραφή:

Στα πλαίσια της πτυχιακής θα αναπτυχθούν μηχανισμοί πολύ-πρακτόρων για την πολύ-παραγοντική βελτιστοποίηση υποδομών όπως δίκτυα δεδομένων και υπολογιστικά νέφη.

Πηγές:

  1. Yang, J., Borovikov, I., & Zha, H. (2019). Hierarchical cooperative multi-agent reinforcement learning with skill discovery. arXiv preprint arXiv:1912.03558.
  2. https://github.com/011235813/hierarchical-marl