[ΥΠΟ ΕΚΠΟΝΗΣΗ]

Επιβλέπων:

Στέφανος Ουγιάρογλου, Επίκουρος Καθηγητής

Περιγραφή:

Ο αλγόριθμος κ μέσων (k-means) είναι ένας αλγόριθμος συσταδοποίησης (clustering) δεδομένων. Βασικό μειονέκτημα είναι ότι ο χρήστης πρέπει να καθορίσει το πλήθος (κ) των συστάδων που θα “ανακαλύψει” ο αλγόριθμος. Συχνά όμως, ο χρήστης δεν μπορεί να προκαταβάλει τον συγκεκριμένο αριθμό και αν ο αλγόριθμος εκτελεστεί με διαφορετική τιμή κ, θα δημιουργηθούν εντελώς διαφορετικές συστάδες. Ένας τρόπος για τον προσδιορισμό της παραμέτρου είναι η μέθοδος του αγκώνα (Elbow). Στόχος της εργασία είναι η ανάπτυξη μιας web εφαρμογής όπου ο κάθε χρήστης θα μπορεί να ανεβάζει σύνολα δεδομένων και η εφαρμογή θα κατασκευάζει το γράφημα όπου θα παρουσιάζεται ο “αγκώνας” και θα προτείνει στον χρήστη πιθανή τιμή για την παράμετρο κ. Το web interface που θα αναπτυχθεί θα δοκιμασθεί με σενάρια χρήσης και οι τιμές κ που θα προτείνει η εφαρμογή θα αξιολογηθούν εκτελώντας πειράματα συσταδοποίησης. Οι τεχνολογίες που θα χρησιμοποιηθούν ενδεικτικά είναι: PHP, Javascript, Ajax, Python, HTML5, Bootstrap.