[ΥΠΟ ΕΚΠΟΝΗΣΗ]

Επιβλέπων:

Στέφανος Ουγιάρογλου, Επίκουρος Καθηγητής

Περιγραφή:

Πολλές τεχνικές μείωσης δεδομένων έχουν προταθεί στο παρελθόν. Οι τεχνικές αυτές έχουν ως στόχο να αντιμετωπίσουν τα προβλήματα του κατηγοριοποιητή κ εγγύτερων γειτόνων που είναι το υψηλό υπολογιστικό κόστος και η μη ανεκτικότητα στον θόρυβο που πιθανότατα περιλαμβάνει το σύνολο δεδομένων εκπαίδευσης. Ωστόσο, οι τεχνικές μείωσης δεδομένων, αν και στην πράξη μπορούν να χρησιμοποιήσουν οποιοδήποτε μετρική απόστασης, συνήθως χρησιμοποιούν την Ευκλείδεια απόσταση. Στόχος της εργασίας είναι η εκπόνηση μιας εκτεταμένης πειραματικής μελέτης όπου οι τεχνικές μείωσης δεδομένων θα εκτελεστούν σε διάφορα σύνολα δεδομένων και θα χρησιμοποιηθούν διαφορετικές μετρικές απόστασης (π.χ. Manhattan, Minkowski). Στόχος είναι το να διευκρινιστεί αν άλλες μετρικές απόστασης είναι εξίσου αποτελεσματικές στην μείωση δεδομένων. Ο φοιτητής ή η φοιτήτρια που θα αναλάβει την εργασία, θα έχει στη διάθεση του/της υλοποιήσεις τεχνικών μείωσης δεδομένων σε C και C++ και θα επέμβει στα τμήματα που υπολογίζονται οι αποστάσεις μεταξύ των στιγμιοτύπων του συνόλου δεδομένων εκπαίδευσης.