[ΟΛΟΚΛΗΡΩΜΕΝΗ]

Επιβλέπων:

Στέφανος Ουγιάρογλου, Επίκουρος Καθηγητής

Περιγραφή:

Η εργασία έχει ως στόχο την ανάλυση δεδομένων επιστημομετρίας μελών που υπηρετούν σε πανεπιστημιακά τμήματα με αντικείμενο την Πληροφορική στην Ελλάδα. Το πρώτο στάδιο της εργασίας περιλαμβάνει μια εκτεταμένη στατιστική μελέτη που αφορά τα δεδομένα. Στο δεύτερο στάδιο θα εφαρμοστούν αλγόριθμοι εξόρυξης γνώσης για την ανακάλυψη ομάδων (συστάδων) μελών με κοινά χαρακτηριστικά και κρυμμένων συσχετίσεων (association rules). Παράλληλα, θα επιχειρηθεί η πρόβλεψη μελλοντικών καταστάσεων με αλγορίθμους κατηγοριοποίησης. Τα δεδομένα που έχουν συλλέγει από το google scholar περιλαμβάνουν και χρονολογικές σειρές (time series) που αφορούν το πλήθος των δημοσιεύσεων και αναφορών ανά έτος. Συνεπώς, μεγάλο τμήμα της διαδικασίας εξόρυξης γνώσης θα περιλαμβάνει την ανάλυση και διαχείριση χρονολογικών σειρών. Σημειώνεται ότι πριν την εφαρμογή κάθε τεχνικής εξόρυξης γνώσης θα εκτελεστούν απαιτούμενα βήματα προ-επεξεργασίας των δεδομένων. Για την υλοποίηση της εργασίας μπορεί να χρησιμοποιηθεί είτε το λογισμικό Εξόρυξης Γνώσης και Μηχανικής Μάθησης WEKA (https://www.cs.waikato.ac.nz/ml/weka/) είτε η βιβλιοθήκη scikit-learn της Python (https://scikit-learn.org/). Επίσης, θα χρησιμοποιηθεί κάποιο open-source λογισμικό για την ανάλυση χρονολογικό σειρών.