Παρουσίαση Διπλωματικής Χρήστου Κωστούλα

Ημερομηνία Εκδήλωσης: 
Τετάρτη, Απρίλιος 15, 2020 - 15:00

Σας  ενημερώνουμε  ότι  την  Μ.  Τετάρτη  15/4/2020  θα  γίνει  παρουσίαση  μεταπτυχιακής  διατριβής  φοιτητή του  μεταπτυχιακού  προγράμματος  Ειδίκευσης  στη Στατιστική (πλήρους φοίτησης) ως εξής:

Φοιτητής:  Κωστούλας Χρήστος

Τίτλος εργασίας: «Cluster Analysis on Partially Ranked Data» (Ανάλυση Συστάδων σε Δεδομένα Ταξινόμησης)

Επιβλέπων: κ. Δ. Καρλής, Καθηγητής Τμήματος Στατιστικής, ΟΠΑ  

Μέλη Τριμελούς Επιτροπής: ‐ κ. Ι.Ντζούφρας, Καθηγητής Τμήματος Στατιστικής, ΟΠΑ, κ. Ν.Δεμίρης, Επικ. Καθηγητής Τμήματος Στατιστικής, ΟΠΑ 

Meeting Details: https://meet.lync.com/auebgr‐aueb/karlis/WJNUPHGD

Ώρα: 15:00

ABSTRACT

This thesis is about understanding how to perform cluster analysis in ranked data that come in big volumes and that might also include missing observations in them. At first, some basic notions, such as the distance between two rankings, are discussed and then we review some probabilistic models that are useful for ranking data. Clustering models are being discussed as well. Afterwards, we present some statistical R packages that are able to perform cluster analysis on big volumes of ranked data. Finally, we display the power of these packages by applying them on a job ranking dataset that consists of 8646 observations and 17 objects to evaluate.  

ΠΕΡΙΛΗΨΗ 

Η διατριβή αυτή έχει σκοπό να δείξει πως μπορούμε να κάνουμε ανάλυση συστάδων σε μεγάλο όγκο δεδομένων  ταξινόμησης  τα  οποία  ενδεχομένως  να  περιέχουν  και  ελλιπείς  παρατηρήσεις.  Πρώτα,  εισάγουμε  κάποιες  βασικές  έννοιες  όπως  η  απόσταση  μεταξύ  δύο  σειρών  κατάταξης  (rankings)  και  έπειτα  κάνουμε  μία  ανασκόπηση  των  πιθανοκρατικών  μοντέλων  που  χρησιμεύουν  στη  μοντελοποίηση  δεδομένων  ταξινόμησης.  Θα  διερευνήσουμε  επίσης και μοντέλα συσταδοποίησης. Εν συνεχεία θα εξεταστούν τρία στατιστικά πακέτα στην R με βάση τα οποία  θα μπορέσουμε να πραγματοποιήσουμε συσταδοποίηση μεγάλου όγκου δεδομένων ταξινόμησης. Τέλος, δείχνουμε  την ισχύ  αυτών  των  πακέτων  εφαρμόζοντας  τα  σε  δεδομένα  αξιολόγησης  επαγγελμάτων,  το  οποίο  περιλαμβάνει  8646 παρατηρήσεις και 17 παράγοντες προς αξιολόγηση.