6127 Μέθοδοι Στατιστικής και Μηχανικής Μάθησης

Μάθημα Επιλογής, Ζ’ εξάμηνο, 8 μονάδες ECTS

Διδάσκων: Επίκουρη Καθηγήτρια Ξανθή Πεντελή, Τμήμα Στατιστικής

URL: https://eclass.aueb.gr/courses/STAT248/

Περιεχόμενο

Διάκριση μεθόδων στατιστικής μάθησης σε supervised και unsupervised και καθορισμός του είδους των στατιστικών προβλημάτων που θεραπεύουν, η έννοια της απόστασης στη Στατιστική, Clustering (K-means, Hierarchical clustering, Model-based clustering), Classification (LDA, QDA, K-nearest neighbors, η διαχωριστική ανάλυση του Fisher), Μέθοδοι 58 resampling (cross-validation, bootstrap), linear model selection και regularization (subset selection, shrinkage, dimension reduction), πολυωνυμική παλινδρόμηση, step functions, regression splines, δενδρικές μέθοδοι, support vector machines, neural networks.

Μαθησιακά Αποτελέσματα

Στο τέλος του μαθήματος ο φοιτητής θα είναι ικανός: να εφαρμόζει σύγχρονες στατιστικές μεθόδους στο στατιστικό πακέτο R για την ανάλυση μεγάλου όγκου δεδομένων, να κάνει γραφήματα και να κατανοεί την ύπαρξη σχέσεων στα δεδομένα του, να βρίσκει ομάδες από παρατηρήσεις στα δεδομένα του, να μπορεί να κατασκευάζει κανόνες κατάταξης για τα δεδομένα του.Προαπαιτούμενα Μαθήματα.

Προαπαιτούμενα Μαθήματα

Για να εγγραφεί στο μάθημα, ο φοιτητής πρέπει να έχει εξεταστεί επιτυχώς σε προηγούμενο εξάμηνο στο μάθημα «Στατιστική στην Πληροφορική».

Συνιστώμενη Βιβλιογραφία

  • Bartholomew D.J., Steele F., Moustaki I., Galbraithe J.I., Ανάλυση Πολυμεταβλητών Τεχνικών στις Κοινωνικές Επιστήμες, Εκδόσεις Κλειδάριθμος ΕΠΕ, 2011.
  • Ιωαννίδης Δ., Αθανασιάδης Ι., Στατιστική και Μηχανική Μάθηση με την R, Εκδόσεις Τζιόλα, 2017.
  • Rajaraman A., Ullman D.J., Εξόρυξη από Μεγάλα Σύνολα Δεδομένων, Εκδόσεις Νέων Τεχνολογιών, 2014.
  • Sidney B., Everitt, Casella G., Fienberg, S., Ingram O., An R and S-PLUS Companion to Multivariate Analysis, Springer-Verlag London Limited, 2005.
  • Hastie, Tibshirani and Friedman (2009) Elements of Statistical Learning, 2nd edition Springer
  • James, Witten, Hastie and Tibshirani (2011) Introduction to Statistical Learning with applications in R, Springer
  • B. S. Everitt, S. Landau, M. Leese, and D. Stahl (2011) Cluster Analysis, Fifth Edition, Wiley

Διδακτικές και Μαθησιακές Μέθοδοι

Η διδασκαλία περιλαμβάνει: Διαλέξεις στην τάξη. Εργαστηριακή Άσκηση. Μελέτη και ανάλυση βιβλιογραφίας. Φροντιστήριο. Συγγραφή εργασίας/εργασιών

Μέθοδοι Αξιολόγησης/Βαθμολόγησης

Γραπτή εξέταση στο τέλος του εξαμήνου. Προφορική Εξέταση. Γραπτή Εργασία (Project).