Μηχανική Μάθηση και Εξόρυξη Δεδομένων

(Machine Learning and Data Mining / MLDM)

Υπεύθυνος Μαθήματος: Φ. Κόκκορας,   Μονάδες ECTS: 7.5,   Εξάμηνο: Α’

Συνοπτική Περιγραφή

Στον παραδοσιακό προγραμματισμό ο προγραμματιστής βρίσκει μόνος του κάποια χαρακτηριστικά του προβλήματος (feature engineering) που τον βοηθούν να χτίσει πάνω τους τη λύση του προβλήματος – λύνει ο ίδιος το πρόβλημα και το κωδικοποεί. Σε πολύπλοκα προβλήματα, όπως ο εντοπισμός αντικειμένων σε φωτογραφίες ή η πρόβλεψη σε πολυπαραμετρικά προβλήματα, αυτή η προσέγγιση δεν λειτουργεί. Η Μηχανική Μάθηση αφορά σε μεθόδους αναπαράστασης και αλγόριθμους που επιτρέπουν σε ένα υπολογιστικό σύστημα να βελτιώνει σταδιακά την απόδοσή του με την επανάληψη, δηλαδή να μαθαίνει μόνο του τον τρόπο που λύνει το πρόβλημα. Πρόκειται για υποπεριοχή της Τεχνητής Νοημοσύνης, την πιο προχωρημένη ίσως.

Οι εφαρμογές της καλύπτουν ένα ευρύ φάσμα αναγκών, κυρίως στην ανάλυση δεδομένων και στο πλαίσιο συστημάτων υποστήριξης αποφάσεων. Εφαρμογή των μεθοδολογιών της μηχανικής μάθησης σε μεγάλες βάσεις δεδομένων αποτελεί η Εξόρυξη Δεδομένων (Data Mining) ή αλλιώς Ανακάλυψη Γνώσης σε Βάσεις Δεδομένων (Knowledge Discovery in Databases). Για παράδειγμα, από δεδομένα εξετάσεων ασθενών είναι εφικτό να φτιαχτεί ένα μοντέλο πρόβλεψης της εξέλιξης κάποιας ασθένειας ενώ από δεδομένα on-line πωλήσεων να γίνουν συστάσεις προϊόντων σε υποψήφιους πελάτες.

Ενδεικτική Θεματολογία: πώς γίνεται ένα πρόγραμμα να μαθαίνει, είδη μάθησης, μάθηση συνάρτησης, ταξινόμηση, παρεμβολή, συσταδοποίηση, κανόνες συσχέτισης, συνδυασμός πολλαπλών μοντέλων, αξιολόγιση μοντέλων/μάθησης, βαθιά μάθηση και νευρωνικά δίκτυα, η εξόρυξη ως εφαρμογή αλγορίθμων μηχανικής μάθησης, επισκόπηση εργασιών εξόρυξης, ποιοτικός έλεγχος στην εξόρυξη γνώσης, εξόρυξη ιστού.

Προτεινόμενη Βιβλιογραφία

  • Εισαγωγή στην Εξόρυξη Δεδομένων (2η έκδοση), Pand-Ning Tan, Michael Steinbach, Vipin Kumar, Anuj Karpatne. Εκδόσεις Τζιόλα, 2019.
  • Introduction to Machine Learning, 3rd Edition, Ethem Alpaydin, The MIT Press, 2014.
  • Machine Learning, Tom Mitchell. McGraw Hill, 1997.
  • Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. 2nd Edition, Bing Liu, Springer, 2011.