Κωδικός Μαθήματος

ΠΠΣ-187

Εξάμηνο Μαθήματος

2ου Εξαμήνου

Πιστωτικές Μονάδες

7,5

Ηλεκτρονικό Υλικό

https://lefkippos.ds.unipi.gr/courses/DSERV107/

Κατηγορία Μαθήματος

Υποχρεωτικό

Αποθήκες Δεδομένων και Επιχειρηματική Ευφυΐα

Στόχος

Ο κύριος στόχος του μαθήματος είναι να παρουσιάσει στους φοιτητές σύγχρονες τεχνικές και μεθόδους για την αποδοτική ανάλυση δεδομένων, την εξαγωγή χρήσιμης πληροφορίας και την παρουσίαση της με τρόπο που θα βοηθήσει τα στελέχη μίας επιχείρησης να λάβουν χρήσιμες επιχειρηματικές αποφάσεις.  Στα πλαίσια του μαθήματος θα μελετηθούν οι κύριες τεχνικές σχεδιασμού και ανάπτυξης αποθηκών δεδομένων καθώς και ανάλυσης πολυδιάστατων μοντέλων δεδομένων. Επίσης οι φοιτητές θα γνωρίσουν ένα ευρύ σύνολο τεχνικών ανάλυσης δεδομένων οι οποίες  μπορούν να αξιοποιηθούν στην κατανόηση των επιχειρηματικών δεδομένων, την εξαγωγή γνώσης από αυτά και στη διαδικασία λήψης αποφάσεων. Μέσα από το μάθημα αυτό, οι φοιτητές αναμένεται ότι θα γνωρίσουν τεχνικές που αποτελούν μέρος της επιχειρηματικής ευφυίας και θα αποκτήσουν σημαντικές τεχνικές δεξιότητες στην ανάλυση  επιχειρηματικών δεδομένων.

Περιεχόμενα Μαθήματος

Αποθήκες δεδομένων.

Πολυδιάστατο μοντέλο δεδομένων, αρχιτεκτονική αποθηκών δεδομένων, σχεδίαση αποθηκών δεδομένων, εξαγωγή-μετασχηματισμός-φόρτωση δεδομένων.

Ανάλυση πολυδιάστατων δεδομένων.

OLAP λειτουργίες, συστήματα επερωτήσεων σε αποθήκες δεδομένων, δημιουργία αναφορών.

Εισαγωγή στα συστήματα συστάσεων.

Εισαγωγή στο πρόβλημα και στις εφαρμογές των συστημάτων συστάσεων. Παρουσίαση των βασικών τεχνικών για εξατομικευμένες συστάσεις μέσω προσεγγίσεων βασισμένες στο περιεχόμενο, τεχνικών πλησιέστερων γειτόνων. Τεχνική φιλτραρίσματος συνεργασίας χρηστών-χρηστών (user-user collaborative filtering), αλγόριθμο φιλτραρίσματος αντικειμένου-αντικειμένου (item-item collaborative filtering).

Προηγμένες τεχνικές συστάσεων.

Μέθοδοι παραγοντοποίησης μήτρας και υβριδικές μέθοδοι συστάσεων.

Κανόνες συσχέτισης.

Μέθοδοι εύρεση συχνά εμφανιζόμενων συνόλων, ανάλυση καλαθιού αγοράς,  αλγόριθμος Apriori, μετρικές αξιολόγησης κανόνων συσχέτισης.

Διερευνητική αναλυτική και οπτικοποιήσεις.

Μονομεταβλητή και διμεταβλητή ανάλυση, οπτικοποίηση, ιστογράμματα, συνάρτηση αθροιστικής κατανομής, στοιχεία συνοπτικής στατιστικής, μέτρα θέσης και διασποράς, εντοπισμός συσχετίσεων ανάμεσα σε δύο μεταβλητές, εναλλακτικοί τρόποι απεικόνισης με χρήση διαγραμμάτων, χρήση τεχνικών οπτικοποίησης για πολυμεταβλητή ανάλυση δεδομένων.

Αναλυτική με οπτικοποίηση.

Εργαλεία και τεχνικές οπτικοποίησης δεδομένων, αναλυτική δεδομένων με οπτικοποίηση, το εργαλείο οπτικοποίησης Tableau, εφαρμογές σε επιχειρηματική ευφυία, νέες διεπαφές χρήστη, προηγμένες τεχνικές οπτικοποίησης, πρωτότυπα ερευνητικά συστήματα.

Ανάλυση χρονοσειρών.

Παραδείγματα και κίνητρα, εντοπισμός τάσεων, κινούμενοι μέσοι όροι, μέθοδοι εξομάλυνσης, συνάρτηση αυτοσυσχέτισης.

Προσομοιώσεις.

O ρόλος της προσομοίωσης για την εξαγωγή πληροφορίας από δεδομένα, προσομοίωση Μόντε-Κάρλο, χρήση προσομοίωσης για περιπτώσεις που η αναλυτική μοντελοποίηση είναι πολύπλοκη, ανάπτυξη μοντέλων με προσομοίωση, επικύρωση μοντέλων με προσομοίωση.

Αναλυτική θέσης.

Ετικέτες για γεωγραφικά δεδομένα, κοινωνικά δίκτυα που λαμβάνουν υπόψιν τη θέση, συνδυασμός χωρικών, χρονικών και δεδομένων κειμένου, εφαρμογές αναλυτικής που στοχεύουν σε γεωγραφικό κοινωνικό περιεχόμενο, αναλυτική θέσης στα Twitter, Flickr, Foursquare.

Προτεινόμενα Συγγράμματα

  • Han J. & Kamber M. (2006): Data Mining: Concepts and Techniques, 2nd Edition, Morgan Kaufmann.
  • Jure Leskovec, Anand Rajaraman, Jeff Ullman. Mining of Massive Datasets. Cam-bridge University Press. 2014 (2nd Edition).
  • Raymond T.Ng et al. (2013): Perspectives on Business Intelligence. Morgan & Claypool Publishers. Synthesis Lectures on Data Management.
  • Philipp K. Janert (2010) Data Analysis with Open Source Tools: A hands-on guide for programmers and data scientists, O’Reilly Media.