Κωδικός Μαθήματος

ΜΔΑ-240

Εξάμηνο Μαθήματος

2ου Εξαμήνου

Πιστωτικές Μονάδες

7,5

Ηλεκτρονικό Υλικό

https://evdoxos.ds.unipi.gr/courses/DSERV114

Κατηγορία Μαθήματος

Υποχρεωτικό

Διδάσκοντες

Χρήστος Δουλκερίδης

Α. Βλάχου

Μεγάλα Δεδομένα και Αναλυτική II: Τεχνικές και Εργαλεία

Στόχος

Ο κύριος στόχος του μαθήματος είναι (α) να εξοικειώσει τους φοιτητές με τις τρέχουσες τάσεις στο χώρο της διαχείρισης Μεγάλων Δεδομένων, και (β) να διδάξει στους φοιτητές προηγμένες τεχνικές ανάλυσης δεδομένων εστιάζοντας σε περιοχές, όπως κείμενα, συστάσεις, οπτικοποίηση, και γράφους. Ως αναμενόμενα αποτελέσματα οι φοιτητές θα αποκτήσουν βαθιά γνώση λύσεων πραγματικών προβλημάτων διαχείρισης Μεγάλων Δεδομένων, ενώ παράλληλα θα αποκτήσουν σημαντικές δεξιότητες στη σχεδίαση και υλοποίηση κλιμακώσιμων λύσεων. Επιπρόσθετα, αναμένεται ότι οι φοιτητές θα μπορούν να εφαρμόζουν τεχνικές αναλυτικής επεξεργασίας και ανάλυσης δεδομένων σε πρακτικά προβλήματα που σχετίζονται με τη σύγχρονη διαχείριση δεδομένων.

 

Περιεχόμενα

Ανοικτά δεδομένα και συνδεδεμένα ανοικτά δεδομένα (Open data and Linked open data)

Η περίπτωση των Ανοικτών Δεδομένων. Αποθετήρια Ανοικτών Δεδομένων. Ανοικτά Δεδομένα παρεχόμενα από κυβερνήσεις. Ανοικτά γεοχωρικά δεδομένα. Συνδεδεμένα δεδομένα. Ανοικτά συνδεδεμένα δεδομένα.

Μεγάλα χωρικά δεδομένα (Big Spatial Data)

Η αξία των χωρικών δεδομένων στις σύγχρονες εφαρμογές. Geotagging. Πλατφόρμες για κλιμακώσιμη διαχείριση Με-γάλων χωρικών δεδομένων. Το SpatialHadoop. Χωρικές επεκτάσεις για το Spark. SpatialSpark.

Τάσεις στη διαχείριση Μεγάλων Δεδομένων (Trends in Big Data management)

Σύγχρονες τεχνικές διαχείρισης Μεγάλων Δεδομένων. «Ένα μέγεθος δεν ταιριάζει σε όλα». Εξερεύνηση δεδομένων. Επεξεργασία στη μνήμη. Επεξεργασία στο σημείο παραγωγής (πηγή δεδομένων). Καινοτόμες πλατφόρμες. Polystores.

Η οπτική της βιομηχανίας για τα Μεγάλα Δεδομένα (The Industry’s view on Big Data)

Καινοτόμες αρχιτεκτονικές για διαχείριση Μεγάλων Δεδομένων από τη βιομηχανία. Google (Pregel, Dremel, Giraph, F1). Facebook. Twitter. LinkedIn (Kafka). SAP (HANA).

Η περίπτωση της NoDB (The case of NoDB)

Ελαχιστοποίηση του χρόνου από τα δεδομένα στις επερωτήσεις. Επεξεργασία δεδομένων σε πρωτογενή αρχεία δεδο-μένων. Αποφυγή του σημείου συμφόρησης της σχεδιασης βάσης δεδομένων και φόρτωσης δεδομένων. Συγκεκριμένες εφαρμογές, όπως επιστημονική ανάλυση δεδομένων.

Αναλυτική πολυδιάστατων δεδομένων (Multidimensional analytics)

Αποθήκες δεδομένων. Κύβοι. Πολυδιάστατες μέθοδοι πρόσβασης. Μείωση διάστασης Αναλυτική πολυδιάστατων δεδομένων.

Αναλυτική κειμένων (Text analytics)

Διαχείριση αδόμητων δεδομένων. Προκλήσεις σχετικές με διαχείριση κειμένου. Ευρετηρίαση κειμένου και αναζήτηση Βαθμολόγηση. Στάθμιση όρων. Το μοντέλο διανυσματικού χώρου. Υπολογισμός βαθμολογιών σε ένα πλήρες σύστημα αναζήτησης. Το ElasticSearch.

Αναλυτική κοινωνικών μέσων (Social media analytics)

Παρακολούθηση κοινωνι-κών μέσων. Συλλογή δεδομένων από κοινωνικά δίκτυα. Κατανόηση κοινωνικών δεδομένων. Ανάλυση κοινωνικών δεδομένων. Η αξία των κοινωνικών δεδομένων για τη σύγχρονη επιχείρηση. Εντοπισμός τάσεων. Επιχειρηματική ευφυία και κοινωνικά μέσα.

Αναλυτική με οπτικοποίηση (Visual analytics)

Εργαλεία και τεχνικές οπτικοποίη-σης δεδομένων. Αναλυτική δεδομένων με οπτικοποίηση. Το εργαλείο οπτικοποίη-σης Tableau. Εφαρμογές σε επειχειρηματική ευφυία. Νέες διεπαφές χρήστη. Προ-ηγμένες τεχνικές οπτικοποίησης. Ερευνητικά πρωτότυπα συστήματα.

Αναλυτική γράφων (Graph analytics)

Καινοτόμα συστήματα διαχείρισης δεδομέ-νων και τεχνικές επεξεργασίας γράφων μεγάλης κλίμακας. Ευρετηρίαση γράφων. Παράλληλη και κατανεμημένη επεξεργασία γράφων. Διαμέριση γράφων.

Προτεινόμενα Συγγράμματα

  • Samet H. (2006): Foundations of Multidimensional and Metric Data Structures. The Morgan Kaufmann Series in Computer Graphics, ISBN-10: 0123694469.
  • Leskovec J, Rajaraman A, Ullman J: Mining of Massive Datasets. Cambridge Univer-sity Press.
  • Mamoulis N. (2011): Spatial Data Management. Morgan & Claypool Publishers, 2011 Synthesis Lectures on Data Management.

Πρόσθετα Συγγράμματα

  • White R.W, and Roth R.A: Exploratory Search Beyond the Query-Response Paradigm. Morgan Claypool. ISBN: 9781598297836
  • Επιλεγμένα ερευνητικά άρθρα.