Κωδικός Μαθήματος

ΠΠΣ-130

Εξάμηνο Μαθήματος

1ου Εξαμήνου

Πιστωτικές Μονάδες

7,5

Ηλεκτρονικό Υλικό

https://evdoxos.ds.unipi.gr/courses/DSERV104

Κατηγορία Μαθήματος

Υποχρεωτικό

Διαχείριση Δεδομένων

Στόχος Μαθήματος Διαχείρισης Δεδομένων

Κύριος στόχος του μαθήματος είναι η εμβάθυνση των φοιτητών στις μεθοδολογίες και τεχνολογίες διαχείρισης δεδομένων. Στα πλαίσια του μαθήματος καλύπτονται προχωρημένα θέματα που αφορούν στο σχεδιασμό βάσεων δεδομένων, στην επεξεργασία επερωτήσεων και στις σύγχρονες αρχιτεκτονικές διαχείρισης δεδομένων στο πλαίσιο ευρύτερων δικτυοκεντρικών συστημάτων και υπηρεσιών. Επίσης, εξετάζονται θέματα επιχειρησιακής νοημοσύνης, όπως ολοκλήρωση επιχειρησιακών δεδομένων, μοντελοποίηση επιχειρησιακών διαδικασιών, καθώς και προηγμένες τεχνικές εξόρυξης γνώσης από επιχειρησιακά δεδομένα. Στα αναμενόμενα μαθησιακά αποτελέσματα του μαθήματος περιλαμβάνεται η δυνατότητα των φοιτητών να αναπτύσσουν αποτελεσματικά κλασικά και δικτυοκεντρικά συστήματα και υπηρεσίες σε περιβάλλοντα βάσεων δεδομένων στις οποίες περιλαμβάνονται δομημένα, ημι-δομημένα και αδόμητα δεδομένα. Επίσης οι φοιτητές αποκτούν βασικές γνώσεις και δεξιοτητες σε θέματα ανάλυσης δεδομένων και εξαγωγής χρήσιμης πληροφορίας από αυτά.

Περιεχόμενα Μαθήματος Διαχείρισης Δεδομένων

Κατανεμημένη διαχείριση δεδομένων

Βασικές έννοιες, προβλήματα, αρχιτεκτονικές, επεξεργασία επερωτήσεων σε κατανεμημένα δεδομένα, συστήματα διαχείρισης δεδομένων ομότιμων κόμβων, αδόμητα και δομημένα δίκτυα ομότιμων κόμβων.

Παράλληλη διαχείριση δεδομένων

Βασικές έννοιες και αρχιτεκτονικές για παράλληλες βάσεις δεδομένων, παράλληλος υπολογισμός επερωτήσεων, διαχείριση δεδομένων στο υπολογιστικό νέφος, το προγραμματιστικό μοντέλο MapReduce, η υλοποίηση Hadoop, το HDFS.

Επεξεργασία επερωτήσεων και βελτιστοποίηση

Επεξεργασία επερωτήσεων κατάταξης (top-k), επεξεργασία επερωτήσεων κατάταξης με σύζευξη (top-k join), αλγόριθμοι για επερωτήσεις κατάταξης με σύζευξη, επερωτήσεις κορυφογραμμής (skyline), αλγόριθμοι επεξεργασίας επερωτήσεων κορυφογραμμής.

Μείωση διαστάσεων – Επιλογή Χαρακτηριστικών

Πολυδιάστατα δεδομένα, μοντελοποίηση, προβλήματα χώρων πολλών διαστάσεων (η «κατάρα των πολλών διαστάσεων», το «φαινόμενο κενού χώρου»), ανεπάρκεια ευρετηρίων, αλγόριθμοι μείωσης διάστασης, εφαρμογή σε πρακτικά προβλήματα διαχείρισης δεδομένων.

Θέματα ασφάλειας δεδομένων και ιδιωτικότητας

Εξουσιοδοτήσεις, έλεγχοι πρόσβασης, πολιτικές και μηχανισμοί εξουσιοδοτήσεων, έλεγχοι προσβάσεων με βάση τους ρόλους των χρηστών (μοντέλο RBAC), το πρόβλημα δημοσιοποίησης ανώνυμων δεδομένων, k-anonymity, l-diversity, μηχανισμοί διασφάλισης ιδιωτικότητας.

Επιχειρησιακή νοημοσύνη

Βασικές έννοιες, η επιχειρησιακή νοημοσύνη από την άποψη της βιομηχανίας, νέες τάσεις (μεγάλα δεδομένα, γρήγορες επιχειρήσεις, καλύτερο λογισμικό), μοντελοποίηση των επιχειρησιακών διαδικασιών.

Ολοκλήρωση πληροφορίας στην επιχειρησιακή νοημοσύνη – Προεπεξεργασία δεδομένων

Επιλογή δεδομένων, καθάρισμα, διαχείριση τιμών που λείπουν, ολοκλήρωση δεδομένων, σημασιολογική ετερογένεια, οπτικοποίηση δεδομένων για λήψη αποφάσεων.

Ομοιότητα αντικειμένων

Μέτρα απόστασης / ομοιότητα για διαφορετικούς τύπους δεδομένων (αριθμητικά, κατηγορικά, κείμενα), επεξεργασία επερωτήσεων ομοιότητας (ερωτήματα εύρους και κοντινότερου γείτονα), εφαρμογές μηχανικής μάθησης.

Αποθήκες δεδομένων

Πολυδιάστατο μοντέλο δεδομένων, αρχιτεκτονική αποθηκών δεδομένων, σχεδίαση αποθηκών δεδομένων, εξαγωγή-μετασχηματισμός-φόρτωση δεδομένων, λειτουργίες OLAP, οι αποθήκες δεδομένων ως εργαλεία επιχειρησιακής νοημοσύνης.

Εξόρυξη γνώσης και ανάλυση κειμένου

Βασικές τεχνικές εξόρυξης γνώσης και η εφαρμογή τους στην επιχειρησιακή νοημοσύνη, τεχνικές εξαγωγής πληροφορίας από διαφορετικές πηγές δεδομένων (κείμενο, Παγκόσμιο Ιστό, κοινωνικά δίκτυα).

Προτεινόμενα Συγγράμματα

  • Βασιλακόπουλος Γ. (2009): Σχεδιασμός Βάσεων Δεδομένων, Αυτοέκδοση.
  • Teorey T. J., Lightstone S. S., Nadeau T. and Jagadish H.V. (2011): Database Modeling and Design, Fifth Edition: Logical Design, Morgan Kaufmann, ISBN-10: 0123820200.
  • Teorey T. J. (1998): Database Modeling & Design: The Fundamental Principles, Morgan Kaufmann, ISBN-10: 1558602941.
  • Siau K. (2007): Contemporary Issues in Database Design and Information Systems Development, IGI Publishing, ISBN-10: 1599042894.
  • Χαλκίδη Μ. και Βαζιργιάννης Μ. (2005): Εξόρυξη Γνώσης από Βάσεις Δεδομένων και τον Παγκόσμιο Ιστό, Εκδόσεις Δάρδανος, ISBN: 978-960-402-116-8.
  • Raymond T.Ng et al. (2013): Perspectives on Business Intelligence. Morgan & Claypool Publishers. Synthesis Lectures on Data Management.

Πρόσθετα Συγγράμματα

  • Silberschatz A., Korth H., and Sudarshan S. (2004): Συστήματα Βάσεων Δεδομένων (μετάφραση στα Ελληνικά), Εκδόσεις Γκιούρδας, ISBN: 9605123843.
  • Elmasri R. and Navathe S. B. (2005): Θεμελιώδεις Αρχές Συστημάτων Βάσεων Δεδομένων, Τόμοι Α’ & Β’, (μετάφραση Μ. Χατζόπουλος), Εκδόσεις Δίαυλος, ISBN: (Τόμος A’) 9605312190, (Τόμος Β’) 9605311194.
  • Ramakrishnan, R., Gehrke, J. (2002): Συστήματα Διαχείρισης Βάσεων Δεδομένων, Τόμος A & Β, Eκδόσεις Τζιόλα, ISBN: (Τόμος A’) 960-8050-70-7, (Τόμος Β’) 960-8050-85-5.
  • Han J. and Kamber M. (2006): Data Mining-Concepts and Techniques. Morgan Kaufmann, ISBN 1-55860-901-6.
  • Vazirgiannis, M., Halkidi, M. and Gunopoulos, D. (2003): Quality Assessment and Uncertainty Handling in Data Mining, Springer Verlag, LNAI Series, ISBN-10: 1852336552.
  • Chakrabarti S. (2002): Mining the Web, Discovering Knowledge from Hypertext Data, Morgan Kaufman Publishers, ISBN-10: 1558607544.
  • Chaudhuri, S, Dayal, U., Narasayya, V. (2011): An Overview of Business Intelligence Technology. Communications of the ACM, Vol. 54 No. 8, Pages 88-98.