Μεγάλα Δεδομένα και Αναλυτική

Συνοπτική Περιγραφή και Μαθησιακοί Στόχοι:

Η σύγχρονη εποχή χαρακτηρίζεται και ως εποχή των «Μεγάλων Δεδομένων» λόγω της πρωτοφανούς κλίμακας δεδομένων που παράγονται καθημερινά και τις ανάγκες ανάλυσης των δεδομένων για την εξαγωγή πολύτιμης γνώσης. Πρόσφατες εκτιμήσεις αναφέρουν ότι ο όγκος των δεδομένων που παράγονται κάθε δύο μέρες είναι ίσος με το πλήθος των δεδομένων που έχουν δημιουργηθεί από την αρχή της ανθρωπότητας ως το 2003(!).

Στην εντυπωσιακή αύξηση των δεδομένων συνεισφέρουν, μεταξύ άλλων, πηγές όπως ο παγκόσμιος ιστός, τα κοινωνικά δίκτυα, τα δίκτυα αισθητήρων, καθώς και η πρόσφατη τάση για ανοικτά δεδομένα. Επιπλέον, τα δεδομένα απαντώνται σε ποικίλες μορφές, πολλές φορές με τη μορφή κειμένων, συχνά περιέχουν θόρυβο, γεγονότα που δυσχεραίνουν την αναλυτική δεδομένων.

Αυτός ο πλούτος δεδομένων είναι ιδιαίτερα σημαντικός διότι οδηγεί και στην οικονομική ευημερία. Προβλέπεται ότι τα μεγάλα δεδομένα θα επηρεάσουν την εργασία, καθώς αναμένεται ότι θα υπάρξει ζήτηση για εκατοντάδες χιλιάδες θέσεις εργασίας για ανθρώπους με δεξιότητες αναλυτικής και εμπειρία στη διαχείριση δεδομένων. Επίσης, φαίνεται ότι η πλειοψηφία των επιχειρήσεων έχουν ήδη επενδύσει ή σκοπεύουν να επενδύσουν στα μεγάλα δεδομένα στο άμεσο μέλλον. Είναι προφανές ότι η έννοια των μεγάλων δεδομένων προβάλει νέες ευκαιρίες για οικονομική ανάπτυξη, ενώ η πραγματική δυναμική τους είναι ακόμη δύσκολο να εκτιμηθεί.

Οι φοιτητές της κατεύθυνσης αυτής αναμένεται να αποκτήσουν σημαντικές δεξιότητες στη διαχείριση και ανάλυση δεδομένων μεγάλης κλίμακας, και συγκεκριμένα:

  • Να καταστρώνουν «προβλήματα» που αφορούν Μεγάλα Δεδομένα σε δομημένη, ημι-δομημένη ή αδόμητη μορφή,
  • Να αντλούν και να διαμορφώνουν τα απαιτούμενα συναφή δεδομένα από διάφορες πηγές,
  • Να επιλέγουν τεχνολογίες προς χρήση και εργαλεία/μεθόδους (στατιστικές, κτλ) για αποδοτική επεξεργασία και ανάλυση δεδομένων,
  • Να εφαρμόζουν τεχνικές ανάλυσης δεδομένων και μηχανικής μάθησης για τον αποτελεσματικό εντοπισμό τάσεων, κρυφών ή επαναλαμβανόμενων προτύπων, τη διατύπωση προβλέψεων, και γενικότερα την ανακάλυψη πολύτιμης γνώσης,
  • Να ενσωματώνουν συστήματα και τεχνολογίες ΜΔΑ σε πληροφοριακά συστήματα παραδοσιακά ή πραγματικού χρόνου.

Επίσης, οι φοιτητές θα αποκτήσουν πρακτική εμπειρία σε σύγχρονα εργαλεία και τεχνικές διαχείρισης δεδομένων, συμπεριλαμβανομένων συστημάτων NoSQL (όπως MongoDB), Hadoop/MapReduce και Apache Spark.

Τέλος, μέσα από τη μελέτη της διεθνούς βιβλιογραφίας, των σύγχρονων ερευνητικών επιτευγμάτων του χώρου και της διπλωματικής εργασίας που θα εκπονηθεί, θα δοθεί η δυνατότητα σε όσους φοιτητές το επιθυμούν να προετοιμαστούν κατάλληλα για τον επόμενο κύκλο μεταπτυχιακών σπουδών σε διδακτορικό επίπεδο.