Μεγάλα Δεδομένα: Τάσεις και Προοπτικές

>>Νίκος Γιαννακόπουλος

Οι σύγχρονες τάσεις και προοπτικές στα Μεγάλα Δεδομένα (Big Data) αποτέλεσαν αντικείμενο συζήτησης στην Ημερίδα που διοργάνωσε το Πρόγραμμα Μεταπτυχιακών Σπουδών «Εφαρμοσμένη Οικονομική & Ανάλυση Δεδομένων» του Τμήματος Οικονομικών Επιστημών του Πανεπιστημίου Πατρών την Τρίτη 16 Απριλίου 2019, στο Συνεδριακό και Πολιτιστικό Κέντρο του Πανεπιστημίου Πατρών. Στην Ημερίδα παρευρέθηκε και πραγματοποίησε ομιλία σχετικά με την ποιότητα και αξιοπιστία των Μεγάλων Δεδομένων ο Πρόεδρος της Ελληνικής Στατιστικής Αρχής, κύριος Αθανάσιος Θανόπουλος. Την Ημερίδα παρακολούθησαν περισσότεροι από 250 προπτυχιακοί και μεταπτυχιακοί φοιτητές, καθώς και μέλη της ακαδημαϊκής κοινότητας του Πανεπιστημίου Πατρών.

Όπως σημείωσε κατά την έναρξη της Ημερίδας ο κύριος Νίκος Γιαννακόπουλος, Αναπληρωτής Καθηγητής του Τμήματος Οικονομικών Επιστημών του Πανεπιστημίου Πατρών και Διευθυντής του ΠΜΣ, η νέα εποχή που έχει διαμορφωθεί στην αξιολόγηση των αποφάσεων και επιλογών των ατόμων, επιχειρήσεων και ευρύτερων μονάδων λήψης αποφάσεων απαιτεί τη διαθεσιμότητα αξιόπιστων μικρο-δεδομένων σε συνδυασμό με τη χρήση σύγχρονων μεθόδων στατιστικής και οικονομετρικής ανάλυσης με στόχο την ταυτοποίηση σχέσεων αιτιώδους συνάφειας (causality) μεταξύ των μεταβλητών ενδιαφέροντος.

Στη συνέχεια, o κύριος Mανώλης Τζαγκαράκης, Επίκουρος Καθηγητής του Τμήματος Οικονομικών Επιστημών του Πανεπιστημίου Πατρών, παρουσίασε εκτενώς τον τρόπο με τον οποίο τα Μεγάλα Δεδομένα αποτελούν στις μέρες μας τη βασική προϋπόθεση για την διεξαγωγή εφαρμοσμένης έρευνας στην Οικονομική Επιστήμη και αναφέρθηκε στα χαρακτηριστικά, τους κινδύνους και τις προκλήσεις που παρουσιάζονται σε αυτό το πλαίσιο. Μάλιστα, παρουσίασε συγκεκριμένα παραδείγματα για τη χρησιμότητα των μεγάλων δεδομένων στη σύγχρονη έρευνα στην Οικονομική Επιστήμη και Δημόσια Πολιτική (π. χ., MIT’s Billion Prices Project), αλλά και σε πολλούς τομείς της καθημερινότητας (π. χ., λιανικό εμπόριο, χρηματοπιστωτικά ιδρύματα, συγκοινωνίες, συμπεριφορά καταναλωτών).

Ακολούθως, ο κος. Σωτήρης Κωτσιαντής, Επίκουρος Καθηγητής του Τμήματος Μαθηματικών του Πανεπιστημίου Πατρών μίλησε για τη διαδικασία εξόρυξης γνώσης από μεγάλα δεδομένα και ειδικότερα παρουσίασε διάφορα εργαλεία εξόρυξης γνώσης με τη χρήση Python και Spark. Αναφέρθηκε εκτενώς σε θέματα ανάγνωσης βάσεων δεδομένων, ταξινόμησης μεταβλητών, τεχνικών ανάλυσης παλινδρόμησης (γραμμικών και μη γραμμικών υποδειγμάτων), ανάλυσης συστάδων (clustering), προβλεπτικής ικανότητας των υποδειγμάτων καθώς σε εργαλεία για την ανάλυση κειμένου σε συμπεριφορές μεταβλητές (sentiment analysis).
Στη συνέχεια της Ημερίδας ο κύριος Βασίλης Μεγαλοοικονόμου, Καθηγητής του Τμήματος Μηχανικών Ηλεκτρονικών Υπολογιστών και Πληροφορικής του Πανεπιστημίου Πατρών αναφέρθηκε διεξοδικά στις προκλήσεις, μεθόδους και τεχνικές που αφορούν τη διαχείριση και ανάλυση δεδομένων μεγάλου όγκου δίνοντας έμφαση στη χρήση των μεγάλων δεδομένων στις επιχειρήσεις. Σημείωσε, ότι οι διαδικασίες εξασφάλισης αξιοπιστίας στα δεδομένα απαιτούν την εφαρμογή διαφόρων εργαλείων προ-επεξεργασίας, επειδή τα πραγματικά δεδομένα συνήθως είναι ελλιπή, θορυβώδη και ασυνεπή. Παρουσίασε, επίσης, τις βασικές τεχνικές χειρισμού των δεδομένων με θόρυβο, της ενοποίησης δεδομένων, του μετασχηματισμού των δεδομένων, καθώς και της μείωσης του όγκου των δεδομένων. Κλείνοντας, σημείωσε ότι στο μέλλον η ποιότητα δεδομένων θα αποτελέσει κομβικό θέμα στη λήψη αποφάσεων και ολοένα και περισσότερες εταιρείες θα επικεντρώνονται στην επίλυση της πρόκλησης της διατήρησης ακριβέστερων και πληρέστερων δεδομένων.

Ο κύριος Αθανάσιος Θανόπουλος ξεκινώντας την ομιλία του σημείωσε, ότι η αποστολή της Ελληνικής Στατιστικής Αρχής (ΕΛΣΤΑΤ) είναι η διασφάλιση και βελτίωση της ποιότητας των στατιστικών της Ελλάδας εφαρμόζοντας πιστά τον Κώδικα Ορθής Πρακτικής του Ευρωπαϊκού Στατιστικού Συστήματος. Στο πλαίσιο αυτό, η ακρίβεια και αξιοπιστία των δεδομένων είναι καίριας σημασίας, επειδή οι επίσημες στατιστικές που παράγονται από την ΕΛΣΤΑΤ είναι δημόσιο αγαθό και αφορούν πολλούς τομείς της ζωής των πολιτών όπως η οικονομική και κοινωνική ανάπτυξη οι συνθήκες διαβίωσης, η υγεία, η εκπαίδευση και το περιβάλλον. Στις μέρες μας, η ΕΛΣΤΑΤ χρησιμοποιεί διάφορες πηγές δεδομένων όπως ελεγχόμενα πειράματα (έρευνες), διοικητικά δεδομένα (π.χ., φορολογικά, υγεία, απασχόληση, εκπαίδευση), web scrapping (π.χ., κενές θέσεις εργασίας) και αισθητήρες (π.χ., περιβάλλον). Τα trade-offs που αντιμετωπίζει η ΕΛΣΤΑΤ αφορούν, την έγκαιρη δημοσίευση στατιστικών (vs εξαντλητική και λεπτομερειακή ανάλυση), την περιεκτική πληροφορία (vs λεπτομέρεια και ακρίβεια), εγκυρότητα (vs κάλυψη), τα κοινά πρότυπα (vs άρτια στατιστική μεθοδολογία), την ποιότητα πρωτογενών δεδομένων (vs πλήρη καταγραφή των χαρακτηριστικών των ερωτώμενων), το μεγάλο κόστος παραγωγής (vs ακρίβεια στην εκτίμηση), τη συγκρισιμότητα και το συντονισμό (vs εξαντλητικότητα στο πλήθος των μεταβλητών) και το ρεαλισμό στο σχεδιασμό και τη συλλογή των δεδομένων (vs φιλοδοξία). Μεταξύ άλλων, ο κύριος Αθανάσιος Θανόπουλος αναφέρθηκε στο γεγονός ότι η καταγραφή των γεγονότων της καθημερινότητας σε βάσεις δεδομένων αντιμετωπίζει στις μέρες ιδιαίτερες προκλήσεις, επειδή τα οικονομικά γεγονότα εξελίσσονται γρήγορα, διαδίδονται γρηγορότερα, επιταχύνουν την εξέλιξη, αυξάνουν τις απατήσεις όσων λαμβάνουν αποφάσεις για παροχή έγκυρης πληροφορίας και δημιουργούν χώρο για ανταγωνισμό σε παροχή πληροφορίας (πολλές φορές χωρίς πρότυπα ποιότητας και δεοντολογίας). Στο πλαίσιο αυτό τόνισε, ότι στόχος της ΕΛΣΤΑΤ είναι να βρίσκεται εντός του ενάρετου κύκλου των «Επίσημων Στατιστικών» και οποιαδήποτε απόκλιση από αυτόν τον στόχο θα κλονίσει την εμπιστοσύνη και θα μετατρέψει τον ενάρετο κύκλο σε φαύλο. Κλείνοντας, ο κύριος Αθανάσιος Θανόπουλος έδωσε ιδιαίτερο βάρος στο πρόγραμμα της ΕΛΣΤΑΤ για την ανάπτυξη Στατιστικής Παιδείας στο γενικό πληθυσμό, που στόχο έχει την κατανόηση του ρόλου της ΕΛΣΤΑΤ στην καθημερινότητα των πολιτών.

Το πρόγραμμα της Ημερίδας καθώς και οι παρουσιάσεις των ομι-
λητών είναι διαθέσιμα στην ακόλουθη ιστοσελίδα: http://postgrad.econ.upatras.gr/el/ekdiloseis