Η θεαματική ανάδυση των «μεγάλων δεδομένων» | Foreign Affairs - Hellenic Edition
Secure Connection

Η θεαματική ανάδυση των «μεγάλων δεδομένων»

Πώς τα big data αλλάζουν τον τρόπο που σκεφτόμαστε τον κόσμο
Περίληψη: 

Όλοι γνωρίζουν ότι το Διαδίκτυο έχει αλλάξει τον τρόπο με τον οποίο δουλεύουν οι επιχειρήσεις, που λειτουργούν οι κυβερνήσεις και ζουν οι άνθρωποι. Αλλά μια καινούργια, λιγότερο εμφανής τεχνολογική τάση αποδεικνύεται να έχει εξίσου μεγάλη μετασχηματιστική δύναμη: τα «μεγάλα δεδομένα».

Ο KENNETH CUKIER είναι Διευθυντής Δεδομένων στον Economist.
Ο VIKTOR MAYER-SCHOENBERGER είναι Καθηγητής Διαδικτυακής Διακυβέρνησης και Ρύθμισης στο Oxford Internet Institute. Είναι οι συγγραφείς του Big Data: A Revolution That Will Transform How We Live, Work, and Think (Hougton Mifflin Harcourt, 2013), απ΄ όπου και τα χωρία αυτού του δοκιμίου.

Όλοι γνωρίζουν ότι το Διαδίκτυο έχει αλλάξει τον τρόπο με τον οποίο δουλεύουν οι επιχειρήσεις, που λειτουργούν οι κυβερνήσεις και ζουν οι άνθρωποι. Αλλά μια καινούργια λιγότερο εμφανής τεχνολογική τάση αποδεικνύεται να έχει εξίσου μεγάλη μεταμορφωτική δύναμη: «τα μεγάλα δεδομένα» (bid data). Τα «μεγάλα δεδομένα» εκκινούν από το γεγονός ότι κυκλοφορεί σήμερα περισσότερη πληροφορία από οποτεδήποτε άλλοτε, και ότι αυτή υπόκειται σε εντελώς νέες χρήσεις. Τα «μεγάλα δεδομένα» είναι κάτι διαφορετικό από το Διαδίκτυο παρότι ο Παγκόσμιος Ιστός καθιστά πολύ ευκολότερο να μαζέψεις και να μοιραστείς τα δεδομένα. Τα «μεγάλα δεδομένα» είναι κάτι περισσότερο από απλή επικοινωνία: η ιδέα είναι ότι από ένα μεγάλο σώμα πληροφοριών μπορούμε να μάθουμε πράγματα που δεν θα μπορούσαμε να καταλάβουμε αν χρησιμοποιούσαμε μόνο μικρότερο όγκο πληροφοριών.

Στον τρίτο αιώνα π.Χ., η βιβλιοθήκη της Αλεξάνδρειας θεωρείτο ότι είχε συγκεντρώσει το σύνολο της ανθρώπινης γνώσης. Σήμερα, υπάρχει πληροφορία στον κόσμο για καθέναν από τους κατοίκους της γης η οποία αντιστοιχεί σε 320 φορές ολόκληρη τη συλλογή η οποία πιστεύεται ότι διατηρείτο στη βιβλιοθήκη της Αλεξάνδρειας –υπολογίζεται σε 1200 exabytes. Αν όλες αυτές οι πληροφορίες μαζεύονταν σε ψηφιακούς δίσκους και στοιβάζονταν, οι ψηφιακοί αυτοί δίσκοι θα σχημάτιζαν πέντε διαφορετικές στοίβες που θα έφθαναν όλες μέχρι το φεγγάρι.

Αυτή η έκρηξη των δεδομένων είναι σχετικά νέα. Το 2000, δηλαδή πολύ πρόσφατα, μόνο το ένα τέταρτο όλων των δεδομένων που φυλάσσονταν παγκοσμίως ήταν ψηφιακά. Τα υπόλοιπα φυλάσσονταν σε χαρτί, σε φιλμ και άλλα αναλογικά μέσα. Αλλά επειδή η ποσότητα των ψηφιακών δεδομένων επεκτείνεται με τόση ταχύτητα –διπλασιάζεται περίπου κάθε τρία χρόνια- αυτή η κατάσταση αντιστράφηκε γρήγορα. Σήμερα, λιγότερο από το 2% από όλες τις αποθηκευμένες πληροφορίες είναι μη ψηφιακές.

Δεδομένης αυτής της τρομερής κλίμακας, η προφανής τάση είναι να κατανοήσουμε τα «μεγάλα δεδομένα» μόνο με όρους μεγέθους. Αλλά αυτό θα ήταν παραπλανητικό. Τα μεγάλα δεδομένα χαρακτηρίζονται επίσης από την ικανότητα να μετατρέπουν σε δεδομένα πολλές όψεις του κόσμου που δεν έχουν ποτέ ποσοτικοποιηθεί: ας το πούμε «δεδομενοποίηση» (datafication). Για παράδειγμα, η γεωγραφική τοποθεσία έχει δεδομενοποιηθεί, πρώτα με την ανακάλυψη του μήκους και του πλάτους και πιο πρόσφατα με τα δορυφορικά συστήματα GPS. Οι λέξεις αντιμετωπίζονται ως δεδομένα όταν οι ηλεκτρονικοί υπολογιστές αντλούν υλικό από βιβλία αιώνων. Ακόμη και οι φιλίες και οι προτιμήσεις (likes) δεδομενοποιούνται, μέσω του Facebook.

Αυτό το είδος δεδομένων υπόκειται σε απίστευτα νέες χρήσεις με τη βοήθεια φθηνής υπολογιστικής μνήμης, ισχυρών επεξεργαστών, έξυπνων αλγόριθμων, ευφυούς λογισμικού, και μαθηματικών που δανείζονται από τη βασική στατιστική επιστήμη. Αντί να προσπαθείς να «διδάξεις» έναν υπολογιστή πως να κάνει διάφορα πράγματα, όπως να οδηγεί ή να μεταφράζει από τη μια γλώσσα στην άλλη, τα οποία οι ειδικοί της τεχνητής νοημοσύνης προσπάθησαν ματαίως να κάνουν επί δεκαετίες, η νέα προσέγγιση είναι να τροφοδοτήσουμε με αρκετά δεδομένα έναν ηλεκτρονικό υπολογιστή έτσι ώστε να μπορεί να υποθέτει πότε, ας πούμε, ένα φανάρι οδικής κυκλοφορίας είναι πράσινο και όχι κόκκινο ή ότι σε ένα δεδομένο συγκείμενο, η γαλλική λέξη lumière είναι πιο κατάλληλη για να αποδώσει το αγγλικό «light» από ό,τι η λέξη léger.

Η χρήση μεγάλων όγκων πληροφορίας κατ’ αυτό τον τρόπο απαιτεί τρεις βαθιές αλλαγές στο πώς προσεγγίζουμε τα δεδομένα. Η πρώτη είναι να συλλέγουμε και να χρησιμοποιούμε πολλά δεδομένα παρά να συμβιβαζόμαστε με μικρές ποσότητες ή δείγματα, όπως κάνουν κατά κόρον οι στατιστικοί για μια χώρα. Η δεύτερη είναι να αποσύρουμε την προτίμησή μας για τα υψηλού βαθμού οργάνωσης και για τα άψογα δεδομένα, και αντ’ αυτού να αποδεχτούμε την ακαταστασία: σε έναν αυξανόμενο αριθμό περιπτώσεων, ένας μικρός βαθμός ανακρίβειας μπορεί να γίνει ανεκτός, διότι τα οφέλη από τη χρήση πολύ περισσότερων δεδομένων διαφορετικής ποιότητας υπερβαίνει το κόστος από τη χρήση δεδομένων μικρότερης ποσότητας αλλά μεγαλύτερης ακρίβειας. Τρίτον, σε πολλές περιπτώσεις, θα χρειαστεί να εγκαταλείψουμε την απαίτησή μας να ανακαλύψουμε τα αιτία των πραγμάτων, και αντ' αυτού να αποδεχτούμε τις συσχετίσεις. Με τα μεγάλα δεδομένα, αντί να προσπαθούν να καταλάβουν ακριβώς γιατί χαλάει μια μηχανή ή γιατί εξαφανίζεται μια παράπλευρη επίπτωση ενός φαρμάκου, οι ερευνητές μπορούν αντιθέτως να συλλέξουν και να αναλύσουν μαζικές ποσότητες πληροφορίας για τέτοια γεγονότα και για ό,τι σχετίζεται με αυτά, αναζητώντας δρόμους που μπορεί να τους βοηθήσουν να προβλέψουν μελλοντικά συμβάντα. Τα «μεγάλα δεδομένα» βοηθάνε να απαντήσουμε στο «τι», όχι στο «γιατί», και συχνά αυτό είναι αρκετό.

Το Διαδίκτυο έχει αναδιαμορφώσει το τρόπο με τον οποίο επικοινωνεί η ανθρωπότητα. Τα «μεγάλα δεδομένα» κάνουν κάτι διαφορετικό: σηματοδοτούν ένα μετασχηματισμό στο πώς η κοινωνία επεξεργάζεται την πληροφορία. Σε λίγο, τα «μεγάλα δεδομένα» μπορεί να αλλάξουν τον τρόπο με τον οποίο σκεφτόμαστε τον κόσμο. Καθώς αντλούμε περισσότερα δεδομένα για να καταλάβουμε τα γεγονότα και για να λάβουμε αποφάσεις, είναι πιθανό να ανακαλύψουμε ότι πολλές όψεις της ζωής κινούνται στη σφαίρα της πιθανότητας παρά της βεβαιότητας.

ΠΡΟΣΕΓΓΙΖΟΝΤΑΣ ΤΟ «Ν=ΟΛΑ»