Σπίτι Επιχείρηση Εξόρυξη μεγάλων δεδομένων

Εξόρυξη μεγάλων δεδομένων

Anonim

Ψάχνετε για επιχειρηματικό πλεονέκτημα; Πάρτε ένα σύνθημα από το Moneyball, το οποίο δραματοποίησε τον τρόπο με τον οποίο οι αθλητικές ομάδες θα μπορούσαν να κερδίσουν εάν έπαιζαν από τους αριθμούς αντί του ένστικτου εντέρου. Ανεξάρτητα από το μέγεθος της επιχείρησής σας, ήρθε η ώρα να ξεπεράσουμε την άκρως αυξανόμενη και ανεκτίμητη ροή πληροφοριών που παράγεται από σχεδόν όλους τους τομείς της κοινωνίας. Οποιοδήποτε λογισμικό χρησιμοποιείτε για να επεξεργαστείτε δεδομένα σήμερα, είναι σχεδόν βέβαιο ότι δεν επαρκεί για να αντιμετωπίσει την πρόκληση ενός κόσμου που αρχίζει να σκέφτεται σε zettabytes (δηλαδή 1 δισεκατομμύριο terabytes, με κάθε terabyte να είναι 1 τρισεκατομμύριο byte ). Η πρόκληση δεν είναι μόνο η αποθήκευση όλων αυτών των πληροφοριών, αλλά και η κατανόηση των ευκαιριών που προσφέρει και η αποτελεσματική ανάλυσή της σε σχέση με τον ανταγωνισμό.

Τα μεγάλα δεδομένα, όπως έρχονται να καλούνται, αναφέρονται σε μεγάλα σύνολα δεδομένων που προέρχονται σχεδόν από παντού - συμπεριλαμβανομένων ηλεκτρονικών πωλήσεων, πληροφοριών αποστολής, πληροφοριών σχετικά με το κλίμα, δορυφορικών φωτογραφιών και βίντεο απομακρυσμένης παρακολούθησης, εμπορικών συναλλαγών χρηματιστηριακών συναλλαγών, αρχείων συλλήψεων, δημοσιεύσεις σε ιστότοπους κοινωνικών μέσων ενημέρωσης, πληροφορίες πτήσεων, σήματα GPS κινητής τηλεφωνίας … και πολλά άλλα.

Τα αστυνομικά τμήματα συνηθίζουν να συλλέγουν τεράστιους όγκους πληροφοριών για την πρόβλεψη και τον προγραμματισμό των τάσεων του εγκλήματος. Μπορούν να δουν, για παράδειγμα, τον καιρό, τα μοντέλα κυκλοφορίας, τα χρονοδιαγράμματα αθλητικών εκδηλώσεων, τις αργίες και τις ημερομηνίες των πληρωμών για να εντοπίσουν τα καυτά σημεία του εγκλήματος, όπου οι στόχοι ευκαιρίας (όπως οι εκκεντροφόροι με τα μετρητά) διασταυρώνονται με τους ενδεχόμενους κακούς.

Οι έμποροι λιανικής πώλησης μπορούν να αξιολογήσουν την απόδοση των προϊόντων, τις τάσεις των τιμών και τα δημογραφικά στοιχεία, προκειμένου να κατανοήσουν καλύτερα τις ανάγκες των πελατών τους με ταχείες αλλαγές.

Οι δικηγόροι θα μπορούσαν να μελετήσουν τις αποφάσεις των μεμονωμένων δικαστών για να αποκτήσουν γνώσεις σχετικά με τις στρατηγικές που πρέπει να χρησιμοποιήσουν στα δικαστήρια - σε πολύ λιγότερο χρόνο από ό, τι θα τους πήγαιναν στη βιβλιοθήκη αναλογικού νόμου.

Οι αεροπορικές εταιρείες μπορούν να γνωρίζουν πριν από την προσγείωση ενός αεροπλάνου ότι η αποσκευή ενός επιβάτη δεν έκανε την πτήση, έπειτα προειδοποίησε τον επιβάτη για τον τόπο της τσάντας και πότε θα το πάρει, προτού το αίμα του επιβάτη αρχίσει να βράζει καθώς περιμένει δίπλα σε ένα άδειο καρουσέλ.

Και οι διαχειριστές αθλητικών ομάδων μπορούν να αναλύσουν τα δεδομένα και τα στατιστικά στοιχεία για να εντοπίσουν τους υποτιμημένους παίκτες, όπως στο παράδειγμα Moneyball με βάση την ομάδα μπέιζμπολ του Όουκλαντ Α, σύμφωνα με το βιβλίο του 2003 του Michael Lewis και την περσινή ταινία με τον Brad Pitt.

Εάν δεν έχετε ακούσει ποτέ για το Big Data ή τη σημασία του, δεν είναι περίεργο. Σκεφτείτε ότι το 90% των δεδομένων του κόσμου δημιουργήθηκαν τα τελευταία δύο χρόνια, λέει η IBM, με περισσότερα από 2, 5 quintallion bytes δεδομένων να δημιουργούνται καθημερινά.

Μόλις πριν από ένα χρόνο, οι θέσεις εργασίας που αφορούσαν την τρύπηση του Big Data ελάχιστα υπήρχαν, αλλά τώρα οι Ηνωμένες Πολιτείες αντιμετωπίζουν έλλειψη έως και 190.000 εργαζομένων με αναλυτική εμπειρογνωμοσύνη, καθώς και 1.5 εκατομμύρια διευθυντές και αναλυτές για να κατανοήσουν και να λάβουν αποφάσεις βάσει αυτής της ανάλυσης, στο McKinsey Global Institute, το ερευνητικό σκέλος του διεθνούς συμβούλου διαχείρισης McKinsey & Co.

Η αγορά της τεχνολογίας των μεγάλων δεδομένων και των υπηρεσιών θα αυξηθεί από 3, 2 δισεκατομμύρια δολάρια το 2010 σε 16, 9 δισεκατομμύρια δολάρια το 2015, σύμφωνα με μια έκθεση της εταιρείας International Data Corp. του 2012. Η ανάπτυξη είναι ακόμη υψηλότερη σε ορισμένους τομείς, όπως η αποθήκευση, να είναι 61, 4% τα επόμενα πέντε χρόνια. Και οι εξειδικευμένοι χειριστές δεδομένων θα πρωτοπορούν σε νέες αγορές. οι εταιρείες που παρέχουν κλινικές ιατρικές πληροφορίες, για παράδειγμα, θα μπορούσαν να δουν μια αγορά αξίας άνω των 10 δισεκατομμυρίων δολαρίων μέχρι το 2020, λέει ο McKinsey.

Ο καλύτερος τρόπος για να αξιοποιήσετε αυτό το πραγματικό χρυσωρυχείο είναι μια ερώτηση που απευθύνεται σε εταιρείες τεχνολογίας, επιχειρηματίες, ακαδημαϊκούς και ακόμη και τη διοίκηση του Ομπάμα. Πολλές εταιρείες το κάνουν ήδη. Έχετε ποτέ ακούσει για Apache Hadoop; Πρόκειται για μια ελεύθερη σουίτα προγραμμάτων λογισμικού ανοικτού κώδικα που επιτρέπει την ακριβή επεξεργασία των μεγάλων συνόλων δεδομένων. ( Ονομάστηκε ο ελέφαντας του γιου του δημιουργού, που ονομάζεται Hadoop .)

Το απαραίτητο σύνολο δεξιοτήτων για την αποτελεσματική χρήση του Hadoop πρέπει να βρίσκεται στην τιμονιέρα των μεγάλων εταιρειών (οι οποίες μπορεί να θέλουν να αναπτύξουν εσωτερικές ομάδες) καθώς και μικρές επιχειρήσεις (οι οποίες είναι πιθανότερο να εκμεταλλευτούν τους συμβούλους). Το Facebook επεξεργάζεται δισεκατομμύρια επικοινωνίες μέσω του Hadoop κάθε μέρα. Η Yahoo είναι επίσης ένας μεγάλος χρήστης που την αποκαλεί "η τεχνολογία ανοιχτού κώδικα στο επίκεντρο του Big Data και του cloud computing." Πέρυσι, η Yahoo διέσχισε μια εταιρεία με την επωνυμία Hortonworks για να αναπτύξει περαιτέρω τον Hadoop και ο CEO Eric Baldeschwieler μέχρι το 2016 τα μισά από τα δεδομένα του κόσμου θα μπορούσαν να εμπιστευτούν τη φροντίδα της Hortonworks. Η λίστα των πελατών είναι μεγάλη, συμπεριλαμβανομένων των εταιρειών Apple, LinkedIn, Microsoft, Netflix και StumbleUpon.

Πωλήσεις βάσει δεδομένων

Ο Mollie Lombardi, διευθυντής έρευνας για τη διαχείριση του ανθρώπινου κεφαλαίου στον Όμιλο Aberdeen, βλέπει πλούσιες ευκαιρίες για το Big Data στο χώρο των πωλήσεων και χρησιμοποιεί ένα εξαιρετικά βασικό προσωπικό παράδειγμα. "Ελέγξαμε σε ένα ξενοδοχείο Westin / Starwood, " λέει, "και ο υπάλληλος μου είπε, " Καλώς ήλθατε πίσω. Βλέπω ότι ήσασταν μαζί μας πριν - θα θέλατε να μείνετε στο ίδιο δωμάτιο; " "

Έχοντας αυτές τις πληροφορίες στα χέρια του, ο υπάλληλος ήταν σε θέση να κάνει μια προσωπική σύνδεση. «Είχαν την τεχνολογία να φέρουν το αίτημα αυτό στο γραφείο», λέει ο Lombardi. "Με τον ίδιο τρόπο, η συλλογή δεδομένων μπορεί να πει μια επιχείρηση μάρκετινγκ ότι δεν πρόκειται να κάνω μια αγορά με έκπτωση 15 τοις εκατό - αλλά έχω ένα αρχείο απαντήσεων σε προσφορές 30 τοις εκατό."

Οι δυνάμεις πωλήσεων θα πρέπει να είναι χρήστες του Big Data. Υποθέστε ότι ένας διευθυντής επιχείρησης είναι στο τηλέφωνο να μιλάει σε έναν τακτικό πελάτη ο οποίος λέει ότι, για $ 1 off ανά τεμάχιο, θα παραγγείλει άλλες 500 μονάδες. Με ένα front end Big Data, ο διαχειριστής μπορεί να πάρει πέντε ή έξι δευτερόλεπτα για να αποκτήσει πρόσβαση στο ιστορικό του πελάτη σε 20 κύκλους κύκλου εργασιών. Μήπως ο πελάτης ανταποκρίθηκε στις υποσχέσεις του; Αν όχι, ο διαχειριστής βρίσκεται σε καλή θέση είτε να αρνηθεί την έκπτωση είτε να το προσφέρει υπό όρους για την αγορά 1.000 και όχι 500 μονάδων.

Η ευκαιρία είναι να βάλουμε πλούσια δεδομένα πελατών μπροστά στους πωλητές και μπορεί να ξεπεράσει τον κατάλογο των γενεθλίων των παιδιών των πελατών, ώστε να συμπεριλάβει λεπτομερή ανάλυση αγοραστικών σχεδίων που συγκεντρώνονται από πολλές πηγές σε πραγματικό χρόνο.

Εντός των εταιρειών, η ανάλυση Big Data θα επιτρέψει στις επιχειρήσεις να μελετήσουν τους κορυφαίους πωλητές τους και να αποκτήσουν πληροφορίες για το τι τους καθιστούν καλούς. "Θα μπορούσαμε να δούμε τους απόφοιτους του κολλεγίου X, Y και Z και να δούμε πώς έχουν κάνει", λέει ο Lombardi, "ή να μελετήσουν τα αποτελέσματα με ανθρώπους που προσλαμβάνονται από τον ανταγωνιστή Α έναντι του ανταγωνιστή B. Με πληροφορίες που αποκτήθηκαν από πηγές όπως αυτό, να δημιουργήσετε ένα προφίλ ικανότητας και να το χρησιμοποιήσετε για να αναπαραγάγετε τις καλύτερες πωλήσεις. "

Συναρπαστικά πράγματα, σωστά; Οχι τόσο γρήγορα. Ένα από τα προβλήματα με το Big Data είναι ότι μεγάλο μέρος του είναι άχρηστο. σύμφωνα με το B2B Sales Intelligence Blog, μόνο το 0, 01% των τεράστιων ποσοτήτων δεδομένων που προέρχονται από τα κοινωνικά δίκτυα, τα blogs και τα σχόλια των προϊόντων βοηθούν στην ανακάλυψη της πρόθεσης του αγοραστή. Και πάλι, το κλειδί είναι η επεξεργασία και η ερμηνεία των δεδομένων και η απόκτηση γνώσης από αυτό.

Λύσεις για την Υγεία

Η ιατρική είναι μια άλλη μεγάλη γεννήτρια δεδομένων και τα Big Data βοηθούν στην αποτελεσματική ανάλυση της - με αποτελέσματα σε ορισμένες περιπτώσεις που μπορούν να σώσουν ζωές. Η ομάδα επιστημών δεδομένων στην εταιρία λογισμικού εταιρειών Cloudera που εδρεύει στην Καλιφόρνια χρησιμοποίησε τον Apache Hadoop για να αναλύσει τα ανεπιθύμητα συμβάντα που μπορεί να συμβούν όταν συνδυάζονται δύο ή περισσότερες συνταγές. Το 4% των Αμερικανών άνω των 55 ετών κινδυνεύουν από αλληλεπιδράσεις φαρμάκων. Το πρόβλημα στην ανάλυση των 1 εκατομμυρίων αναφορών που ελήφθησαν ετησίως από την Υπηρεσία Διατροφής και Φαρμάκων, ο Cloudera γρήγορα βρέθηκε, είναι μια υπολογιστική έκρηξη - υπάρχουν περισσότεροι από 3 τρισεκατομμύρια δυνητικοί συνδυασμοί τριπλών αλληλεπιδράσεων φαρμάκων.

Ωστόσο, η λήψη απαντήσεων από τέτοια τεράστια σύνολα δεδομένων δεν είναι πλέον πέρα ​​από την τεχνική μας εμβέλεια. Η βαθιά κατάδυση του Cloudera στα ιατρικά δεδομένα αποκάλυψε δεκάδες χιλιάδες ανεπιθύμητες αντιδράσεις σε ασθενείς που έλαβαν συνδυασμούς τριών φαρμάκων, όλα τα οποία αξίζουν περαιτέρω διερεύνηση. Για παράδειγμα, ένα φάρμακο κατάσχεσης που χρησιμοποιήθηκε σε συνδυασμό με ένα συγκεκριμένο αναλγητικό βρέθηκε να συσχετίζεται με την εξασθένιση της μνήμης.

Οι αλληλεπιδράσεις φαρμάκων είναι μόνο μία ιατρική εφαρμογή μεταξύ πολλών. Η εταιρεία Salient Management Co. χρησιμοποιεί τα μεγάλα δεδομένα για να βοηθήσει τις κρατικές υπηρεσίες της Νέας Υόρκης να ελέγχουν τις δαπάνες Medicaid. Πάνω από πέντε χρόνια, το ηλεκτρονικό σύστημα πληρωμών του κράτους επεξεργάστηκε σχεδόν 2 δισεκατομμύρια ιατρικές συναλλαγές με περισσότερους από 200.000 παρόχους και 9 εκατομμύρια παραλήπτες.

Η εξάλειψη της απάτης είναι δύσκολη και δυσχερέστερη, επειδή τα παράνομα προγράμματα περιλαμβάνουν μεγάλο αριθμό αρχείων. Το σύστημα Medicaid παράγει ετησίως 2 terabytes δεδομένων, λέει ο Salient CEO Guy Amisano. Ωστόσο, η τεχνολογία του Salient μπορεί να ταξινομήσει γρήγορα όλα αυτά τα δεδομένα, αναζητώντας περίεργα πρότυπα και τάσεις που μπορεί να είναι κόκκινες σημαίες για απάτη, όπως ξαφνικές αυξήσεις χρέωσης από συγκεκριμένη τοποθεσία ή συγκεντρωμένες περιπτώσεις της ίδιας διαδικασίας.

Ο ανθρώπινος παράγοντας

Το Big Data προσφέρει επίσης μια σημαντική ευκαιρία για επαγγελματίες του ανθρώπινου δυναμικού. Η Brenda Kowske, Ph.D., ανώτερος αναλυτής της Bersin & Associates, αναφέρει ότι η χρήση αναλυτικών στοιχείων για ανθρώπινο δυναμικό που βασίζονται σε δεδομένα είναι ακόμα στα αρχικά στάδια. "Χρησιμοποιούμε δεδομένα στο μάρκετινγκ για να υπολογίσουμε τι θα αγοράσουν οι καταναλωτές και για τη χρηματοδότηση της διαχείρισης κινδύνων", λέει. "Στον ανθρώπινο δυναμικό, μπορούμε να το χρησιμοποιήσουμε για να προβλέψουμε πώς θα δουλέψουν οι εργαζόμενοι στην εργασία και πώς θα τους εμπλακούν και θα παρακινηθούν".

Οι νόμοι περί εμπιστευτικότητας παρουσιάζουν ένα μεγάλο εμπόδιο για την πρόσβαση σε μεγάλα δεδομένα ανθρώπινων πόρων. Οι εταιρείες αντιμετωπίζουν όρια για το πόσο χρόνο μπορούν να αποθηκεύουν δεδομένα που αφορούν άτομα και η ανταλλαγή δεδομένων ανθρώπινου δυναμικού μεταξύ διαφορετικών εταιρειών είναι δύσκολη.

Αλλά μέσα στα νομικά όρια, υπάρχουν πολλά που μπορούν να γίνουν. Συγκεκριμένα, οι διαχειριστές ανθρώπινου δυναμικού μπορούν να μελετήσουν δεδομένα από τους υπαλλήλους του παρελθόντος, συμπεριλαμβάνοντας συμπεριφορές στη δουλειά τους, οι οποίες θα οδηγήσουν στον εντοπισμό των χαρακτηριστικών προσωπικότητας που είναι χρήσιμα, εάν οι άνθρωποι πρόκειται να εκτελέσουν το επίπεδο που απαιτείται για τη θέση. "Απαιτεί διευθυντικά στελέχη να σκέπτονται σαν ερευνητές και όχι ανθρώπους ανθρώπων", λέει ο Kowske. "Οι επιχειρήσεις πρέπει όχι μόνο να συλλέγουν δεδομένα, αλλά να τα αποθηκεύουν σε μορφές που είναι ανόμοιες. Στην πραγματικότητα, θα ήταν χρήσιμο να έχουμε έξυπνα εργαλεία που θα μπορούσαν να ανιχνεύσουν διάφορα συστήματα HR, επειδή τα δεδομένα δεν είναι πιθανό να είναι όλα στην ίδια θέση ».

Μια βιομηχανία εξοχικών κατοικιών αναπτύσσεται για να βοηθήσει τα τμήματα HR να επιταχύνουν την εργασία τους με το Big Data. Μια τέτοια εταιρεία είναι η Spring International, της οποίας ο διευθύνων σύμβουλος, Robert Berrier, έχει ιστορικό προεδρικών εκλογών. Οι πολιτικοί χωρίζουν τους ψηφοφόρους σε τμήματα που μπορούν στη συνέχεια να στοχεύουν ειδικά στην διαφημιστική εκστρατεία, λέει ο Matt Fumento, αντιπρόεδρος στρατηγικής και ανάπτυξης της Άνοιξης. Στην HR, λέει, οι επιχειρήσεις προσπαθούν να κατανοήσουν καλύτερα τις δικές τους εργατικές δυνάμεις (και πιθανές προσλήψεις) και να μεγιστοποιήσουν το επίπεδο εμπλοκής τους στη δουλειά. Η Άνοιξη αξιολογεί την αφοσίωση των εργαζομένων μέσω της ανίχνευσης των εργαζομένων και της μελέτης αυτών των δεδομένων, μαζί με πληροφορίες όπως η απουσία υπαλλήλων και ο ασθενής χρόνος. Η άνοιξη εξετάζει επίσης παράγοντες όπως η ικανοποίηση του πελάτη, η παραγωγή εσόδων και η κερδοφορία.

Οι αφοσιωμένοι επαγγελματίες προσθέτουν σίγουρα στην κατώτατη γραμμή. Για έναν πελάτη αερομεταφορέα, τα επίπεδα συσχετισμού πιλότων της Άνοιξης συσχετίζονταν με το χρονικό διάστημα που δαπανώνταν για την άσφαλτο πριν από την απογείωση και διαπίστωσαν ότι οι καθυστερήσεις στην αερομεταφορά κόστισαν την εταιρεία 100 εκατομμύρια δολάρια. Για τους λιανικούς πελάτες, όπως το Lowe, βοηθάει στον εντοπισμό του αντίκτυπου της δέσμευσης στα έσοδα που παράγονται ανά τετραγωνικό πόδι του αποθηκευτικού χώρου. Η Lowe ήταν σε θέση να επιβεβαιώσει τη σχέση μεταξύ των εργαζομένων, την ικανοποίηση του πελάτη και την παραγωγή εσόδων.

Στο απλούστερο επίπεδο, ένας πελάτης της Lowe, που αναζητά ένα γαλόνι χρώματος, θα πάρει αυτό και τίποτα άλλο από έναν αποσπασμένο υπάλληλο. Αλλά αν ο υπάλληλος ακούει, αυτός ή αυτή θα ενδιαφέρεται για το έργο-και ο πελάτης θα μπορούσε να καταλήξει με spackling πάστα, γυαλόχαρτο, βούρτσες και κυλίνδρους εκτός από το χρώμα. Η Lowe διαπίστωσε ότι η διαφορά μεταξύ των καταστημάτων υψηλότερης και χαμηλότερης εμπλοκής της ήταν πάνω από 1 εκατομμύριο δολάρια σε πωλήσεις ετησίως.

Η αναζήτηση πραγματικών αποτελεσμάτων εσόδων είναι σημαντική, διότι σύμφωνα με το βιβλίο Στρατηγικών Χαρτών: Μετατροπή άϋλων περιουσιακών στοιχείων σε απτά αποτελέσματα, το 70 έως 90 τοις εκατό των εταιριών αποτυγχάνουν στις επιχειρηματικές στρατηγικές τους. Και ένας λόγος για αυτό είναι ότι ο ΥΕ-με δυνητικά πολύτιμες πληροφορίες για τον τρόπο αύξησης της απόδοσης των εργαζομένων- δεν έχει θέση στο τραπέζι όταν λαμβάνονται σημαντικές στρατηγικές αποφάσεις. Σε μια έρευνα του 2011, πρακτικές ωριμότητας δέσμευσης, μόνο τέσσερις από τις 200 εταιρείες που μελετήθηκαν είχαν τη δυνατότητα να εξισώσουν την εμπλοκή των εργαζομένων με τα αποτελέσματα των επιχειρήσεων.

Η Fumento δηλώνει ότι η πρόσβαση στο Big Data και στις πληροφορίες που παράγονται σε πραγματικό χρόνο καθ 'όλη τη διάρκεια της ζωής ενός εργαζομένου, όχι μόνο σε ετήσιες ή σε τριμηνιαίες αναθεωρήσεις, θα καταστήσει σαφές ότι η HR παρέχει απόδοση στην επένδυση στην εταιρεία. "Το μοντέλο νοημοσύνης του εργατικού δυναμικού έχει τη δυνατότητα επανάστασης στη λειτουργία του ανθρώπινου δυναμικού", λέει.

Στο Σύννεφο

Τα δεδομένα δεν είναι μόνο αυξανόμενα, αλλά και μεταναστεύουν στο διαδίκτυο, γεγονός που δημιουργεί πρόσθετες προκλήσεις καθώς και ευκαιρίες. Ενώ το cloud computing αποτελεί σήμερα λιγότερο από 2 τοις εκατό των δαπανών πληροφορικής σήμερα, σύμφωνα με μια μελέτη Digital Universe, μέχρι το 2015, σχεδόν 20 τοις εκατό των πληροφοριών θα υποβληθούν σε επεξεργασία από το σύννεφο και 10 τοις εκατό θα αποθηκευτούν εκεί. Περισσότεροι εικονικοί διακομιστές που χρησιμοποιήθηκαν για cloud computing αγοράστηκαν το 2010 από φυσικούς διακομιστές, λέει η IDC.

Η διαχείριση μεγάλων δεδομένων αποτελεί πρόκληση καθώς το σύννεφο αναλαμβάνει, επειδή οι πληροφορίες που αποθηκεύονται μακριά από το γραφείο σε απομακρυσμένους διακομιστές πρέπει να ενσωματώνονται με bytes που είναι αποθηκευμένα σε σκληρούς δίσκους της εταιρείας. Οι υπάλληλοι της εταιρείας θα θέλουν να διασφαλίσουν ότι τα δεδομένα σύννεφου τους είναι ασφαλή και off-limits σε τρίτους και ότι υποστηρίζονται τακτικά και αρχειοθετούνται σωστά. Όμως, η στέγαση Big Data στο σύννεφο έχει πολλά πλεονεκτήματα. Γράφοντας για το ZDNet, ο Phil Wainewright χρησιμοποιεί τον ψηφιακό φωνητικό βοηθό του iPhone 4, Siri, για να δείξει αυτό το σημείο. Οι προηγούμενες γενιές αναγνώρισης φωνής έπρεπε να εκπαιδεύονται με τη φωνή του χρήστη με την πάροδο του χρόνου. Ο Siri διανέμει αυτό - ταιριάζει με το χρήστη στο πλησιέστερο μοτίβο φωνής σε μια διαρκώς αναπτυσσόμενη βιβλιοθήκη δεκάδων χιλιάδων που κατέστη δυνατή από το σπίτι του στο σύννεφο. Για τις περισσότερες επιχειρήσεις, μικρές και μεγάλες, η αποθήκευση σύννεφων θα έχει νόημα, επειδή δεν υπάρχει κανένα όριο χώρου που να έχει σημασία και επειδή τα δεδομένα είναι εξίσου προσβάσιμα από απομακρυσμένες τοποθεσίες όπως είναι όταν αποθηκεύονται στο σπίτι.

Δεν είναι μόνο η δυνατότητα ανάλυσης μεγάλων συλλογών δεδομένων. "Αυτό που πραγματικά έχει σημασία, " λέει ο Wainewright, "είναι η ευρεία βάση αυτών των δεδομένων, που συλλέγονται από ένα μεγάλο μείγμα χρηστών, μέσα στο οποίο μπορούν να αναλυθούν τα πρότυπα συμπεριφοράς και να εφαρμοστούν αλλού. Σκεφτείτε το ως στοιχεία σμήνους - πολλές ατομικές, αυτόνομες συμπεριφορές που προσθέτουν συλλογικά σε επαναχρησιμοποιούμενα μοτίβα. "

Ένα άλλο πλεονέκτημα για την αποθήκευση μεγάλων δεδομένων στο σύννεφο είναι οι εξοικονομήσεις που προσφέρει στο ενεργειακό κόστος, σύμφωνα με το 62% των διαχειριστών πληροφορικής που εξετάστηκαν στην Έκθεση για την Ενεργειακή Πληροφόρηση για το 2012 από την CDW, έναν πάροχο τεχνολογίας και υπηρεσιών. Η κατανάλωση ενέργειας δεν είναι ασήμαντη υπόθεση - εξετάστε την περίπτωση της Google, που λέγεται ότι εξυπηρετεί έως 900.000 διακομιστές που απαιτούν 220 megawatts παραγωγής ηλεκτρικής ενέργειας, που είναι σχεδόν το 1% της συνολικής κατανάλωσης ενέργειας από το κέντρο δεδομένων και το 0, 01% της παγκόσμιας συνολικής ζήτησης ενέργειας. Σύμφωνα με την έρευνα CDW, η εικονική λύση μείωσε τη ζήτηση ενέργειας κατά μέσο όρο 28% μεταξύ των ερωτηθέντων.

Στην ιδανική περίπτωση, οι λύσεις νέφους μιας επιχείρησης θα συνδυάζουν τόσο την τεράστια αποθήκευση δεδομένων όσο και την ικανότητα να αναλύουν όλες αυτές τις πληροφορίες - ένα κατάστημα ενιαίας εξυπηρέτησης. Μόλις μια τέτοια λύση ανακοινώθηκε από τον Global Computers Enterprises τον Απρίλιο ως SMART Cloud για Μεγάλα Δεδομένα και Analytics. Αναπτύχθηκε με εργαλεία ανοικτού κώδικα όπως ο προαναφερθείς Apache Hadoop. Οι κρατικές υπηρεσίες είναι σημαντικοί χρήστες.

Η κυβέρνηση Ομπάμα δεν είναι τυχαία, λαμβάνοντας υπόψη τις δυνατότητες του Big Data. Τον Μάρτιο, ανακοίνωσε την Πρωτοβουλία Έρευνας και Ανάπτυξης Μεγάλων Δεδομένων, δέσμη δεσμεύσεων ύψους 200 εκατομμυρίων δολαρίων σε έξι υπηρεσίες, συμπεριλαμβανομένων των τμημάτων Ενέργειας, Άμυνας και Εσωτερικής Ασφάλειας, με σκοπό τη "σημαντική βελτίωση των εργαλείων και των τεχνικών που απαιτούνται για την πρόσβαση, την οργάνωση και τη συλλογή ανακαλύψεις από τεράστιους όγκους ψηφιακών δεδομένων ", λέει ο Tom Kalil, αναπληρωτής διευθυντής για την πολιτική του Γραφείου Πολιτικής Επιστήμης και Τεχνολογίας.

Ακριβώς όπως ένα κυβερνητικό σύστημα που ονομάζεται ARPANET ήταν πρόδρομος στο σημερινό Διαδίκτυο, παρόμοιες ευκαιρίες υπάρχουν τώρα με το Big Data, λέει ο John Holdren, σύμβουλος επιστήμης στον Obama. "Με τον ίδιο τρόπο που οι προηγούμενες ομοσπονδιακές επενδύσεις στην τεχνολογία της πληροφορίας οδήγησαν σε δραματικές εξελίξεις στον τομέα της υπερυπολογιστής και της δημιουργίας του Διαδικτύου, η πρωτοβουλία που ξεκινάμε σήμερα υπόσχεται να μεταμορφώσει την ικανότητά μας να χρησιμοποιήσουμε τα μεγάλα δεδομένα", λέει.

Μέρος του ομοσπονδιακού σχεδίου είναι η χρηματοδότηση έρευνας στο Πανεπιστήμιο της Καλιφόρνιας στο Berkeley, μέσω του Εθνικού Ιδρύματος Επιστημών, για cloud computing, crowdsourcing (χρησιμοποιώντας σύγχρονη τεχνολογία για τη συλλογή πληροφοριών και εικόνων από το κοινό) και τεχνικές για να βοηθήσουν τους υπολογιστές "Μάθουν" από την εμπειρία. Αυτό είναι ακριβώς το είδος του έργου αιχμής που χρειαζόμαστε καθώς το Big Data ωριμάζει, ειδικά εάν οι ΗΠΑ πρόκειται να διατηρήσουν ένα τεχνολογικό προβάδισμα. Βρισκόμαστε σε ένα συναρπαστικό σταυροδρόμι, και τόσο το Big Data όσο και η μελέτη του βρίσκονται σε μικρή ηλικία. Θα δούμε σίγουρα ότι η συσσώρευση δεδομένων θα αυξηθεί εκθετικά στο εγγύς μέλλον. Το ερώτημα είναι πόσο σοφά θα έχουμε πρόσβαση σε αυτό.

Μεγάλα δεδομένα στον πραγματικό κόσμο

Οι πρακτικές χρήσεις για το Big Data δεν είναι απλώς θεωρητικές - είναι εδώ και τώρα. Εδώ είναι πέντε τρόποι με τους οποίους οι καινοτόμοι άνθρωποι και οι εταιρείες κάνουν τεράστιες ροές πληροφοριών για αυτούς:

Επιτραπέζιοι πολεμιστές. Κρατώντας ένα τεράστιο ποσό διαθέσιμων στο κοινό πληροφοριών του Wikileaks για τον πόλεμο στο Αφγανιστάν, το Πανεπιστήμιο της Νέας Υόρκης Ph.D. ο σπουδαστής Drew Conway κατάφερε να καταλήξει σε κάποια συμπεράσματα σχετικά με τις περιόδους αιχμής και τον τόπο των συγκρούσεων, σύμφωνα με μια έκθεση του Gigaom. Ο Conway, ο οποίος διαχειρίζεται το ιστολόγιο Zero Intelligence Agents, οργάνωσε το Big Data dump με βάση τη γεωγραφία και τη φύση των συναντήσεων (εχθρικές ή φιλικές) μεταξύ αμερικανικών στρατευμάτων και Αφγανών. Τα συμπεράσματα έδωσαν την πεποίθηση ότι η σύγκρουση με τους Ταλιμπάν τείνει να κορυφωθεί κατά τη διάρκεια ορισμένων περιόδων και συγκεντρώνεται γύρω από τον περιφερειακό δρόμο που περιβάλλει την πρωτεύουσα της Καμπούλ.

Στόχοι πωλήσεων. Η βρετανική αλυσίδα σούπερ μάρκετ Tesco έχει βιώσει μια αύξηση 12 τοις εκατό στις πωλήσεις κατά τη διάρκεια των πρώτων δοκιμών χρησιμοποιώντας την ανάλυση δεδομένων για να καθορίσει ποια είδη πώλησης υψηλής απόδοσης να εκπτωθούν και πότε. Η πρόσφατα εξαγοραζόμενη θυγατρική εταιρεία Dunnhumby της Tesco, μια εταιρεία πληροφορικής αγορών, παρακολούθησε στοιχεία πωλήσεων από 16 εκατομμύρια οικογένειες, οι οποίες πραγματοποιούν περίπου 6 εκατομμύρια συναλλαγές την ημέρα χρησιμοποιώντας κάρτες Tesco Clubcards για να συγκεντρώσουν πόντους επιβράβευσης. Η εταιρεία επωφελείται επίσης από την πώληση των δεδομένων προτίμησης αγορών σε άλλες επιχειρήσεις. Ωστόσο, το πρόγραμμα δεν είναι αμφιλεγόμενο, διότι ορισμένοι επικριτές λένε ότι οι αγοραστές δεν λένε ότι οι πληροφορίες τους χρησιμοποιούνται για το κέρδος της Tesco. Η εταιρεία λέει ότι είναι μόνο ταυτοποίηση των τάσεων, δεν προσφέρει μια ματιά στις ζωές των πελατών της.

Ποιος οδηγεί τα παιδιά μας; Δεν είναι όλες οι χρήσεις για το Big Data πολύ σύνθετες ή τεχνικές. Στην Αϊόβα, ο κυβερνήτης Terry Branstad υπέγραψε στο νόμο μια νέα εντολή ότι οι οδηγοί σχολικών λεωφορείων θα υπόκεινται σε ελέγχους ιστορικού. Για να περάσει η συγκέντρωση, ο αιτών πρέπει να επιβιώσει σε αναζήτηση δημόσιων αρχείων - συμπεριλαμβανομένου του μητρώου κακοποιών, του κεντρικού μητρώου για κακοποίηση παιδιών, αρχείων σχετικά με την κατάχρηση σε ενήλικες και τις παραβάσεις οδήγησης, αν υπάρχουν. Αυτά τα αρχεία δεν είναι απομονωμένα για επίσημη χρήση, όπως ήταν κάποτε, αλλά διατίθενται στο Διαδίκτυο μέσω της Iowa Courts Online Search. Η διαδικασία πρέπει να ακολουθείται κάθε πέντε χρόνια, όταν ο οδηγός ανανεώνει την άδειά του. Το αρχείο δείχνει ότι οι διασταυρούμενοι έλεγχοι δεδομένων μπορούν να είναι πολύτιμοι για την αποφυγή των βλαβών από τα παιδιά. Ένας οδηγός σχολικού λεωφορείου του Όρεγκον συνελήφθη το 2010, μετά από έρευνα εγκληματολογικής πληροφορικής, όπου βρέθηκαν οκτώ βίντεο παιδικής πορνογραφίας σε ιστότοπο κοινωνικής δικτύωσης που είχε μεταφορτωθεί με τη διεύθυνση ηλεκτρονικού ταχυδρομείου και τον κωδικό πρόσβασής του. Έλαβε μια ποινή επτά ετών και, χωρίς να χρειάζεται να πούμε, δεν θα οδηγήσει πλέον παιδιά στο σχολείο.

Φορτίζεται από το Volt. Η General Motors ήταν ο πρώτος κατασκευαστής αυτοκινήτων για να προσφέρει ένα πλήρες φάσμα υπηρεσιών, από την εύρεση του χαμένου αυτοκινήτου σας σε χώρο στάθμευσης μέχρι την αντιμετώπιση έκτακτης ανάγκης και οδηγώντας κατευθύνσεις μέσω της ασύρματης συνδεσιμότητας της υπηρεσίας OnStar. Μέσα από το OnStar, η GM τώρα ζογκλερίζει ένα καταπληκτικό τρία πετακάδες δεδομένων ετησίως (ένα petabyte είναι ίσο με 1 τετραγωνικό bytes). Ο Υπεύθυνος Πληροφοριών OnStar Jeffrey Liedel παραδέχεται ότι η GM δεν έχει καταλάβει πλήρως πώς να κάνει τη ροή δεδομένων της να λειτουργεί για τους πελάτες της και για την κατώτατη γραμμή της εταιρείας. Αλλά γνωρίζει ότι το OnStar θα είναι σημαντικό πλεονέκτημα για τους μελλοντικούς αγοραστές ηλεκτρικών αυτοκινήτων και δοκιμάζει μια εφαρμογή που θα αφήσει τους οδηγούς να ελέγξουν από απόσταση την φόρτιση της μπαταρίας τους και να ξεκινήσουν ή να σταματήσουν μια περίοδο φόρτισης από την άνεση της καρέκλας καθιστικού τους.

Πρόβλεψη παγκόσμιων κρίσεων. Η πρωτοβουλία Global Pulse των Ηνωμένων Εθνών χρησιμοποιεί ψηφιακά δεδομένα, όπως κοινωνικές φωνητικές επικοινωνίες, κλήσεις μέσω κινητού τηλεφώνου και ηλεκτρονικές συναλλαγές, για την πρόβλεψη και καλύτερη κατανόηση των οικονομικών κρίσεων, των επιδημιών υγείας και των φυσικών καταστροφών. Οι ερευνητές της Pulse και του ειδικού λογισμικού αναλύσεων SAS ανέλυσαν περισσότερα από 500.000 ιστολόγια, φόρουμ σε απευθείας σύνδεση και ειδησεογραφικά sites στην Ιρλανδία και τις ΗΠΑ για να καθορίσουν ότι η κοινωνική συζήτηση (ιδίως για την "μείωση της χρήσης", "χρήση δημόσιων μέσων μεταφοράς" και "υποβάθμιση του αυτοκινήτου" ) θα μπορούσε να προβλέψει αιχμές στην ανεργία που σημειώθηκαν τρεις έως πέντε μήνες αργότερα. Οι ερευνητές του Global Pulse χρησιμοποίησαν επίσης ψηφιακά δεδομένα όπως η χρήση κινητών τηλεφώνων για να παρακολουθήσουν την κίνηση των ανθρώπων μετά τον σεισμό του 2010 στην Αϊτή, καθώς και την εξάπλωση μιας επακόλουθης επιδημίας χολέρας.

Το Big Data είναι σαν ένα παγόβουνο, με ελάχιστη μόνο πρακτική χρήση για μας. Αυτό που είναι συναρπαστικό είναι αυτό που θα μπορέσουμε να κάνουμε καθώς το υπόλοιπο του παγόβουνου γίνεται ορατό. Και βεβαίως, με τα ζητήματα της ιδιωτικής ζωής πιο διακυβευόμενα από ποτέ, θα πρέπει να αναρωτηθούμε: Θα ανακάλυψη αυτού του παγόβουνου να σώσει την παγκόσμια οικονομία, να βυθίσει την ανθρωπότητα μας ή και τα δύο;

Χάρτες στρατηγικής: Μετατροπή άϋλων περιουσιακών στοιχείων σε απτά αποτελέσματα