Se pensate che i Big Data siano solo soldi facili per i giganti del web, sbagliate

I big data rappresentano la nuova frontiera del business, ma anche della tecnologia e dell'innovazione. big data è un termine ricorrente ma che rischia di essere fuorviante. La traduzione letterale, 'grandi dati', fa pensare a un'enorme mole di dati utilizzabile per il business online. Questo è vero solo in parte, perché questa enorme quantità di dati non è sempre liberamente condivisa e disponibile per tutti.

ADV

I dati generati dai telefoni, dalle carte di credito, dai pagamenti online, dalle tv contiene effettivamente un'impressionante quantità di informazioni: nomi, indirizzi e codici email, conti bancari, numeri telefonici, ma anche preferenze di acquisto, gusti, interessi personali, dati sulla salute. Si tratta di una massa di informazioni che non è facile da quantificare, perché ha superato l'ordine degli Zettabyte (10 alla 21esima byte), un numero teorico, per archiviare il quale occorrono strumenti e metodologie che non tutti hanno a disposizione.

ADV

La rivoluzione dei big data e, in generale, il termine big data si riferisce proprio a cosa si può fare con tutta questa quantità di informazioni e quindi, in termini tecnologici, agli algoritmi capaci di trattare così tante variabili in poco tempo e con risorse computazionali adeguate.

No, i big data non interessano solo il settore dell'Information Technology

Il paragone è presto e fatto: fino a poco tempo fa, uno scienziato per analizzare una montagna di dati che oggi definiremmo Small o Medium Data avebbe impiegato molto tempo e si sarebbe servito di computer mainframe da oltre 2 milioni di dollari. Oggi, con un semplice algoritmo, quelle stesse informazioni possono essere elaborate nel giro di poche ore, magari sfruttando un semplice laptop per accedere alla piattaforma di analisi, oppure incrociando e analizzando i dati con i cloud. Il bello è che i big data non interessano solo il settore dell'Information Technology, per il quale vengono impiegati strumenti come il cloud computing, gli algoritmi di ricerca e via discorrendo, ma sono necessari e utili nei business più disparati:

automobili che si guidano da sole,
medicina
commercio
astronomia
biologia
chimica
farmaceutica
turismo
finanza
gaming.

Nessun settore in cui esiste un marketing e dei dati da analizzare può dirsi indenne dalla rivoluzione big data.

I principali collettori di big data

Google, Facebook e Amazon, numeri uno rispettivamente dei motori di ricerca, dei social network e dei servizi online, sono i prioincipali collettori di big data del mondo e li ottengono gratis, o quasi. Per muoverci su questi siti noi non paghiamo ma in compenso offriamo loro una mole di dati personali impressionante, che questi colossi possono facilmente collegare e incrociare tra loro, disponendo così di un bene inestimabile: i nostri big data personali.

In base all'attuale legislazione le autorità antitrust sanno bene che le compagnie che abbattono i prezzi per le clientela possono essere grandi e potenti quanto vogliono, cioè non sono soggette ai limiti antitrust, non abusano della loro posizione dominante. Google, Facebook e Amazon offrono i loro servizi praticamente gratuitamente e concorrono ad abbassare i prezzi. Tuttavia un bene, o un servizio non è gratuito se invece di pagarlo in dollari e in euro lo paghiamo in dati, che poi vengono monetizzati per altre vie. Tanto piu' che i nostri dati personali sono difficilmente prezzabili.

Altro problema è quello che pongono le tecnologie delle aziende high tech, le quali custodiscono questi dati, al riparo da occhi indiscreti (inclusi quelli dei governi e delle autorità di pubblica sicurezza), cioè li monopolizzano, o li mettono in vendita (Facebook in testa), dopo aver ottenuto a prezzi stracciati e in modo non sempre chiaro a tutti il diritto di farlo. Tra il 2011 e il 2014 è diventato evidente, indiscutibile, che i big data, rappresentano una ricchezza inestimabile, che sono l'oro, il petrolio del futuro: il 'tesorò del mondo digitalizzato.

Gli specialisti della trasformazione dei big data in pubblicità mirate

Il problema è che i big data non sono beni, servizi, o materie prime qualunque, viaggiano dentro delle macchine e non si vedono, non si toccano. Vengono raccolgono, in quantità gigantesche, dai colossi del web, in particolare Google, Amazon, Apple, Facebook, i quali fin dal 2015, fiutato l'affare, hanno iniziato ad assumere esperti che hanno lavorato per dotarli di tecnologie in grado di archiviarli, analizzarli, incrociarli, sfruttarli economicamente.

Amazon e Netflix sono diventate specialiste nel trasformare i big data in proposte di acquisto, pubblicità ad hoc, coupon, sconti e quant'altro il marketing online suggerirà in futuro. Sulla base dei big data le assicurazioni e le società di carte di credito sono in grado di valutare il rischio di credito dei clienti. Nella sfera della sicurezza pubblica, della sanità e della previdenza ci sono enormi potenzialità per i big data, tanto che Apple e il dipartimento Usa alla Giustizia hanno già ingaggiato un duello all'ultimo sangue per il diritto di accesso ai dati personali di criminali, che l'azienda di Cupertino si è rifiutata di dare in nome della difesa della privacy.

Google, analizzando i gruppi dei termini di ricerca digitati dagli utenti sul proprio motore, era riuscito a prevedere nel 2008 l'avanzamento dei focolai di infliuenza negli Usa piu' velocemente di come lo stesso ministero della salute non fosse riuscito a fare utilizzando i record di ammissione ospedaliera delle strutture sanitare pubbliche e private. Lo stesso dicasi per i dati utilizzabili in termini di manipolazione politica. Insomma, i big data, sono diventati una miniera d'oro per chi li raccoglie ed è in grado di sfruttarli.

Il vero confine tra cervello umano e macchine: l'analisi dei dati

Un cervello umano non può digerire e processare la montagna di informazioni dei big data, è troppo lento per trasformare in intuizioni, decisioni e ipotesi di lavoro una simile mole di dati. Macchine e algoritmi invece sono perfette a questo scopo, digeriscono montagne di dati e li intrecciano, li mettono in relazione tra loro, ricavando così modelli ricorrenti, osservazioni, soluzioni. Gli ingegneri in grado di costruire queste macchine e l'architettura software in grado di farle fuzionare, dapprima sono stati ingaggiati dai colossi di Internet, poi si sono messi in proprio, creando startup specializzate, presto diventate 'unicorni', cioè società del valore di piu' di un miliardo di dollari.

La nuova frontiera dei big data è comunque quella dell'intelligenza artificiale e del 'machine learning', cioè dei dispositivi a intelligenza artificiale forte, dotati di schede di istruzione più complesse, basate su algoritmi di apprendimento, cioè su programmi particolari, che consentono alla macchina di apprendere funzioni e comportamenti molto potenti, grazie all'interazione con l'ambiente esterno.

Una delle applicazioni commerciali più innovative del machine learning è l'assistente digitale degli smartphone , uno strumento pensato per pianificare la giornata, gli appuntamenti, l'organizzazione della vita, non solo quella domestica ma anche quella sociale e lavorativa, dell'utente. Il dispositivo, in teoria, potrebbe essere programmato anche per giocare a scacchi, in ogni modo ragiona, pianifica, decide, apprende, comprende, comunica, manipola oggetti, tende a sostituire il cervello umano anche nelle sue funzioni piu' complesse, affronta il problem solving, ha funzioni che hanno un fondamento ontologico (si rappresentano ciò che esiste), cioè una capacità di apprendimento automatico.

Il fondamento conoscitivo dell'intelligenza artificiale: l'apprendimento delle macchine

Insomma, il machine learning, non è un programma di istruzioni, per quanto complesso, ma è un fondamento conoscitivo che permette almeno tre tipi di apprendimento.

Il primo è quello non supervisionato, che è tipico dei motori di ricerca.

Il secondo è un apprendimento supervisionato, tipico di alcune macchine biomediche, che tengono conto dei dati biometrici passati, o dell'identificazione vocale, che migliora sulla base degli ascolti audio passati, o quello che consente l'identificazione visiva, che ha grandi capacità di sviluppo potenziali e può procedere a riconoscimenti inaspettati, molto utili nelle indagini poliziesche.

Il terzo tipo di apprendimento è quello cosiddetto per rinforzo, come il Q-learning, che permette di adattarsi all'ambiente, usa le reti neurali artificiali e la logica fuzzy. Questo apprendimento può trovare applicazioni in campo finanziario, per programmare gli investimenti, oppure in campo medico, ingegneristico, nelle auto che si guidano da sole, nelle case intelligenti, ed è programmato per scambiare informazioni con i 'cloud', archivi dati super-potenti, che dispongono di una memoria infinitamente superiore a quella della mente umana.

Il problema vero è che alla sua massima potenza, l'intelligenza diventa incomprensibile

Queste macchine intelligenti sono molto potenti, hanno capacità che la mente umana non possiede, come d'altra parte hanno anche i computer di calcolo, ma sono ancora molto lontani dal funzionare come un cervello umano, restano macchine artificiali. Dunque, il problema vero dell'Intelligenza Artificiale è che quando l'AI si esprime al massimo della sua potenza diventa spesso incomprensibile. Di qui il problema, ancora non del tutto risolto, di rendere pienamente applicabili nel mondo reale le macchine intelligenti più forti, più complesse. La soluzione fin qui adottata tende a indirizzare la ricerca sull'intelligenza artificiale a servirsi di sistemi applicativi misti, dotati di più algoritmi e in grado di riconoscere quando le risposte o le raccomandazioni finiscono fuori controllo.