Comprendre les fondements Bigdata

L’humanité produit aujourd’hui autant de données en 2 jours qu’elle ne l’a fait en 2 millions d’années. Impossible d’évoquer les grands programmes de transformation numérique  sans parler de « bigdata ». Pour autant peu de gens savent en parler au delà du fait que beaucoup de données sont en jeu… De plus en plus on entend parler non plus de bigdata mais de smartdata. Decryptages…

La compréhension des concepts de base permet d’appréhender les projets bigdata / smartdata de chaque entreprise avec le socle de connaissances minimal Le choix de la solution, la pertinence de l’intégrateur, sont en effet des clefs de succès majeures.

Les 3 « V »

Etre dans un contexte « bigdata », c’est être dans un contexte où le traitement des données via des bases de données classiques (relationnelles) n’est plus adapté. Trois 3 conditions,  que l’on appelle les 3V, doivent être réunies :

V comme Volume : cela parait évident, un projet bigdata a pour caractéristique le fait de traiter un important volume de données. Les études maketing de plus en plus micro segmentées peuvent par exemple entrer dans ce cadre. Ceci est d’autant plus vrai que des traceurs comportementaux généreront une multitude de données pour chaque parcours client. Savoir adresser la masse de données est un facteur capital de création de valeur.

V comme Vitesse : le fait d’avoir besoin de traitement des données en temps réel est aussi un élément fondamental. Un des leviers majeur de la transformation numérique vient du fait que la donnée est immédiatement disponible, du cœur du système d’information jusque dans la main du client.

V comme Variété. En effet une nouvelle donne apparaît, celle de devoir gérer des données de sources et de forme hétérogène. Le schéma classique de définition des architectures de bases de données ne peut plus fonctionner : les bases doivent s’autoadapter à la réception de données de format non prévu à priori.

L’importance du bon choix de technologie bigdata

Pour faire face à ces trois contraintes, les systèmes de base de données de technologies Big Data:

  • Se basent sur d’autre forme que les bases relationnelles, ce que l’on appelle les bases « NoSQL » (Not Only SQL), utilisant des systèmes de clef, de graphes, de colonnes ou de gestion de documents.
  • Sont sur des architectures distribuées.

Il existe plusieurs technologies répondant à des impératifs différents. Ceci rend les projets bigdata complexes. En effet il est démontré (théorème de CAP ou Brewer) [voir lien] que l’on ne peut avoir à la fois un système qui garantisse

  • La disponibilité (toutes les requêtes reçoivent une réponse)
  • La cohérence (toutes les partitions de la base de données donnent la même réponse à un instant donné à une requête donnée – cas d’une mise à jour de données en cours par exemple)
  • La tolérance au partitionnement (chaque sous système doit répondre, même en cas de défaillance des autres).

Il convient donc, pour chaque projet, de faire le bon choix stratégique pour choisir l’outil adéquat. Surtout il faut le paramétrer correctement pour qu’il s’interface aux systèmes d’informations internes et externes à l’entreprise. S’il y a des retours mitigés de certaines entreprises sur leur aventure bigdata, c’est notamment du fait de la complexité de ce choix et des paramétrages ensuite.

De bigdata à smartdata

Les entreprises ayant mis en oeuvre des projets bigdata ont donc accès, dans des systèmes informatiques ultraperformants, à une multitude de données. Celles-ci peuvent servir à améliorer le service offert au client, notamment via son expérience utilisateur. Ou encore à mieux cibler les clients grâce aux données sur les comportements de ces clients.

L’enjeu réside en effet dans le choix d’informations ultra qualifiées basées sur ces sources gigantesques de données. Ce sont alors les projets smartdata qui prennent le pas sur les priorités bigdata. Aux solutions de bases de données NoSQL (Hadoop ou autre cassandra) s’ajoutent des technologies d’intelligence artificielle poussée, utilisant des concepts mathématiques évolués tels les réseaux de neurones.

Le coeur de l’enjeu du passage de bigdata a smartdata est donc bien le client. Les entreprises qui arriveront à qualifier finement les informations qui le caractérisent pour lui offrir les produits et services pertinents qui répondent à ses besoins prendront un avantage concurrentiel majeur.

Smartdata, un enjeu « customer centric ».

A propos de Dooxy:

L’agence de conseil en transformation numérique Dooxy, basée à Lyon, vous accompagne dans l’identification des opportunités offertes par le numérique au service de votre business model. Nous vous aidons concrètement dans vos projets, qu’il s’agisse d’améliorer l’expérience utilisateur de vos clients (notamment en utilisant les leviers bidgata et smartdata), ou de réduire vos coûts (analyse des flux de données dans vos processus interne pour en optimiser les fonctionnements, projets collaboratifs..).