Qu’est ce que le Big Data ?

téléchargement4

L’émergence du Big Data transforme notre monde de jour en jour. Mais qu’est-ce que le Big Data ?

Le Big Data (ou méga données en français) rassemble des données massives variées, stockées sur une base numérique, puis traitées grâce à des technologies avancées adaptées qui permettent d’élaborer des diagnostics, de prendre des décisions en conséquence et d’établir des plans d’actions. Le terme « Big Data » recoupe plusieurs dimensions que l’on retrouve dans la règle des 5V (VolumeVélocitéVariétéVéracité et Valeur).

Big Data : d’où provient ce volume massif de données variées ?

Les données qui sont aujourd’hui disponibles trouvent leur source principalement dans notre vie quotidienne qui devient de plus en plus connectée avec l’essor de l’internet.

« Tous les deux jours, nous créons une quantité d’informations équivalente à ce qui a été créé de l’aube de la civilisation jusqu’en 2003. » – Eric Schmidt, PDG de Google à l’époque (2010)

Réseaux sociaux, capteurs, caméras, smartphones et messages envoyés, signaux GPS, achats en ligne, transactions financières, utilisation de la carte bancaire, envoi de mails, etc. Les technologies que nous utilisons directement ou indirectement engendrent toutes sortes de données. Aujourd’hui les données sont donc partout autour de nous. Cependant, afin d’être utilisables, elles doivent être stockées puis traitées.

Selon l’IDC, le volume de données devrait être multiplié par 50 entre 2005 et 2020 pour atteindre 40 zettaoctets (ce qui équivaut à 40 000 000 000 000 000 mégaoctets).

Le stockage

Plus le volume de données devient important, plus la capacité de stockage des supports informatiques nécessite d’être grande. Aujourd’hui, c’est principalement sur le cloud que sont enregistrées ces données. Ce « nuage » de données est en réalité un espace de stockage distant qui remplace les disques durs, les CD, les clés USB, etc. en offrant la possibilité aux utilisateurs d’avoir accès à leurs documents depuis n’importe quel ordinateur via internet.

Des données analysées très rapidement

Ces données peuvent s’avérer utiles pour de nombreux acteurs de la société, comme les entreprises et les gouvernements. Mais pour être utilisées, elles doivent être d’abord traitées et analysées. C’est principalement grâce à des supercalculateurs guidés par des algorithmes que ceci est désormais possible.

Les supercalculateurs sont des outils extrêmement puissants capables de réaliser des millions de milliards d’opérations par seconde. Au cœur de ce système, on trouve des algorithmes, qui sont des programmes informatiques permettant de résoudre des problèmes grâce à une suite d’opérations prédéfinies.

Le développement de ces algorithmes a fait émerger l’apprentissage automatique (« Machine Learning » en anglais) qui permet de faire des analyses prédictives sur les données qui sont à disposition. Ainsi, ces données peuvent être utilisées pour détecter des tendances et des régularités dans le comportement des consommateurs en ligne, ou encore du trafic routier.

La véracité des données, nécessaire pour qu’elles aient de la valeur

Particuliers, comme entreprises, disposent aujourd’hui d’un très grand volume de données, de nature variée, traitées à une vitesse record, mais qui nécessitent d’être fiables et crédibles (véracité) afin d’avoir une réelle valeur correspondant au profit qu’on peut tirer de leur usage. C’est ce que l’on appelle, la règle des 5V. Le but du Big Data est donc de donner un sens et un intérêt économique et social aux données collectées.