Lexiques, tutos & outils

Le petit lexique du big data

Comme pour toute nouvelle technologie, le Big Data est entouré d’un jargon qui n’est pas évident et évolue rapidement. Voici un petit lexique qui explique les principaux termes et acronymes incontournables du Big Data.

Le petit lexique Big Data

Big data

La notion de big data s’est développée en 2012 et traduit le fait que les entreprises doivent traiter de plus en plus de données, data en anglais, dans leur stratégie commercial et marketing.

Les 3V

Pour définir le big data on parle des 3V pour : Volume, Vitesse et Variété, qui caractérisent les données. Le volume, car un grand nombre de données sont collectées et traitées, la vitesse pour les traiter en temps réel, et enfin la variété des données.

Data Analyst 

Nouveau métier au sein des entreprises, le Data Analyst est responsable de toutes les opérations des bases de données.  Son rôle est de collecter et d’analyser les données récoltées par l’entreprise et de livrer des informations clés permettant une prise de décision.

Algorithmes 

Les algorithmes, une intelligence artificielle basée sur les statistiques, permettent d’analyser les données collectées. Maîtrisant les outils du Big Data et les statistiques, c’est le Data Analyst qui code ces algorithmes.

Data Scientist 

Le Data Scientist est aussi un nouveau métier ayant émergé avec le Big Data. A la fois statisticien, capable de manipuler les outils informatiques du Big Data et comprendre les enjeux, le Data Scientist est l’homme clé du Big Data.

Data Cleansing 

C’est une phase importante du traitement des données. Elle consiste à supprimer les données incohérentes, corriger les erreurs, les données mal saisies… C’est l’un des problèmes clés du Big Data : pour que les algorithmes fonctionnent correctement, ils doivent pouvoir s’appuyer sur des données fiables et cohérentes. Cela impose un gros travail de nettoyage en amont appelé le « data cleansing » qui permet aux entreprises de disposer d’informations de qualité

DMP – Data Management Platform 

La DMP est un outil permettant aux entreprises de regrouper l’ensemble des données issues de différents canaux : web, mobile, centre d’appel… Il est ainsi plus facile et les analyser et d’en tirer profit.

OpenData 

Vous avez certainement déjà entendu parler d’Open Data. Il s’agit des données dont l’accès et l’usage sont laissés ouvert à tous. Les données qui composent l’Open Data peuvent être d’origine publique ou produite par une entreprise. L’Open Data donc les données libres accès et réutilisables par tous.

Vous souhaitez améliorer vos connaissances ?