a propos

Je suis architecte d'entreprise dans une grande entreprise publique de transport (devinez !) et depuis quelques années impliqué dans des sujets data "en grand". Vous trouverez dans ce blog quelques modestes réflexions liées à mon quotidien, les problématiques et réponses que j'ai pu trouver. N'hésitez pas à interagir !

Big Data, la théorie du complot


L'histoire de l'humanité est jalonnée de mythes. Pas un continent n'y échappe : de la poupée vaudou Haïtienne, au Yéti tibétain, en passant par le Dahu savoyard.

Aujourd'hui les légendes urbaines ont pris la place de ces mythes ancestraux jusqu'à la théorie du complot. Les mécanismes restent les mêmes : un phénomène fondé et expliqué, détourné, modifié, propagé.

Nos projets SI sont souvent impactés par différentes croyances qui nous font ralentir, échouer, renoncer. 

Le BigData, n'échappe pas au phénomène. Voire meme il en est une des principales victimes technologiques.

Issue de ma maigre experience, la liste des mythes BigData qui suit n'est pas exhaustive.



La valeur est dans la donnée : tu la récupères, tu la stockes et hop, ça crée de la valeur. D'abord, de quelle valeur on parle ? Ensuite, il faudrait peut-être la mettre en qualité, la comprendre, l'interpreter, l'analyser, non ?

horn1
Rebecca Horn, Masque-crayons, 1972, performance
Pourquoi mettre en qualité les données ? Elles proviennent du SI, donc elles sont forcément en qualité ! En effet, elles sont d'une qualité suffisante pour le système et le processus metier qui les a produites. Par contre pour l'étude à realiser, peut-être pas. Le processus metier a une certaine représentation de la réalité qui n'est peut être pas celle souhaitée pour l'étude. Le système à lui-même  fait l'objet de différents biais lors de son étude , sa conception, sa réalisation.

Mais je n'ai pas assez de donnees à analyser, ca ne va rien donner. Ou alors j' en ai plein, ca va être génial ! Ni l'un ni l'autre gros volumes n'est pas forcément synonyme  de BigData : c'est une approche, un ensemble de méthodes ou de technologies. Parfois pas besoin de BigData pour répondre à une question, une requête SQL suffit.

La ok, l'analyse peut commencer. Ou pas. Es tu sur de bien avoir compris les concepts métier portés par ces données ? Cette date, cette adresse ont-elles bien le sens qu'ils sont sensés avoir ? Le seul remède à cela est d'avoir dans l'équipe des personnes capables d'aller chercher l'information auprès des metiers, des SI, du terrain. 

Ces données sont confidentielles ou personnelles (donc protegees) et ça t'empêche d'avancer ? Quelque part dans une cellule sécurité, il y a un expert eBios qui pourra accompagner le projet à identifier la criticite des donnees utilisées, établir un diagnostic et préconiser les bonnes pratiques afin de. Pouvoir avancer en maîtrisant les risques. 

Avec ma plateforme qui fait tout, et mon datascientist, la c'est sur je vais trouver de la valeur maintenant ! Possible mais l'outillage qui fait tout et le datascientist qui trouve seul la valeur n'existent pas. Seule solution : partager itérativement la problématique, les avancées entre acteurs métiers, terrain, analystes, techniciens, SI. On adapte collectivement l'outillage, la démarche, les actions prises suite à l'analyse. Le BigData est une matière itérative et collective.

Ca y est, tu as ton analyse ? Oui et si demain je veux refaire une analyse, mon code sera déjà la, il n'y aura qu'à réutiliser ! Sauf que la vérité d'aujourd'hui n'est celle de demain. L'analyse réalisée aujourd'hui devra être revue avec le prisme des réalités de demain.



Beaucoup de mythes et de promesses accompagnent les projets et technologies BigData. Ils sont souvent colportés par ceux qui ont un intérêt immédiat à ce que des projets soient lancés rapidement : experts, consultants, éditeurs. Une seule voie rencontrez vos pairs et partagez !

Aucun commentaire:

Enregistrer un commentaire