Et d’abord, qu’est-ce qu’on appelle data ?
La data, au sens large, représente tout ce qui concerne les données, qu’il s’agisse de leur collecte, de leur interprétation ou de leur transformation.
Elle a sa propre science, sobrement nommée… data science. Ce n’est d’ailleurs pas une science au sens strict, mais plutôt un ensemble de disciplines liées à l’extraction de connaissances. Mais on s’égare : avec l’intérêt grandissant pour le Big Data, la data, peu importe sa taille, a retrouvé ses lettres de noblesse. Et dans la foulée, de nombreux développeurs se sont formés et se forment encore afin de savoir faire plus “qu’aller chercher 3 infos dans une table”. Et il y a tellement plus à faire…
Pour autant, se former à la data ne signifie pas nécessairement se former au métier de data scientist. Ni à celui de data analyst ou de data engineer. Déjà parce que ce sont des métiers dont la définition change d’une boîte à l’autre mais surtout parce que ce sont des métiers à part entière, totalement différents des développeurs web que nous formons chez O’clock.
Et enfin, parce que ces métiers sont l’apanage d’un bon nombre d’écoles privées qui proposent des cursus de 3 à 7 ans pour obtenir l’étiquette de data <insérez un mot anglais qui claque ici>.
Voilà, le décor est posé, il est temps d’énumérer maintenant quelques raisons de ne pas rater cette vague ?
Parce que… ce n’est pas qu’une vague
Les bases de données, ça date des années 60. Les ingénieurs de l’époque ne s’appelaient pas encore des data scientists mais il ne leur en manquait que l’appellation. Et vous vous doutez bien qu’ils n’ont pas passé quasiment 60 ans à stocker des données en vrac sans rien en faire. Ça n’a jamais été inutile de se former à la data, au final.
Et maintenant que tout le monde a réalisé que la monnaie de demain, c’est la data, et qu’on ne pourra pour ainsi dire plus rien faire sans elle, ce n’est pas près de devenir une compétence obsolète.
À y regarder plus précisément, la vague ne concerne finalement que le Big Data. Dont la problématique est simplement de pouvoir appliquer à de grands volumes de données, les traitements qu’on opère déjà sur des volumes plus modestes. C’est un sujet intéressant mais beaucoup plus proche de la lame de fond.
Et surtout très anecdotique dans le web : une excellente raison de ne pas en parler plus longtemps.
Parce qu’elle est sous-évaluée (notamment dans les équipes où personne ne dispose d’une expertise data)
Souvent quand on dit qu’on en a pas besoin, c’est par ignorance. On a tendance à penser que les données sont là pour une seule et unique utilité, un seul rôle qu’elles remplissent.
Mais tout dépend du prisme qu’on utilise pour les examiner, les combiner, les trier. La data science se situe au-delà de ce simple rôle qu’on prête aux données : elle explore les possibilités qu’elles offrent.
Si on prend l’exemple d’un blog publiant régulièrement des articles dans plusieurs catégories. Si on ne regarde que le nombre de consultations par semaine par exemple, on en tire un unique indicateur de performance : ça marche ou ça ne marche pas. Mais si on segmente ce nombre de lectures par catégorie, on verra alors des tendances se dessiner.
Ces tendances permettront d’orienter le développement de l’activité du blog vers telle catégorie plutôt que telle autre. Et il sera alors intéressant de noter l’impact de ce changement de rythme sur le nombre de consultations par semaine.
Ces nouvelles informations de forte valeur découlent pourtant de ces mêmes données qu’on ne regardait que sous l’angle de la performance globale jusque là. Parfois, avec très peu de données, on peut déjà déduire beaucoup de choses.
D’autres organismes peuvent, à l’inverse, avoir beaucoup de données mais pas les moyens ou l’idée d’en faire quelque chose. Le cas typique, c’est les collectivités et les organismes chargés de mission publique : ils croulent souvent sous un monceau de données mais ne les utilisent que de façon très conventionnelle, pour dresser des bilans d’activité, par exemple.
Là encore, un profil “data” viendrait déjà faciliter le quotidien de ces organismes mais aussi être force de proposition dans les nouveaux sens qu’on peut donner à la lecture de ces données.
Parce qu’on ne peut pas toujours se payer un data scientist (et qu’il n’y en a pas toujours besoin)
Des boîtes qui ont besoin de brasser de la donnée, il y en a des tonnes. Mais des boîtes qui peuvent se payer un Master data scientist à 60k€ par an et trouver de quoi l’occuper toute l’année, il y en a nettement moins (en fait, il y en a juste assez pour embaucher ceux qui sortent des écoles dont on a parlé plus tôt).
C’est là que le profil de développeur web spécialiste data entre en jeu. Fondamentalement, il reste un développeur web donc il trouvera toujours de quoi s’occuper (on a toujours besoin d’outils internes pour se faciliter le quotidien).
Mais régulièrement, il pourra enfiler sa blouse blanche d’apprenti scientifique de la donnée pour apporter son regard et son expertise sur tous les besoins d’une entreprise liés à la collecte ou l’exploitation de données.
De plus en plus, les entreprises réalisent spontanément qu’elles ont besoin d’une expertise data dans leur équipe technique. Mais par manque d’information ou de profils adaptés à leur besoin, elles y renoncent au moins temporairement.
Ou elles forment leurs salariés mais là encore, il faut trouver la bonne formation et les bons salariés.
Parce que pour bosser en start-up, c’est une compétence qui vaut de l’or
Toutes les start-ups génèrent de la data, mais parce que souvent l’idée à l’origine de l’entreprise sort de l’esprit fécond d’un profil non technique, cette data n’est pas correctement exploitée. Bon, au fond, ce constat, on peut l’appliquer à n’importe quel aspect d’une start-up.
Là où brille vraiment un profil data dans une startup, c’est quand il s’agit de lever des fonds. À qui pensez-vous que les financeurs donnent leurs deniers lorsqu’il sont face à 2 porteurs de projet ?
- Un premier qui présente un PowerPoint contenant 3 graphiques, créés à partir de données synthétiques péniblement rangées dans un tableur
- Un second qui, armé des mêmes données, les a retournées dans tous les sens pour en déduire de façon plutôt fiable la pertinence de son projet sur le marché, un volume de vente estimé, les couleurs idéales pour son prochain modèle phare et un business plan qui prévoit d’engager 5 profils précis à 5 étapes clés du projet ?
Et derrière tous ces points qui séduisent instantanément un financeur (bon, il faut que l’idée soit bonne quand même), se cache un profil data qui a décortiqué, retourné, combiné, transformé, sublimé toutes les données qu’il avait à portée de main.
C’est ce qui fait que bon nombre de mots-clés liés à la data figurent parmi les plus recherchés sur les sites de freelances ou de recherche de collaborateurs pour les start-ups.
Parce que c’est pas que des maths
On a tendance à percevoir le monde de la data de deux manières très stéréotypées :
- D’un côté, le type du marketing qui récupère tout ce qu’il peut sur vous pour décortiquer vos moindres mouvements et estime le pourcentage limite de la promo Black Friday qui vous fera acheter ce produit dont vous n’avez pas besoin, tout en maximisant la marge du vendeur.
- De l’autre, le data scientist en blouse blanche à qui on demande de prédire comment vont se porter les ventes des toutes nouvelles sandales chauffantes cet hiver, qui part dans son labo avec 71 To de données sous le bras et qui revient un quart d’heure plus tard avec 5 graphiques simples, clairs et concis à présenter à son patron.
Bon ok, celui-là, il mange beaucoup de maths, il fait 10 régressions linéaires au saut du lit, calcule la transformée en Z d’un produit de convolution de 2 fonctions asymptotiques en avalant son bol de céréales et il parle Loi de Poisson et calcul intégral à la pause café (d’ailleurs, il parle tout seul parce que personne ne le comprend vraiment). Mais c’est un data scientist, il a fait 5 à 7 ans d’études ultra spécifiques pour en arriver là.
Nous, ce qu’on propose, c’est de former des développeurs web qui gèrent la data, qui savent assainir une base de données, en extraire des infos pertinentes, normaliser un jeu de données ou encore coder une API pour mettre à disposition de la data.
Et pour ça, point de maths. Enfin, un soupçon mais niveau 2nde générale, pas plus, promis.
Parce que c’est une porte ouverte sur une plus grande diversification professionnelle
Dernier point et non des moindres : sur le plan individuel, c’est intéressant d’avoir, dans sa besace, les « connaissances de base » pour entreprendre un virage dans sa carrière un jour peut-être, si le cœur nous en dit ou si l’occasion se présente.
Les postes de data analyst et de data scientist sont pour l’instant encore le fief des écoles privées à cursus longs et titres pompeux mais chez O’clock, on compte bien marquer les esprits avec ce nouveau profil hybride.