La multiplication des services sur Internet et la croissance continue du commerce en ligne ont entraîné une augmentation exponentielle des données générées. Entre les informations des utilisateurs et le contenu des offres, c'est plusieurs exaoctets qui sont désormais échangés chaque mois via le web. Face à cette affluence d'éléments à traiter, il faut une multitude de compétences pour analyser, planifier, modéliser, compétences que possède le data scientist. Qui est ce scientifique de la data ?
Ce professionnel est un spécialiste du big data, dont le principal rôle est de donner du sens aux diverses informations recueillies depuis diverses sources. Parfait complément du data analyst et du business analyst, dont il cumule d'ailleurs souvent les compétences, il examinera en profondeur chaque donnée mise à sa disposition. Il procédera ainsi, en procédant souvent à des regroupements et à des recoupements, jusqu'à être en mesure de proposer des solutions marketing ou des modèles statistiques visant à aider la structure à améliorer ses résultats. Dans l'exercice de son métier, il travaillera généralement avec les entreprises qui collectent chaque jour de grands volumes.
Compte-tenu des qualités qui doivent être les siennes, mais aussi et surtout à cause des objectifs qui sous-tendent la naissance même de l'activité, les missions couvrent une multitude de domaines. Leur énonciation ne saurait d'ailleurs être exhaustive. Néanmoins, les missions phares suivantes sont associés à cet indépendant :
Pour réussir dans l'accomplissement des tâches qui lui sont confiées, un excellent niveau en mathématiques constitue la base incontournable. En outre, il doit idéalement maîtriser au moins un langage de programmation. Dans la plupart des cas, la connaissance de Python est une bonne base ; mais pour que les clients aient plus facilement confiance en l'indépendant qu'il est, et pour renforcer sa crédibilité, il serait d'autant plus intéressant pour lui de connaître d'autres langages. Par exemple, des aptitudes à coder en Java ou en C++ constitueraient assurément un plus pour lui. Il lui faut également avoir des notions très poussées en ce qui concerne les méthodes statistiques, et disposer de bases solides dans l'utilisation des outils d'analyse, tels que ceux proposés par R ou SPSS. Pouvoir gérer une base et initier des requêtes en SQL serait également un atout.
Pour travailler dans la science de la data, les formations requises sont généralement tournées vers l'informatique ou d'autres filières tout aussi techniques. Un cursus en Génie Informatique et Statistique peut par exemple aider à avoir les pré-requis nécessaires. Certaines écoles de commerce, de gestion et de marketing offrent aussi des spécialisations pouvant déboucher sur l'exercice d'une activité en tant qu'expert indépendant dans l'analyse d'informations complexes et déstructurées. Un parcours en Master de Système d'Information et d'Aide à la Décision s'avérera aussi utile. Enfin, il est à noter que de nombreuses écoles commencent à proposer un cursus de spécialisation dans le domaine.
Les scientifiques de la data sont à ce jour très recherchés. Le métier est nouveau, et les exigences pour l'exercer sont très élevées. En conséquence, on se retrouve logiquement avec des salaires plus élevés que la moyenne. Un indépendant du domaine peut ainsi gagner entre 3 000 et 6 000 euros par mois, voire plus selon la quantité de travail qu'il peut abattre.
En tant que freelance, le statut adéquat est celui de micro-entrepreneur, avec inscription au régime micro-social simplifié. En alternative, il y a aussi le portage salarial, qui présente de nombreux avantages.
Avec le portage salarial, le consultant en science de la data peut se garantir un salaire chaque mois. Mais en parallèle, il est libre de trouver ses clients selon son rythme. Il collaborera alors simultanément avec une société de portage et l'entreprise cliente.
À l'ère du big data, l'on a connu les analystes de données, à une époque où seulement quelques acteurs détenaient le monopole de tout ce qui transitait en ligne. Mais face à la décentralisation qui s'observe aujourd'hui, et aux quantités de plus en plus élevées qui sont à traiter, il ne suffit plus seulement d'analyser. Il faut aller bien au-delà, en s'appuyant sur l'existant pour réaliser des modèles, proposer des solutions et anticiper des événements. C'est ce que font les data scientists. Très recherchés, ils peuvent exercer en indépendant grâce au portage salarial.