Les données sont le carburant du numérique — et une responsabilité. Ces professionnelles et professionnels collectent, transforment, analysent, protègent et gouvernent l’information (RGPD, NIS2, éthique). Objectif : créer de la valeur sans compromettre la confiance.
À l’ère des agents IA et des décisions automatisées, qualité, traçabilité et fiabilité deviennent critiques : de mauvaises données produisent… de mauvaises décisions.
Métiers émergents à surveiller
- Privacy Engineer : privacy by design, anonymisation, consentement, DSR.
- Data Storyteller : insights → récits percutants (visualisation + narration).
- Data Governance Manager : politiques, rôles, métadonnées, lineage & qualité.
Tous les métiers de cette famille
Collecte & ingénierie des données
- Data Engineer : pipelines, entrepôts/lacs, fiabilité & coûts.
- Ingénieur ETL/ELT : Talend/Informatica/dbt ; standardise les flux.
- Architecte de données : modèles, intégrations, normes.
- Ingénieur temps réel (streaming) : Kafka/Flink/Spark Streaming.
Analyse & science des données
- Data Analyst : explorations, KPIs, recommandations métier.
- Data Scientist : modèles prédictifs/prescriptifs, MLOps léger.
- Data Storyteller (émergent) : dashboards narratifs, dataviz.
- Analyste BI : Power BI/Tableau/Looker, sémantique & métriques.
Gouvernance, qualité & conformité
- Data Governance Manager (émergent) : cadre, rôles, catalogues.
- Data Steward : qualité & cohérence par domaine.
- Privacy Engineer (émergent) : implémente RGPD (minimisation, DPIA).
- DPO : conformité, registres, interlocuteur CNIL.
Visualisation & communication
- Data Viz Designer : lisibilité, esthétique, perception.
- BI Developer : modèles & self-service pour les métiers.
- Analytics Translator : passerelle data ↔ décision.
Éthique & stratégie
- Chief Data Officer (CDO) : vision & portefeuille data.
- Éthicien·ne de la data : biais, risque, équité, impacts.
- Data Product Manager : APIs, plateformes & produits data.
Métiers complémentaires
- Web/Digital Analyst : analytics marketing produit.
- CDP Manager : données clients unifiées.
- Master Data Manager : référentiels (clients/produits/fournisseurs).
Compétences transverses clés
Modélisation & SQL | Python (pandas/pySpark) | ETL/ELT & orchestration | Cloud data (BigQuery/Snowflake/Redshift/Lakehouse) | Streaming (Kafka/Flink) | BI & dataviz | Qualité & lineage | Catalogue & métadonnées | RGPD/NIS2 | Sécurité & contrôle d’accès | Storytelling & data literacy
Outils & écosystèmes (exemples)
- Ingestion/ETL-ELT : Fivetran, Airbyte, dbt, Talend, Informatica.
- Orchestration : Airflow, Dagster, Prefect.
- Stockage/compute : BigQuery, Snowflake, Redshift, Databricks, Delta/Iceberg.
- Streaming : Kafka, Flink, Spark Streaming.
- BI/Viz : Power BI, Tableau, Looker, Superset.
- Catalogues & lineage : Collibra, Atlan, Amundsen, OpenLineage.
- Gouvernance/Privacy : OneTrust, BigID (+ model/data cards).
- Notebooks & ML : Jupyter, scikit-learn, TensorFlow/PyTorch, MLflow.
Optimisation agentique (GEO) appliquée à la data
- Données structurées “Dataset” (schema.org) sur pages jeux de données/études.
- Data/Model Cards : objectifs, sources, limites, lineage, licences, mises à jour.
- Dashboards “agent-friendly” : titres explicites, définitions de métriques, tableaux exportables.
- Traçabilité : identifiants de versions, changelog, sources citées.
KPI data (repères pragmatiques)
- Qualité : complétude, exactitude, unicité, cohérence, fraîcheur.
- Fiabilité : SLA/SLO des jobs, taux d’échec, délais de reprise.
- Gouvernance : % datasets catalogués, lineage couvert, accès revus.
- Conformité : délais DSR, couverture DPIA, incidents privacy.
- Adoption : utilisateurs BI actifs, réutilisation de métriques, NPS data.
- Modèles : performance + drift & stabilité dans le temps.
- Coûts : coût par requête/rapport/pipeline.
Exemples de missions types
- Mettre en place une plateforme data (ingestion → modélisation → BI) avec catalogue & lineage.
- Migrer d’ETL vers ELT + dbt avec couche de métriques partagées.
- Déployer un streaming temps réel (fraude, IoT) avec KPIs de latence.
- Lancer un programme RGPD : minimisation, consentement, DPIA, DSR.
- Créer un design system data (noms, définitions, métriques officielles).
- Standardiser des Data/Model Cards pour transparence & agents IA.
← Retour à la cartographie complète des métiers du numérique
