Données avant la base : fiabiliser un inventaire d'atelier en Python
Diagnostiquer, filtrer, nettoyer un inventaire CSV fragile avec Python standard et produire un CSV corrigé + un rapport JSON. La marche 1CIEL avant les bases de données en terminale.
Le contexte
Avant de mettre des données « en base », il faut qu’elles soient propres. Un inventaire d’atelier exporté à la va-vite, c’est toujours la même histoire : un identifiant manquant ici, un doublon là, une date au mauvais format, une quantité négative qui n’a aucun sens. Cette séquence apprend à diagnostiquer puis fiabiliser un jeu de données réel avec les outils de base du Python — sans base de données, sans SQL.
L’élève est technicien dans une PME fictive de gestion de données (« RunData 974 ») : on lui confie un inventaire bancal à remettre d’aplomb avant qu’il parte en base.
Problématique : comment repérer les anomalies d’un fichier de données, les corriger de façon traçable, et produire un export propre exploitable par la suite ?
Livrable observable — Un CSV corrigé + un rapport JSON listant les anomalies détectées et traitées.
Autoportante : le jeu de données est fourni
Le pack contient l’inventaire CSV brut support des trois TP — un fichier fictif dans lequel des anomalies ont été volontairement injectées (identifiant manquant, doublon, date incohérente, quantité manquante ou négative, localisation absente, état en panne). Il suffit d’avoir Python 3 : aucune bibliothèque externe, aucune base de données. Tout se fait avec la bibliothèque standard.
Le plan séance par séance
| Séance | Durée | Type | Objectif |
|---|---|---|---|
| S1 | 3 h | TP | Diagnostic : repérer et classer les anomalies d’un inventaire CSV fragile |
| S2 | 3 h | TP | Lire, filtrer et trier l’inventaire avec Python standard |
| S3 | 3 h | TP | Produire un CSV corrigé et un rapport JSON |
| S4 | 3 h | Éval | Transférer la méthode sur un inventaire différent, en autonomie |
Guidage dégressif : très encadré au TP1 (méthode + repérage), puis l’élève prend la main sur le code en TP2 et TP3, jusqu’à l’autonomie complète à l’évaluation.
Ce que les élèves repartent capables de faire
- Ouvrir et parcourir un fichier CSV en Python (bibliothèque standard)
- Repérer et nommer les anomalies classiques d’un jeu de données (doublon, type incohérent, valeur aberrante, champ manquant)
- Filtrer et trier des enregistrements par critère
- Écrire un CSV corrigé et un rapport JSON de synthèse
- Documenter le traitement appliqué, pour le rendre reproductible et vérifiable
Pour aller plus loin
C’est la marche 1CIEL qui prépare l’introduction aux bases de données en terminale : ici on reste sur du CSV, du JSON et du Python standard ; le SQL, les tables et les requêtes viendront ensuite, en TCIEL. La logique « diagnostiquer → nettoyer → exporter un rapport » est exactement celle qu’on retrouve avant tout import en base — un réflexe de technicien qui manipule de la donnée.
Documents inclus dans le ZIP
Inventaire généré depuis l'archive publique contrôlée le 2026-06-21.
Compétences du référentiel visées
Codes du référentiel Bac Pro CIEL.