1CIEL Pôle 3 · programmation

Données avant la base : fiabiliser un inventaire d'atelier en Python

Diagnostiquer, filtrer, nettoyer un inventaire CSV fragile avec Python standard et produire un CSV corrigé + un rapport JSON. La marche 1CIEL avant les bases de données en terminale.

Séquence n°13 12 h 4 séances
Archive non publiée Contrôle 2026-06-21 4 fichiers Relecture stricte requise

Le contexte

Avant de mettre des données « en base », il faut qu’elles soient propres. Un inventaire d’atelier exporté à la va-vite, c’est toujours la même histoire : un identifiant manquant ici, un doublon là, une date au mauvais format, une quantité négative qui n’a aucun sens. Cette séquence apprend à diagnostiquer puis fiabiliser un jeu de données réel avec les outils de base du Python — sans base de données, sans SQL.

L’élève est technicien dans une PME fictive de gestion de données (« RunData 974 ») : on lui confie un inventaire bancal à remettre d’aplomb avant qu’il parte en base.

Problématique : comment repérer les anomalies d’un fichier de données, les corriger de façon traçable, et produire un export propre exploitable par la suite ?

Livrable observable — Un CSV corrigé + un rapport JSON listant les anomalies détectées et traitées.

Autoportante : le jeu de données est fourni

Le pack contient l’inventaire CSV brut support des trois TP — un fichier fictif dans lequel des anomalies ont été volontairement injectées (identifiant manquant, doublon, date incohérente, quantité manquante ou négative, localisation absente, état en panne). Il suffit d’avoir Python 3 : aucune bibliothèque externe, aucune base de données. Tout se fait avec la bibliothèque standard.

Le plan séance par séance

SéanceDuréeTypeObjectif
S13 hTPDiagnostic : repérer et classer les anomalies d’un inventaire CSV fragile
S23 hTPLire, filtrer et trier l’inventaire avec Python standard
S33 hTPProduire un CSV corrigé et un rapport JSON
S43 hÉvalTransférer la méthode sur un inventaire différent, en autonomie

Guidage dégressif : très encadré au TP1 (méthode + repérage), puis l’élève prend la main sur le code en TP2 et TP3, jusqu’à l’autonomie complète à l’évaluation.

Ce que les élèves repartent capables de faire

  • Ouvrir et parcourir un fichier CSV en Python (bibliothèque standard)
  • Repérer et nommer les anomalies classiques d’un jeu de données (doublon, type incohérent, valeur aberrante, champ manquant)
  • Filtrer et trier des enregistrements par critère
  • Écrire un CSV corrigé et un rapport JSON de synthèse
  • Documenter le traitement appliqué, pour le rendre reproductible et vérifiable

Pour aller plus loin

C’est la marche 1CIEL qui prépare l’introduction aux bases de données en terminale : ici on reste sur du CSV, du JSON et du Python standard ; le SQL, les tables et les requêtes viendront ensuite, en TCIEL. La logique « diagnostiquer → nettoyer → exporter un rapport » est exactement celle qu’on retrouve avant tout import en base — un réflexe de technicien qui manipule de la donnée.

Documents inclus dans le ZIP

Inventaire généré depuis l'archive publique contrôlée le 2026-06-21.

CSV
inventaire_atelier_brut.csv
1C_PRG_04_DONNEES_AVANT_BDD/ressources/inventaire_atelier_brut.csv
Word
TP1_Diagnostic_Inventaire_ELEVE.docx
1C_PRG_04_DONNEES_AVANT_BDD/S1_TP1/TP1_Diagnostic_Inventaire_ELEVE.docx
Word
TP2_Filtrer_Trier_CSV_ELEVE.docx
1C_PRG_04_DONNEES_AVANT_BDD/S2_TP2/TP2_Filtrer_Trier_CSV_ELEVE.docx
Word
TP3_Nettoyer_Exporter_Rapport_ELEVE.docx
1C_PRG_04_DONNEES_AVANT_BDD/S3_TP3/TP3_Nettoyer_Exporter_Rapport_ELEVE.docx

Manifest JSON public

Compétences du référentiel visées

Codes du référentiel Bac Pro CIEL.

C04 Analyser une structure matérielle et logicielle
C08 Coder