ajout activité sur les données structurées

This commit is contained in:
2026-01-23 08:14:16 +01:00
parent 426987e567
commit ec08aed1f9
4 changed files with 122 additions and 4 deletions

View File

@@ -0,0 +1,107 @@
# Activité : Enquête sur les données des pays du monde
**Durée** : 30-35 min
**Objectifs** : Identifier descripteurs/valeurs/types, manipuler un fichier CSV, trier et filtrer des données, découvrir l'Open Data
---
## Partie 1 — Vocabulaire et compréhension (10 min)
**Contexte** : Vous êtes data analyst pour une agence de voyages. Voici un extrait de votre base de données :
| Pays | Capitale | Population | Superficie_km2 | Continent | Euro_monnaie |
|------|----------|------------|----------------|-----------|--------------|
| France | Paris | 67390000 | 643801 | Europe | Vrai |
| Japon | Tokyo | 125800000 | 377975 | Asie | Faux |
| Brésil | Brasília | 214300000 | 8515767 | Amérique | Faux |
| Allemagne | Berlin | 83200000 | 357386 | Europe | Vrai |
| Égypte | Le Caire | 104100000 | 1001449 | Afrique | Faux |
**Questions** :
1. Combien d'**objets** contient cette collection ?
2. Listez les **descripteurs** de cette collection.
3. Donnez le **type** de chaque descripteur (texte, entier, décimal, booléen).
4. Quelle est la **valeur** du descripteur "Capitale" pour le Brésil ?
5. Écrivez la ligne du Japon au **format CSV** (séparateur : point-virgule).
---
## Partie 2 — Manipulation sur tableur (15 min)
**Fichier à utiliser** : `pays.csv`
**Consignes** :
1. Ouvrez le fichier dans LibreOffice Calc (ou Excel)
2. **Triez** les pays par population décroissante. Quel pays est le plus peuplé ?
3. **Filtrez** pour n'afficher que les pays d'Europe
4. Parmi les pays européens, combien utilisent l'Euro ?
5. **Calculez** la population moyenne de tous les pays (formule : `=MOYENNE(...)`)
6. **Calculez** la superficie totale des pays européens (formule : `=SOMME(...)`)
**Bonus** : Ajoutez une colonne "Densité" qui calcule `Population / Superficie_km2`
---
## Partie 3 — Réflexion Open Data et vie privée (5-10 min)
**Questions de réflexion** :
1. Ces données sur les pays sont-elles des **données personnelles** ? Justifiez.
2. Donnez un exemple de données que vous pourriez trouver sur **data.gouv.fr** concernant votre commune.
3. Si une entreprise collecte votre nom, âge, adresse et historique d'achats, quels **droits** vous donne le RGPD ?
4. **Défi** : Expliquez la différence entre une **donnée brute** (`67390000`) et une **information** (`La France compte 67,39 millions d'habitants`).
---
## Critères d'évaluation
| Compétence | Acquis | En cours | Non acquis |
|------------|--------|----------|------------|
| Identifier descripteurs, valeurs et types | | | |
| Comprendre le format CSV | | | |
| Trier et filtrer des données | | | |
| Utiliser des formules de calcul | | | |
| Connaître les principes de l'Open Data et du RGPD | | | |
---
## Corrigé
### Partie 1
1. **5 objets** (5 lignes de données, hors en-tête)
2. **Descripteurs** : Pays, Capitale, Population, Superficie_km2, Continent, Euro_monnaie
3. **Types** :
- Pays : texte
- Capitale : texte
- Population : nombre entier
- Superficie_km2 : nombre entier
- Continent : texte
- Euro_monnaie : booléen
4. **Valeur** : Brasília
5. **Format CSV** : `Japon;Tokyo;125800000;377975;Asie;Faux`
### Partie 2
1.
2. Le pays le plus peuplé est le **Brésil** (214 300 000 habitants)
3.
4. **4 pays** européens utilisent l'Euro (France, Allemagne, Italie, Espagne)
5. Population moyenne : **=MOYENNE(C2:C11)** → **80 051 000** habitants
6. Superficie totale Europe : **=SOMME(...)** sur les lignes filtrées → **1 808 519 km²**
7. **Bonus** : Densité = `=C2/D2` (puis étendre la formule)
### Partie 3
1. **Non**, ce ne sont pas des données personnelles car elles ne permettent pas d'identifier une personne physique. Ce sont des données publiques sur des pays.
2. Exemples : résultats des élections, budget de la commune, équipements sportifs, qualité de l'eau...
3. **Droits RGPD** : droit d'accès, droit de rectification, droit à l'effacement, droit à la portabilité, droit d'opposition.
4. Une **donnée brute** est une valeur sans contexte (67390000). Une **information** est une donnée avec du sens et du contexte (La France compte 67,39 millions d'habitants).
---
Auteur : Florian Mathieu
Licence CC BY NC