TermNSI/Paradigmes/TP_SpotifyWrapped.md

# TP : Créer son Spotify Wrapped — Programmation Fonctionnelle

> **Thème** : Paradigmes de programmation, fonctions lambda, map, filter, reduce

---

## Contexte

Chaque fin d'année, **Spotify Wrapped** révèle aux utilisateurs leurs statistiques d'écoute : artistes préférés, genres favoris, minutes écoutées... Ce résumé personnalisé est devenu un phénomène viral sur les réseaux sociaux.

Dans ce TP, vous allez créer votre propre **mini Wrapped** en utilisant exclusivement la **programmation fonctionnelle**. Vous découvrirez comment les géants du streaming traitent des milliards de données grâce à ce paradigme.

**Règle d'or du TP** : Aucune boucle `for` ou `while` n'est autorisée ! Uniquement `map`, `filter`, `reduce` et la récursivité.

---

## Partie 1 : Les données

### Les écoutes

Voici un extrait de l'historique d'écoute d'un utilisateur. Chaque écoute est représentée par un dictionnaire.

```python
# Données d'écoute (à copier dans votre fichier)
ecoutes = [
    {"titre": "Blinding Lights", "artiste": "The Weeknd", "duree": 203, "genre": "pop", "date": "2026-01-15"},
    {"titre": "Bohemian Rhapsody", "artiste": "Queen", "duree": 354, "genre": "rock", "date": "2026-01-15"},
    {"titre": "Bad Guy", "artiste": "Billie Eilish", "duree": 194, "genre": "pop", "date": "2026-01-16"},
    {"titre": "Stairway to Heaven", "artiste": "Led Zeppelin", "duree": 482, "genre": "rock", "date": "2026-01-16"},
    {"titre": "Shape of You", "artiste": "Ed Sheeran", "duree": 234, "genre": "pop", "date": "2026-01-17"},
    {"titre": "Smells Like Teen Spirit", "artiste": "Nirvana", "duree": 279, "genre": "rock", "date": "2026-01-17"},
    {"titre": "Levitating", "artiste": "Dua Lipa", "duree": 203, "genre": "pop", "date": "2026-01-18"},
    {"titre": "Back in Black", "artiste": "AC/DC", "duree": 255, "genre": "rock", "date": "2026-01-18"},
    {"titre": "Blinding Lights", "artiste": "The Weeknd", "duree": 203, "genre": "pop", "date": "2026-01-19"},
    {"titre": "drivers license", "artiste": "Olivia Rodrigo", "duree": 242, "genre": "pop", "date": "2026-01-19"},
    {"titre": "Lose Yourself", "artiste": "Eminem", "duree": 326, "genre": "rap", "date": "2026-01-20"},
    {"titre": "HUMBLE.", "artiste": "Kendrick Lamar", "duree": 177, "genre": "rap", "date": "2026-01-20"},
    {"titre": "Blinding Lights", "artiste": "The Weeknd", "duree": 203, "genre": "pop", "date": "2026-01-21"},
    {"titre": "Watermelon Sugar", "artiste": "Harry Styles", "duree": 174, "genre": "pop", "date": "2026-01-21"},
    {"titre": "Enter Sandman", "artiste": "Metallica", "duree": 332, "genre": "metal", "date": "2026-01-22"},
    {"titre": "Nothing Else Matters", "artiste": "Metallica", "duree": 388, "genre": "metal", "date": "2026-01-22"},
    {"titre": "Thriller", "artiste": "Michael Jackson", "duree": 358, "genre": "pop", "date": "2026-01-23"},
    {"titre": "Billie Jean", "artiste": "Michael Jackson", "duree": 294, "genre": "pop", "date": "2026-01-23"},
    {"titre": "Anti-Hero", "artiste": "Taylor Swift", "duree": 200, "genre": "pop", "date": "2026-01-24"},
    {"titre": "Flowers", "artiste": "Miley Cyrus", "duree": 200, "genre": "pop", "date": "2026-01-24"},
]
```

---

## Partie 2 : Fonctions de base

### Exercice 1 : Extraction de données avec `map`

La fonction `map(fonction, liste)` applique une fonction à chaque élément d'une liste.

**Question 1.1** : Écrivez une fonction lambda `get_titre` qui extrait le titre d'une écoute.

```python
get_titre = lambda ecoute: # À compléter

# Test
titres = list(map(get_titre, ecoutes))
print(titres[:3])  # ['Blinding Lights', 'Bohemian Rhapsody', 'Bad Guy']
```

**Question 1.2** : Écrivez une fonction lambda `get_duree_minutes` qui convertit la durée (en secondes) en minutes (arrondi à 2 décimales).

```python
get_duree_minutes = lambda ecoute: # À compléter

# Test
durees = list(map(get_duree_minutes, ecoutes))
print(durees[:3])  # [3.38, 5.9, 3.23]
```

**Question 1.3** : Créez une fonction `formater_ecoute` qui retourne une chaîne au format `"Titre - Artiste (Xmin)"`.

```python
formater_ecoute = lambda e: # À compléter

# Test
formatees = list(map(formater_ecoute, ecoutes))
print(formatees[0])  # "Blinding Lights - The Weeknd (3.38min)"
```

---

### Exercice 2 : Filtrage avec `filter`

La fonction `filter(fonction, liste)` conserve uniquement les éléments pour lesquels la fonction retourne `True`.

**Question 2.1** : Filtrez les écoutes pour ne garder que les morceaux de genre "pop".

```python
est_pop = lambda ecoute: # À compléter

ecoutes_pop = list(filter(est_pop, ecoutes))
print(f"Nombre de morceaux pop : {len(ecoutes_pop)}")  # 12
```

**Question 2.2** : Filtrez les écoutes de plus de 5 minutes (300 secondes).

```python
est_long = lambda ecoute: # À compléter

ecoutes_longues = list(filter(est_long, ecoutes))
print(f"Morceaux longs : {len(ecoutes_longues)}")  # 5
```

**Question 2.3** : Créez un filtre paramétrable `filtre_genre(genre)` qui retourne une fonction lambda.

```python
def filtre_genre(genre):
    """
    Retourne une fonction lambda qui filtre par genre.
    C'est une fonction d'ordre supérieur !
    """
    return lambda ecoute: # À compléter

# Test
ecoutes_rock = list(filter(filtre_genre("rock"), ecoutes))
ecoutes_rap = list(filter(filtre_genre("rap"), ecoutes))
print(f"Rock: {len(ecoutes_rock)}, Rap: {len(ecoutes_rap)}")  # Rock: 4, Rap: 2
```

---

### Exercice 3 : Agrégation avec `reduce`

La fonction `reduce(fonction, liste, valeur_initiale)` combine tous les éléments en une seule valeur.

```python
import functools
```

**Question 3.1** : Calculez le temps total d'écoute en secondes.

```python
temps_total = functools.reduce(
    lambda acc, ecoute: # À compléter,
    ecoutes,
    0
)
print(f"Temps total : {temps_total} secondes")  # 5301 secondes
```

**Question 3.2** : Convertissez ce temps en heures et minutes.

```python
heures = temps_total // 3600
minutes = (temps_total % 3600) // 60
print(f"Temps d'écoute : {heures}h {minutes}min")  # 1h 28min
```

**Question 3.3** : Trouvez le morceau le plus long en utilisant `reduce`.

```python
plus_long = functools.reduce(
    lambda acc, ecoute: # À compléter,
    ecoutes
)
print(f"Plus long : {plus_long['titre']} ({plus_long['duree']}s)")
# Plus long : Stairway to Heaven (482s)
```

---

## Partie 3 : Statistiques avancées

### Exercice 4 : Comptage par catégorie

**Question 4.1** : Comptez le nombre d'écoutes par genre en utilisant `reduce`.

```python
def compter_par_genre(ecoutes):
    """
    Retourne un dictionnaire {genre: nombre_ecoutes}.
    Utilise reduce pour accumuler les comptages.
    """
    return functools.reduce(
        lambda acc, e: {**acc, e["genre"]: acc.get(e["genre"], 0) + 1},
        ecoutes,
        {}
    )

stats_genres = compter_par_genre(ecoutes)
print(stats_genres)  # {'pop': 12, 'rock': 4, 'rap': 2, 'metal': 2}
```

**Question 4.2** : Adaptez cette fonction pour compter les écoutes par artiste.

```python
def compter_par_artiste(ecoutes):
    """Retourne un dictionnaire {artiste: nombre_ecoutes}."""
    # À compléter (inspirez-vous de compter_par_genre)
    pass

stats_artistes = compter_par_artiste(ecoutes)
print(stats_artistes)
# {'The Weeknd': 3, 'Queen': 1, 'Billie Eilish': 1, ...}
```

**Question 4.3** : Trouvez l'artiste le plus écouté.

```python
def artiste_prefere(stats_artistes):
    """
    Retourne le nom de l'artiste avec le plus d'écoutes.
    Utilise reduce sur les items du dictionnaire.
    """
    return functools.reduce(
        lambda acc, item: # À compléter,
        stats_artistes.items()
    )[0]

top_artiste = artiste_prefere(stats_artistes)
print(f"Artiste préféré : {top_artiste}")  # The Weeknd
```

---

### Exercice 5 : Chaînage fonctionnel (Pipeline)

L'intérêt de la programmation fonctionnelle est de **chaîner** les opérations.

**Question 5.1** : Calculez le temps total d'écoute des morceaux pop uniquement.

```python
# En une seule expression chaînée
temps_pop = functools.reduce(
    lambda acc, e: acc + e["duree"],
    filter(lambda e: e["genre"] == "pop", ecoutes),
    0
)
print(f"Temps pop : {temps_pop // 60} minutes")
```

**Question 5.2** : Listez les titres des morceaux rock de plus de 4 minutes, triés par durée décroissante.

```python
# Pipeline : filter -> filter -> map -> sorted
titres_rock_longs = list(map(
    lambda e: e["titre"],
    sorted(
        filter(
            lambda e: e["duree"] > 240,
            filter(
                lambda e: e["genre"] == "rock",
                ecoutes
            )
        ),
        key=lambda e: e["duree"],
        reverse=True
    )
))
print(titres_rock_longs)
# ['Stairway to Heaven', 'Bohemian Rhapsody', 'Smells Like Teen Spirit']
```

**Question 5.3** : Créez une fonction `pipeline` qui compose plusieurs fonctions.

```python
def pipeline(*fonctions):
    """
    Retourne une fonction qui applique les fonctions en séquence.
    pipeline(f, g, h)(x) équivaut à h(g(f(x)))
    """
    return lambda x: functools.reduce(
        lambda acc, f: f(acc),
        fonctions,
        x
    )

# Exemple d'utilisation
traitement = pipeline(
    lambda data: filter(lambda e: e["genre"] == "pop", data),
    lambda data: map(lambda e: e["titre"], data),
    list
)

print(traitement(ecoutes)[:3])  # ['Blinding Lights', 'Bad Guy', 'Shape of You']
```

---

## Partie 4 : Génération du Wrapped

### Exercice 6 : Créer le résumé final

**Question 6** : Créez une fonction `generer_wrapped` qui produit un dictionnaire avec toutes les statistiques.

```python
def generer_wrapped(ecoutes):
    """
    Génère un résumé Wrapped complet de manière fonctionnelle.

    :param ecoutes: (list) liste des écoutes
    :return: (dict) statistiques complètes
    """
    # Temps total
    temps_total = functools.reduce(lambda acc, e: acc + e["duree"], ecoutes, 0)

    # Comptages
    stats_artistes = compter_par_artiste(ecoutes)
    stats_genres = compter_par_genre(ecoutes)

    # Top artiste
    top_artiste = # À compléter

    # Top genre
    top_genre = # À compléter

    # Morceau le plus écouté (celui qui apparaît le plus)
    stats_titres = functools.reduce(
        lambda acc, e: {**acc, e["titre"]: acc.get(e["titre"], 0) + 1},
        ecoutes,
        {}
    )
    top_titre = # À compléter

    # Morceau le plus long
    plus_long = # À compléter

    return {
        "nombre_ecoutes": len(ecoutes),
        "temps_total_minutes": round(temps_total / 60, 1),
        "artiste_prefere": top_artiste,
        "genre_prefere": top_genre,
        "titre_prefere": top_titre,
        "morceau_plus_long": plus_long["titre"],
        "stats_genres": stats_genres,
        "top_5_artistes": dict(sorted(
            stats_artistes.items(),
            key=lambda x: x[1],
            reverse=True
        )[:5])
    }


# Test
wrapped = generer_wrapped(ecoutes)

print("=" * 40)
print("       VOTRE WRAPPED 2026")
print("=" * 40)
print(f"Écoutes totales : {wrapped['nombre_ecoutes']}")
print(f"Temps d'écoute : {wrapped['temps_total_minutes']} minutes")
print(f"Artiste préféré : {wrapped['artiste_prefere']}")
print(f"Genre préféré : {wrapped['genre_prefere']}")
print(f"Titre préféré : {wrapped['titre_prefere']}")
print(f"Top 5 artistes : {list(wrapped['top_5_artistes'].keys())}")
print("=" * 40)
```

---

## Partie 5 : Bonus — Récursivité

### Exercice 7 : Implémenter reduce sans boucle

**Question 7** : Réécrivez la fonction `reduce` en utilisant la récursivité.

```python
def mon_reduce(fonction, liste, initial):
    """
    Implémentation récursive de reduce.

    :param fonction: (callable) fonction à 2 arguments (acc, elem)
    :param liste: (list) liste à réduire
    :param initial: valeur initiale de l'accumulateur
    :return: résultat de la réduction
    """
    if len(liste) == 0:
        # À compléter : cas de base
        pass
    else:
        # À compléter : appel récursif
        pass

# Test
total = mon_reduce(lambda acc, x: acc + x, [1, 2, 3, 4, 5], 0)
print(f"Somme : {total}")  # 15
```

---

## Résumé des notions

| Fonction | Description | Exemple |
|----------|-------------|---------|
| `map(f, lst)` | Applique f à chaque élément | `map(lambda x: x*2, [1,2,3])` → [2,4,6] |
| `filter(f, lst)` | Garde les éléments où f est True | `filter(lambda x: x>2, [1,2,3])` → [3] |
| `reduce(f, lst, init)` | Combine tous les éléments | `reduce(lambda a,x: a+x, [1,2,3], 0)` → 6 |
| `lambda` | Fonction anonyme | `lambda x: x + 1` |
| Pipeline | Composition de fonctions | `f(g(h(x)))` |

---

## Pour aller plus loin

- **Compréhensions de liste** : Alternative pythonique à map/filter
- **Générateurs** : `map` et `filter` retournent des itérateurs (lazy evaluation)
- **Bibliothèques** : `itertools`, `toolz`, `fn.py` pour la programmation fonctionnelle avancée
- **Langages fonctionnels purs** : Haskell, Elm, Clojure

---

Auteurs : Florian Mathieu, Enzo Frémeaux, Thimothée Decooster

Licence CC BY NC

<a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="Licence Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png" /></a> <br />Ce cours est mis à disposition selon les termes de la <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/">Licence Creative Commons Attribution - Pas d'Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International</a>.