Übung zu groupby und join

Übung zu groupby und join#

In diesem Notebook wenden Sie die Konzepte aus den beiden screencasts an.

Basierend auf dem DataFrame individuelle_einkommen:

import pandas as pd
individuelle_einkommen = pd.DataFrame(
    [
        {"p_id": 0, "hh_id": 0, "einkommen_m": 1000},
        {"p_id": 1, "hh_id": 0, "einkommen_m": 2000},
        {"p_id": 2, "hh_id": 1, "einkommen_m": 3000},
        {"p_id": 3, "hh_id": 1, "einkommen_m": 0},
        {"p_id": 4, "hh_id": 2, "einkommen_m": 1500},
        {"p_id": 5, "hh_id": 2, "einkommen_m": 1500},
        {"p_id": 6, "hh_id": 3, "einkommen_m": 1500},
        {"p_id": 7, "hh_id": 4, "einkommen_m": 1500},
    ],
)
individuelle_einkommen

führen Sie bitte folgende Schritte aus:

  1. Setzen Sie einen vernünftigen Index für den DataFrame individuelle_einkommen

  2. Erstellen Sie einen DataFrame haushaltseinkommen mit dem Haushaltseinkommen.

  3. Benennen Sie die Spalte für das Haushaltseinkommen um in einkommen_m_hh

  4. Fügen Sie beide DataFrames zusammen in einem DataFrame alle_einkommen, welcher wie folgt aussehen sollte (Index besteht aus hh_id, p_id):

hh_id

p_id

einkommen_m

einkommen_m_hh

0

0

1000

3000

0

1

2000

3000

1

2

3000

3000

1

3

0

3000

2

4

1500

3000

2

5

1500

3000

3

6

1500

1500

4

7

1500

1500