Übung zu groupby
und join
#
In diesem Notebook wenden Sie die Konzepte aus den beiden screencasts an.
Basierend auf dem DataFrame individuelle_einkommen
:
import pandas as pd
individuelle_einkommen = pd.DataFrame(
[
{"p_id": 0, "hh_id": 0, "einkommen_m": 1000},
{"p_id": 1, "hh_id": 0, "einkommen_m": 2000},
{"p_id": 2, "hh_id": 1, "einkommen_m": 3000},
{"p_id": 3, "hh_id": 1, "einkommen_m": 0},
{"p_id": 4, "hh_id": 2, "einkommen_m": 1500},
{"p_id": 5, "hh_id": 2, "einkommen_m": 1500},
{"p_id": 6, "hh_id": 3, "einkommen_m": 1500},
{"p_id": 7, "hh_id": 4, "einkommen_m": 1500},
],
)
individuelle_einkommen
führen Sie bitte folgende Schritte aus:
Setzen Sie einen vernünftigen Index für den DataFrame
individuelle_einkommen
Erstellen Sie einen DataFrame
haushaltseinkommen
mit dem Haushaltseinkommen.Benennen Sie die Spalte für das Haushaltseinkommen um in
einkommen_m_hh
Fügen Sie beide DataFrames zusammen in einem DataFrame
alle_einkommen
, welcher wie folgt aussehen sollte (Index besteht aushh_id
,p_id
):
hh_id |
p_id |
einkommen_m |
einkommen_m_hh |
---|---|---|---|
0 |
0 |
1000 |
3000 |
0 |
1 |
2000 |
3000 |
1 |
2 |
3000 |
3000 |
1 |
3 |
0 |
3000 |
2 |
4 |
1500 |
3000 |
2 |
5 |
1500 |
3000 |
3 |
6 |
1500 |
1500 |
4 |
7 |
1500 |
1500 |