
Feature Engineering
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
# Laden des Iris-Datensatzes
iris = load_iris()
X, y = iris.data, iris.target
# Erstellen eines Pandas DataFrame aus den Iris-Daten
df = pd.DataFrame(data=X, columns=iris.feature_names)
df['species'] = y
# Erstellen neuer Features
# Berechnung der "sepal" Fläche
df['sepal_area'] = df['sepal length (cm)'] * df['sepal width (cm)']
# Berechnung des Verhältnisses von Petal Length zu Petal Width
df['petal_length_to_width_ratio'] = df['petal length (cm)'] / df['petal width (cm)']
# Entfernen die Spalte "species" aus dem DataFrame
df.drop("species", axis=1, inplace=True)
# Normalisierung der Feature-Werte
# Skalierung aller numerischen Features auf eine gemeinsame Skala
scaler = StandardScaler()
df_scaled = pd.DataFrame(scaler.fit_transform(df), columns=df.columns)Last updated