
Feature Engineering
Feature Engineering ist der Prozess, bei dem neue Merkmale aus den vorhandenen Daten erstellt werden, um die Modellleistung zu verbessern.
Der bereitgestellte Code demonstriert Feature Engineering für den Iris-Datensatz, einschließlich der Berechnung neuer Merkmale, der Umwandlung kategorischer Daten in numerische mittels One-Hot-Encoding und der Normalisierung der Feature-Werte.
import pandas as pd
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
# Laden des Iris-Datensatzes
iris = load_iris()
X, y = iris.data, iris.target
# Erstellen eines Pandas DataFrame aus den Iris-Daten
df = pd.DataFrame(data=X, columns=iris.feature_names)
df['species'] = y
# Erstellen neuer Features
# Berechnung der "sepal" Fläche
df['sepal_area'] = df['sepal length (cm)'] * df['sepal width (cm)']
# Berechnung des Verhältnisses von Petal Length zu Petal Width
df['petal_length_to_width_ratio'] = df['petal length (cm)'] / df['petal width (cm)']
# Entfernen die Spalte "species" aus dem DataFrame
df.drop("species", axis=1, inplace=True)
# Normalisierung der Feature-Werte
# Skalierung aller numerischen Features auf eine gemeinsame Skala
scaler = StandardScaler()
df_scaled = pd.DataFrame(scaler.fit_transform(df), columns=df.columns)
Mehr erfahren: HEAVY.AI/Feature Engineering, ProjectPro/8 Feature Engineering Techniques for Machine Learning
Last updated