Page cover

Grundlagen maschinelles Lernen

Im Bereich des maschinellen Lernens und des TinyML ist es von grundlegender Bedeutung, die verschiedenen Arten des maschinellen Lernens und den dazugehörigen Workflow zu verstehen. TinyML bezeichnet die Implementierung von maschinellem Lernen auf ressourcenbeschränkten Geräten, wie Mikrocontrollern und Internet der Dinge (engl. Internet of things, IoT)-Geräten. In diesem Abschnitt wird auf die Grundlagen des maschinellen Lernens und dessen Konzepte, die für die Anwendung von TinyML bedeutend sind, eingegangen.

Arten des maschinellen Lernens

Es gibt verschiedene Formen des maschinellen Lernens, die sich in ihrem Ansatz und ihren Anwendungen unterscheiden. Die Hauptkategorien hierbei sind:

Unterschiede zwischen den Arten des maschinellen Lernens

Die verschiedenen Formen des maschinellen Lernens unterscheiden sich in ihrem Ansatz und den verwendeten Daten. Überwachtes Lernen nutzt Eingabe- und Ausgabedaten, unüberwachtes Lernen erkennt Muster ohne Ausgabedaten. Halbüberwachtes Lernen kombiniert gelabelte und ungelabelte Daten, während bestärkendes Lernen auf Interaktion und Rückmeldungen basiert.

Maschinelles Lernen - Ablauf

Der Workflow des maschinellen Lernens umfasst die folgenden, beispielhaften Schritte:

  1. Datensammlung:

    • Open-Source-Datensätze: Verwendung frei verfügbarer Datensätze.

    • Datenaufnahme: Sammeln und aufbereiten eigener Daten.

  2. Datenvorverarbeitung:

    • Bereinigung: Entfernen von Fehlern, Auffüllen fehlender Werte, Anpassen von Datenformaten.

    • Aufteilung: Daten in Trainings-, Validierungs- und Testdatensätze aufteilen für das Modelltraining und die Leistungsbeurteilung.

  3. Modellauswahl:

    • Problemdefinition: Klarstellung des Problems, ob es sich bspw. um überwachtes oder unüberwachtes Lernen handelt.

    • Algorithmenwahl: Auswahl eines geeigneten Modells basierend auf der Aufgabenstellung, z. B. Klassifikation (Logistische Regression), Clustering (K-Means), usw.

    • Modelltyp: Wahl zwischen eines selbst erstellten Modells oder Verwendung eines vortrainierten Modells, je nach Datenmenge und spezifischen Anforderungen.

  4. Modelltraining: Das Modell wird mit den Trainingsdaten trainiert und auf dem Validierungsdatensatz validiert, um Muster zu erkennen und Vorhersagen zu treffen.

  5. Modellevaluation: Das Modell wird auf dem Testdatensatz getestet, um seine Leistung zu bewerten.

  6. Monitoring (MLOps): Nach der Bereitstellung des Modells ist es wichtig, das Modell kontinuierlich zu überwachen. Dies beinhaltet die Überwachung seiner Leistung im Einsatz und gegebenenfalls die Aktualisierung des Modells, um sicherzustellen, dass es weiterhin genaue Vorhersagen trifft.

Dies sind grundlegenden Schritte und Konzepte im maschinellen Lernprozess. In den kommenden Kapiteln wird eingehender auf die genannten Schritte und auf verschiedene Algorithmen und Techniken dieser Bereiche eingegangen.

Mehr erfahren: GoogleCloud/ML-Workflowarrow-up-right

Frameworks

Frameworks sind essenzielle Werkzeuge im maschinellen Lernen, die Entwicklern die Implementierung von Modellen und Algorithmen erleichtern. Hier sind einige der wichtigsten Frameworks, die in der ML-Community verwendet werden:

Diese Frameworks sind eine ausgezeichnete Grundlage für die Entwicklung von ML-Anwendungen. In den folgenden Kapiteln werden die Frameworks TensorFlow und scikit-learn für Beispiele verwenden.

Last updated