ML-Klassifikation
Random Forest, SVM, CNN & Logistic Regression – am PlantVillage-Dataset erklärt.
Lektion starten →Vier klassische Wege, einem Computer das Klassifizieren beizubringen — alle am selben Problem: kranke Pflanzenblätter auf Fotos erkennen (PlantVillage, ~54.000 Bilder, 38 Klassen). Jedes Verfahren bekommt den gleichen Bogen: Intuition → Mathematik → Python-Implementierung → Tuning & Fallstricke. Am Ende weißt du nicht nur wie jedes Verfahren funktioniert, sondern auch wann du welches nimmst.
Wo soll ich anfangen?
Drei Reisen durch das Material – such dir aus, was zu dir passt.
Überblick
High-Level-Einstieg: jedes Verfahren einmal verstehen, ohne tief in Mathe oder Code zu gehen.
- 1Bildklassifikation & PlantVillage
- 2Die ML-Pipeline
- 3Intuition: Linie + Sigmoid
- 4Intuition: die breiteste Straße
- 5Vom Baum zum Wald
Theorie-Deep-Dive
Die Mathematik hinter den Verfahren: Loss-Funktionen, Kernel-Trick, Gini, Convolutions.
- 1Metriken & Confusion Matrix
- 2Mathe: Cross-Entropy & Gradient Descent
- 3Der Kernel-Trick
- 4Der Entscheidungsbaum
- 5Vom Baum zum Wald
Praxis & Code
Python-Implementierungen auf PlantVillage: Feature-Extraktion, scikit-learn, Keras.
- 1Features: von Pixeln zu Vektoren
- 2Praxis: scikit-learn auf PlantVillage
- 3Praxis: SVC auf PlantVillage
- 4Praxis: RandomForestClassifier
- 5Praxis: Keras auf PlantVillage
Tuning & Fallstricke
Hyperparameter, typische Fehler und die Frage: welches Verfahren wann?
- 1Tuning: C, Solver & Fallstricke
- 2Tuning: C & gamma
- 3Tuning: n_estimators & Co.
- 4Transfer Learning & Overfitting
- 5Der große Vergleich
Die ganze Landkarte
Grundlagen
Das Problem, die Pipeline, die Messlatte – gilt für alle vier Verfahren.
Logistic Regression
Das einfachste Verfahren – und die beste Baseline.
Support Vector Machine
Maximum Margin und der Kernel-Trick.
Random Forest
Viele schwache Bäume, ein starker Wald.
Convolutional Neural Network
Das Verfahren, das seine Features selbst lernt.