Der große Vergleich

Vier Verfahren, ein Dataset — jetzt nebeneinander. Diese Lektion gibt dir das Werkzeug, um in der Verteidigung die Frage zu beantworten, die garantiert kommt: Warum dieses Verfahren und nicht ein anderes?

Es gibt kein bestes Verfahren — nur das passendste für eine gegebene Kombination aus Daten, Hardware, Erklärbarkeits-Anforderung und Zeitbudget.

Die Vergleichstabelle

Kriterium	Logistic Regression	SVM	Random Forest	CNN
Input	handgebaute Features (Histogramm/Textur)			rohe Pixel
Entscheidungsgrenze	linear	linear / Kernel	achsenparallele Stufen	beliebig (gelernt)
Skalierung nötig?	ja	ja (Pflicht)	nein	ja (0–1 oder −1…1)
Trainingszeit (54k Bilder)	Sekunden–Minuten	Minuten (linear) bis Stunden (RBF)	Minuten	Minuten (Transfer) bis Stunden
Hardware	CPU	CPU	CPU (parallel)	GPU empfohlen
Erklärbarkeit	hoch (Gewichte)	mittel (Support-Vektoren)	mittel (Importance)	niedrig (Grad-CAM nötig)
Typ. Accuracy*	~70–90 %	~75–90 %	~80–92 %	97 %+
Hauptknopf	C	C & gamma	max_features	Architektur & Lernrate

*Grobe Größenordnungen auf PlantVillage-Histogrammen bzw. Rohbildern — stark abhängig von Feature-Wahl, Bildgröße und Tuning. Nicht als Benchmark zitieren, sondern als Verhältnis lesen.

Entscheidungshilfe

Erklärbarkeit ist Pflicht (Behörde, Medizin, Audit) → Logistic Regression, notfalls Random Forest. Niemals mit „das CNN sagt krank“ vor Gericht.
Tabellen-/Feature-Daten, schnelle solide Baseline → Random Forest. Pflegeleicht, kein Scaler, gute Defaults.
Wenig Beispiele, viele Dimensionen → SVM (linear). Glänzt genau dort, wo CNNs verhungern.
Rohe Bilder, genug Daten, Genauigkeit zählt → CNN, am besten via Transfer Learning.
Im Zweifel → erst die einfachste Baseline (LogReg), dann nach oben arbeiten. Komplexität muss sich ihren Platz verdienen.

Warum eigentlich? — Warum nicht immer das CNN, wenn es gewinnt?

Weil die Accuracy-Spalte nur eine von acht Zeilen ist. Ein CNN, das 2 Punkte mehr liefert, aber GPU braucht, nicht erklärbar ist, im Feld auf 31 % einbricht (Domain Shift!) und Tage Tuning kostet, ist für viele reale Projekte die schlechtere Wahl. Reife im ML zeigt sich nicht darin, das stärkste Verfahren zu kennen, sondern die ganze Tabelle gegen die konkreten Projektziele abzuwägen.

Tiefer rein — Was es in der Tabelle nicht gibt: Ensembles über Verfahren

In der Praxis muss man sich nicht entscheiden. Ein Stacking-Ensemble kombiniert die Vorhersagen mehrerer Verfahren (z.B. CNN-Wahrscheinlichkeiten + RF auf Histogrammen) über ein Meta-Modell — oft besser als jedes Einzelne, weil die Fehler unterschiedlich gelagert sind. In sklearn: StackingClassifier. Für eure vier Projekte ein spannendes gemeinsames Finale: Schlägt das Team-Ensemble jedes Einzelmodell?

Aufgabe

Verfahrenswahl begründen

●●○⏱ 45 min

Schreibe für dein in der Projektarbeit gebautes Verfahren eine einseitige Begründung, die ein Prüfer als Verteidigung akzeptieren würde. Stütze dich auf die Vergleichstabelle, bleib aber konkret bei PlantVillage.

Benenne die Entscheidungsgrenze deines Verfahrens und was das für trennbare vs. überlappende Klassen bedeutet.
Erkläre, welche Vorverarbeitung dein Verfahren zwingend braucht (Scaler? Features? Rescaling?) — und was passiert, wenn man sie weglässt.
Nenne den/die wichtigsten Hyperparameter und in welche Richtung du sie bei Over- bzw. Underfitting drehst.
Gib die für PlantVillage passende Metrik an (nicht nur Accuracy!) und begründe die Wahl mit der Klassen-Unbalance.
Diskutiere ehrlich eine Schwäche: Wo würde dein Verfahren gegen die anderen drei verlieren?

KI-Review starten

Kopiere den Prompt, öffne eine KI-deiner-Wahl (Claude, ChatGPT, Gemini, etc.), füge den Prompt ein und hänge dein Bild dran. Du bekommst eine strukturierte Rückmeldung zu den genannten Kriterien.

Du bist Prüfer einer ML-Einführungsveranstaltung. Ich habe in einem Uni-Projekt ein Klassifikationsverfahren (Random Forest, SVM, CNN oder Logistic Regression) auf dem PlantVillage-Dataset (~54.000 Blatt-Fotos, 38 Klassen, stark unbalanciert) implementiert und verteidige nun meine Verfahrenswahl. Hier ist meine Begründung:

[HIER DEINE BEGRÜNDUNG EINFÜGEN]

Bewerte kritisch wie in einer mündlichen Prüfung. Prüfe konkret: (1) Stimmt meine Beschreibung der Entscheidungsgrenze und ist sie für das Problem passend begründet? (2) Habe ich die nötige Vorverarbeitung korrekt benannt — insbesondere Feature-Skalierung bei LogReg/SVM, Pixel-Rescaling beim CNN, oder korrekt deren Wegfall beim Random Forest? (3) Ist meine Hyperparameter-Logik richtig (z.B. C/gamma-Richtung, max_features, Lernrate, n_estimators)? (4) Habe ich verstanden, warum Accuracy bei unbalancierten Klassen irreführt und macro-F1 die ehrlichere Metrik ist? (5) Ist meine genannte Schwäche real und nicht nur Pflichtübung? Erwähne, falls ich die PlantVillage-Domain-Shift-Falle (99 % im Labor vs. ~31 % auf Feldfotos) übersehen habe. Schließe mit den zwei größten Verbesserungs-Hebeln meiner Argumentation.

← Transfer Learning & Overfitting