Imbalanced Data
Eines der häufigsten Probleme beim Trainieren von Machine Learning Modellen sind unbalancierte Daten, also ein Datensatz, in dem die Klassen stark ungleich verteilt sind. Wenn …
Data Science, Machine Learning, AI
Eines der häufigsten Probleme beim Trainieren von Machine Learning Modellen sind unbalancierte Daten, also ein Datensatz, in dem die Klassen stark ungleich verteilt sind. Wenn …
In den meisten Machine-Learning-Projekt kommt irgendwann der Moment, an dem die Datenaufbereitung unübersichtlich wird: Man hat mehrere Schritte zur Vorverarbeitung, unterschiedliche Feature-Typen und Modelle, die …
Beim Trainieren von Machine-Learning-Modellen entsteht schnell eine Vielzahl an Varianten: unterschiedliche Hyperparameter, Trainingsdaten, Modelle und Evaluationsmetriken. Um den Überblick zu behalten, ist Experiment Tracking unerlässlich. …
Baumbasierte Verfahren wie bspw. XGBoost (Extreme Gradient Boosting) sind die mit am weitesten verbreiteten Machine-Learning-Frameworks. Fast alle Data Scientisten kennen mindestens eines dieser Framework und …
Grundidee SHAP (SHapey Additive exPlanations) messen den Beitrag von Features zur Gesamtvorhersage in Machine-Learning-Modellen. Sie basieren auf der Spieltheorie und messen dort den fairen Beitrag …