Imbalanced Data
Eines der häufigsten Probleme beim Trainieren von Machine Learning Modellen sind unbalancierte Daten, also ein Datensatz, in dem die Klassen stark ungleich verteilt sind. Wenn …
Data Science, Machine Learning, AI
Eines der häufigsten Probleme beim Trainieren von Machine Learning Modellen sind unbalancierte Daten, also ein Datensatz, in dem die Klassen stark ungleich verteilt sind. Wenn …
In vielen realen Anwendungen sind Zusammenhänge zwischen Variablen nichtlinear. Klassische lineare Regressionsmodelle können solche Zusammenhänge nicht adäquat erfassen. Trotzdem gibt es auch in linearen Regressionsmodellen …
In vielen Machine Learning Modellen wird zum Optimieren der Parameter das Gradientenabsteigsverfahren angewendet. Besonders bei neuronalen Netzen ist dieses Verfahren ein wichtiger Standard. Aber auch …
Konfidenzintervalle legen den Bereich fest, in der ein Wert mit einer bestimmten Wahrscheinlichkeit fällt. Üblich ist das 95%-Konfidenzintervall. Man erwartet, dass der Wert mit 95%iger …
Baumbasierte Verfahren wie bspw. XGBoost (Extreme Gradient Boosting) sind die mit am weitesten verbreiteten Machine-Learning-Frameworks. Fast alle Data Scientisten kennen mindestens eines dieser Framework und …