Machine Learning
Übersicht und Fachbereich
Machine Learninig teilt viele Methoden mit der Veranstaltung Data Mining. Hierbei kann zwischen supervised, unsupervised und reinforcement learning unterschieden werden. Anspruchsvolle Methoden, wie Deep Learninig Verfahren werden zur Regression und Klassifikation verwendet. Gerade der Umgang mit Bild und Textdateinen und deren quantitaitve verarbeitung in der Bilderkennung bzw. im Text Mining werden immer relevanter.
Beispiele für Machine Learning Verfahren:
- Supervised learning
- Predictive vs. Explanatory modelling , performance measurement
- Regularization (ridge, lasso, elastic net) and feature engineering
- Tree-based modelling (CART, bagging, random forests)
- NN, recurrent NN and deep learning
- Support vector machines (SVM) and Bayes’s classifiers
- Ensemble methods and super learners (boosting, stacking)
- Interpretable Machine Learning (LIME, Shapley)
- Unsupervised learning
- Clustering and pattern detection
- Advanced clustering techniques
- PCA as a dimension reduction technique
- Basics of Reinforcement learning
- Text Mining
- Basics of Image Processing (recognition) and CNN
Datensatzquellen
Eine Abschlussarbeit kann auch ausgehend von einem Datensatz bearbeitet werden. Hier eine Reihe möglicher Datensatzquellen:
Anforderungen
Sämtliche Themenstellungen sollen neben den theoretischen Grundlagen (d.h. der Modellbildung und den Modellannahmen) einen empirischen Teil aufweisen, in dem ein reeller, themenbezogener Datensatz mittels einer Programmiersprache (Python oder R) ausgewertet wird.
Literature
- Backhaus et al., 2011, Multivariate Analysemethoden – eine anwendungsorientierte Einführung, Springer
- Backhaus et al., 2011, Fortgeschrittene Multivariate Analysemethoden – eine anwendungsorientierte Einführung, Springer
- James et al.; An Introduction to Statistical Learning - with Applications in R; 2013; Springer
- Download-Link
- Hastie et al.; The Elements of Statistical Learning – Data Mining, Inference and Prediction; 2009; Springer
- Rencher, Methods of multivariate analysis, 2002, John Wiley & Sons Inc.
- Nisbet et al., 2009, Handbook of Statistical Analysis and Data Mining Applications, Academic Press
- Hand et al., 2001, Principles of Data Mining, The MIT Press
- Runkler, 2010, Data Mining: Methoden und Algorithmen intelligenter Datenanalyse, Vieweg+Teubner
- Bishop, Pattern Recognition and Machine Learning, 2006, Springer
- Fahrmeir et al., Regression – Modelle, Methoden und Anwendungen, 2007, Springer
- Tutz, Regression for Categorical Data, 2012, Cambridge Verlag
- Toutenburg, Lineare Modelle – Theorie und Anwendungen, 2003, Physika Verlag
- Kaufman, Rousseeuw; Finding Groups In Data – An Introduction to Cluster Analysis; 1990; Wiley&Sons
- Breiman et al., Classification and Regression Trees, 1998, Chapman & Hall
- …