Data Mining - Einführung in Data Mining

 

Aktuelles (02.06.2020): Für Übungsblatt 6 wird der neu hinzugefügte "Special Topics" Foliensatz benötigt. Die bereits hochgeladenen Aufzeichnungen aus Vorlesungsblock 6 werden für Übungsblatt 7 benötigt. Falls euch Diskrepanzen dieser Art auffallen sollten, kontaktiert uns bitte rechtzeitig, damit wir reagieren können. Für die Verwirrungen diese Woche entschuldigen wir uns.

 
 

 

Termine

TagZeitRhythmusZeitraumRaumLehrpersonBemerkungMax. Teilnehmer/-innen
Vorlesung (V) - Termine:
Mo. 15:00 bis 17:00 wöchentlich G29-336 (30 Pl.) Beyer   70
Übung (Ü) - Termine: Gruppe 1
Di.09:00 bis 11:00wöchentlichG29-K059 (24 Pl.) Schleicher

Beginn: 20.04.2020

Übung (Ü) - Termine: Gruppe 2
Mi.11:00 bis 13:00wöchentlichG22A-211 (40 Pl.)Tutor

Beginn: 20.04.2020

Übersicht (from LSF)

Lerninhalte

Data Mining liefert den Werkzeugkasten, auf dem Empfehlungssysteme, Kampagnenmanagementsysteme oder Entscheidungsunterstützungssysteme ihre Lösungen bauen.

Die Systeme, die wir in einer Wirtschaftsinformatik-Vorlesung wie ITO besprechen, sammeln Daten und bearbeiten Daten. Sie liefern dem Entscheidungsträger Berichte und Statistiken, und vor allem Modelle, die aus den Daten abgeleitet wurden. 

 

  • Ein Entscheidungsträger bestimmt unter anderem, welche Produkte den Internet-Kunden angeboten werden sollen und zu welchen Konditionen.
  • Er bestimmt, unter welchen Bedingungen einem Kunden ein Produkt empfohlen wird bzw. ob der Kunde Werbung bekommt und in welcher Form.
  • "Er" kann ein Mensch sein oder ein intelligenter Dienst – ein Teil von einer Empfehlungsmaschine.

 

Solche Bestimmungen basieren auf Modelle, die die Kundeninteressen, Präferenzen, Preissensitivität usw beschreiben, ihr Verhalten in jedem Verkaufskanal und ihre Ähnlichkeit zu anderen Kunden. Diese Modellewerden genutzt, um das geeigneteste Produkt oder einen passenden Dienst einem Kunden anzubieten.

 

In der Bachelor-Vorlesung "Data Mining" besprechen wir Methoden zur Ableitung von Modellen aus Daten. Wir besprechen Methoden zur 

 

  • Klassifikation (Beispielanwendungen: Spam-Erkennung, Bonitätsprüfung)‏
  • Clustering (Beispielanwendungen: Ableitung von Kundenprofilen, Erkennung von Ausnahmesituationen)‏
  • Assoziationsregeln (Beispielanwendungen: Warenkorbanalyse für Cross/Up-Selling, Empfehlungssysteme)

 

Kurzkommentar

 Bitte nutzen Sie die LSF-Belegungsfunktion.

 

Literatur

Pan-Ning Tan, M. Steinbach, Vipin Kumar.
 Introduction to Data Mining. 2004

Auswahl von wiss. Artikeln, Angaben zum Semesterbeginn

Bemerkung

 

 

Voraussetzungen

Keine inhaltlichen Voraussetzungen.

Leistungsnachweis

Voraussetzung für die Teilnahme an die Abschlussprüfung ist die erfolgreiche Durchführung von Vorleistungen im Rahmen einesVotierungsverfahrens.Angaben zu den Vorleistungen, darunter Anzahl und Termine der Testate, Untergrenze zum Bestehen eines Testats und Anzahl der zu bestehenden Testate im Rahmen des Votierungsverfahrens werden zum Semesterbeginn angekündigt.

Zielgruppe

WPF CV;B ab 4

WPF CV;i ab 4

WPF CSE;B ab 4

WPF DKE;M 1-3

WPF IF;i ab 4

WPF IF;B ab 4

WPF INGIF;i ab 4

WPF WIF;i ab 4

WPF WIF;B ab 4

WPF Statistik; M 1-3

Beschreibung Data Mining - Einführung in Data Mining

 FAQ

 Frequently Asked Questions

 E-Vorlesung

Willkommensvideo von Professorin Spiliopoulou

Vorlesung 1 - EInführung und Naive Bayes

  1. Einführung Klassifikation
  2. Naive Bayes 1
  3. Naive Bayes 2
  4. Naive Bayes 3
  5. Naive Bayes 4
  6. Folien

Vorlesung 2 - Entscheidungsbäume

  1. Entscheidungsbäume 1
  2. Entscheidungsbäume 2
  3. Entscheidungsbäume 3
  4. Entscheidungsbäume 4

Vorlesung 3 - Evaluation und Rückblick

  1. Evaluation 1
  2. Evaluation 2
  3. Evaluation 3
  4. Rückblick

Vorlesung 4 - Clustering K-Means

  1. Einführung
  2. K-Means
  3. Folien zu Clustering

Vorlesung 5 - Hierarchisches Clustering, Dichte basiertes Clustering und Cluster Evaluation

  1. Ähnlichkeitsfunktionen
  2. Hierarchisches Clustering 1
  3. Hierarchisches Clustering 2
  4. Dichte basiertes Clustering
  5. Clustering Evaluation 1 (Selbststudium nicht Teil der Übung, aber der Prüfung!)
  6. Clustering Evaluation 2 (Selbststudium nicht Teil der Übung, aber der Prüfung!)
  7. Clustering Evaluation 3 (Selbststudium nicht Teil der Übung, aber der Prüfung!)

Vorlesung 6 -  Datenvorverarbeitung etc.

  1. Einführung
  2. Attributes 1/2
  3. Attributes 2/2
  4. Data Quality
  5. Similarity Measures 1/4
  6. Similarity Measures 2/4
  7. Similarity Measures 3/4
  8. Similarity Measures 4/4
  9. Data Preparation 1/2
  10. Data Preparation 2/2
  11. Folien zum Block Daten

Update (02.06.2020)

Special Topic: Imbalanced Classes, ROC, Cost Sensitive Classification (benötigt für ÜB 6)

 

Vorlesung 7 - Assoziationsregeln und Frequent Item Sets

  1. Einführung
  2. Apriori Algorithmus
  3. Support, Confidence und Lift
  4. Graphbasierter Algorithmus
  5. Maximal und Closed Item Sets
  6. Umgang mit dubiosen Regeln
  7. Abschluss
  8. Folien

 

Exercise

 

Last Modification: 13.04.2021 - Contact Person: