Lehrinhalte : |
Data Mining
Teilnehmer: 1-2 Studierende
Möglichkeit zur Masterarbeit: ja
Vorkenntnisse: Grundlagen der Wissensverarbeitung, Interesse an maschinellem Lernen
Data Mining ist die Gewinnung bislang unbekannter und nützlicher Informationen aus Datenmengen. Im Projekt lernen Sie verschiedene Methoden und Aspekte der Suche nach Regelmäßigkeiten in Datenmengen kennen und wenden diese praxisnah an. Dabei ist es erstaunlich, wie gut bereits einfache Algorithmen interessante Regeln entdecken können. Reale Datenmengen im Projekt stammen aus dem medizinischen, sozialen und auch
industriellen Bereich und sind in der Regel mit konkreten Kundenwünschen verknüpft. Das Anwendungsproblem und die Beschaffenheit der Daten entscheiden, ob eher die Bestimmung relevanter Merkmale, die Modellierung von Zusammenhängen oder bspw. die Visualisierung im Vordergrund steht.
Literatur: Witten, Ian H. ; Frank, Eibe: Data Mining. Praktische Werkzeuge und Techniken für das maschinelle Lernen. Hanser Fachbuch, 2001 (12 Exemplare in der Bibliothek)
Datenmanagement
Teilnehmer: 1-2 Studierende
Möglichkeit zur Masterarbeit: ja
Vorkenntnisse: DBS 1 und 2, Interesse an DBS
Der Großteil aller heute verfügbaren Daten ist semistrukturiert oder unstrukturiert, z.B. Texte, Bilder oder Videos. Für diese Daten sind relationale DBS nicht gut geeignet. Im Projekt lernen Sie verschiedene NoSQL-Ansätze kennen und vertiefen dann die Anwendung eines bestimmten Systems, z.B. MongoDB, an realen Daten.
Literatur: Celko, Joe: Complete Guide to NoSQL. Morgan Kaufmann, 2013
Algorithmen für Big Data
Teilnehmer: 1-2 Studierende
Möglichkeit zur Masterarbeit: ja
Interesse an Algorithmen und Datenstukturen
Für "Big Data" haben sich spezielle Algorithmen und Datenstrukturen entwickelt. Oft sind diese probabilistischer Natur d.h. es wird Exaktheit für bessere Laufzeit und/oder geringeren Speicherverbrauch eingetauscht. Nach dem Verschaffen eines Überblicks sollen im Projekt konkrete Implementierungen solcher Algorithmen an praktischen Beispielen evaluiert werden.
Literatur: Rajaraman Anand; Ullman Jeff: Mining of Massive Datasets. Cambridge University Press, 2011 |