In einem Datenwust die richtigen Zusammenhänge entdecken

20.04.2004 -  

Magdeburger Informatiker erfolgreich beim SAS Mining Challange

Folker Folkens und Mark-André Krogel, Doktoranden an der Fakultät für Informatik, konnten von 250 Teilnehmern die hervorragenden Plätze 2 und 3 bei der SAS Mining Challenge 2003 belegen. Mark-A. Krogel musste nach seinem Sieg im Vorjahr nun diesen Rang an Torsten Hildebrandt von der TU Ilmenau abgeben. Der zweitplatzierte Folker Folkens, seit kurzem wissenschaftlicher Mitarbeiter an der Fakultät, nahm an diesem Wettbewerb erstmalig teil. Ende Februar 2004 wurden die Preise überreicht.

Die SAS Mining Challenge ist ein Wettbewerb für Studierende und Hochschulangehörige in Deutschland, Österreich und der Schweiz, bei dem die Teilnehmer in Daten verborgene Zusammenhänge aufspüren sollen. Im November 2003 wurden sowohl Software von SAS als auch Daten zur Analyse an die Teilnehmer verschickt. Anfang Januar 2004 waren die Lösungen per Internet einzureichen.

Die Software gehört zu den marktführenden Systemen für die Datenanalyse. Die Daten wurden von einem großen deutschen Medien-Unternehmen zur Verfügung gestellt, selbstverständlich in anonymisierter Form. Sie enthielten Beschreibungen von etwa 100000 Kunden.

Durch Wettbewerbe wie die SAS Mining Challenge wird den Studierenden eine hervorragende Möglichkeit geboten, das in den Vorlesungen angebotene Wissen in ein reales Problem in die Praxis umzusetzen. Diese große Chance wird an der Magdeburger Informatik-Fakultät in den Lehrveranstaltungen unter der Leitung von Prof. Dr. Myra Spiliopoulou genutzt. Seit dem Sommersemester 2003 bietet sie regelmäßig eine Lehrveranstaltung an, in der Studierende für die Teilnahme an einen Wettbewerb im Bereich der Datenanalyse vorbereitet werden. Wie bereits im vergangenen Sommersemester für den Data Mining Cup 2003 wurden auch im aktuellen Wintersemester für die SAS Mining Challenge die Studierende im angebotenen Data Mining-Intensivkurs befähigt, eine Aufgabe aus der Praxis mit Methoden der Datenanalyse zu lösen. Es zeigte sich, dass Wettbewerbe die Motivation der teilnehmenden Studierenden erhöhen und zu vertieften Erkenntnissen auch über theoretische Aspekte des Wissenschaftsgebietes führen.

Potenzielle Kunden finden

Die Wettbewerbe zur Datenanalyse befassen sich mit aktuellen Problemen aus der Unternehmenspraxis. So war Thema der diesjährigen SAS Mining Challenge die Identifizierung jener Kunden, die mit höchster Wahrscheinlichkeit eine vorgegebene Illustrierte abonnieren werden. Zu einer Anzahl von etwa 40000 Kunden wurden Informationen bereitgestellt wie z. B. die Postleitzahl, vorhandene Abonnements für verschiedene Wochenzeitschriften und eben die Angabe, ob eine bestimmte Illustrierte abonniert wurde. Es sollten dann Einflüsse der rund 100 gegebenen Merkmale der Kunden auf den Wert dieser Variablen gefunden werden. Dieses Wissen sollte dann verwendet werden, um aus weiteren etwa 60000 Kunden – nun ohne Angabe zum interessierenden Abo – genau 10000 auszuwählen, die am wahrscheinlichsten ebenfalls jene
Illustrierte abonniert haben. Beispielsweise können so Zusammenhänge der folgenden Art "entdeckt" werden: Abonnenten über 60, die auch Zeitschrift X sowie die Illustrierte Y abonniert haben und aus dem Postleitzahlenbereich 36xxx kommen, werden auch die gesuchte Illustrierte abonnieren. Folkens und Krogel gelang es hier, den Anteil von ca. 15 Prozent von Abonnenten, der bei "zufälligem Ziehen" erreicht worden wäre, auf fast 70 Prozent zu erhöhen, Hildebrandt erreichte 72 Prozent.

Mit diesem Wissen könnte eine zukünftige Werbeaktion für Abonnements kostengünstiger gestaltet werden, indem Angebote nur an potenzielle Abonnenten verschickt werden. Als Nebeneffekt würden die Uninteressierten nicht mit diesem Material "belästigt". Eine weitere Anwendung des neu gewonnenen Wissens könnte sich bei der weiteren Gestaltung der Illustrierten niederschlagen, z. B. bei der Auswahl von Anzeigerubriken.

Letzte Änderung: 20.04.2004 - Ansprechpartner: Webmaster