Erstellung eines Modells zur Vorhersage der
Wirtschaftlichkeit von Kinofilmen mittels Data Mining
Ablauf der Datenanalyse
Filmeigenschaften
1. Vorbereitung
• Auswahl der Daten
• Extrahieren der Daten aus Quellen
• Einheitliches Format  MySQL-Datenbank
• Merkmalsgenerierung
mit Hilfe PHP & MySQL
Feiertage
M-V
Wetter
Schwerin
MySQL-Datenbank
Kassensystem
Kino
Schulferien
M-V
Rohdaten
Beispiel: Clustern der Wochentage
2. Vorverarbeitung
• Analyse der Rohdaten
• Löschen nicht brauchbarer Daten
• Clustern von Merkmalsausprägungen
• Ergänzen fehlender Daten
• Korrigieren falscher Werte
• Transformieren für Data-Mining-Verfahren
Mo-Mi-Do
Kinotag
Freitag
3. Mustererkennung
• Maschinelles Lernen durch
WEKA
• Visualisierung
• Klassifikation
• Entscheidungsbäume
• Neuronales Netz
Samstag
Sonntag
J48-Entscheidungsbaum
Klassen:
Y – Überdurchschnittlich
N – Unterdurchschnittlich
Mo-Mi-Do
nein
<=2
<=12
Y
>12
N
Y
Sonntag
Temperatur
<=17
Y
Feiertag
>17
ja
Y
Altersfreigabe
>2
4. Nachbereitung
• Interpretation
• Entscheidungstabelle
• Dokumentation
• Auswertung
Mit den verwendeten Daten und Verfahren
konnten Muster gefunden werden, die auf
die Wirtschaftlichkeit von Kinofilmen deuten.
 Mustererkennung möglich
 viele Einflussfaktoren noch unberücksichtigt
 Vorhersagemodell generierbar
Fakultät für
Wirtschaftswissenschaften
Jens Möller
Bachelor-Thesis
Samstag
Altersfreigabe
ja
Spielwoche
Freitag
Kinotag
Ferientag
N
Wochentag
Betreuer:
Prof. Dr. rer. nat. Jürgen Cleve
Prof. Dr.-Ing. Uwe Lämmel
www.wi.hs-wismar.de/kiwi
nein

Methoden der Künstlichen Intelligenz in betriebswirtschaftlichen