www.uhasselt.be
DSpace

Document Server@UHasselt >
Education >
Faculty of Business Economics >
Master theses >

Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/1166

Title: Optimaliseren van e-business campagnes met behulp van data mining technieken.
Authors: NOBLESSE, Sabrina
Issue Date: 2005
Abstract: Meer en meer bedrijven willen het Internet gebruiken om klanten aan te trekken en te selecteren. Door de overvloed aan data die men via dit medium krijgt, is er nood aan technieken en methodes om deze data te analyseren en om te zetten naar informatie. Ook het verkennen en modelleren van betekenisvolle relaties en patronen die gevonden werden in de beschikbare data is belangrijk. Data mining is het verkennen en analyseren van grote hoeveelheden observationele data met als doelen het samenvatten van de data op een nuttige en begrijpbare manier voor de eigenaar van de data en het ontdekken, verkennen en modelleren van eventuele betekenisvolle relaties, regels en patronen in de beschikbare data. Observationele data zijn data die niet door een bedrijf worden aangemaakt, verzameld of bijgehouden met het doel gebruikt te worden voor data mining. Om aan data mining te kunnen doen werden er diverse data mining technieken, zoals beslissingsbomen, ontwikkeld. Iedere data mining techniek kan echter een verschillend resultaat opleveren en is niet geschikt om op alle soorten data toegepast te worden. Ook de manier waarop de resultaten van de gebruikte data mining techniek(en) beoordeeld zullen worden kan belangrijk zijn en voor verschillende uitkomsten zorgen. De situatie en het bedrijf waarin het data mining project moet uitgevoerd worden, hebben eveneens een invloed op de keuze van een bepaalde data mining techniek. Een bedrijf zal dus zijn e-business campagne proberen te optimaliseren aan de hand van zorgvuldig geselecteerde data mining technieken en evaluatiemethodes. Het kiezen van de juiste evaluatiemethode voor een specifieke data mining techniek is niet altijd evident. Er bestaan namelijk verschillende methodes om de resultaten van data mining technieken te beoordelen. Deze evaluatiemethodes kunnen bovendien ook verschillend zijn voor elke data mining techniek. Aangezien de keuze van een evaluatiemethode een invloed kan heb- iv - ben op het succes van een data mining onderzoek, is het belangrijk om de meest optimale methode te vinden. In deze thesis gaan we aan de hand van een gevalstudie onderzoeken of het sensitiviteitsalgoritme gebruikt kan worden voor het beoordelen en rangschikken van resultaten gegeven door binaire beslissingsbomen. Het sensitiviteitsalgoritme werd oorspronkelijk voorgesteld door Isabelle Alvarez in het artikel Sensitivity Analysis of the Result in Binary Decision Trees: Giving More Information to the End-user met als doel het uitvoeren van een sensitiviteitsanalyse van het resultaat van binaire beslissingsbomen zodat er meer informatie kan gegeven worden aan de eindgebruiker. In het sensitiviteitsalgoritme wordt per geclassificeerd geval de afstand tussen het geval en het bijhorende beslissingsoppervlak berekend. We veronderstellen dat deze afstand omgekeerd evenredig is met de kans dat de besslissingsboom een verkeerde classificatie heeft gedaan. We hebben onderzocht op welke manier het sensitiviteitsalgoritme kan gebruikt worden om de resultaten of classificaties gegeven door een beslissingsboom te beoordelen en de geclassificeerde gevallen te rangschikken. Met waarschijnlijkheidsschatting bedoelen we de kans dat de voorspelling die de beslissingsboom gedaan heeft juist is, of met andere woorden dat de voorspelde klasse ook de werkelijke klasse zal zijn van het specifieke geval. Afhankelijk van welke doelen men vooropstelt betreffende de gewenste resultaten zal het sensitiviteitsalgoritme, al dan niet in combinatie met de waarschijnlijkheidsschattingen, gebruikt kunnen worden om de door een binaire beslissingsboom geclassificeerde gevallen te rangschikken. Een voorbeeld van een doel is het vooropstellen dat vooral de gevallen met een weinig frequente klasse juist geclassificeerd zullen worden.
URI: http://hdl.handle.net/1942/1166
Category: T2
Type: Theses and Dissertations
Appears in Collections: Master theses

Files in This Item:

Description SizeFormat
N/A831.1 kBAdobe PDF

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.