www.uhasselt.be
DSpace

Document Server@UHasselt >
Education >
Faculty of Business Economics >
Master theses >

Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/1895

Title: Kennisontsluiting ten behoeve van management uit de blogosfeer
Authors: KEUNEN, Antoon
Advisors: SCHREURS, J.
Issue Date: 2007
Publisher: UHasselt
Abstract: Door de opkomst van breedbandverbindingen en de toegenomen populariteit van onder andere Web 2.0 kan iedereen op het internet tegenwoordig over zowat alles zijn bijdrage en mening kwijt. Men kan dit doen door gebruik te maken van verschillende technologieën waaronder weblogs. Momenteel zijn er al meer dan 70 miljoen weblogs. Samen vormen ze een soort sociaal netwerk: de blogosfeer. Er zijn al verschillende onderzoeken gebeurd naar de invloed die de blogosfeer heeft op de publieke opinie. De resultaten lopen erg uiteen zodat het op dit moment nog moeilijk is om hier een definitieve uitspraak over te doen. Weblogs hebben echter al voldoende bewezen dat ze een bepalende factor kunnen zijn. De blogosfeer bevat een enorme hoeveelheid informatie over een erg breed aantal zaken. De blogosfeer onder het licht houden kan voor bedrijven interessante informatie aan het licht brengen. Bedrijven kunnen door het oprichten van een corporate blog zelf deel gaan uitmaken van de blogosfeer. Slechts weinig bedrijven hebben op dit moment deze stap gezet. Naast heel wat potentiële voordelen stelt het bedrijf zich ook bloot aan mogelijke gevaren die moeilijk zijn in te schatten. Indien een bedrijf geconfronteerd wordt met een groot aantal berichten, kan het nodig zijn om te kiezen voor een gerichte aanpak. Een eerste mogelijkheid is om relevante invloedrijke weblogs te identificeren en te volgen. Een tweede optie is om met behulp van tekstanalysesoftware kennis te ontsluiten uit weblogs. Om te verduidelijken hoe men hierbij te werk kan gaan, worden zowel text mining als web mining besproken. Text mining is het automatisch ontsluiten van kennis uit tekstuele data. Web mining focust zich op het ontsluiten van kennis uit data op het internet. Voor het praktijkgedeelte werd samengewerkt met i.Know1. Als case werd gekozen voor de heisa die afgelopen zomer ontstond toen enkele Dell laptops in brand schoten. De blogosfeer speelde een bepalende rol om dit probleem in de aandacht te krijgen. Dell kondigde hierdoor een van de grootste terugroepingen uit de recente geschiedenis aan. Met behulp van PHP-code werd een lijst bekomen met 6.997 URL’s van blogposts die tussen 22 juni en 1 oktober deze zaak aanhaalden. Bij 3.490 hiervan kon de inhoud van de blogpost worden weggeschreven naar een txt-bestand. Zonder de teksten zelf te analyseren kon reeds een en ander geconcludeerd worden uit onder andere het aantal posts per dag en de pagina’s waarnaar werd gelinkt. Een sentiment classification werd uitgevoerd door gebruik te maken van de ‘General Inquirer’2 aan de hand van de categorieën ‘positiv’ en ‘negativ’ in de ‘Harvard-IV-4 dictionary’. Deze methode heeft een aantal zwakke punten. Eén daarvan is de behandeling van woordgroepen. Aan de hand van de methode die i.Know hanteert om zinnen in te delen in clusters werd gekeken in hoever het mogelijk is dit te verbeteren. i.Know identificeerde een groot aantal clusters in de blogposts die waarschijnlijk een positieve of negatieve connotatie hebben. Een deel hiervan werd handmatig ingedeeld als ‘positief’, ‘neutraal’ of ‘negatief’. Aan de hand hiervan werd een sentiment classification uitgevoerd. De behaalde resultaten werden vervolgens vergeleken met de resultaten behaald door de ‘General Inquirer’. 1 www.iknow.be; 2 http://www.wjh.harvard.edu/~inquirer
Notes: 3de Jaar Handelsingenieur - Beleidsinformatica
URI: http://hdl.handle.net/1942/1895
Category: T2
Type: Theses and Dissertations
Appears in Collections: Master theses

Files in This Item:

Description SizeFormat
N/A1.44 MBAdobe PDF

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.