www.uhasselt.be
DSpace

Document Server@UHasselt >
Education >
School for Information Technology >
Master theses >

Please use this identifier to cite or link to this item: http://hdl.handle.net/1942/19372

Title: Big Data Counting : Hoe kunnen we een zeer groot aantal distincte objecten efficiënt tellen?
Authors: Broeckx, Jana
Advisors: VAN DEN BUSSCHE, Jan
Issue Date: 2015
Publisher: tUL
Abstract: Een thesis waarin we bestuderen hoe we het aantal unieke items in een stream efficiënt kunnen tellen. We bekijken eerst voorkennis in verband met hashing, streaming en kanstheorie. Daarna gaan we over op het bestuderen van makkelijkere algoritmes die bv. frequenties in een stream schatten. Zodra we genoeg basiskennis hebben verworven, gaan we over de complexere distinct-count algoritmes. Uiteindelijk implementeren we twee van de distinct count algoritmes die we gebruiken om empirisch te kunnen evalueren gegeven een dataset van het bedrijf Selligent.
Notes: master in de informatica-databases
URI: http://hdl.handle.net/1942/19372
Category: T2
Type: Theses and Dissertations
Appears in Collections: Master theses

Files in This Item:

Description SizeFormat
N/A3.84 MBAdobe PDF

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.