Verschil Tussen KDD En Datamining

Verschil Tussen KDD En Datamining
Verschil Tussen KDD En Datamining

Video: Verschil Tussen KDD En Datamining

Video: Verschil Tussen KDD En Datamining
Video: Data mining ,KDD Model, difference between data mining and query tools 2024, November
Anonim

KDD versus datamining

KDD (Knowledge Discovery in Databases) is een vakgebied van de informatica, dat de tools en theorieën omvat om mensen te helpen bij het extraheren van nuttige en voorheen onbekende informatie (dwz kennis) uit grote verzamelingen gedigitaliseerde gegevens. KDD bestaat uit verschillende stappen, en Data Mining is er een van. Datamining is de toepassing van een specifiek algoritme om patronen uit data te halen. Desalniettemin worden KDD en Data Mining door elkaar gebruikt.

Wat is KDD?

Zoals hierboven vermeld, is KDD een vakgebied van de informatica, dat zich bezighoudt met het extraheren van voorheen onbekende en interessante informatie uit onbewerkte gegevens. KDD is het hele proces van proberen gegevens te begrijpen door geschikte methoden of technieken te ontwikkelen. Dit proces behandelt het in kaart brengen van gegevens op laag niveau in andere vormen die compacter, abstracter en bruikbaarder zijn. Dit wordt bereikt door korte rapporten te maken, het proces van het genereren van gegevens te modelleren en voorspellende modellen te ontwikkelen die toekomstige gevallen kunnen voorspellen. Door de exponentiële groei van data, vooral op gebieden als het bedrijfsleven, is KDD een zeer belangrijk proces geworden om deze grote schat aan data om te zetten in business intelligence, aangezien handmatige extractie van patronen in de afgelopen decennia schijnbaar onmogelijk is geworden. Bijvoorbeeld,het wordt momenteel gebruikt voor verschillende toepassingen, zoals analyse van sociale netwerken, fraudedetectie, wetenschap, investeringen, fabricage, telecommunicatie, gegevensopschoning, sport, het ophalen van informatie en grotendeels voor marketing. KDD wordt meestal gebruikt om vragen te beantwoorden als wat zijn de belangrijkste producten die kunnen helpen om volgend jaar een hoge winst te behalen in Wal-Mart ?. Dit proces bestaat uit verschillende stappen. Het begint met het ontwikkelen van inzicht in het toepassingsdomein en het doel en vervolgens het maken van een doelgegevensset. Dit wordt gevolgd door het opschonen, voorbewerken, verkleinen en projecteren van gegevens. De volgende stap is het gebruik van datamining (hieronder uitgelegd) om een patroon te identificeren. Tenslotte wordt ontdekte kennis geconsolideerd door visualisatie en / of interpretatie.sport, het ophalen van informatie en grotendeels voor marketing. KDD wordt meestal gebruikt om vragen te beantwoorden als wat zijn de belangrijkste producten die kunnen helpen om volgend jaar een hoge winst te behalen in Wal-Mart ?. Dit proces kent verschillende stappen. Het begint met het ontwikkelen van inzicht in het toepassingsdomein en het doel en vervolgens het maken van een doelgegevensset. Dit wordt gevolgd door het opschonen, voorbewerken, verkleinen en projecteren van gegevens. De volgende stap is het gebruik van datamining (hieronder uitgelegd) om een patroon te identificeren. Tenslotte wordt ontdekte kennis geconsolideerd door visualisatie en / of interpretatie.sport, het ophalen van informatie en grotendeels voor marketing. KDD wordt meestal gebruikt om vragen te beantwoorden als wat zijn de belangrijkste producten die kunnen helpen om volgend jaar een hoge winst te behalen in Wal-Mart ?. Dit proces bestaat uit verschillende stappen. Het begint met het ontwikkelen van inzicht in het toepassingsdomein en het doel en vervolgens het maken van een doelgegevensset. Dit wordt gevolgd door het opschonen, voorbewerken, verkleinen en projecteren van gegevens. De volgende stap is het gebruik van datamining (hieronder uitgelegd) om een patroon te identificeren. Tenslotte wordt ontdekte kennis geconsolideerd door visualisatie en / of interpretatie. Het begint met het ontwikkelen van inzicht in het toepassingsdomein en het doel en vervolgens het maken van een doelgegevensset. Dit wordt gevolgd door het opschonen, voorbewerken, verkleinen en projecteren van gegevens. De volgende stap is het gebruik van datamining (hieronder uitgelegd) om een patroon te identificeren. Tenslotte wordt ontdekte kennis geconsolideerd door visualisatie en / of interpretatie. Het begint met het ontwikkelen van inzicht in het toepassingsdomein en het doel en vervolgens het maken van een doelgegevensset. Dit wordt gevolgd door het opschonen, voorbewerken, verkleinen en projecteren van gegevens. De volgende stap is het gebruik van datamining (hieronder uitgelegd) om een patroon te identificeren. Tenslotte wordt ontdekte kennis geconsolideerd door visualisatie en / of interpretatie.

Wat is datamining?

Zoals hierboven vermeld, is datamining slechts een stap binnen het algehele KDD-proces. Er zijn twee belangrijke Data Mining-doelen zoals gedefinieerd door het doel van de applicatie, en ze zijn namelijk verificatie of ontdekking. Verificatie is het verifiëren van de hypothese van de gebruiker over gegevens, terwijl ontdekking automatisch interessante patronen vindt. Er zijn vier belangrijke dataminingtaken: clustering, classificatie, regressie en associatie (samenvatten). Clustering is het identificeren van vergelijkbare groepen op basis van ongestructureerde gegevens. Classificatie zijn leerregels die kunnen worden toegepast op nieuwe gegevens. Regressie is het vinden van functies met minimale fouten om gegevens te modelleren. En associatie zoekt relaties tussen variabelen. Vervolgens moet het specifieke datamining-algoritme worden geselecteerd. Afhankelijk van het doel, verschillende algoritmen zoals lineaire regressie, logistische regressie,beslissingsbomen en Naïve Bayes kunnen worden geselecteerd. Vervolgens worden interessante patronen in een of meer representatieve vormen doorzocht. Ten slotte worden modellen geëvalueerd met behulp van voorspellende nauwkeurigheid of begrijpelijkheid.

Wat is het verschil tussen KDD en datamining?

Hoewel de twee termen KDD en Data Mining intensief door elkaar worden gebruikt, verwijzen ze naar twee gerelateerde maar enigszins verschillende concepten. KDD is het algemene proces van het extraheren van kennis uit gegevens, terwijl datamining een stap is binnen het KDD-proces, dat zich bezighoudt met het identificeren van patronen in gegevens. Met andere woorden, datamining is slechts de toepassing van een specifiek algoritme op basis van het algemene doel van het KDD-proces.

Aanbevolen: