Verschil Tussen Supervised En Unsupervised Machine Learning

Verschil Tussen Supervised En Unsupervised Machine Learning
Verschil Tussen Supervised En Unsupervised Machine Learning
Anonim

Belangrijkste verschil - gecontroleerd versus niet-gecontroleerd machine learning

Begeleid leren en onbewaakt leren zijn twee kernconcepten van machine learning. Supervised Learning is een Machine Learning-taak om een functie te leren die een input aan een output koppelt op basis van de voorbeeld input-output paren. Unsupervised Learning is de Machine Learning-taak waarbij een functie wordt afgeleid om een verborgen structuur te beschrijven uit niet-gelabelde gegevens. Het belangrijkste verschil tussen machinaal leren met en zonder toezicht is dat bij leren met supervisie gelabelde gegevens worden gebruikt, terwijl bij leren zonder supervisie gebruik wordt gemaakt van niet-gelabelde gegevens.

Machine Learning is een vakgebied in de informatica dat een computersysteem de mogelijkheid biedt om van gegevens te leren zonder expliciet te worden geprogrammeerd. Het maakt het mogelijk om de gegevens te analyseren en patronen erin te voorspellen. Er zijn veel toepassingen van machine learning. Sommigen van hen zijn gezichtsherkenning, gebarenherkenning en spraakherkenning. Er zijn verschillende algoritmen met betrekking tot machine learning. Sommigen van hen zijn regressie, classificatie en clustering. De meest voorkomende programmeertalen voor het ontwikkelen van op machine learning gebaseerde applicaties zijn R en Python. Andere talen zoals Java, C ++ en Matlab kunnen ook worden gebruikt.

INHOUD

1. Overzicht en belangrijkste verschil

2. Wat is

gesuperviseerd leren 3. Wat is onbewaakt leren

4. Overeenkomsten tussen supervised en unsupervised machine learning

5. Vergelijking zij aan zij - supervised vs unsupervised machine learning in tabelvorm

6. Samenvatting

Wat is begeleid leren?

In op machine learning gebaseerde systemen werkt het model volgens een algoritme. Bij begeleid leren wordt het model begeleid. Ten eerste is het nodig om het model te trainen. Met de opgedane kennis kan het antwoorden voorspellen voor de toekomstige gevallen. Het model wordt getraind met behulp van een gelabelde dataset. Wanneer een niet-steekproefgegevens aan het systeem worden gegeven, kan het het resultaat voorspellen. Hieronder volgt een klein fragment uit de populaire IRIS-dataset.

Verschil tussen begeleid en onbewaakt leren Figure 02
Verschil tussen begeleid en onbewaakt leren Figure 02

Volgens de bovenstaande tabel worden kelkbladlengte, kelkbladbreedte, patellengte, patelbreedte en soorten de attributen genoemd. De kolommen staan bekend als features. Een rij bevat gegevens voor alle attributen. Daarom wordt één rij een waarneming genoemd. De gegevens kunnen numeriek of categorisch zijn. Het model krijgt de waarnemingen met de bijbehorende soortnaam als input. Als er een nieuwe waarneming wordt gegeven, moet het model het soort soort voorspellen waartoe het behoort.

Bij begeleid leren zijn er algoritmen voor classificatie en regressie. Classificatie is het proces waarbij de gelabelde gegevens worden geclassificeerd. Het model creëerde grenzen tussen de gegevenscategorieën. Wanneer er nieuwe gegevens aan het model worden verstrekt, kan het categoriseren op basis van waar het punt zich bevindt. De K-Naaste Buren (KNN) is een classificatiemodel. Afhankelijk van de k-waarde wordt de categorie bepaald. Als k bijvoorbeeld 5 is en een bepaald gegevenspunt in de buurt van acht gegevenspunten in categorie A en zes gegevenspunten in categorie B ligt, wordt het gegevenspunt geclassificeerd als A.

De regressie is het proces waarbij de trend van de vorige gegevens wordt voorspeld om de uitkomst van de nieuwe gegevens te voorspellen. Bij regressie kan de uitvoer bestaan uit een of meer continue variabelen. Voorspelling wordt gedaan met behulp van een lijn die de meeste gegevenspunten bedekt. Het eenvoudigste regressiemodel is een lineaire regressie. Het is snel en vereist geen afstemmingsparameters zoals in KNN. Als de gegevens een parabolische trend laten zien, is het lineaire regressiemodel niet geschikt.

Verschil tussen begeleid en onbewaakt leren
Verschil tussen begeleid en onbewaakt leren

Dat zijn enkele voorbeelden van leeralgoritmen onder supervisie. Over het algemeen zijn de resultaten die worden gegenereerd met leermethoden onder supervisie nauwkeuriger en betrouwbaarder omdat de invoergegevens bekend en gelabeld zijn. Daarom hoeft de machine alleen de verborgen patronen te analyseren.

Wat is leren zonder toezicht?

Bij leren zonder toezicht wordt het model niet onder toezicht gehouden. Het model werkt op zichzelf om de uitkomsten te voorspellen. Het maakt gebruik van algoritmen voor machine learning om conclusies te trekken over niet-gelabelde gegevens. Over het algemeen zijn de leeralgoritmen zonder toezicht moeilijker dan leeralgoritmen onder toezicht omdat er weinig informatie is. Clustering is een vorm van leren zonder toezicht. Het kan worden gebruikt om de onbekende gegevens te groeperen met behulp van algoritmen. De k-gemiddelde en op dichtheid gebaseerde clustering zijn twee clusteralgoritmen.

k-gemiddelde-algoritme, plaatst k-zwaartepunt willekeurig voor elk cluster. Vervolgens wordt elk gegevenspunt toegewezen aan het dichtstbijzijnde zwaartepunt. Euclidische afstand wordt gebruikt om de afstand van het gegevenspunt tot het zwaartepunt te berekenen. De datapunten zijn ingedeeld in groepen. De posities voor k centroïden worden opnieuw berekend. De nieuwe zwaartepuntpositie wordt bepaald door het gemiddelde van alle punten in de groep. Opnieuw wordt elk gegevenspunt toegewezen aan het dichtstbijzijnde zwaartepunt. Dit proces herhaalt zich totdat de centroïden niet meer veranderen. k-mean is een snel clusteralgoritme, maar er is geen gespecificeerde initialisatie van clusterpunten. Ook is er een grote variatie aan clustermodellen op basis van initialisatie van clusterpunten.

Een ander clusteralgoritme is op dichtheid gebaseerde clustering. Het is ook bekend als op dichtheid gebaseerde ruimtelijke clusteringstoepassingen met ruis. Het werkt door een cluster te definiëren als de maximale set met dichtheid verbonden punten. Het zijn twee parameters die worden gebruikt voor clustering op basis van dichtheid. Ze zijn Ɛ (epsilon) en minimum punten. De Ɛ is de maximale straal van de buurt. De minimum punten zijn het minimum aantal punten in de Ɛ buurt om een cluster te definiëren. Dat zijn enkele voorbeelden van clustering die hoort bij leren zonder toezicht.

Over het algemeen zijn de resultaten die worden gegenereerd door leeralgoritmen zonder toezicht niet erg nauwkeurig en betrouwbaar omdat de machine de invoergegevens moet definiëren en labelen voordat de verborgen patronen en functies worden bepaald.

Wat is de overeenkomst tussen supervised en unsupervised machine learning?

Zowel supervised als unsupervised learning zijn soorten machine learning

Wat is het verschil tussen supervised en unsupervised machine learning?

Diff Artikel Midden voor Tafel

Bewaakt versus onbewaakt machinaal leren

Supervised Learning is de Machine Learning-taak om een functie te leren die een input koppelt aan een output op basis van voorbeeld input-output paren. Unsupervised Learning is de Machine Learning-taak waarbij een functie wordt afgeleid om een verborgen structuur te beschrijven uit niet-gelabelde gegevens.
Belangrijkste functionaliteit
Bij begeleid leren voorspelt het model de uitkomst op basis van de gelabelde invoergegevens. Bij leren zonder toezicht voorspelt het model de uitkomst zonder gelabelde gegevens door de patronen zelf te identificeren.
Nauwkeurigheid van de resultaten
De resultaten van begeleide leermethoden zijn nauwkeuriger en betrouwbaarder. De resultaten die worden gegenereerd met leermethoden zonder toezicht zijn niet erg nauwkeurig en betrouwbaar.
Belangrijkste algoritmen
Er zijn algoritmen voor regressie en classificatie bij begeleid leren. Er zijn algoritmen voor clustering bij onbewaakt leren.

Samenvatting - Machinaal leren onder supervisie versus niet-gecontroleerd

Supervised Learning en Unsupervised Learning zijn twee soorten machine learning. Supervised Learning is de Machine Learning-taak om een functie te leren die een input koppelt aan een output op basis van voorbeeld input-output paren. Unsupervised Learning is de Machine Learning-taak waarbij een functie wordt afgeleid om een verborgen structuur te beschrijven uit niet-gelabelde gegevens. Het verschil tussen machinaal leren met en zonder toezicht is dat bij leren met toezicht gebruik wordt gemaakt van gelabelde gegevens, terwijl bij niet-gecontroleerd leren gebruik wordt gemaakt van niet-gelabelde gegevens.

Aanbevolen: