Övervakad lärande i Apache Mahout



Supervised Learning är en teknik för maskininlärning, där en funktion härleds från de märkta exemplen på träningsdata.

Supervised Learning är metoden, där träningsdata inkluderar både input och önskade resultat. Att träna systemet med exempel kallas övervakat lärande. Annars kan träning av algoritmen med en lärare också behandlas som övervakat lärande. Efter att ha tränat algoritmen med all exempeldata eller märkt data, som har både prediktorerna på målvariabeln, kan man träna algoritmen och använda det osedda exemplet för vidare klassificering.





hur man konverterar decimal till binär i python

Här är några av de viktiga funktionerna i Supervised Learning in Mahout:

  • Konstruktionen av en korrekt utbildning, validering och testuppsättning (Bok) är avgörande.
  • Dessa metoder är vanligtvis snabba och korrekta.
  • De övervakade inlärningsmetoderna måste kunna generalisera.
  • De ger korrekta resultat när nya data ges i input utan att veta apriorimål.
  • I vissa fall är de korrekta resultaten (målen) kända och ges i input till modellen under inlärningsprocessen.

Exempel på övervakat lärande

Om du vill träna ett uppdrag och du får två olika grupper av bilder tillsammans med de märkta uppgifterna, t.ex. i bilden ovan har en grupp bilder av en elefant och den andra har bilder av ett lejon. Märkt data innebär att varje datamängd har ett målvärde. I exemplet ovan är datauppsättningen bilder av elefanter, medan den etikett som ges till den, dvs ”Elefant” är målvärdet för datamängden. Sådan märkt datamängd används för träningsprocessen, så att träningsalgoritmen kan utnyttja denna datamängd och bygga någon modell, som kan användas vidare för att klassificera de osedda exemplen utan märkta data eller målvariabel.



Låt oss identifiera de funktioner som hjälper till att identifiera ett objekt som en elefant eller ett lejon:

Funktionerna kan vara - storlek, färg, höjd, öronstorlek, bagageutrymme, brosk

Detta kan kallas en funktionsuppsättning, som kommer att användas för träningsändamålet. Denna funktionssats kommer att påverka den slutliga målvariabeln. Dessa variabler är kända som prediktorvariabler , eftersom de hjälper oss att bestämma slutlig målvariabel . Den slutliga variabeln kan också kallas en etikett. Den slutliga variabeln här är Elephant / Lion.



table-word

I detta exempel är var och en av posterna i kategorierna, storlek, färg, höjd, öronstorlek, bagageutrymme och brosme en prediktorvariabel, medan Elephant och Lion är målvariablerna. Dessa variabler kan behandlas som träningsexempel respektive träningsdatamängder.

Således är övervakad lärande ett sätt genom vilket du tränar tillsammans med etiketterna, där du ber algoritmen att extrahera vissa funktioner ur den, och baserat på det, när du ser ett osynligt exempel, kommer algoritmen att kunna klassificera den in i rätt klass.

Har du en fråga till oss? Nämn dem i kommentarfältet så återkommer vi till dig.

hur man gör en dubbel till en int

Relaterade inlägg: