Modelleringstekniker i affärsanalys med R



Bloggen ger en kort introduktion av modelleringstekniker i affärsanalys med R.

Olika modelleringstekniker:

Vi kan dela upp alla problem i mindre processer:





Klassificering - är, där vi klassificerar uppgifterna. T.ex. sjukdomar alla sjukdomar uppvisar visst beteende, och vi kan klassificera dem ytterligare.

Till exempel: sjukdomar som minskar immuniteten, sjukdomar som ger huvudvärk etc.



Regression - innebär att ta reda på sambandet mellan flera variabler.

Till exempel: hur en människas vikt är relaterad till hans längd.

AnomolyUpptäckt - är i grunden en fluktuation.



hur man vänder en strängpython

Till exempel: Vid hög eller låg spänning.

Ett annat exempel kan inkludera reglerat beteende som innebär körning på höger eller vänster sida baserat på land. Anomolen här är någon som kör från det motsatta.

Ett annat exempel kan vara nätverksintrång. Här loggar en autentiserad användare in på ditt företags webbplats, och om någon obehörig loggar in är det enAn0moly.

Attributets betydelse - Det ger i princip flera attribut, som höjd, vikt, temperatur, hjärtslag. En sak att notera är att alla dessa attribut är viktiga för en uppgift.

Till exempel: Någon försöker förutsäga, vid vilken tidpunkt en person når kontoret. Varje attribut spelar en viktig roll men inte alla attribut är viktiga.

Föreningsregler - I enklare termer är det att analysera eller förutsäga nästa beteende, där det kretsar kring rekommendationsmotorn.

Till exempel: En person som köper bröd kan också köpa mjölk. Om vi ​​analyserar tidigare shoppingbeteenden har alla artiklar i korgen en relation. I det här fallet kan det finnas en sannolikhet att den som köper bröd också köper mjölk.

Kluster - Det är en av de äldsta teknikerna inom statistik. I själva verket kan man alltid modellera alla problem, vare sig det är klassificering eller kluster, vilket innebär att man grupperar liknande enheter.

Till exempel:

1) Ta en korg med äpplen och apelsiner, där vi kan separera äpplen från apelsiner.

2) Ett viktigt användningsfall för kluster är hälso- och sjukvård. Nästan all statistik och analys startade med användningsfall av vård. För att gå djupare finns det ett klustertermer som kallas kohorter (personer med liknande sjukdomar), så att de kan studeras separat från befintliga kunder. Till exempel, om 10 personer lider av feber och ytterligare 10 personer av huvudvärk, kommer vi att hitta vad som är vanligt mellan dem och generera medicin.

Särdragsextraktion - I exaktionsegenskaper är noggrannhet, validitet och fel ganska relevant. Med andra ord kan funktionsextraktion kallas mönsterigenkänning.

Till exempel:

När en användare anger en term i Google-sökning kommer den upp med resultat. Nu, en viktig fråga som ska ställas är hur visste den, vilken sida är relevant och inte relevant för termen? Detta kan besvaras med funktionsextraktion och mönsterigenkänning, där det lägger till framstående funktioner. Låt oss säga att ett foto ges, vissa kameror upptäcker ansikten, markerar ansiktet för att ge vackra bilder, som också använder funktionsigenkänning.

skillnad mellan forskarutbildning och magisterexamen

Övervakat lärande vs Övervakat lärande

till) Förutsägelsekategori - Teknikerna inkluderar regression, logistik, neurala nätverk och beslutsträd. Några exempel inkluderar upptäckt av bedrägerier (där en dator lär sig och förutspår nästa bedrägeri från tidigare bedrägerihistorik). I icke övervakat lärande kan man inte förutsäga med exempel eftersom det inte finns några historiska data.

b) Klassificeringskategori - Om vi ​​tar ett exempel, oavsett om transaktionen är bedräglig eller inte, går den in i klassificeringskategorin. Här tar vi historisk data och klassificerar den med beslutsträd eller om vi inte tar någon historisk data alls, börjar vi direkt med data och försöker utnyttja funktioner på egen hand. Till exempel om vi behöver veta de anställda som sannolikt kommer att lämna organisationen eller sannolikt kommer att stanna. Om det är en ny organisation, där vi inte kan använda historisk data, kan vi alltid använda kluster för datautvinning.

c) Utforskningskategori - Det här är en rak metod som kommer fram till vad big data betyder. I inlärning utan tillsyn kallas det principkomponenter och kluster.

d) Affinitetskategori - här är flera element involverade som korsförsäljning / uppförsäljning, analys av marknadskorgen. I korganalysen finns det inget övervakat lärande eftersom det inte finns historiska data. Så vi tar data direkt och hittar associationer, sekvensering och faktoranalys.

Har du en fråga till oss? Nämn dem i kommentarfältet så återkommer vi till dig.

Relaterade inlägg: