Statistisk modellering i affärsanalys med R



Den här bloggen belyser den statistiska modellen i Business Analytics med R

Affärsanalys med R

Kärnfokus för Business Analytics är att utveckla nya insikter i verksamheten och att bedöma prestanda. Det har talats tillräckligt mycket om Business Analytics och dess olika tekniker. Det som krävs mest är en grundlig förståelse för hur statistik tillämpas i Business Analytics.





Vad är statistisk modellering?

Statistisk modellering är formaliseringen av relationer mellan variabler i form av matematiska ekvationer. Det handlar i princip om att ta reda på variabeln. Den beskriver hur en eller flera variabler är relaterade till en eller flera andra variabler. Här är variablerna inte exakt relaterade men kan vara stokastiskt relaterade.

I enklare termer är en variabel inget annat än ett attribut. Ett attribut blir en persons längd, vikt och ålder. Höjd och ålder är sannolik till sin natur. En 30-årig person har större chanser att vara 4 fot lång. På samma sätt, när du är medveten om en person som är 13 år, har han större chanser att vara 6 fot lång.



Hela syftet med statistisk modellering handlar inte om forskningen, det handlar i slutändan om att ge en inblick i lösningar. Det handlar om att analysera data och tillämpa den under olika omständigheter. Teman som diskuteras i videon är följande:

1. Vad är statistisk modellering
2. Vad är regressionsmodellering
3. Förstå Analytics

Vad är regressionsmodellering?

Som nämnts i ovanstående rader om statistisk modellering är en viktig och grundläggande faktor i denna teori regressionsmodellering. Regressionsmodellering handlar om att skaffa förhållandet mellan två variabler. Mer specifikt hjälper regression en att förstå hur värdet på den beroende variabeln ändras medan någon av den oberoende variabeln varierar, medan de andra oberoende variablerna hålls fasta. Till exempel är tid en oberoende variabel medan försäljning och hastighet är beroende av vissa faktorer. Därför är målet att ta reda på förhållandet mellan de två.



Det finns vissa ekvationer i regressionsmodellen, det är den linjära, multivariata och logistiska regressionen. Logistisk regression liknar regression där det finns två variabler och klassificerar sig därför som en sannolik statistisk modell. Den används för att beskriva parametrarna för en kvalitativ svarsmodell.

I diagrammet som nämns i videon introducerar linjen två begrepp - ett som är på linjen och det andra som inte är. De som är borta från linjen har ett fel. Detta är avståndet mellan det verkliga värdet (blå prickar) och det förutspådda värdet (den svarta linjen). Målet med modellering, vare sig det är i någon form, är att minimera dessa fel, det vill säga att försöka överbrygga klyftan mellan de två. Det finns andra tekniker för att förstå teorin.

Förstå Analytics i Business

Hela analysen fungerar till tre enkla modeller - förutsägbar, beskrivande och beslutsmodell. Som namnet antyder gör det att man kan förstå framtiden. Till exempel kommer systemfel, kreditvärdighet, bedrägeri under den förutsägbara modellen som vinner världsomspännande popularitet idag. Å andra sidan finns det beskrivande och beslutsmodeller som har funnits länge. En beskrivande modell gör det möjligt för en att karakterisera uppgifterna, där ett lands BNP och den genomsnittliga livslängden kan uppskattas. Det är också utforskande till sin natur, där en kund tillhandahåller data och problemet analyseras. Kunden får en inblick i problemet och sedan används beslutsmodellen varefter vissa optimeringar föreslås. Modellen har ett mål som bara är optimering.

hashmap-implementering i java-exempel

Har du en fråga till oss? Nämn dem i kommentarfältet så återkommer vi till dig.

Relaterade inlägg: