Prediktiv Analytics-process i Business Analytics med R



Bloggen ger en kort uppfattning om Predictive Analytics-processen i Business Analytics med R

Typisk modelleringsprocess:

I en typisk modelleringsprocess är det viktigt att börja rita en hypotes. En RFP (begäran om förslag) tas emot och sedan ritas en hypotes.





  1. Bestäm rätt datakälla - Här kan kunden ge datakälla, om inte, måste vi leta efter en datakälla. Med tanke på ett scenario där vi försöker utvärdera vem som skulle vinna valet görs en offentlig analys av data med källor som inkluderar sociala medier, nyhetskanaler eller opinion. Vi måste också förstå mängden data som behövs för att analysera problemet. I det här fallet letar vi vanligtvis efter stora prover, eftersom det är ett valfall. Å andra sidan, om analysen görs på Healthcare, är det svårt att gå för en stor befolkning eftersom det finns en möjlighet att inte få tillräckligt många människor för att validera hypotesen. Datakvaliteten är också mycket viktig.
  2. Extrahera data - Om vi ​​till exempel tar ett populationsprov kan vi titta på attribut, såsom hög inkomst, låg inkomst, ålder, arbetande befolkning (utanför / på plats), invånare, NRI, sjukhusdäckning etc. för att inleda studien . Här behöver vi kanske inte så många attribut för hypotesen. Vi förstår att attribut, som hög och låg inkomst, kanske inte är de bidragande faktorerna för att avgöra vem som vinner valet. Men ålder kan göra skillnad eftersom det ger en direkt räkning av hur många som ska rösta. Många gånger kan vi utesluta mindre använda attribut eller inkludera attribut som är användbara. Det kan gå fel i båda fallen. Det är anledningen till att analys är en utmaning.
  3. Massera datan så att den passar verktyget - Detta beror på att inte alla verktyg kan acceptera all data. Vissa verktyg accepterar endast CSV-data eller excel-data. Brist på verktyg är en utmaning.
  4. Kör analysen - Denna operation kan utföras med många analystekniker.
  5. Dra slutsatser - Analysen ger ut siffror för att vara exakt. Men det är upp till en användare att dra slutsatser av dessa siffror. Till exempel, om det står 10% eller 20%, måste vi förstå vad det betyder? Har det samband mellan attribut A och attribut B?
  6. Implementera resultat - Det är viktigt att genomföra slutsatser för att se resultat i affärer. Till exempel kan man dra slutsatsen att ”Folk köper paraply under regnperioden” vilket kan leda till fler affärer. Här måste vi implementera slutsatser där vi gör paraply, tillgängliga i butiker, men då kan det ha ledningsproblem. När statistiken ger resultat kan implementeringen gå fel.
  7. Övervaka framstegen - Det sista steget här, övervakning spelar en viktig roll. Övervakning kan gå fel eftersom inte många organisationer vill övervaka framstegen och det anses vara ett försumligt steg. Men övervakning är viktigt eftersom vi kan förstå om vår forskning och slutsatser går i rätt riktning.

Kolla även in den här artikeln'' Korrelation betyder inte orsak ''vilket ger en inblick i hur analytiker kan gå fel. En viktig punkt att notera i detta diagram är att Running Analysis är det enda steget där maskinen är ansvarig och utöver det är det upp till en människa som i slutändan kommer att avgöra hur forskningen görs.

Har du en fråga till oss? Nämn dem i kommentarfältet så återkommer vi till dig.



Relaterade inlägg: