R-handledning - En nybörjarguide för att lära sig R-programmering



Denna blogg på R Tutorial introducerar dig till R-verktyget och hjälper dig att förstå de olika grunderna för R-programmering i detalj med exempel.

R är det mest populära dataanalysverktyget eftersom det är öppen källkod, flexibelt, erbjuder flera paket och har en enorm gemenskap. Den är utformad för programvaruprogrammerare, statistiker och databearbetare, både och följaktligen med tanke på populariteten för .I denna R-självstudieblogg kommer jag att ge dig en fullständig inblick i R med exempel.

Nedan följer ämnena i denna R-självstudieblogg som jag kommer att diskutera i följande sekvens:





  1. Varför behöver vi Analytics ?
  2. Vad är Business Analytics ?
  3. Varför R och vem använder R ?
  4. Installation av R
  5. Dataoperatörer
  6. Datatyper
  7. Flödeskontroll

R-handledning: Varför behöver vi Analytics?

Innan jag svarar på frågan, låt mig informera dig om några av problemen och deras lösningar i R på flera domäner.



bank - R Handledning - Edureka

Bank :

Stor mängd kunddata genereras varje dag i banker. WNär du regelbundet hanterar miljontals kunder blir det svårt att spåra deras inteckningar.



Lösning :

R bygger en anpassad modell som underhåller de lån som ges till varje enskild kund som hjälper oss att bestämma det belopp som kunden ska betala över tiden.

Försäkring :

Försäkring beror i stor utsträckning på prognoser. Det är svårt attbesluta vilken policy som ska accepteras eller avvisas.

Lösning:

Genom att använda den kontinuerliga kreditrapporten som input kan vi skapa en modell i R som inte bara kommer att bedöma riskaptit utan också göra en förutsägbar prognos.

hur man testar en databas

Sjukvård:

Varje år läggs miljontals människor på sjukhus och miljarder spenderas årligen bara i inläggningsprocessen.

Lösning :

Med tanke på patientens historia och sjukdomshistoria kan en prediktiv modell byggas för att identifiera vem som riskerar sjukhusvistelse och i vilken utsträckning den medicinska utrustningen ska skalas.

Nu vet vi hur dataanalys hjälper organisationer att utnyttja sina data och använda den för att identifiera nya möjligheter. Om vi ​​pratar om behovet av analys i en organisation måste du stöta på dessa fyra aspekter:

Låt oss sedan gå vidare i R tutorial-bloggen, där vi först förstår vad exakt affärsanalys är.

R-handledning: Vad är Business Analytics?

Affärsanalys är en process för att undersöka stora datamängder och uppnå dolda mönster, korrelationer och andra insikter. Det hjälper dig i grunden att förstå all data du har samlat in, vare sig det är organisationsdata, marknads- eller produktforskningsdata eller någon annan typ av data. Det blir lätt för dig att fatta bättre beslut, bättre produkter, bättre marknadsföringsstrategier etc. Se nedanstående bild för bättre förståelse:

Om du tittar på figuren ovan är dina data i den första bilden spridda. Nu, om du vill ha något specifikt, till exempel en viss post i en databas, blir det besvärligt. För att förenkla detta behöver du analys. Med analys blir det lätt att hitta en korrelation mellan data. När du väl har fastställt vad du ska göra blir det ganska enkelt för dig att fatta beslut som vilken väg du vill följa eller när det gäller affärsanalys, vilken väg leder till förbättring av din organisation.

Men du kan inte förvänta dig att människor i kedjan ovan alltid förstår rådata som du tillhandahåller dem efter analys. Så för att övervinna detta gap har vi ett koncept av datavisualisering .

Datavisualisering : Datavisualisering är en visuell åtkomst till stora mängder data som du har genererat efter analys. Det mänskliga sinnet bearbetar visuella bilder och visuell grafik är bättre än att jämföra med rådata. Det är alltid lätt för oss att förstå ett cirkeldiagram eller ett stapeldiagram jämfört med rådata. Nu kanske du undrar hur kan du uppnå denna datavisualisering utifrån den data du redan har analyserat?
Det finns olika verktyg på marknaden för datavisualisering:

Ni alla måste undra på att det redan finns så många verktyg som hjälper dig att uppnå datavisualisering och viss mängd analys, varför gå med R?

Så mitt nästa ämne i R tutorial blogg handlar om 'varför R' och 'vem använder R'.

R-handledning: Varför använder R och vem R?

Varför R?

R är ett programmerings- och statistikspråk.

R används för dataanalys och visualisering.

R är enkelt och lätt att lära sig, läsa och skriva.

R är ett exempel på en FLOSS (Free Libre och Open Source Software) där man fritt kan distribuera kopior av denna programvara, läsa dess källkod, ändra den etc.

Vem använder R?

  • Consumer Financial Protection Bureau använder R för dataanalys
  • Statistiker vid John Deere använder R för modellering av tidsserier och geospatial analys på ett tillförlitligt och reproducerbart sätt.
  • Bank of America använder R för rapportering.
  • R är en del av teknikstacken bakom Foursquares berömda rekommendationsmotor.
  • ANZ, den fjärde största banken i Australien, som använder R för kreditriskanalys.
  • Google använder R för att förutsäga ekonomisk aktivitet.
  • Mozilla, stiftelsen som ansvarar för webbläsaren Firefox, använder R för att visualisera webbaktivitet.

Nedan följer några av domänerna där R används:

Låt oss gå vidare i R tutorial blogg och installera R.

R-handledning: Installation av R

Låt mig vägleda dig genom processen att installera R på ditt system. Följ bara stegen nedan:

Steg 1 : Gå till länken- https://cran.r-project.org/

Steg 2 : Ladda ner och installera R 3.3.3 på ditt system.

Se skärmdumpen nedan för att få en bättre förståelse.

Genom att följa stegen ovan är du klar med R-installationsdelen. Nu kan du direkt börja koda i R genom att ladda ner RStudio IDE. För att ladda ner detta, följ stegen nedan:

vad är en instans i java

Steg 1 : Gå till länken- https://www.rstudio.com/

Steg 2 : Ladda ner och installera Rstudio på ditt system.

Efter att ha installerat allt är du redo att koda!

R Handledning för nybörjare | R programmeringshandledning | Edureka

Låt oss sedan gå vidare i R Tutorial-bloggen och förstå vad som är dataoperatörer i R.

R-handledning: Dataoperatörer i R

Det finns huvudsakligen 5 olika typer av operatörer, som listas nedan:

  1. Aritmetiska operatörer : Utför aritmetiska operationer som addition, subtraktion, multiplikation, division etc.
  2. Uppdragsoperatörer :Tilldelningsoperatörer används för att tilldela värden. Till exempel:
  • Uppdragsoperatör =
    Syntax:
    variabelnamn = värde
> x = 5 >x 
Utgång: [1] 5
  • Uppdragsoperatör<-
    Syntax:
    variabelnamn<- value

    > x<- 15 > x
    Utgång: [1] 15
  • Uppdragsoperatör<<-
    Syntax:
    variabelnamn<<- value
> x<<- 2 > x
Utgång: [1] 2
  • Uppdragsoperatör ->
    Syntax:
    värde -> variabelnamn

    > 25 -> x > x 
    Utgång: [1] 25

3. Relationsoperatör : Det definierar en relation mellan två enheter. Till exempel: ,<=,!= etc.

> xx! = 2
Produktion:[1] SANT

4. Logiska operatörer : Dessa operatörer jämför de två enheterna och används vanligtvis med booleska (logiska) värden som &, | och!.

> x2 & 3
Produktion:[1] SANT

5. Specialoperatörer : Dessa operatörer används för specifika ändamål, inte för logisk beräkning. Till exempel:

  • Den skapar nummerserien i sekvens för en vektor.

    > xx
    Utgång: [1] 2 3 4 5 6 7 8
  • % i% Denna operator används för att identifiera om ett element tillhör en vektor.
    Exempel

    > xyy% i% x
    Utgång: [1] SANT

R Handledning: Datatyper

Datatyper används för att lagra information. I R behöver vi inte deklarera en variabel som någon datatyp. Variablerna tilldelas R-objekt och datatypen för R-objektet blir datatypen för variabeln.Det finns huvudsakligen sex datatyper i R:

Låt oss gå in på mer detaljer om var och en av dem:

Vektor : En vektor är en sekvens av dataelement av samma grundtyp. Exempel:

vtr = (1, 3, 5, 7 9)

eller

vtr<- (1, 3, 5 ,7 9)

Det finns 5 atomvektorer, även benämnda som fem klasser av vektorer.

Lista : Listor är R-objekten som innehåller element av olika typer som & minus siffror, strängar, vektorer och en annan lista inuti den.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = lista (n, s, SANT) > x

Produktion -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] SANT

Arrayer : Arrayer är R-dataobjekten som kan lagra data i mer än två dimensioner. Det tar vektorer som inmatning och använder värdena i dimparametern för att skapa en matris.

vektor1<- c(5,9,3) vektor2<- c(10,11,12,13,14,15) resultat<- array(c(vector1,vector2),dim = c(3,3,2))

Produktion -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Arrayer : Matriser är R-objekten där elementen är ordnade i en tvådimensionell rektangulär layout. En matris skapas med funktionen matris (). Exempel: matris (data, nrow, ncol, byrow, dimnames) var,

data är ingångsvektorn som blir matrisens dataelement.

nu är antalet rader som ska skapas.

ncol är antalet kolumner som ska skapas.

byrå är en logisk ledtråd. Om SANT är ordnade inmatningsvektorelementen efter rad.

dimnamn är namnen som tilldelats raderna och kolumnerna.

> Mat<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Mat
Produktion :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Faktorer : Faktorer är dataobjekten som används för att kategorisera data och lagra dem som nivåer. De kan lagra både strängar och heltal. De är användbara vid dataanalys för statistisk modellering.

> data<- c('East','West','East','North','North','East','West','West“,'East“) > faktor_data<- factor(data) > faktor_data

Produktion :

[1] East West East North North East West West East Nivåer: East North West

Dataramar : En dataram är en tabell eller en tvådimensionell arrayliknande struktur där varje kolumn innehåller värden på en variabel och varje rad innehåller en uppsättning värden från varje kolumn.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > märken = c (623,3,515,2,611,0,729,0,843,25) > std. data<- data.frame(std_id, std_name, marks) > std. data

Produktion :

std_id std_name-märken 1 1 Rick 623.30 2 2 och 515,20 3 3 Michelle 611.00 4 4 Ryan 729.00 5 5 Gary 843,25

Genom detta kommer vi till slutet av olika datatyper i R. Låt oss sedan gå vidare i R Tutorial-blogg och förstå ett annat nyckelbegrepp - flödeskontrolluttalanden.

R Tutorial: Flow Control Statements

Flödeskontrolluttalanden spelar en mycket viktig roll eftersom de låter dig styra körningen av ett skript i en funktion. De mest använda flödeskontrolluttalandena visas i bilden nedan:

Låt oss nu diskutera var och en av dem med exempel.

R-handledning: Väljaruttalanden

  • Om kontrollutlåtande : Detta kontrolluttalande utvärderar ett enda tillstånd. Det är ganska enkelt eftersom det bara har ett enda nyckelord 'om' följt av villkoret och sedan vissa uppsättningar av uttalanden som måste köras om det är sant. Se nedanstående flödesschema för att få en bättre förståelse:

I detta flödesschema svarar koden på följande sätt:

  1. Först och främst kommer den in i slingan där den kontrollerar tillståndet.
  2. Om villkoret är sant kommer villkorlig kod eller skriftliga uttalanden att utföras.
  3. Om villkoret är falskt ignoreras påståendena.

Nedan följer ett exempel på om kontrolluttalande i R. Försök att köra detta exempel i R Studio.

x = 2 upprepa {x = x ^ 2 skriva ut (x) om (x> 100) {break}

Utgång:

[1] 4 [1] 16 [1] 256
  • Om annat kontrollmeddelande :Examens typ av kontrolluttalandeutvärderar en grupp villkor och väljer uttalanden. Se nedanstående flödesschema för att få en bättre förståelse:

I detta flödesschema svarar koden på följande sätt:

  1. Först och främst kommer den in i slingan där den kontrollerar tillståndet.
  2. Om villkoret är sant kommer de första om-uttalandena att utföras.
  3. Om villkoret är falskt går det till 'annat om' -villkor och om det är sant kommer 'annat om' -koden att köras.
  4. Slutligen, om 'annars om' -koden också är falsk, kommer den att gå till 'annat' -koden och den körs. Detta betyder att om inget av dessa villkor är sant, utförs 'annat' uttalandet.

Nedan följer ett exempel på om annat kontrolluttalande i R. Försök att köra detta exempel i R Studio.

x5) {print ('x är större än 5')} elseif (x == 5) {print ('x är lika med 5')} annat {print ('x är inte större än 5')}

Produktion:

[1] 'x är lika med 5'
  • Byt uttalanden : Dessa kontrolluttalanden används i grunden för att jämföra ett visst uttryck med ett känt värde. Se nedanstående flödesschema för att få en bättre förståelse:

I det här flödesschemat för Switch-fall svarar koden i följande steg:

  1. Först och främst kommer det att gå in i switchfallet som har ett uttryck.
  2. Därefter går det till fall 1-tillstånd, kontrollerar värdet som skickats till villkoret. Om det är sant kommer Statement block att köras. Efter det kommer det att bryta från det växlingsfallet.
  3. Om det är falskt byter det till nästa fall. Om fall 2 villkor är sant kommer det att utföra uttalandet och bryta från det fallet, annars hoppar det igen till nästa fall.
  4. Låt oss säga att du inte har angett något ärende eller att det finns fel inmatning från användaren, då går det till standardfallet där det kommer att skriva ut ditt standarduttalande.

Nedan följer ett exempel på switch-uttalande i R. Försök att köra detta exempel i R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Utgång:

[1] 275

R Tutorial: Loop Statements

Slingor hjälper dig att upprepa vissa åtgärder så att du inte behöver utföra dem upprepade gånger. Tänk dig att du måste utföra en operation tio gånger, om du börjar skriva koden för varje gång ökar programmets längd och det skulle vara svårt för dig att förstå det senare. Men samtidigt genom att använda en slinga, om jag skriver samma uttalande i en slinga, sparar det tid och underlättar kodläsbarheten. Det blir också mer optimerat med avseende på kodeffektivitet.

I bilden ovan, ” upprepa' och ' medan ”Uttalanden hjälper dig att utföra en viss uppsättning regler tills villkoret är sant men” för' är ett loop-uttalande som används när du vet hur många gånger du vill upprepa ett uttalande. Om du vet att du vill upprepa det tio gånger kommer du att gå med 'för' uttalande men om du inte är säker på hur många gånger du vill att koden ska upprepas, kommer du att gå med 'upprepa' eller 'while' loop.

Låt oss diskutera var och en av dem med exempel.

  • Upprepa : Repeteringsslingan hjälper till att köra samma uppsättning kod om och om igen tills ett stoppvillkor är uppfyllt. Se nedanstående flödesschema för att få en bättre förståelse:

I ovanstående flödesschema svarar koden i följande steg:

  1. Först och främst kommer det att ange och köra en uppsättning kod.
  2. Därefter kommer det att kontrollera villkoret, om det är sant kommer det att gå tillbaka och köra samma uppsättning kod igen tills det är tänkt att vara falskt.
  3. Om det visar sig vara falskt kommer det direkt att gå ut ur slingan.
  • Medan : While-uttalandet hjälper också till att köra samma uppsättning kod om och om igen tills ett stoppvillkor är uppfyllt. Se nedanstående flödesschema för att få en bättre förståelse:

I ovanstående flödesschema svarar koden i följande steg:

  1. Först och främst kommer det att kontrollera tillståndet.
  2. Om det visar sig vara sant kommer det att köra koden.
  3. Därefter kontrollerar den igen villkoret, om det är sant kommer det att köra samma kod igen. Så snart villkoret är falskt går det omedelbart ut i slingan.

Nedan följer ett exempel på medan uttalande i R. Försök att köra detta exempel i R Studio.

x = 2 medan (x<1000) { x=x^2 print(x) } 

Produktion:

4 16 256 65 536

Så du måste undra hur dessa två uttalanden skiljer sig åt? Låt mig rensa ditt tvivel!
Här är den stora skillnaden mellan upprepningen och medan uttalandet är att det förändras med avseende på ditt tillstånd. Medan loop definierar i princip när du ska gå in i loop för att utföra uttalanden och upprepa loop definierar när du lämnar slingan efter genomförandet av uttalandena. Så dessa två uttalanden är kända som ingångskontrollslinga och utgångskontrollslingan. Det är hur medan och upprepade uttalanden är olika.

  • För loop: För loopar används när du behöver köra ett kodblock flera gånger. Se nedanstående flödesschema för att få en bättre förståelse:

I ovanstående flödesschema svarar koden i följande steg:

  1. Först och främst finns det initialisering där du anger hur många gånger du vill att slingan ska upprepas.
  2. Därefter kontrollerar den tillståndet. Om villkoret är sant kommer koden att köras för det angivna antalet gånger.
  3. Så snart villkoret är falskt går det omedelbart ut i slingan.

Nedan följer ett exempel på för uttalande i R. Försök att köra detta exempel i R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Utgång:

7 19 25 65 45

Låt oss sedan gå till vår sista uppsättning uttalanden i R Tutorial-bloggen, dvs. hopputtalanden.

R Självstudier: Jump Statements

Bryta uttalande : Break uttalanden hjälper till att avsluta programmet och återupptar kontrollen till nästa uttalande efter slingan. Dessa uttalanden används också i switchfall. Se nedanstående flödesschema för att få en bättre förståelse:

I ovanstående flödesschema svarar koden i följande steg:

  1. Först och främst kommer den in i slingan där den kontrollerar tillståndet.
  2. Om slingans villkor är falskt går det direkt ut slingan.
  3. Om villkoret är sant kommer det att kontrollera pausvillkoret.
  4. Om pausvillkoret är sant finns det från slingan.
  5. Om brytningsvillkoret är falskt kommer det att utföra de påståenden som finns kvar i slingan och sedan upprepa samma steg.

Nedan följer ett exempel på hopputtryck i R. Försök att köra det här exemplet i R Studio.

x<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Produktion:

[1] 1 [1] 2

Nästa uttalande : Nästa uttalande används när du vill hoppa över den aktuella iterationen av slingan utan att avsluta den. Nästa uttalande liknar ganska 'fortsätt' på andra programmeringsspråk. Se nedanstående flödesschema för att få en bättre förståelse:

I ovanstående flödesschema svarar koden i följande steg:

Fibonacci-kod c ++
  1. Först och främst kommer den in i slingan där den kontrollerar tillståndet.

  2. Om slingans villkor är falskt går det direkt ut slingan.

  3. Om loop-villkoret är sant kommer det att utföra block 1-uttalanden.

  4. Därefter kommer den att söka efter ”nästa” uttalande. Om den är närvarande kommer uttalandena därefter inte att utföras i samma iteration av slingan.

  5. Om 'nästa' uttalande inte finns, kommer alla uttalanden därefter att utföras.

Nedan följer ett exempel på nästa uttalande i R. Försök att köra det här exemplet i R Studio.

för (i 1:15) {if ((i %% 2) == 0) {nästa} skriv ut (i)}

Utgång:

1 3 5 7 9 11 13 15

Detta är slutet på R-självbloggen. Jag hoppas ni är tydliga om varje koncept som jag har diskuterat ovan. Håll ögonen öppna, min nästa blogg kommer att vara på R-utbildning där jag kommer att förklara några fler koncept för R i detalj med exriklig.

Nu när du har förstått grunderna för R, kolla in av Edureka, ett pålitligt inlärningsföretag online med ett nätverk av mer än 250 000 nöjda elever spridda över hela världen. Edurekas dataanalys med R-utbildning hjälper dig att få expertis inom R-programmering, datamanipulation, Exploratory Data Analysis, Data Visualization, Data Mining, Regression, Sentiment Analysis och användning av R Studio för verkliga fallstudier inom detaljhandel, sociala medier.

Har du en fråga till oss? Vänligen nämna det i kommentarsektionen i denna 'R Tutorial' -blogg så kommer vi tillbaka till dig så snart som möjligt.