R-programmering - Nybörjarguide för R-programmeringsspråk



Denna blogg om R-programmering introducerar dig till R och hjälper dig att förstå de olika grundläggande begreppen för R-programmering i detalj med exempel.

R är ett av de mest populära analysverktygen. Men förutom att det används för analys är R också ett programmeringsspråk.Med sin tillväxt inom IT-branschen finns det en blomstrande efterfrågan på skickliga eller med förståelse för R som båda, ett dataanalysverktyg och ett programmeringsspråk.I den här bloggen hjälper jag dig att förstå de olika grunderna för R-programmering. I vår sid glada Blogg ,vi har diskuterat Varför behöver vi Analytics, vad är Business Analytics, varför och vem använder R.

I den här bloggen kommer vi att förstå nedanstående kärnkoncept för R-programmering i följande sekvens:





  1. Variabler
  2. Datatyper
  3. Dataoperatörer
  4. Villkorligt uttalande
  5. Öglor
  6. Funktioner

Du kan gå igenom webinarinspelningen av R Programming Language där vår instruktör har förklarat ämnena på ett detaljerat sätt med exempel som hjälper dig att förstå R-programmering bättre.

R-programmering för nybörjare | R Handledning för programmeringsspråk | Edureka



Så låt oss gå vidare och titta på det första konceptet för R-programmering - variabler.

R-programmering: variabler

Variabler är inget annat än ett namn till en minnesplats som innehåller ett värde. En variabel i R kan lagra numeriska värden, komplexa värden, ord, matriser och till och med en tabell. Förvånande, eller hur?

Variabel - R-programmering - Edureka

Fikon: Skapandeav variabler



Ovanstående bild visar hur variabler skapas och hur de lagras i olika minnesblock. I R behöver vi inte deklarera en variabel innan vi använder den, till skillnad från andra programmeringsspråk som Java, C, C ++, etc.

Låt oss gå vidare och försöka förstå vad som är en datatyp och de olika datatyper som stöds i R.

R-programmering: datatyper

I R deklareras inte en variabel av någon datatyp utan den får datatypen för det R-objekt som tilldelats den. Så R kallas ett dynamiskt typat språk, vilket innebär att vi kan ändra en datatyp av samma variabel om och om igen när vi använder den i ett program.

Datatyper anger vilken typ av värde en variabel har och vilken typ av matematiska, relationella eller logiska operationer som kan tillämpas på den utan att orsaka ett fel. Det finns många datatyper i R, men nedan är de vanligaste:

Låt oss nu diskutera var och en av dessa datatyper individuellt, med utgångspunkt från vektorer.

Vektorer

Vektorer är de mest grundläggande R-dataobjekten och det finns sex typer av atomvektorer. Nedan följer de sex atomvektorerna:

Logisk : Det används för att lagra logiskt värde som SANN eller FALSK .

Numerisk : Den används för att lagra både positiva och negativa siffror inklusive verkligt antal.

Exempel: 25, 7,1145, 96547

Heltal : Den innehåller alla helvärden, dvs alla positiva och negativa heltal.

Exempel: 45.479, -856.479, 0

Komplex : Dessa har formen x + yi, där x och y är numeriska och i representerar kvadratroten -1.

Exempel: 4 + 3i

Karaktär : Den används för att lagra antingen enstaka tecken, grupp tecken (ord) eller en grupp ord tillsammans. Tecknen kan definieras i antingen enstaka eller dubbla citat.

Till exempel: 'Edureka', 'R är kul att lära sig'.

I allmänhet definieras och initialiseras en vektor på följande sätt:

Vtr = c (2, 5, 11, 24) Eller Vtr<- c(2, 5, 11 , 24)

Låt oss gå vidare och förstå andra datatyper i R.

Lista

Listor liknar vektorer, men listor är R-objekt som kan innehålla element av olika typer som & minus siffror, strängar, vektorer och en annan lista inuti den.

T.ex:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Produktion:

java system.exit (1)
[[1]] [1] 'Hej' 'Hej' 'Hur gör du '[[2]] [1] 22.5 [[3]] [1] 14965 [[4]] [1] SANT

Matris

Matris är R-objektet där elementen är ordnade i en tvådimensionell rektangulär layout.

Den grundläggande syntaxen för att skapa en matris i R är & minus

 matris (data, nrow, ncol, byrow, dimnames) 

Var:

  • data är ingångsvektorn som blir matrisens dataelement.
  • nu är antalet rader som ska skapas.
  • ncol är antalet kolumner som ska skapas.
  • byrå är en logisk ledtråd. Om SANT är ordnade inmatningsvektorelementen efter rad.
  • dimnamn är namnen som tilldelats raderna och kolumnerna.

Exempel:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Produktion:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

Arrayer i R är dataobjekt som kan användas för att lagra data i mer än två dimensioner. Det tar vektorer som inmatning och använder värdena i Nej parameter för att skapa en matris.

Den grundläggande syntaxen för att skapa en matris i R är & minus

c ++ sorteringsmatris
 array (data, dim, dimnames) 

Var:

  • data är ingångsvektorn som blir dataelementen i matrisen.
  • Nej är arrayens dimension, där du skickar antalet rader, kolumn och antalet matriser som ska skapas av nämnda dimensioner.
  • dimnamn är namnen som tilldelats raderna och kolumnerna.

Exempel:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Produktion:

, , ett [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Dataram

En dataram är en tabell eller en tvådimensionell matrisliknande struktur där varje kolumn innehåller värden på en variabel och varje rad innehåller en uppsättning värdenförvarje kolumn. Nedan följer några av egenskaperna hos en dataram som måste beaktas varje gång vi arbetar med dem:

  • Kolumnnamnen ska vara tomma.
  • Varje kolumn ska innehålla samma mängd dataobjekt.
  • De data som lagras i en dataram kan vara av numerisk, faktor- eller karaktärstyp.
  • Radnamnen ska vara unika.

Exempel:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' FoU ') emp. Data<- data.frame(emp_id, emp_name, dept) emp.data 

Produktion:

emp_id emp_name avd 1 100 John Sales 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary R & D

Så nu när vi har förstått de grundläggande datatyperna för R är det dags att vi djupt dyker in i R genom att förstå begreppen dataoperatörer.

R-programmering: Dataoperatörer

Det finns huvudsakligen 4 dataoperatörer i R, de ser ut nedan:

Aritmetiska operatörer : Dessa operatörer hjälper oss att utföra de grundläggande aritmetiska operationerna som addition, subtraktion, multiplikation etc.

Tänk på följande exempel:

num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraktion num3 = num1 - num2 num3 #multiplicering num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modul num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # golvdelning num3 = num1% /% num2 num3

Produktion:

[1] 35 [femton [1] 300 [1] 0,75 [1] 15 [1] 125 [elva

Relationsoperatörer : Dessa operatörer hjälper oss att utföra relationsoperationer som att kontrollera om en variabel är större än, mindre än eller lika med en annan variabel. Resultatet av en relationsoperation är alltid ett logiskt värde.

Tänk på följande exempel:

num1 = 15 num2 = 20 # lika till num3 = (num1 == num2) num3 # inte lika med num3 = (num1! = num2) num3 # mindre än num3 = (num1 num2) num3 # mindre än lika med num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Produktion:

[1] FALSKT [1] SANT [1] SANT [1] FALSKT [1] SANT [1] FALSKT

Uppdragsoperatörer: Dessa operatorer används för att tilldela värden till variabler i R. Tilldelningen kan utföras med antingen tilldelningsoperatören(<-) eller är lika med operator (=). Variabelns värde kan tilldelas på två sätt, vänster tilldelning och höger tilldelning.

LogiskOperatörer: Dessa operatörer jämför de två enheterna och används vanligtvis med booleska (logiska) värden som 'och', 'eller'och'inte'.


R-programmering: Villkorliga uttalanden

  1. Om uttalande: If-uttalandet hjälper dig att utvärdera ett enda uttryck som en del av flödet. För att utföra denna utvärdering behöver du bara skriva If-nyckelordet följt av uttrycket som ska utvärderas. Nedanstående flödesdiagram ger en uppfattning om hur If-uttalandet styr flödet av en kod: Tänk på följande exempel:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Produktion:

[1] 'Num1 är mindre eller lika med Num2'
  • Annars om uttalande: Else if-uttalandet hjälper dig att utvidga grenar till det flöde som skapas av If-uttalandet och ge dig möjlighet att utvärdera flera förhållanden genom att skapa nya grenar av flöde. Nedanstående flöde ger dig en uppfattning om hur det andra if-uttalandet förgrenar kodens flöde:

    Tänk på följande exempel:

    Num1 = 5 Num2 = 20 om (Num1 Num2) {print ('Num2 är mindre än Num1')} annars om ('Num1 == Num2) {print (' Num1 och Num2 är lika ')}

    Produktion:

    [1] 'Num1 är mindre än Num2'

  • Annat uttalande: Det andra uttalandet används när alla andra uttryck är kontrollerade och befinns ogiltiga. Detta kommer att vara det sista uttalandet som körs som en del av If - Else if filialen. Nedanstående flöde ger dig en bättre uppfattning om hur Else ändrar flödet av koden:

Tänk på följande exempel:

Num1 = 5 Num2 = 20 om (Num1 Num2) {print ('Num2 är mindre än Num1')} annars skriver ut ('Num1 och Num2 är lika')}

Produktion:

[1] 'Num1 och Num2 är lika'

R-programmering: loopar

Ett loop-uttalande gör att vi kan utföra ett uttalande eller en grupp av uttalanden flera gånger. Det finns huvudsakligen tre typer av öglor i R:

  1. upprepa Loop : Det upprepar ett uttalande eller en grupp av uttalanden medan ett visst villkor är SANT. Repeat-loop är det bästa exemplet på en exit-kontrollerad loop där koden först körs och sedan kontrolleras villkoret för att avgöra om kontrollen ska vara inuti loop eller utgång från den. Nedan följer kontrollflödet i en repetitionsslinga:
    Låt oss titta på exemplet nedan för att förstå hur vi kan använda repeterande slinga för att lägga till n-tal tills summan når överstiger 100:

    x = 2 upprepa {x = x ^ 2 skriva ut (x) om (x> 100) {break}

    Produktion:

    [1] 4 [1] 16 [1] 256
  2. medan Loop : Jagt hjälper till att upprepa ett uttalande eller en grupp av uttalanden medan ett visst villkor är SANT. Medan loop, jämfört med repetitionsslingan är något annorlunda, är det ett exempel på en ingångsstyrd slinga där villkoret först kontrolleras och endast om villkoret visar sig vara sant levereras kontrollen inuti slingan för att köra . Nedan följer flödet av kontroll i en stundslinga:
    Låt oss titta på exemplet nedan för att lägga till summan av kvadrater för de första 10 siffrorna och förstå hur stundslingan fungerar bättre:

    hur man implementerar länkad lista i c
    num = 1 sumn = 0 medan (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Produktion:

    [elva [femton [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. för Loop : Den används för att upprepa ett uttalande eller en grupp av ett bestämt antal gånger. Till skillnad från repetition och while loop används for loop i situationer där vi är medvetna om hur många gånger koden behöver köras i förväg. Det liknar stundslingan där villkoret först kontrolleras och då körs bara koden inuti. Låt oss se flödet av kontroll av för loop nu:

Låt oss nu titta på ett exempel där vi kommer att använda for-loop för att skriva ut de första 10 siffrorna:

för (x i 1:10) {print (x)}

Produktion:

[elva [1] 2 [1] 3 [1] 4 [femton [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Programmering: Funktioner

En funktion är ett block med organiserad, återanvändbar kod som används för att utföra en enda relaterad åtgärd. Det finns huvudsakligen två typer av funktioner i R:

Fördefinierade funktioner : Dessa är inbyggda funktioner som kan användas av användaren för att göra sitt arbete lättr. Till exempel: mean( x) , sum( x) , kvmt ( x ), pipett( x ), etc.

Användardefinierad Funktioner: Dessa funktioner skapas av användaren för att uppfylla ett specifikt krav från användaren. Nedan är syntaxen för att skapa en funktion iR:

 funk  tion_name  <– fungera (arg_1, arg_2, &hellip){ // Funktionskropp }

Tänk på följande exempel på en enkel funktion för att generera summan av rutornaav2 nummer:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Utgång: [1] 25

Jag hoppas att du gillat att läsa denna R-programmeringsblogg. Vi har täckt alla grunderna i R i denna handledning, så att du kan börja träna nu. Efter denna R-programmeringsblogg kommer jag att komma med fler bloggar på R för Analytics så håll dig uppdaterad.

Nu när du har förstått grunderna för R, kolla in av Edureka, ett pålitligt inlärningsföretag online med ett nätverk av mer än 250 000 nöjda elever spridda över hela världen. Edurekas dataanalys med R-utbildning hjälper dig att få expertis inom R-programmering, datahantering, exploratorisk dataanalys, datavisualisering, datautvinning, regression, sentimentanalys och användning av RStudio för verkliga fallstudier inom detaljhandel, sociala medier.

Har du en fråga till oss? Vänligen nämna det i kommentarsektionen i denna 'R-programmering' -blogg så återkommer vi så snart som möjligt.