SAS självstudie: Allt du behöver veta om SAS



Lär dig vad som är SAS i den här SAS självstudiebloggen? Vad kan den göra och förstå varför SAS är ett av de mest populära analysverktygen på marknaden.

Frågor - SAS handledning - EdurekaVad är SAS? Varför ska jag lära mig SAS?Vilka är fördelarna med ?Letar du efter svar på ovanstående frågor? Om ja, då dettaSAS handledningsvarar på alla dina frågor.

Vi människor är en nyfiken art, eller hur? Vi vill alltid veta mer. Denna önskan att veta, får oss att ställa fler frågor och i sin tur håller oss på jakt efter fler svar.





Låt oss överväga ett enkelt problem. Vad händer om du vill shoppa och du har två alternativ att välja mellan:

  • En kupong på 149 $
  • 25% rabatt på kupongen

Du kanske undrar, vilket alternativ hjälper dig att spara mer?Detta är ett scenario. Vi har många sådana frågor och vi kan stöta på olika scenarier där vi inte kan fatta ett ordentligt beslut. Gör dessa frågor dig nyfikenom att hitta svar? Om ja, kommer du att gilla analys och även de verktyg som hjälper dig att analysera data. SAS är ett sådant verktyg.



SAS självstudie

I slutet av artikeln bör du känna till följande ämnen:

Din förståelse för SAS är ofullständig utan förståelse dataanalys.Så, låt oss komma igång.

Vad är dataanalys?

Ordet 'analys' har trenderat ett tag nu, men det finns inget enda sätt att definiera det. Låt oss försöka förstå analys med ett enkelt exempel. Tänk dig att du vill köpa en T-shirt. Vilka är de möjliga frågorna du kan tänka dig? Låt mig hjälpa dig med några vanliga:



  • När ska jag köpa en T-shirt?
  • Hur mycket ska jag spendera för T-tröjan?
  • Ska jag köpa T-shirt online eller ska jag besöka en butik?
  • Om jag bestämmer mig för att köpa T-shirt online, från vilken webbplats ska jag köpa den?
  • Om jag bestämmer mig för att besöka en butik, vilken butik ska jag besöka?

Beslutet kan bero på faktorer som tid, pengar, preferenser och tidigare erfarenheter. Låt oss fortsätta med ovanstående problem. Tänk på följande:

  • Du är fri på söndag
  • Din budget är 300 USD
  • Du föredrar att besöka en butik eftersom det låter dig handplocka en T-shirt
  • Du bestämmer dig för att besöka en viss butik eftersom ditt tidigare besök i butiken inte gjorde dig besviken

Antag att du, baserat på ovanstående punkter, bestämmer dig för att besöka en butik på söndag och köpa en T-shirt som kostar cirka 265 USD. Du övervägde några möjligheter, valde de som passade kravet och fattade ett beslut.

lära sig att använda visual studio

Med enkla ord gjorde du bara någon form av analys för att hjälpa dig att köpa en T-shirt. Låt mig förenkla det ytterligare. Din hjärna gjorde två enkla saker här:

  • Insamlad information enligt dina krav
  • Förstått data och baserat på den informationen hjälpte du dig att välja T-shirt.

Det här är vad du kan göra med analyser. Du kan samla in information, analysera den och fatta bättre beslut. Ovanstående exempel varlätt, så du kan fatta ett beslut baserat på några antaganden. Vad händer om problemet och beslutsfattandet inte var så enkelt?

Tänk på detta problem ur affärssynpunkt.Antag att ett e-handelsföretag vill studera sina kunders köpmönster baserat på tidigare data. Företaget måste tänka på tusentals poster, eller hur? Föreställ dig nu de data vi just pratat om eller permutationer och kombinationer som företaget kan tänka sig för olika preferenser som människor kan ha.

Dessutom kanske företaget inte har all information. Till exempel, om en kund inte köpte en T-shirt, vilka faktorer fick kunden att besluta att inte köpa T-shirt? Denna saknade data kan skapa problem. Hur hanterar vi dessa problem? Hur hanterar vi sådan information? Väl,dessa problem blir lättare när vi använder analyser. Genom att använda analys kan du eliminera onödig data och optimera relevant information för att hitta mönster som kan hjälpa dig att fatta bättre beslut.

Vi har många verktyg för analys och för att förenkla sådana problem.Ett framstående verktyg är SAS. Denna SAS-handledning hjälper dig att förstå SAS och hur det kan användas för att lösa våra problem.

Prenumerera på vår youtube-kanal för att få nya uppdateringar ..!

Behov av SAS

Analysmarknaden har vuxit enormt de senaste åren. Detta har resulterat i en ökning av antalet använda verktyg. Alla dessa är fördelaktiga på ett eller annat sätt. Så låt oss gå vidare med vår SAS-handledning och ta en titt på några av de mest använda verktygen på marknaden.

  • SAS: Det är det mest använda verktyget på kommersiell analysmarknad. Med en uppsjö av statistiska funktioner och bra GUI (Enterprise Guide & Miner) leder det verkligen marknaden.
  • R: Det är en programvara med öppen källkod. Det är lätt att lära sig R eftersom det är väl dokumenterat. Det är kostnadseffektivt och har starka statistiska funktioner.
  • Pytonorm är ett annat skriptspråk med öppen källkod som används i stor utsträckning. Pythonanvändningen har ökat över tiden.Idag är det idrottsbibliotek som Numpy, Scipy och MatPlotLib. Du kan utföra nästan vilken statistisk operation som helst eller bygga vilken modell som helst med hjälp av dessa bibliotek.

SAS Vs. R Vs. Pytonorm

Låt oss jämföra dessa tre verktyg i denna SAS-handledning och jag kommer att använda följande parametrar för jämförelse.

1) Jobb

Eftersom det är ett viktigt verktyg för forskning och analys har det säkert genererat mycket krav på SAS-utbildade resurser. SAS äger 70% av marknadsandelen. R har 15% och python har minst, vilket är mindre än 10%.

2) Enkel förståelse

SAS är ett av de enklaste verktygen att lära sig. Även personer med begränsad kunskap om SQL kan lära sig det enkelt. Python är inte lika bekvämt som SAS för analyser. R kräver att du skriver tråkiga och långa koder, vilket ger SAS en fördel.

3) Fjärde generationens språk

SAS är ett fjärde generationens programmeringsspråk. En fjärde generationens programmeringsspråk är ”ett programmeringsspråk som är utformat med ett specifikt syfte i åtanke såsom utveckling av kommersiell affärsprogramvara.” Den är utformad för att minska programmeringsansträngningen och minimera den tid och kostnad det tar att utveckla en programvara. R och Python är inte fjärde generationens språk.

4) Flexibel

SAS håller sig uppdaterad om marknadens behov. Den enkla integrationen gör den mer flexibel och användbar. Detta innebär också att det går bra ihop med andra tekniker. Gör det flexibelt i verklig mening.

Ovanstående skäl stöder starkt påståendet att SAS håller sin topposition på marknaden stadigt.Så nu när vi har sett jämförelsen av dessa tre analytiska verktyg. Genom att gå vidare i denna SAS-handledning kan vi förstå SAS lite mer detaljerat.

SAS självstudie: Vad är SAS ?

Låt oss nu försöka förstå vad det är SAS och vad det gör?

SAS står för Statistical Analysis System. Det är en mjukvarupaket som utvecklats av SAS Institute.

SAS applikationer

Bilden nedan visar några tillämpningar av SAS:

Med enkla ord kan SAS bearbeta komplexa data och generera meningsfulla insikter som skulle hjälpa organisationer att fatta bättre beslut eller förutsäga möjliga resultat inom en snar framtid.

SAS låter dig bryta, ändra, hantera och hämta data från olika källor och analysera den.Det grafiska pek-och-klicka-användargränssnittet för SAS hjälper icke-tekniska användare att använda dess funktioner för grafiska operationer och avancerade alternativ.

SAS handledning | SAS handledning för dataanalys | Edureka

SAS-komponenter

Låt oss gå vidare med vår SAS-handledning och titta på några viktiga SAS-komponenter:

  • SAS-bas: Det är den mest använda komponenten. Det har anläggning för datahantering. Du kan göra dataanalys med Base SAS.
  • SAS / GRAFIK: Med SAS / Graph kan du representera data som diagram. Detta gör datavisualisering lätt.
  • SAS / STAT: Det låter dig utföra statistisk analys, såsom varians, regression, multivariat, överlevnad och psykometrisk analys.
  • SAS / ETS: Det är lämpligt för tidsserie-analys.

Eftersom detta är en inledande artikel kommer vi att fokusera på Base SAS och jag är säker på att det borde vara lätt för alla att förstå.

Intresserad av att lära dig SAS från experter? Anmäl dig nu

SAS som ett programmeringsspråk

De flesta programmeringsmiljöer är antingen menydrivna (peka och klicka) eller kommandostyrda (ange och köra kommandon). SAS är dock varken menydriven eller kommandostyrd. Detta beror på att den använder en serie instruktioner eller uttalanden som kallas SAS-program. Detta program är en skildring av vad du vill göra och är skrivet på SAS-språk.

Data

Data är central för varje datamängd. I SAS finns data tillgängliga i tabellform där variabler upptar kolumnutrymmet och observationer upptar radutrymmet.

Datatyper:

SAS behandlar siffror som numeriska data och allt annat faller under karaktärsdata. Därför har SAS två datatyper, numeriska och tecken. Enkelt, eller hur?

DATA-steg och PROC-steg utgör de grundläggande byggstenarna i ett SAS-program. Vad gör dessa byggstenar är vad vi ska diskutera i denna SAS-handledning.

Byggstenar från SAS

Vi startar ett program med ett DATA-steg för att skapa en SAS-datauppsättning och sedan överföra data till ett PROC-steg. PROC-steget bearbetar data. För att förstå hur DATA- och PROC-stegen fungerar, låt oss överväga nedanstående exempel.

Anta att jag ville konvertera ett tal som är i tum till centimeter och lagra resultatet i en variabel som heter 'storlek' och skriva ut det, då konverterar DATA-steget antalet i tum till centimeter och PROC-steget skriver ut resultatet.

Bilden nedan visar ett kodavsnitt för ovan nämnda problem:

Uttalandena utgör DATA- och PROC-steg. Längden på ett steg kan variera från ett till mer än hundra uttalanden. Det är viktigt att du kommer ihåg att DATA-steg används för att läsa och modifiera data, medan PROC-steg används för att analysera data, utföra verktygsfunktioner eller skriva ut rapporter.

DATA-steg börjar med nyckelordet DATA som följs av ett namn som du väljer för din SAS-datauppsättning. Det är uppenbart att ovanstående DATA-steg ger en datamängd med namnet storlek. DATA-steg läser data från externa datafiler och kan också användas för att inkludera slingor och falluttalanden. Den kan användas för att slå samman, sortera, kombinera och sammanfoga data.

På samma sätt börjar procedurer med ett PROC-uttalande där nyckelordet PROC följer namnet på den procedur som används (till exempel kan procedurens namn vara PRINT, SORT, eller MEAN). SAS-procedurer har oftast en handfull möjliga uttalanden.

Varje gång SAS stöter på ett nytt steg (markerat med ett DATA- eller PROC-uttalande) avslutas eller avslutas det föregående steget och börjar med ett nytt.

Medan ett typiskt program börjar med ett DATA-steg för att mata in eller modifiera data och sedan överföra data till ett PROC-steg, är det verkligen inte det enda mönstret för att blanda DATA- och PROC-steg. Precis som du kanstapla byggstenari valfri ordning kan du ordna DATA- och PROC-steg i valfri ordning. Ett program kan till och med innehålla endast DATA-steg eller bara PROC-steg.

Ändå kommer det att bli mycket lättare att skriva SAS-program om du förstår dessa grundläggande funktioner. Ovan nämnda är få grunder som alla nybörjare i SAS borde veta. Gå vidare till nästa del av vår SAS-handledning, låt oss förstå hur man installerar SAS universitetsutgåva.

Nu kan nybörjare lära sig och öva SAS, som SAS Institute Inc. har släppt SAS universitetsutgåva som är tillgänglig gratis. Alla funktioner som behövs för att lära sig Base SAS finns här. Learning Base SAS gör det enkelt för dig att lära dig andra komponenter.

Följande steg hjälper dig att installera SAS University Edition.Det är en programvara med vilken du kan öva på SAS-programmering.

SAS självstudie: Installation

Det är enkelt att installera SAS University Edition. Men dess tillgänglighet som en virtuell maskin kräver att du kör den i en virtuell miljö. Du måste installera en virtualiseringsprogramvara på din dator innan du kör SAS-programvaran. Följande steg hjälper dig att ladda ner och konfigurera SAS-miljön.

1) Ladda ner SAS University Edition

SAS University Edition kan laddas ner från den här länken SAS universitetsutgåva . Om du klickar på länken ovan visas följande fönster. Läs kravuppgifterna innan du börjar ladda ner.

2) Snabbstartguide för installation

Personer som är helt nya i installationsprocessen kan gå igenom följande guider och videor som finns i steg 1. Det är valfritt och du kan hoppa över det om du redan är bekant.

3) Ställa in en virtualiseringsprogramvara

Länkarna i steg 2 låter dig ladda ner lämplig virtualiseringsprogramvara. Du kan hoppa över detta steg om du redan har installerat en virtualiseringsprogramvara.

4) Ladda ner zip-filen

Välj lämplig version av SAS University Edition-kompatibelmed den virtualiseringsmiljö du har. Den laddas ner som en zip-fil. Namnetskulle likna: 'Unvbasicvapp_9411005_vmx_en_sp0_1.zip'

5) Packa upp zip-filen

Packa upp ovanstående zip-fil och lagra den i en lämplig katalog.

6) Ladda den virtuella maskinen

Öppna och starta din VMware-spelare, leta efter en fil som slutar med ett tillägg .vmx och öppna den. Följande skärm visas. Notera de grundläggande inställningarna som minne och hårddiskutrymme som tilldelats för din referens.

7) Slå på den virtuella maskinen

Klicka på Slå på den här virtuella maskinen bredvid det gröna pilmärket, kan du starta den virtuella maskinen. Följande skärm ska visas.

Under laddningen visas följande skärm. Efter detta kan du köra den virtuella maskinen. Du får en uppmaning att gå till webbadressen som öppnar SAS-miljön.

8) S tartande SAS Studio

Öppna en ny flik i din webbläsare och ladda webbadressen markerad i bilden ovan. Följande skärm visas för att indikera beredskapen för SAS-miljön. Du kan få en annan URL eftersom URLkan skilja sig från PC till PC.

Du kan börja studion och du är redo att gå.

Kör ett SAS-program

Nu när vi har förstått hur vi installerar SAS University Edition, låt oss sedan ta ett exempel på SAS-program i vår SAS-handledning.

Koden nedan visar hur man skriver ut en Fibonacci-sekvens. Om du inte vet vad en Fibonacci-sekvens är, låt mig definiera den åt dig.

Fibonacci-sekvensen är en uppsättning siffror som börjar med en eller en noll, följt av en, och fortsätter baserat på regeln att varje nummer (kallat ett Fibonacci-nummer) är lika med summan av de föregående två siffrorna. Om Fibonacci-sekvensen betecknas F (n), där n är den första termen i sekvensen, visar följande ekvation Fibonacci-sekvensen för n = 0, där de två första termerna definieras som 0 och 1 enligt konvention:

F (0) = 0, 1, 1, 2, 3, 5, 8, 13, 21, 34 ...

I vissa sammanhang är det vanligt att använda n = 1. I så fall definieras de två första termerna som 1 och 1 som standard och därför:

F (1) = 1, 1, 2, 3, 5, 8, 13, 21, 34 ...

Låt oss ta en titt på den här SAS-koden som genererar en Fibonacci-sekvens som börjar med en.

DATA Fibonacci Do i = 1 till 10 Fib = Sum (Fib, lag (Fib)) om i = 1 då Fib = 1 utgångsänd PROC UTSKRIFT Fibonacci Run

I ovanstående kod har vi definierat en funktion som kallas ”Fib” för att beräkna nästa nummer. Fib är lika med summan av det aktuella Fib-numret och det föregåendeFibonaccisiffra. Vi använder fördröjningsfunktionen för att hämta den sista funktionen och för att hämta värdet på föregående fibnummer.

Följande bild visar utdata från ovanstående kod. Vi har använt PROC PRINT-proceduren för att visa utskriften i tryckt form.

Jag hoppas att du gillade den här SAS-självbloggen. Detta var den första bloggen i SAS Tutorial-bloggserien. Min nästa blogg kommer att handla om SAS-programmering, läs det också för att lära dig att skriva program i SAS.

Om du vill lära dig SAS och bygga en karriär inom analysdomänen, kolla in vår som kommer med instruktörsledad liveutbildning och verklig projektupplevelse.Denna utbildning hjälper dig att förstå SAS på djupet och hjälper dig att behärskaolika koncept för SAS-språk.

Intresserad av att lära dig SAS från experter? Anmäl dig nu

Har du en fråga till oss? Vänligen nämna det i kommentarfältet så återkommer vi till dig.