Apache Pig Installation på Linux



Den här bloggen är en steg-för-steg-guide för Apache Pig Installation i Linux-miljö. Vi installerar Apache Pig 0.16.0 och kör den i olika lägen.

I det här inlägget kommer jag att prata om Apache Pig-installation på Linux . Låt oss börja med den grundläggande definitionen av Apache Pig och Pig Latin.

Apache Pig är ett verktyg / plattform för att skapa och köra Map Reduce-program som används med Hadoop. Det är ett verktyg / plattform för att analysera stora datamängder. Du kan säga, Apache Pig är en abstraktion över MapReduce. Programmerare som inte är så bra på Java brukade kämpa med att arbeta på Hadoop, främst när de skrev MapReduce-jobb.Så det är ett viktigt ämne att lära sig och behärska för .Apache Pig har sitt eget språk Gris latin vilket är välsignat för dåliga programmerare.





En grundläggande introduktion till Pig Latin hjälper dig att förstå bättre:

Det höga procedurspråket som används i Apache Pig-plattformen kallas Gris latin . Apache Pig har 'Pig Latin' som är ett relativt enklare språk som kan köras över distribuerade datamängder på Hadoop File System (HDFS). I Apache Pig måste du skriva Pig-skript med Pig Latin-språk, som konverteras till MapReduce-jobb när du kör ditt Pig-skript. Apache Pig har olika operatörer som används för att utföra uppgifter som att läsa, skriva, bearbeta data. För att lära dig mer om Apache Pig-operatörer, gå till vår blogg “ Operatörer i Apache Pig: Del 1- Relationsoperatörer ”.

Nu när du har grundläggande förståelse för Apache Pig, låt oss börja med Apache Pig Installation på Linux.



Apache Pig Installation på Linux:

Nedan följer stegen för installation av Apache Pig på Linux (ubuntu / centos / windows använder Linux VM). Jag använder Ubuntu 16.04 under installationen nedan.

Steg 1: Ladda ner Gris tar fil.

Kommando: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz



Ladda ner Pig - Pig Installation - Edureka

Steg 2: Extrahera tar fil med tar-kommandot. I nedanstående tjärkommando, x betyder extrahera en arkivfil, med betyder filtrera ett arkiv genom gzip, f betyder filnamn på en arkivfil.

Kommando: tjära -xzf gris-0.16.0.tar.gz

Kommando: ls

Steg 3: Redigera “ .bashrc ”-Fil för att uppdatera miljövariablerna för Apache Pig. Vi ställer in det så att vi kan komma åt gris från vilken katalog som helst, vi behöver inte gå till griskatalogen för att utföra griskommandon. Om någon annan applikation letar efter Pig kommer den också att lära känna vägen till Apache Pig från den här filen.

Kommando: sudo gedit .bashrc

SQL-serverintegrationstjänster SSIS steg för steg-handledning

Lägg till följande i slutet av filen:

# Ställ in PIG_HOME

exportera PIG_HOME = / home / edureka / pig-0.16.0
exportera PATH = $ PATH: /home/edureka/pig-0.16.0/bin
exportera PIG_CLASSPATH = $ HADOOP_CONF_DIR

Se också till att hadoop-vägen också är inställd.

Kör nedanför kommandot för att göra ändringarna uppdaterade i samma terminal.

Kommando: källa .bashrc

Steg 4: Kontrollera grisversion. Detta är för att testa att Apache Pig installerades korrekt. Om du inte får Apache Pig-versionen måste du verifiera om du har följt stegen ovan korrekt.

Kommando: grisversion

Steg 5 :Kontrollera grishjälpen för att se alla alternativ för griskommandon.

Kommando: gris -hjälp

Steg 6 :Kör gris för att starta grunt skalet. Grunt shell används för att köra gris Latinskript.

Kommando: gris

Om du tittar på bilden ovan korrekt har Apache Pig två lägen där den kan köras, som standard väljer den MapReduce-läge. Det andra läget där du kan köra gris är lokalt läge. Låt mig berätta mer om detta.

Exekveringslägen i Apache Pig:

  • MapReduce Mode - Detta är standardläget, vilket kräver åtkomst till ett Hadoop-kluster och HDFS-installation. Eftersom detta är ett standardläge är det inte nödvändigt att ange -x-flagga (du kan köra gris ELLER gris -x mapreduce ). Ingången och utgången i detta läge finns på HDFS.
  • Lokalt läge - Med åtkomst till en enda maskin installeras och körs alla filer med ett lokalt värd- och filsystem. Här specificeras det lokala läget med ”-x flagga” ( gris -x lokal ). Ingången och utgången i detta läge finns på det lokala filsystemet.

Kommando: gris -x lokal

Du kan gå igenom videon nedan för att se Apache Pig Installation på Linux:

Installation av Apache Pig | Grisinstallation på Linux | Edureka

Nu när du är klar med Apache Pig Installation på Linux är nästa steg framåt att prova några relationella grisoperatörer på Pig Grunt-skal. Därför nästa blogg “ Operatörer i Apache Pig: Del 1- Relationsoperatörer ”Hjälper dig att bemästra grisoperatörer.

Nu när du har installerat Apache Pig på Linux, kolla in av Edureka, ett pålitligt inlärningsföretag online med ett nätverk av mer än 250 000 nöjda elever spridda över hela världen. Edureka Big Data Hadoop-certifieringskursen hjälper eleverna att bli experter på HDFS, Garn, MapReduce, Pig, Hive, HBase, Oozie, Flume och Sqoop med realtidsanvändningsfall på Retail, Social Media, Aviation, Tourism, Finance.

Har du en fråga till oss? Vänligen nämna det i kommentarfältet så återkommer vi till dig.