Hur man kör bikupeskript?



Det här är en handledning om hur man kör Hive-skript. Att köra detta skript minskar tiden och ansträngningen vi lägger på att skriva och utföra varje kommando manuellt.

Apache Hive blir ett datalagerpaket byggt ovanpå Hadoop och blir alltmer van vid dataanalys, datautvinning och förutsägbar modellering. Organisationer letar efter yrkesverksamma med ett fast grepp . I det här inlägget ska vi titta på hur du kör Hive-skript. I allmänhet använder vi skript för att utföra en uppsättning uttalanden på en gång. Hive-skript används ganska mycket på samma sätt. Det minskar tiden och ansträngningen vi lägger på att skriva och utföra varje kommando manuellt.

Hive-skript stöds i Hive 0.10.0 och högre versioner. Eftersom Hive 0.90-versionen är installerad i CDH3 kan vi inte köra Hive-skript i CDH3. Du kan prova stegen nedan i CDH4 eftersom den har Hive 0.10.0-versionen installerad i dem. Är du medveten om hur du skapar ett Hive-skript? Om nej, klicka för att få mer förtydligande.





Master-Hive-Now

Låt oss nu se hur man skriver skript i Hive och kör dem i CDH4:



Steg 1: Skriva ett Hive-skript.

För att skriva Hive-skriptet ska filen sparas med .sql-tillägget. Öppna en terminal i din Cloudera CDH4-distribution och ge följande kommando för att skapa ett Hive-skript.
Kommando: sudo gedit sample.sql

När kommandot ovan körs öppnas filen med listan över alla Hive-kommandon som behöver köras.



I detta skript kommer en tabell att skapas, beskrivas och data laddas och hämtas från tabellen.

1. Skapa tabellen i bikupan:

Kommando: skapa tabellprodukt (produktid: int, produktnamn: sträng, pris: flyt, kategori: sträng) rader format avgränsade fält avslutade med ','

Här är produkten tabellnamnet och {productid, productname, price, category} är kolumnerna i denna tabell.

Fält som avslutas med ',' indikerar att kolumnerna i inmatningsfilen är åtskilda av symbolen ','.

Som standard separeras posterna i inmatningsfilen med en ny rad.

2. Beskriva tabellen:

Kommando: beskriva produkten

3. Ladda data i tabellen.

För att ladda in data i tabellen först måste vi skapa en inmatningsfil som innehåller de poster som måste infogas i tabellen.

Låt oss skapa en inmatningsfil.

Kommando: sudo gedit input.txt

passera värde och passera referens java

Redigera innehållet i filen som visas i figuren.

4. Hämta data:

För att hämta data används select-kommandot.

Kommando: Välj * från produkten

Ovanstående kommando används för att hämta värdet på alla kolumner som finns i tabellen. Skriptet ska vara som det visas i bilden nedan.

Nu är vi klara med att skriva Hive-skriptet. Filen sample.sql kan nu sparas.

Steg 2: Köra Hive Script

Följande är kommandot för att köra Hive-skriptet:

Kommando: bikupa –f /home/cloudera/sample.sql

När du kör skriptet, se till att hela sökvägen till platsen för skriptfilen finns.

Vi kan se att alla kommandon körs framgångsrikt.

Så här körs och körs Hive-skript i CDH4.

Hive är en kritisk del av Hadoop och din expertis inom Hive kan ge dig toppbetalda Hadoop-jobb! Edureka har en speciellt kuraterad Hadoop-kurs som hjälper dig att behärska koncept som MapReduce, Garn, Pig, Hive, HBase, Oozie, Flume och Sqoop. Klicka på knappen nedan för att komma igång.

Har du en fråga till oss? Vänligen nämna dem i kommentarfältet så återkommer vi till dig.

Relaterade inlägg:

Hive-kommandon

Hive-datamodeller