Steg för att skapa UDF i Apache Pig



Apache Pig har flera fördefinierade funktioner. Inlägget innehåller tydliga steg för att skapa UDF i Apache Pig. Här är koderna skrivna i Java och kräver Pig Library

Det här inlägget innehåller nödvändiga steg för att skapa UDF i Apache Pig. Alla UDF bör utöka en filterfunktion och måste innehålla en metod som kallas exec, som innehåller en Tuple. Logiken som tillämpas här är att om Tuple är noll eller noll, kommer det att ge dig ett booleskt värde: True eller False. Och ”IsofAge” är för att kontrollera om den angivna åldern är korrekt eller inte. Logiken för den användardefinierade funktionen skrivs i Java-koder, där JAR-filen skapas och sedan exporteras. JAR-filen registreras senare. Dessa JAR-filer finns i biblioteksfilerna hos Apache Pig vid laddningen.

 offentlig klass IsOfAge utökar FilterFunc { @Åsidosätta publicBoolean exec (Tuple tuple) kastarIOException {   om (tuple == null || tuple.size () == 0) {   returfalsk } Prova{ Objektobjekt = tuple.get (0) om (objekt == null) {   returfalsk } inti = (heltal) objekt   om (i == 18 || i == 19 || i == 21 || i == 23 || i == 27) {   tillbaka } annat { returfalsk }} fånga (ExecExceptione) { throwewIOException (e) }}}

Hur man kallar en gris UDF?

När en UDF har skapats måste följande kommando användas för att registrera JAR-filen.





registrera myudf.jar X = filter A av IsOfAge (ålder)

Steg för att skapa UDF i gris:

Det finns flera fördefinierade funktioner i Apache Pig. Vi har också funktionen att skapa vår egen funktion som är användardefinierad funktion (UDF). Pig UDF är skrivet i Java och detta kräver att Pig Library använder de fördefinierade klasserna. Apache Pig-biblioteket pig-0.8.0-cdh3u0-core.jar kan laddas ner från internet.

vad gör .trim i java

Klicka här för steg för att skapa ett grisskript med UDF i HDFS-läge.



Har du en fråga till oss? Nämn dem i kommentarfältet så återkommer vi till dig.

Relaterade inlägg:

fördelar med metodöverbelastning i java

Apache Pig Script med UDF i HDFS-läge



java få datum från sträng

Operatörer i Apache Pig: Del 1- Relationsoperatörer

Operatörer i Apache Pig: Del 2 - Diagnostiska operatörer