Big Data

Spark vs Hadoop: Vilket är det bästa Big Data Framework?

Detta blogginlägg talar om apache gnista vs hadoop. Det ger dig en uppfattning om vilken rätt Big Data-ram du kan välja i olika scenarier.

Köra Scala-applikation i Eclipse IDE med Sbteclipse

Den här bloggen hjälper dig att förstå hur du installerar och konfigurerar sbteclipse-plugin med steg-för-steg-instruktioner för att köra Scala-applikationen i Eclipse IDE.

Behärskade Hadoop? Dags att komma igång med Apache Spark

Det här blogginlägget förklarar varför du måste komma igång med Apache Spark efter Hadoop & varför att lära sig Spark efter att ha behärskat hadoop kan göra underverk för din karriär!

Drilling Down On Apache Drill, New-Age Query Engine

Den här Apache Drill-handboken ger dig all information du behöver för att komma igång med Apache Drill-frågemotorn, användning med Hadoop, Big Data & Apache Spark.

Apache Spark combineByKey Explained

Den här Spark Hadoop-bloggen berättar allt du behöver veta om Apache Spark combineByKey. Hitta medelvärdet per elev med hjälp av combineByKey-metoden.

Apache Falcon: Ny datahanteringsplattform för Hadoop-ekosystemet

Apache Falcon är en ny datahanteringsplattform för Hadoop-ekosystemet som förenklar ombordmatning av foderbehandling och foderhantering på hadoop-kluster. Lär dig hur du ställer in det.

Gnistackumulatorer förklarade: Apache Spark

Den här Apache Spark-bloggen förklarar Spark-ackumulatorer i detalj. Lär dig användning av gnistackumulator med exempel. Gnistackumulatorer är som Hadoop Mapreduce-räknare.

Apache Flink: Nästa generations Big Data Analytics-ramverk för databehandling av ström och batch

Lär dig allt om Apache Flink och skapa ett Flink-kluster i den här bloggen. Flink stöder realtids- och batchbehandling och är ett måste för Big Data-teknik för Big Data Analytics.

Distribuerad caching med sändningsvariabler: Apache Spark

Det här blogginlägget diskuterar distribuerad caching med sändningsvariabler och du kommer igång med att effektivt distribuera stora värden i Spark-programmering.

CCA- och CCP-certifieringar av Cloudera: Allt du behöver veta

CCA- och CCP-certifieringar av Cloudera har ersatt CCDH- och CCSHB-prov. Den här bloggen berättar allt du behöver veta om de nya certifieringarna.

Stateful Transformations with Windowing in Spark Streaming

Det här blogginlägget diskuterar stateful transformations with windowing in Spark Streaming. Lär dig allt om spårning av data i flera satser med hjälp av statliga D-Streams.

Kumulativ Stateful Transformation In Apache Spark Streaming

Det här blogginlägget diskuterar stateful transformations in Spark Streaming. Lär dig allt om kumulativ spårning och kompetens för en Hadoop Spark-karriär.

Stora data inom vården: Hur Hadoop revolutionerar Healthcare Analytics

Hadoop & Big Data-teknologier revolutionerar sjukvårdsanalyser. Den här stora datan i vårdbloggen diskuterar hur stor dataanalys kan förbättra medicinsk vård.

Hadoop Streaming: Skriva ett Hadoop MapReduce-program i Python

Det här blogginlägget på Hadoop Streaming är en steg-för-steg-guide för att lära dig att skriva ett Hadoop MapReduce-program i Python för att bearbeta enorma mängder Big Data.

Big Data Tutorial: Allt du behöver veta om Big Data!

Denna blogg om Big Data Tutorial ger dig en fullständig översikt över Big Data, dess egenskaper, applikationer samt utmaningar med Big Data.

HDFS-handledning: Introduktion till HDFS och dess funktioner

Denna HDFS självstudieblogg hjälper dig att förstå HDFS eller Hadoop Distribuerade filsystem och dess funktioner. Du kommer också att utforska dess kärnkomponenter i korthet.

Splunk vs. ELK vs. Sumo Logic: Vilket fungerar bäst för dig?

I denna Splunk-handledning ska du förstå skillnaderna mellan Splunk vs. ELK vs. Sumo Logic och bestämma vilka av dessa verktyg som passar dig bäst.

Splunk Use Case: Dominos framgångshistoria

I denna blogg om Splunk-användningsfall kommer du att förstå hur Domino's Pizza använde Splunk för att få konsumentbeteende. Och formulera sina affärsstrategier.

Installera Hadoop: Konfigurera ett enda nod Hadoop-kluster

Denna handledning är en steg-för-steg-guide för att installera Hadoop-kluster och konfigurera det på en enda nod. Alla installationsstegen för Hadoop är för CentOS-maskinen.