APACHE KAFKA: NÄSTA GENERATIONS DISTRIBUERADE MEDDELANDESYSTEM -

I dagens värld, data är huvudingrediensen av internetapplikationer och omfattar vanligtvis följande:

Sidbesök och klick
Användaraktiviteter
Händelser som motsvarar inloggningar
Sociala nätverksaktiviteter som gillanden, delningar och kommentarer
Applikationsspecifika mätvärden (t.ex. loggar, sidladdningstid, prestanda etc.)

Detta data kan användas för att köra analyser i realtid tjänar olika syften, varav några är:

Leverera annonser
Spåra onormala användarbeteenden
Visar sökning baserat på relevans
Visar rekommendationer baserat på tidigare aktiviteter

Problem: Det är inte lätt att samla in all information eftersom data genereras från olika källor i olika format

Lösning: Ett av sätten att lösa detta problem är att använda ett meddelandesystem. Meddelandesystem ger en sömlös integration mellan distribuerade applikationer med hjälp av meddelanden.

apache-kafka-next-generation-distributed-messaging-system

Apache Kafka:

Apache Kafka är ett distribuerat publiceringsmeddelandesystem som ursprungligen utvecklades på LinkedIn och senare blev en del av Apache-projektet. Kafka är snabb, smidig, skalbar och distribuerad efter design.

Kafka Architecture and Terminology:

Ämne: En ström av meddelanden som tillhör en viss kategori kallas ett ämne

Producent: En producent kan vara vilken applikation som helst som kan publicera meddelanden till ett ämne

Konsument: En konsument kan vara vilken applikation som helst som prenumererar på ämnen och konsumerar meddelandena

Mäklare : Kafka-kluster är en uppsättning servrar som alla kallas en mäklare

Kafka är skalbar och möjliggör skapande av flera typer av kluster.

hur man konverterar ett tal till binärt i python

Single Node Single Broker Cluster
Single Node Multiple Broker Cluster
Flera noder Multipla mäklarkluster

Single Node Single Broker

Vilken roll har ZooKeeper?

Varje Kafka-mäklare samordnar med andra Kafka-mäklare som använder ZooKeeper. Producenter och konsumenter meddelas av ZooKeeper-tjänsten om närvaron av nya mäklare eller misslyckande hos mäklaren i Kafka-systemet.

Single Node Multiple Brokers

Flera noder Flera mäklare

Kafka @ LinkedIn

LinkedIn Newsfeed drivs av Kafka

vad är begränsningar i sql

LinkedIn-rekommendationer drivs av Kafka

LinkedIn-aviseringar drivs av Kafka

Notera: Bortsett från detta använder LinkedIn Kafka för många andra uppgifter som loggövervakning, prestandamätvärden, sökförbättring, bland andra.

Vem använder Kafka annars?

DataSift: DataSift använder Kafka som samlare av övervakningshändelser och för att spåra användarnas konsumtion av dataströmmar i realtid

Wooga: Wooga använder Kafka för att samla och bearbeta spårningsdata från alla deras Facebook-spel (värd hos olika leverantörer) på en central plats

Svampcell: Spongecell använder Kafka för att köra hela sin analys- och övervakningspipeline som driver både realtids- och ETL-applikationer

Loggly: Loggly är världens mest populära molnbaserade logghantering. Den använder Kafka för loggsamling.

Jämförande studie: Kafka vs. ActiveMQ vs. RabbitMQ

Kafka har ett mer effektivt lagringsformat. I genomsnitt har varje meddelande en overhead på 9 byte i Kafka, jämfört med 144 byte i ActiveMQ

I både ActiveMQ och RabbitMQ upprätthåller mäklare leveransstatus för varje meddelande genom att skriva till disk men i fallet med Kafka finns det ingen diskskrivning, vilket gör det snabbare.

Med den breda antagandet av Kafka i produktionen ser det ut att vara en lovande lösning för att lösa verkliga världsproblem. Apache Kafka-utbildning kan hjälpa dig att komma före dina kamrater i en analytisk karriär i realtid. Kom igång med en Apache Kafka-handledning här .

Har du en fråga till oss? Vänligen nämna det i kommentarfältet så återkommer vi till dig.

Relaterade inlägg:

Vad du behöver för en karriär inom realtidsanalys

Apache Kafka: Nästa generations distribuerade meddelandesystem

Apache Kafka tillhandahåller hög kapacitet och skalbara meddelandesystem som gör det populärt i realtidsanalys. Lär dig hur en Apache kafka-handledning kan hjälpa dig

Kategorier

Popular Articles

De bästa tekniska färdigheterna för att säkra framtidens jobb

Allt du behöver veta om ITIL V3 vs ITIL V4

Hur implementerar jag olika typer av listor i HTML?

Hur man implementerar abstrakt klass i php?

En introduktion till Power Query Editor

Hur man utför logistisk regression i Python?

Allt om datahämtning i PHP

HDFS-handledning: Introduktion till HDFS och dess funktioner

Webbtjänster: The Real Deal

Vad är logger i Java och varför använder du det?

Handledning för Android-tjänster: Hur kör jag ett program i bakgrunden?

Git vs Github - Demystifying The Differences