Big Data Processing med Apache Spark & ​​Scala



Apache Spark har kommit fram som en stor utveckling inom stor databehandling.

hur man skapar session i java

IST: 07:00 - 08:00, 17 oktober’14





PDT: 18:30 - 19:30, 16 oktober '14

Begränsade platser !! Fyll i formuläret till höger och boka din spelautomat idag.



Hej alla, vi genomför ett gratis webbseminarium om Apache Spark och Scala den 18 oktober 14. Webbinariets titel är 'Big Data Processing with Apache Spark and Scala' . I detta webinar diskuteras de viktigaste ämnena angående Apache Spark och Scala. Eventuella frågor eller tvivel kan klargöras under sessionen.

Ämnen som ska täckas:

  • Vad är Big Data?
  • Vad är Spark?
  • Varför gnista?
  • Spark Ecosystem
  • En anteckning om Scala
  • Varför Scala?
  • Hello Spark - Hands on

Varför gnista?

Apache Spark är ett ramverk för öppen källkodsdator för Hadoop-community-kluster. Det kvalificerar sig för att vara en av de bästa dataanalys- och bearbetningsmotorerna för storskalig data med sin oöverträffade hastighet, användarvänlighet och sofistikerade analys. Följande är fördelarna och funktionerna som gör Apache Spark till en crossover-hit för såväl operativ som undersökande analys:

  • De program som utvecklats över Spark körs 100 gånger snabbare än de som utvecklats i Hadoop MapReduce.
  • Spark sammanställer 80 högnivåoperatörer.
  • Spark Streaming möjliggör databehandling i realtid.
  • GraphX ​​är ett bibliotek för grafiska beräkningar.
  • MLib är maskininlärningsbiblioteket för Spark.
  • Primärt skrivet i Scala, kan Spark inbäddas i vilket JVM-baserat operativsystem som helst, samtidigt kan det också användas på REPL (Läs, utvärdera, bearbeta och ladda).
  • Den har kraftfulla cachning och diskuthållighetskapacitet.
  • Spark SQL gör det möjligt att hantera SQL-frågor på ett skickligt sätt
  • Apache Spark kan distribueras via Apache Mesos, Garn i HDFS, HBase, Cassandra eller Spark Cluster Manager (Sparks egen klusterhanterare).
  • Spark simulerar Scalas funktionella stil och samlings-API, vilket är en stor fördel för Scala- och Java-utvecklare.

Behov av Apache Spark:

Spark ger enorma fördelar för branschen när det gäller hastighet, olika uppgifter den kan utföra, flexibilitet, kvalitetsdataanalys, kostnadseffektivitet etc., vilket är dagens behov. Den levererar avancerade lösningar med stora dataanalyser i realtid till IT-industrin och tillgodoser den ökande kundernas efterfrågan. Realtidsanalys utnyttjar affärsmöjligheter till massor. Dess kompatibilitet med Hadoop gör det mycket enkelt för företagen att snabbt anta det. Det finns ett brant behov av experter och utvecklare från Spark-lärda, eftersom det är en relativt ny teknik som alltmer antas.