OLTP vs OLAP



Följande blogg berättar kort om OLTP vs OLAP och de olika användningsfallen.

OLTP vs OLAP

OLTP sägs vara mer av ett online-transaktionssystem eller datalagringssystem, där användaren gör massor av online-transaktioner med hjälp av datalagret. Det sägs också att fler ad-hoc läser / skriver händer i realtid.





OLAP är mer en offline datalager. Det nåsantal gångeroffline. Till exempel läses massloggfiler och skrivs tillbaka till datafiler. Några av de vanliga områdena där OLAP används är Log Jobs, Data mining Jobs, etc.

Cassandra sägs vara mer av OLTP, eftersom det är i realtid, medan Hadoop är mer av OLAP, eftersom det används för analys och massskrivningar.



Varför integrera OLAP & OLTP?

Om du letar efter det billigaste priset för hotellbokning de närmaste 365 dagarna, här har du en enorm datamängd för Cassandra och vill rekommendera en databas i realtid, en kampanj körs baserat på pris.

I ett sådant scenario måste vi upprepa alla poster och hålla analyser ovanpå, vilket är ett enormt offlinejobb som måste startas ofta. Här spelar Hadoop in för att knäcka massdata.

Den andra fördelen är att vi kan köra ett kluster och avbryta att köra ett annat Hadoop-kluster.



Den tredje fördelen är att man också kan minska en hel del driftskostnader.

Med tanke på ett scenario där, om en användare är väl insatt i olika Hadoop Eco-system, som Hive, Pig Latin och behöver integrera data i den, måste man plugga in någon datakälla i Cassandra och försöka köra Map Minska också jobb.

Det finns ett märkbart mönster mellan OLTP och OLAP. I OLTP finns det mindre antal skrivningar, t.ex. Hotellinformation. Om vi ​​antar att prisändringarna sker var 5000: e gång per sekund kan läsningarna vara mer här. I ett sådant scenario kan det finnas en skrivning per sekund men läsningar kan utvisas till hundratusentals. Så förhållandet här är cirka 1: 1000.

Det är en intressant iakttagelse att Cassandra lätt kan passa in i den här modellen, vilket inkluderar modeller där läs / skriv är lika. Även när det gäller OLTP, även om man kommer in i en avstämbar och stark konsistensmodell, kan man se ett millisekundskillnad mellan eventuella konsekventa modeller och starkaste konsekventa modeller. Således kan Cassandra passa in i OLTP.

När man kommer till OLAP kan man se olika OLAP-mönster, vilket innebär att det finns flera skrivningar som händer samtidigt. I OLAP dumpar vi data i ett skott, dvs. alla loggfiler läggs i datalagret och sedan börjar vi bearbeta. Datamönstret eller åtkomstmönstret är precis motsatsen till OLTP-typ av applikation. Här kommer Hadoop eller MapReduce att vara användbara.

Har du en fråga till oss? Nämn dem i kommentarfältet så återkommer vi till dig.

Relaterade inlägg:

Topp 5 skäl att lära sig Cassandra

generera slumpmässig sträng i Java