Big data hadoop rdbms

Big Data MapReduce vs. RDBMS Arjen P. de Vries [email_address] Centrum Wiskunde & Informatica Delft University of Technology Spinque B.V.

Context ,[object Object],[object Object],[object Object]

Shared-nothing Architecture ,[object Object],[object Object]

Programming Model ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Parallel DBMS ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Parallel DBMS ,[object Object]

Parallel DBMS ,[object Object],[object Object],[object Object]

Comparison (on 100-node cluster) http://database.cs.brown.edu/projects/mapreduce-vs-dbms/ Hadoop DBMS-X Vertica Hadoop/ DBMS-X Hadoop/ Vertica Grep 284s 194s 108s 1.5 2.6 Web Log >1Ks 740s 268s 1.6 4.3 Join >1Ks 32s 55s 36.3 21

Details Comparison Study ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Details Comparison Study ,[object Object],[object Object],[object Object],[object Object]

Parallel DBMS ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Ease-of-Use ,[object Object],[object Object],[object Object],[object Object]

Parallel DBMS ,[object Object],[object Object],[object Object],[object Object]

Hybrid Solution? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Desiderata ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

HadoopDB ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

HadoopDB ,[object Object],[object Object],[object Object],[object Object]

Data Loader ,[object Object],[object Object],[object Object],[object Object]

Planner (SMS) ,[object Object],[object Object],[object Object],[object Object]

SELECT YEAR(saleDate), SUM(revenue) FROM SALES GROUP BY YEAR(saleDate)

Planner (SMS) ,[object Object],[object Object],[object Object]

Comparison ,[object Object],[object Object],[object Object],[object Object],[object Object]

Hadoop / Hive ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Hadapt ,[object Object],[object Object],[object Object],[object Object],[object Object]

Two orders of magnitude ,[object Object],[object Object],[object Object],[object Object]

Dutch Database History!!! ,[object Object],[object Object],[object Object]

Vectorwise ,[object Object],[object Object],[object Object],[object Object]

Improved Query Plans ,[object Object],[object Object],[object Object]

Improved Query Plans ,[object Object],[object Object],[object Object],[object Object]

Join in Hadoop ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Improved Query Plans ,[object Object],[object Object],[object Object],[object Object],[object Object]

Broadcast & Directed Joins ,[object Object],[object Object],[object Object]

Broadcast Join ,[object Object],[object Object],[object Object],[object Object]

Directed Join ,[object Object]

Semi-join ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Results ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Results ,[object Object],[object Object],[object Object],[object Object],[object Object]

Conclusion ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Conclusion ,[object Object],[object Object],[object Object]

Information Science ,[object Object],[object Object]

References ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Big data hadoop rdbms

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to Big data hadoop rdbms

Similar to Big data hadoop rdbms (20)

More from Arjen de Vries

More from Arjen de Vries (20)

Recently uploaded

Recently uploaded (20)

Big data hadoop rdbms