Final deck

Big Data for Everyone Twitter: #bd4e

Introduction to Big Data Steve Watt Hadoop Strategy @wattsteve #bd4e

What is “Big Data”? ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

How were these issues addressed? ,[object Object],[object Object],[object Object],[object Object]

What is Apache Hadoop ? It is a cluster technology with a single master and multiple slaves, designed for commodity hardware It consists of two runtimes, the Hadoop distributed file system ( HDFS ) and Map/Reduce As data is copied onto the HDFS, it ensures the data is blocked and replicated to other machines (node) to provide redundancy Self contained jobs are written in Map/Reduce and submitted to the cluster. The jobs run in parallel on each of the machines in the cluster, processing the data on the local machine ( data locality ). Hadoop may execute or re-execute a job on any node in the cluster. Node failures are automatically handled by the framework.

The Big Data Ecosystem ClusterChef / Apache Whirr / EC2 Hadoop Pig / WuKong /Cascading Cassandra / HBase Offline Systems (Analytics) Human Consumption BigSheets / DataMeer Hive / Karmasphere Provisioning Nutch / SQOOP / Flume Scripting DBA Non-Programmer Import/Export Tooling Visualizations Online Systems (OLTP @ Scale) NoSQL Commodity Hardware

Offline customer scenario Eric Sammer Solution Architect @esammer #bd4e

Use Case: Product Recommendations ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Problems ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

The Answer ,[object Object],[object Object]

Online customer scenario Matt Pfeil CEO @mattz62 #bd4e

What is Apache Cassandra? 03/17/11

Use Case: Managing Email ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Requirements ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Solution ,[object Object],[object Object],[object Object],[object Object],[object Object]

Where to next? The Adjacent Possible Flip Kromer CTO @mrflip #bd4e

myth of the “data base” ,[object Object],[object Object]

Managing & Shipping ,[object Object],[object Object],[object Object],[object Object],[object Object]

Data flutters by label Elephants make sturdy piles {GROUP} Number becomes thought process_group Hadoop

Twitter Parser in a Tweet class TwStP < Streamer def process line a = JSON.load(line) rescue {} yield a.values_at(*a.keys.sort) endendWukong.run(TwStP)

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Data Stores in Production

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Dev Ops: Rethink Hard

Still Blind ,[object Object],[object Object],[object Object],[object Object]

Human-Scale Tools ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Panel Discussion Stu Hood Software Engineer @stuhood #bd4e

Thanks for coming! Stu Hood @stuhood Flip Kromer @mrflip Matt Pfeil @mattz62 Eric Sammer @esammer Steve Watt @wattsteve

Final deck

Recommended

Recommended

More Related Content

What's hot

What's hot (20)

Viewers also liked

Viewers also liked (20)

Similar to Final deck

Similar to Final deck (20)

More from Steve Watt

More from Steve Watt (10)

Recently uploaded

Recently uploaded (20)

Final deck

Editor's Notes