SlideShare a Scribd company logo
Büyük Veri (Big data)
Hakkımda
 İstanbul Ünv . Bilgisayar Müh
 8+ Java , Java EE
 3+ Hadoop,Spark,Pig,Hive,Oozie
 Big Data Developer (Comodo)
İçerik
• Büyük Verilerin Özellikleri
• Büyük Verilerin saklanma yöntemleri
• Hadoop Nedir ve Temel Bileşenleri (HDFS , MapReduce)?
• Apache Spark , Apache Kafka , MongoDB
• Kullanım Senaryoları
• Uzmanlaşmak için tavsiyeler
Büyük Verilerin Özellikleri
Veri Miktarı (Volume)
◦ Boeing 737 uçağı tek bir uçuşta 240 terabyte veri üretmektedir
Veri hızı (Velocity)
◦ Bir dakika içerisinde 204 milyon e-mail , 1.8 milyon Facebook like , 278000 tweet işlemi yapılmaktadır
Veri çeşitliliği (Variety)
◦ Klasik veritabanı sistemleri küçük boyutta düzenli yapıdaki veriler için tasarlanmıştır . Oysa gerçek
hayatta resim , ses , konum , log , mekan verileri sıkça karşımıza çıkmaktadır
Verinin değerli olması (Value)
◦ Amazon firması tavsiye sistemi ile satış oranlarını %29 artırmıştır
Büyük verilerin saklanma yöntemleri
Verilerin karakteristiği ve işlenme yöntemine göre bir saklama sistemi kullanılır
Wide Column Stores/Column Family database
◦ HBase , Cassandra
◦ Buradaki yapı klasik veritabanına benzer bir şekilde tablo , kolon ve satır yapısı vardır.
Document Store
◦ ElasticSearch , MongoDB
◦ Veriler belirli bir şema yapısına sahip olmadan kaydedilir . JSON gibi
Key Value Store
◦ Redis , MemcacheDB
Hadoop Nedir ?
Hadoop , büyük veri kümeleri ile birden fazla makinada paralel olarak işlem yapmamızı sağlayan
Java ile yazılmış açık kaynak kodlu kütüphanedir
Hadoop Hdfs Nedir ?
Hadoop içerisinde büyük verileri sakladığımız bileşene HDFS (Hadoop Distributed File System)
denir
Hadoop MapReduce Nedir?
Hadoop içerisinde büyük verileri paralel olarak işleyebileceğimiz bileşene MapReduce denir .
Apache Spark
Spark büyük verileri işlemek için kullanılan bir kütüphanedir
Apache Kafka ile mesajlasma sistemleri
Apache Kafka büyük veri akışını düşük bir gecikme zamanı ile sağlayan açık kaynak kodlu bir
kütüphanedir
MongoDB
Mongo DB verileri JSON tabanlı kaydeden açık kaynak kodlu ilişkisel olmayan bir veritabanıdır
Kullanım Senaryoları
Örnek Analizler
 Son bir saat içerisinde 50 den fazla reklama tıklayan kullanıcılar
 Referer_url bilgisinden arama yapılan anahtar kelimelerin bulunması
 Tavsiye motoru (Müzik siteleri , sinema siteleri , alışveriş siteleri)
 Network üzerinde anormal durumlar ( fraud , anomaly detection )
 Reklam gösterimleri (Ad-network)
Big Data Job Trends
Uzmanlaşmak için tavsiyeler
•Büyük verilerin temel özellikleri
•Temel linux
•Temel programlama bilgisi (java , scala ..)
•Apache Hadoop
•Apache Spark
•Örnek bir mesajlaşma kütüphanesi (Apache Kafka)
•Örnek bir NoSQL kütüphanesi (MongoDB , ElasticSearch ..)
Teşekkürler
Güncel yazıları www.buyukveri.co
sitesinden takip edebilirsiniz

More Related Content

What's hot

Hadoop introduction , Why and What is Hadoop ?
Hadoop introduction , Why and What is  Hadoop ?Hadoop introduction , Why and What is  Hadoop ?
Hadoop introduction , Why and What is Hadoop ?
sudhakara st
 
(STG402) Amazon EBS Deep Dive
(STG402) Amazon EBS Deep Dive(STG402) Amazon EBS Deep Dive
(STG402) Amazon EBS Deep Dive
Amazon Web Services
 
Hbase Kullanım Senaryoları
Hbase Kullanım SenaryolarıHbase Kullanım Senaryoları
Hbase Kullanım Senaryoları
Talat UYARER
 
Hadoop Security Architecture
Hadoop Security ArchitectureHadoop Security Architecture
Hadoop Security Architecture
Owen O'Malley
 
Hive + Tez: A Performance Deep Dive
Hive + Tez: A Performance Deep DiveHive + Tez: A Performance Deep Dive
Hive + Tez: A Performance Deep DiveDataWorks Summit
 
Hadoop Overview & Architecture
Hadoop Overview & Architecture  Hadoop Overview & Architecture
Hadoop Overview & Architecture
EMC
 
(BDT303) Construct Your ETL Pipeline with AWS Data Pipeline, Amazon EMR, and ...
(BDT303) Construct Your ETL Pipeline with AWS Data Pipeline, Amazon EMR, and ...(BDT303) Construct Your ETL Pipeline with AWS Data Pipeline, Amazon EMR, and ...
(BDT303) Construct Your ETL Pipeline with AWS Data Pipeline, Amazon EMR, and ...
Amazon Web Services
 
MongoDB Sharding
MongoDB ShardingMongoDB Sharding
MongoDB Sharding
Rob Walters
 
Spark - Alexis Seigneurin (Français)
Spark - Alexis Seigneurin (Français)Spark - Alexis Seigneurin (Français)
Spark - Alexis Seigneurin (Français)
Alexis Seigneurin
 
Hadoop File system (HDFS)
Hadoop File system (HDFS)Hadoop File system (HDFS)
Hadoop File system (HDFS)
Prashant Gupta
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture
Lilia Sfaxi
 
데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...
데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...
데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...
Amazon Web Services Korea
 
Seminar Presentation Hadoop
Seminar Presentation HadoopSeminar Presentation Hadoop
Seminar Presentation HadoopVarun Narang
 
Optimizing Hive Queries
Optimizing Hive QueriesOptimizing Hive Queries
Optimizing Hive Queries
Owen O'Malley
 
Presentation Hadoop Québec
Presentation Hadoop QuébecPresentation Hadoop Québec
Presentation Hadoop Québec
Mathieu Dumoulin
 
Apache Spark Overview
Apache Spark OverviewApache Spark Overview
Apache Spark Overview
Vadim Y. Bichutskiy
 
Redis introduction
Redis introductionRedis introduction
Dremio introduction
Dremio introductionDremio introduction
Dremio introduction
Alexis Gendronneau
 
Introduction to elasticsearch
Introduction to elasticsearchIntroduction to elasticsearch
Introduction to elasticsearch
pmanvi
 
Hive: Loading Data
Hive: Loading DataHive: Loading Data
Hive: Loading Data
Benjamin Leonhardi
 

What's hot (20)

Hadoop introduction , Why and What is Hadoop ?
Hadoop introduction , Why and What is  Hadoop ?Hadoop introduction , Why and What is  Hadoop ?
Hadoop introduction , Why and What is Hadoop ?
 
(STG402) Amazon EBS Deep Dive
(STG402) Amazon EBS Deep Dive(STG402) Amazon EBS Deep Dive
(STG402) Amazon EBS Deep Dive
 
Hbase Kullanım Senaryoları
Hbase Kullanım SenaryolarıHbase Kullanım Senaryoları
Hbase Kullanım Senaryoları
 
Hadoop Security Architecture
Hadoop Security ArchitectureHadoop Security Architecture
Hadoop Security Architecture
 
Hive + Tez: A Performance Deep Dive
Hive + Tez: A Performance Deep DiveHive + Tez: A Performance Deep Dive
Hive + Tez: A Performance Deep Dive
 
Hadoop Overview & Architecture
Hadoop Overview & Architecture  Hadoop Overview & Architecture
Hadoop Overview & Architecture
 
(BDT303) Construct Your ETL Pipeline with AWS Data Pipeline, Amazon EMR, and ...
(BDT303) Construct Your ETL Pipeline with AWS Data Pipeline, Amazon EMR, and ...(BDT303) Construct Your ETL Pipeline with AWS Data Pipeline, Amazon EMR, and ...
(BDT303) Construct Your ETL Pipeline with AWS Data Pipeline, Amazon EMR, and ...
 
MongoDB Sharding
MongoDB ShardingMongoDB Sharding
MongoDB Sharding
 
Spark - Alexis Seigneurin (Français)
Spark - Alexis Seigneurin (Français)Spark - Alexis Seigneurin (Français)
Spark - Alexis Seigneurin (Français)
 
Hadoop File system (HDFS)
Hadoop File system (HDFS)Hadoop File system (HDFS)
Hadoop File system (HDFS)
 
Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture Thinking Big - Big data: principes et architecture
Thinking Big - Big data: principes et architecture
 
데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...
데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...
데브시스터즈 데이터 레이크 구축 이야기 : Data Lake architecture case study (박주홍 데이터 분석 및 인프라 팀...
 
Seminar Presentation Hadoop
Seminar Presentation HadoopSeminar Presentation Hadoop
Seminar Presentation Hadoop
 
Optimizing Hive Queries
Optimizing Hive QueriesOptimizing Hive Queries
Optimizing Hive Queries
 
Presentation Hadoop Québec
Presentation Hadoop QuébecPresentation Hadoop Québec
Presentation Hadoop Québec
 
Apache Spark Overview
Apache Spark OverviewApache Spark Overview
Apache Spark Overview
 
Redis introduction
Redis introductionRedis introduction
Redis introduction
 
Dremio introduction
Dremio introductionDremio introduction
Dremio introduction
 
Introduction to elasticsearch
Introduction to elasticsearchIntroduction to elasticsearch
Introduction to elasticsearch
 
Hive: Loading Data
Hive: Loading DataHive: Loading Data
Hive: Loading Data
 

Similar to Big Data Sunum

Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri AnaliziHadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Serkan Sakınmaz
 
Hadoop @ devveri.com
Hadoop @ devveri.comHadoop @ devveri.com
Hadoop @ devveri.com
Hakan Ilter
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
Mudur Alkan
 
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı GüçlendirinPHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
Muhittin Özer
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnıMustafa Tepe
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış
Veysel Taşcıoğlu
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel BakışBerkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış
techbase
 
TBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri AnalitiğiTBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri Analitiği
isa ölmez
 
MongoDB Overview
MongoDB OverviewMongoDB Overview
MongoDB Overview
Cihan Özhan
 
Linkle mimari
Linkle mimariLinkle mimari
Linkle mimari
Tahsin Yüksel
 
1 hafta_dersi
1  hafta_dersi1  hafta_dersi
1 hafta_dersi
Mudur Alkan
 
Nosql & MongoDB
Nosql & MongoDBNosql & MongoDB
Nosql & MongoDB
Serdar Buyuktemiz
 
Veri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan SarıbıyıkVeri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan Sarıbıyık
Hakan Sarıbıyık
 
Büyük Veri İşlemleri ve Hadoop
Büyük Veri İşlemleri ve HadoopBüyük Veri İşlemleri ve Hadoop
Büyük Veri İşlemleri ve Hadoop
Cenk Derinozlu
 
NoSQL Sunumu
NoSQL SunumuNoSQL Sunumu
NoSQL Sunumu
Ahmet Balkan
 
Hepsistream real time click-stream data analytics platform
Hepsistream real time click-stream  data analytics platformHepsistream real time click-stream  data analytics platform
Hepsistream real time click-stream data analytics platform
Hepsiburada
 
İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01
Cihan Özhan
 
İlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrineİlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrine
Muhittin Özer
 
AnkaraJUG Haziran 2013 - No SQL / Big Data
AnkaraJUG Haziran 2013 - No SQL / Big DataAnkaraJUG Haziran 2013 - No SQL / Big Data
AnkaraJUG Haziran 2013 - No SQL / Big DataAnkara JUG
 

Similar to Big Data Sunum (20)

Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri AnaliziHadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
Hadoop,Pig,Hive ve Oozie ile Büyük Veri Analizi
 
Hadoop @ devveri.com
Hadoop @ devveri.comHadoop @ devveri.com
Hadoop @ devveri.com
 
Big Data Analytics
Big Data AnalyticsBig Data Analytics
Big Data Analytics
 
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı GüçlendirinPHPkonf'15 - PHP Uygulamanızı Güçlendirin
PHPkonf'15 - PHP Uygulamanızı Güçlendirin
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnı
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnı
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış
 
Berkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel BakışBerkeley Data Analytics Stack Genel Bakış
Berkeley Data Analytics Stack Genel Bakış
 
TBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri AnalitiğiTBD Bilişim 2014 Veri Analitiği
TBD Bilişim 2014 Veri Analitiği
 
MongoDB Overview
MongoDB OverviewMongoDB Overview
MongoDB Overview
 
Linkle mimari
Linkle mimariLinkle mimari
Linkle mimari
 
1 hafta_dersi
1  hafta_dersi1  hafta_dersi
1 hafta_dersi
 
Nosql & MongoDB
Nosql & MongoDBNosql & MongoDB
Nosql & MongoDB
 
Veri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan SarıbıyıkVeri işleme üzerine, Hakan Sarıbıyık
Veri işleme üzerine, Hakan Sarıbıyık
 
Büyük Veri İşlemleri ve Hadoop
Büyük Veri İşlemleri ve HadoopBüyük Veri İşlemleri ve Hadoop
Büyük Veri İşlemleri ve Hadoop
 
NoSQL Sunumu
NoSQL SunumuNoSQL Sunumu
NoSQL Sunumu
 
Hepsistream real time click-stream data analytics platform
Hepsistream real time click-stream  data analytics platformHepsistream real time click-stream  data analytics platform
Hepsistream real time click-stream data analytics platform
 
İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01İleri Seviye T-SQL Programlama - Chapter 01
İleri Seviye T-SQL Programlama - Chapter 01
 
İlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrineİlişkisel Veritabanları, ORM ve Doctrine
İlişkisel Veritabanları, ORM ve Doctrine
 
AnkaraJUG Haziran 2013 - No SQL / Big Data
AnkaraJUG Haziran 2013 - No SQL / Big DataAnkaraJUG Haziran 2013 - No SQL / Big Data
AnkaraJUG Haziran 2013 - No SQL / Big Data
 

Big Data Sunum

  • 2. Hakkımda  İstanbul Ünv . Bilgisayar Müh  8+ Java , Java EE  3+ Hadoop,Spark,Pig,Hive,Oozie  Big Data Developer (Comodo)
  • 3. İçerik • Büyük Verilerin Özellikleri • Büyük Verilerin saklanma yöntemleri • Hadoop Nedir ve Temel Bileşenleri (HDFS , MapReduce)? • Apache Spark , Apache Kafka , MongoDB • Kullanım Senaryoları • Uzmanlaşmak için tavsiyeler
  • 4. Büyük Verilerin Özellikleri Veri Miktarı (Volume) ◦ Boeing 737 uçağı tek bir uçuşta 240 terabyte veri üretmektedir Veri hızı (Velocity) ◦ Bir dakika içerisinde 204 milyon e-mail , 1.8 milyon Facebook like , 278000 tweet işlemi yapılmaktadır Veri çeşitliliği (Variety) ◦ Klasik veritabanı sistemleri küçük boyutta düzenli yapıdaki veriler için tasarlanmıştır . Oysa gerçek hayatta resim , ses , konum , log , mekan verileri sıkça karşımıza çıkmaktadır Verinin değerli olması (Value) ◦ Amazon firması tavsiye sistemi ile satış oranlarını %29 artırmıştır
  • 5. Büyük verilerin saklanma yöntemleri Verilerin karakteristiği ve işlenme yöntemine göre bir saklama sistemi kullanılır Wide Column Stores/Column Family database ◦ HBase , Cassandra ◦ Buradaki yapı klasik veritabanına benzer bir şekilde tablo , kolon ve satır yapısı vardır. Document Store ◦ ElasticSearch , MongoDB ◦ Veriler belirli bir şema yapısına sahip olmadan kaydedilir . JSON gibi Key Value Store ◦ Redis , MemcacheDB
  • 6. Hadoop Nedir ? Hadoop , büyük veri kümeleri ile birden fazla makinada paralel olarak işlem yapmamızı sağlayan Java ile yazılmış açık kaynak kodlu kütüphanedir
  • 7. Hadoop Hdfs Nedir ? Hadoop içerisinde büyük verileri sakladığımız bileşene HDFS (Hadoop Distributed File System) denir
  • 8. Hadoop MapReduce Nedir? Hadoop içerisinde büyük verileri paralel olarak işleyebileceğimiz bileşene MapReduce denir .
  • 9. Apache Spark Spark büyük verileri işlemek için kullanılan bir kütüphanedir
  • 10. Apache Kafka ile mesajlasma sistemleri Apache Kafka büyük veri akışını düşük bir gecikme zamanı ile sağlayan açık kaynak kodlu bir kütüphanedir
  • 11. MongoDB Mongo DB verileri JSON tabanlı kaydeden açık kaynak kodlu ilişkisel olmayan bir veritabanıdır
  • 13. Örnek Analizler  Son bir saat içerisinde 50 den fazla reklama tıklayan kullanıcılar  Referer_url bilgisinden arama yapılan anahtar kelimelerin bulunması  Tavsiye motoru (Müzik siteleri , sinema siteleri , alışveriş siteleri)  Network üzerinde anormal durumlar ( fraud , anomaly detection )  Reklam gösterimleri (Ad-network)
  • 14. Big Data Job Trends
  • 15. Uzmanlaşmak için tavsiyeler •Büyük verilerin temel özellikleri •Temel linux •Temel programlama bilgisi (java , scala ..) •Apache Hadoop •Apache Spark •Örnek bir mesajlaşma kütüphanesi (Apache Kafka) •Örnek bir NoSQL kütüphanesi (MongoDB , ElasticSearch ..)