SlideShare a Scribd company logo
Mehmet AKŞAHİN
Bilgisayar Mühendisliği
Yüksek Lisans Öğrencisi
WEB MİNİNG
WEB MADENCİLİĞİ NEDİR?
NERELERDE KULLANILIR?
GİRİŞ
• Web Madenciliği; birçok mühendisin görüşüne
göre ilk kez Etzioni tarafından 1996’da ortaya
atılmıştır[1]
• Web Madenciliği, Veri Madenciliğinin alt dalıdır.
• Veri Madenciliğinden yola çıkarak, Web
Madenciliği, Metin Madenciliği gibi alt dallar
ortaya çıkmıştır.
GİRİŞ
• Veri toplamanın önemini kavrayan her firma ,
kamu kuruluşu ve benzeri kuruluşlar, verileri
depolayarak onlardan sonuçlar çıkarmaktadır.
• Ancak veri tabanlarından sorgular yardımı ile elde
edilen bilgiler sadece sorgu bazlı bilgiler olup en
üst düzeyde faydaya ulaşılamamaktadır.
Verilerden en yüksek şekilde faydalanabilmenin
yolu veri madenciliğinden geçmektedir.
Veri, Metin ve Web Madenciliği
• Veri Madenciliği yerine göre alt dallara
ayrılmaktadır.
• Veri madenciliği mevcut veriden anlamlı bilgileri,
ilişkileri çıkarmada kullanılan tekniklere verilen
genel isimdir. Veri madenciliği yapısal veriyi analiz
edebilmekte iken; metin ve web madenciliği
yapısal olmayan verinin, veri madenciliğinde
kullanılmak üzere, yapısal hale
dönüştürülmesinde kullanılmaktadır.
Veri, Metin ve Web Madenciliği
• Farklı birçok alanda kullanılabilen veri
madenciliğinin alt alanlarından Metin ve Web
Madenciliği; yapısal olmayan verinin metin ve
web madenciliği yöntemleri ile yapısal hale
dönüştürülmesi ile başlar ve teknik işlemlerle
devam eder.
• Ancak her şeyden önce; yapısal olmayan verinin,
veri,web veya metin madenciliğinde
kullanılabilecek bir yapısal veri haline gelmesi
gerekmektedir.
Yapısal ve Yapısal Olmayan Veriler
• Yapısal veri, bir yapı içerisinde organize edilebilen
ve bundan dolayı tanımlanabilen veri için
kullanılan bir terimdir. Yapısal veri, içerikteki veri
tipine göre organize edilebilen ve arama
yapılabilen veridir.
• En yaygın kullanılan yapısal veri kaynakları SQL
(Structured Query Language) ve Access gibi veri
kaynaklarıdır. SQL kaynaklar için Oracle,
PostgreSQL, Microsoft SQL Server gibi yardımcı
database programları kullanılabilir.
Yapısal ve Yapısal Olmayan Veriler
• Buna karşın yapısal olmayan verinin
tanımlanabilir bir yapısı yoktur.
• En çok bilinen yapısal olmayan veri türleri; resim
dosyaları, pdf, word ve text gibi metin dosyaları,
web üzerinde tutulan log dosyaları ve
epostalardır. Excel gibi hücre yapısına sahip veri
türleri yapısal olmasına rağmen halen yapısal
olma ve olmama konusundaki yeri tartışmalıdır.
Veri Madenciliğinin Metin ve Web
Madenciliğindeki Rolü
• Veri madenciliği çözümleri ve algoritmalar metin
veya web verisindeki kalıplar bulmadan veya
model oluşturmadan önce metin veya web
verisinin yapısal olması gerekmektedir.
• Metin ve Web madenciliği işlemleri, veri
madenciliğinde kullanılacak yapısal veriye
ulaşmak için kullanılan araçlar olarak
tanımlanabilir
Metin ve Web Madenciliği
• Metin ve web madenciliği son yıllarda oldukça
fazla çalışılan birbiri ile ilişkili alanlardır. Metin
madenciliği, çok büyük belgelerin analizi ve metin
tabanlı verinin içerisindeki gizli kalıpların elde
edilmesidir.
• Web madenciliği ise, web içerikleri, sayfa yapıları
ve web bağlantı istatistiklerinin de içinde olduğu
web ile ilişkili olan verinin analizini içermektedir
[10].
Metin Madenciliği
• Kısaca Metin Madenciliğinden bahsedersek;
• Metin verisindeki anlamın ortaya
çıkarılabilmesi için kullanılan yöntem metin
madenciliğidir.
• Metin yazımında standart kurallar
olmadığından dolayı bilgisayar bunları
anlayamamaktadır.
Metin Madenciliği
• Yapısal olmayan bilgiden içerik çıkarmak için
kullanılan geleneksel yöntemler; dilbilimsel
olmayan yöntemlerdir.
• Bu yöntemler, hem sorgudaki hem de
metindeki kelimelerin karakterlerini
karşılaştıran bir temele dayanır. Bundan dolayı
içeriği açıklayıcı sonuçlar elde edemez.
Metin Madenciliği
• Dili anlamanın temeli dilbilimsel yollara dayanır
ve bu Natural Language Processing (NLP) olarak
ifade edilir.
• NLP’yi içeren bir sistemde, karmaşık yapıların
bulunduğu ifadeler (örneğin; duştan akan soğuk
su ile içilen soğuk su arasındaki fark gibi) akıllı
olarak çıkarabilmekte ve terimleri sınıflayarak;
ürünler, organizasyonlar veya kişiler gibi sınıflara
atamaktadır.
Web Madenciliği Giriş
• Tüm bu özetlerden sonra asıl konumuz olan
Web Madenciliğine giriş yapacağız.
• Başta da belirtildiği gibi Web Madenciliğini
anlayabilmek için Veri Madenciliğini anlamak
ve Metin Madenciliği hakkında yüzeysel bilgi
sahibi olmak gerekmektedir.
Web Madenciliği
• Web kullanım madenciliği, bir veya birçok web
sunucusundan kullanıcı erişim desenlerinin
otomatik keşfinin ve analizin yapıldığı bir tip veri
madenciliği etkinliğidir.
• Birçok kuruluş pazar analizleri için geliştirdikleri
stratejileri ziyaretçi bilgilerine dayanarak yerine
getirir. Kuruluşlar günlük operasyonlarla her gün
yüzlerce MB veri toplamaktadır.
Web Madenciliği
• Bu bilgilerin çoğu web sunucuların otomatik
olarak tuttuğu günlük dosyalarından elde edilir.
Günlük dosyaları, istemciden sunucuya
gönderilen her bir isteğin bir kayıt olarak
eklenmesi ile meydana gelir.
• Günlük dosyalarının analizi, müşterilerin ilgi
alanları, ürünler üzerinden pazar stratejileri
oluşturma, promosyon kampanyalarının etkisi gibi
hususlarda, kurumlara karar süreçlerinde
yardımcı olur.
Web Madenciliği
• Sunucu erişim kayıtlarının ve kullanıcı kaydı
verilerinin analizi, aynı zamanda kurumun daha
etkili bir sunumunun yapılabilmesi için Web
sitesini nasıl daha iyi hale getirebileceği hakkında
değerli bilgiler sağlar.
• İntranet teknolojilerini kullanan kurumlarda, bu
tür analizler çalışma grubu iletişimi ve kurumsal
altyapının daha iyi işletilmesine ışık tutabilir.
Web Madenciliği
• Son olarak, World Wide Web üzerinden
reklam yapan kurumlar için kullanıcı erişim
desenlerini analiz etmek, reklamların belirli bir
kullanıcı grubuna yönlendirilmesine yardımcı
olur
• Web madenciliği alanları ve web kullanım
madenciliği aşamaları şeması bir sonraki
slaytta verilmiştir.
Web
Madenciliği
Web İçerik
Madenciliği
Web Yapı
Madenciliği
Web Kullanım
Madenciliği
Web Sayfa
İçerik
Madenciliği
Arama
Sonuç
Madenciliği
Genel Web
Kullanım
Madenciliği
Site
Güncelleme
Sistemleri
Sistem
İyileştirme
Kişiselleştirme
Web
Madenciliği
Web İçerik
Madenciliği
Web Yapı
Madenciliği
Web Kullanım
Madenciliği
Erişilebilir web
kaynaklarından
faydalı bilgi
bulmaya çalışır
Web sitesi ve
sayfalarının yapısal
olarak özetini
çıkarmaya çalışır
Kullanıcı erişimleri esnasında
oluşan hareket verisinden
anlamlı ve faydalı paternler
bulmaya çalışır
1. Web İçerik Madenciliği
• Web içerik madenciliği ile web sayfalarının
içerikleri incelenir ve kullanışlı bilgi çıkarımı
sağlanır.
• Web içerik madenciliği kullanarak web
sayfalarının başlıklar, içerisinde geçen
kelimeler, resimler veya müzik dosyalar
incelenir. Bulunan içeriklere göre web siteleri
belirli sınıflara veya kümelere ayrılabilir
1. Web İçerik Madenciliği
• Web içerik madenciliği web kaynaklarından
otomatik bilgi arama tekniklerini tanımlar. Verinin
farklı tiplerde oluşu ve yapısal olmayışı bu
konudaki tekniklere daha karışık yaklaşımlar
kazandırır.
• İki tip veri madenciliği stratejisi olabilir; metin
içeriklerini doğrudan arama ya da arama
motorları gibi araçların aramalarını yardımcı alan.
2. Web Yapı Madenciliği
• Web erişim araçlarının çoğu çok değerli olabilecek
bağlantı(link) verisini gözardı ederek sadece text
verisine ulaşır, Web yapı madenciliğinin amacı
web sitesi ve web sayfası hakkında bağlantı
verisine bakarak bilgi üretmektir.
• Teknik olarak, Web içerik madenciliği dökümanın
içeriğine, yapı madenciliği ise dökümanlar arası
bağlantılara yoğunlaşır
2. Web Yapı Madenciliği
• Yani web yapı madenciliği ile internetin temel
yapısını oluşturan web siteleri, web sayfaları
arası ya da web sayfasındaki bağlantılar
arasındaki ilişkiler incelenir.
3. Web Kullanım Madenciliği
• Web kullanım madenciliği ile web
sunucularında tutulan kullanıcı erişim kayıtları
incelenerek anlamlı ve faydalı kalıplar
bulunabilir. Web kullanım madenciliği
yöntemleri uygulanarak web sitelerini ziyaret
eden kişilerin davranış ve tutumları
belirlenebilir
3. Web Kullanım Madenciliği
• Web kullanım madenciliği kullanıcıların
web’de dolaşırken yaptıkları erişim
hareketlerince oluşturulan veriden bilgi
üretmeyi hedefler.
• Bu konudaki çalışmalar Genel Web Kullanım
Madenciliği, Site Güncelleme Sistemleri,
Sistem İyileştirme ve Kişiselleştirme başlıkları
altında toplanabilir.
3. Web Kullanım Madenciliği
1. Genel Web Kullanım Madenciliği Sistemleri kullanıcıların
genel davranış biçimerini bilinen ya da önerilen veri
madenciliği algoritmalarını sunucu erişim dosyalarındaki
veriye uygulayarak bulmaya çalışır.
2. Site Günçelleştirme Sistemlerinin hedefi ise site içerik ve
yapısında yapılması gereken tadilatları bulmaktır.
3. Sistem İyileştirme üzerine yapılan araştırmalar web
kullanım verisini kullanarak trafiği etkinleştirmeyi hedefler.
4. Son olarak, kişiselleştirme çalışmaları bireysel taleplere
gore değişen siteler oluşturmaya çalışır
Patern Bulma Teknikleri
• Her web madenciliği işlemi çeşitli araştırma
alanlarından uyarlanan patern bulma
tekniğine ihtiyaç duyar.
Veri
Temizleme
Veri Entegrasyonu
İlgili
Veri
Seçim
Veri Madenciliği
Patern Tespiti
Patern
Değerlendirme
Veritabanı
Anlamlı
Bilgi
Patern Bulma Teknikleri
• Tanımsal İstatistik : Web sitesindeki veriyi
tanımlamakta ve bilgi elde etmekte kullanılan
en güçlü teknikler istatistik metodlardır.
Analist farklı değişkenleri baz alan tanımlayıcı
istatistik analizler yapabilir.
Patern Bulma Teknikleri
• İlişkilendirme Kuralları (Association Rules):
Web alanında beraber kullanılan sayfalar
ilşkilendirme kuralları uygulanarak bulunup
aynı sunucuya konulabilirler. İlişkilendirme
kuralları genelllikle veri tabanındaki veriler
arasındaki ilşkileri tespit etmeye çalışır.
Patern Bulma Teknikleri
• Gruplama (Clustering) : Gruplama(kümeleme)
analizi veriler arasında benzer karakteristik
değerler taşıyanları bir araya getirerek gruplar
oluşturmayı hedefler.
• Sınıflandırma (Classification) : Bu teknikler
verileri ait oldukları tanımlı sınıflara koymaya
çalışır..
Patern Bulma Teknikleri
• Sıralı Paternler : Zamana yayılan veri kümeleri
arasında benzer paternler bulmaya çalışılır.
• Bağımlılık Modellemesi : Web değikenleri
arasındaki bağımlılıkları ortaya çıkaran
modeler oluşturmak hedeflenir.
SONUÇ
• Web madenciliğinin günümüzde birçok alanda
kullanılmasının en önemli sebebi; kişilerin web
sayfalarında göstermiş oldukları davranışların,
hareketlerin ve yapmış oldukları işlem
bilgilerinin var olan iş süreçlerine
entegrasyonunu sağlayarak müşterinin en iyi
şekilde anlaşılmasını sağlayan müşteri odaklı
bir sistem oluşturmasıdır.
Örnek
2002-01-06 13:45:24 65.116.145.138 - 193.255.141.93 80 GET
/dersler/grafik/Notes/default.html - 200
Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+98;+DigExt)
Örnek
Kaynaklar
• [1] Chakrabarti, S. (2003), Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann
• Publishers, San Francisco.
• [2] Dolgun, M.Ö. (2006), Büyük Al$veri$ Merkezleri Kçin Veri Madencilii Uygulamalar, Yüksek Lisans Tezi,
• Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
• [3] Han, J., Kamber, M. (2001), Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, San
• Francisco.
• [4] Hearst, M. (2009), What is text mining, http://www.sims.berkeley.edu/~hearst/textmining.html.
• [5] Introduction to Text Mining (2008), SPSS Inc.
• [6] Liu, B. (2007), Web Data Mining: Exploring Hyperlinks, Contents and Usage Data, Springer.
• [7] Özdemir Güzel, T., Dolgun, M.Ö., Patr, U., Delilolu, S., Korkmaz, H.E. (2007), 2005 Yl Örenci Seçme
• Snav (ÖSS) Verileri Kullanlarak Örenci Profilinin Belirlenmesi, 5. +statistik Kongresi, Antalya.
• [8] Shapiro-Piatetsky, G., Steingold, S. (2000), Measuring Lift Quality in Database Marketing, ACM SIGKDD
• Explorations Newsletter, 2(2), 76-80.
• [9] Sholom M.W., Indurkhya N., Zhang T., Damerau F. (2004), Text Mining: Predictive Methods for
• Analyzing Unstructured Information, Springer.
• [10] Tan, A.H., Yu, P.S. (2004), Guest Editorial: Text and Web Mining, Applied Intelligence 18, 239-241,
• Kluwer Academic Publisher.
• [11] Unstructured data (2009), http://en.wikipedia.org/wiki/Unstructured_data.
• [12] W. Fan, L. Wallace, S. Rich, Z. Zhang. (2006), Tapping into the power of text mining, Communications of
• ACM, 49(9), 76-82.

More Related Content

What's hot

Developing Data Products
Developing Data ProductsDeveloping Data Products
Developing Data Products
Peter Skomoroch
 
Market Segmentation and Market Basket Analysis
Market Segmentation and Market Basket AnalysisMarket Segmentation and Market Basket Analysis
Market Segmentation and Market Basket Analysis
Spotle.ai
 
A Beginner's Guide to Building Data Pipelines with Luigi
A Beginner's Guide to Building Data Pipelines with LuigiA Beginner's Guide to Building Data Pipelines with Luigi
A Beginner's Guide to Building Data Pipelines with Luigi
Growth Intelligence
 
Business Intelligence Presentation - Data Mining (2/2)
Business Intelligence Presentation - Data Mining (2/2)Business Intelligence Presentation - Data Mining (2/2)
Business Intelligence Presentation - Data Mining (2/2)
Bernardo Najlis
 
Version Stamps in NOSQL Databases
Version Stamps in NOSQL DatabasesVersion Stamps in NOSQL Databases
Version Stamps in NOSQL Databases
Dr-Dipali Meher
 
Impuls-Vortrag Data Strategy
Impuls-Vortrag Data StrategyImpuls-Vortrag Data Strategy
Impuls-Vortrag Data Strategy
Marco Geuer
 
Introduction aux bases de données NoSQL
Introduction aux bases de données NoSQLIntroduction aux bases de données NoSQL
Introduction aux bases de données NoSQL
Antoine Augusti
 
Big data components - Introduction to Flume, Pig and Sqoop
Big data components - Introduction to Flume, Pig and SqoopBig data components - Introduction to Flume, Pig and Sqoop
Big data components - Introduction to Flume, Pig and Sqoop
Jeyamariappan Guru
 
Designing Data Products
Designing Data ProductsDesigning Data Products
Designing Data Products
Vassilis Protonotarios
 
Designing Distributed Systems: Google Cas Study
Designing Distributed Systems: Google Cas StudyDesigning Distributed Systems: Google Cas Study
Designing Distributed Systems: Google Cas Study
Meysam Javadi
 
The Persona-Based Value of Modern Data Governance
The Persona-Based Value of Modern Data Governance The Persona-Based Value of Modern Data Governance
The Persona-Based Value of Modern Data Governance
Precisely
 
Master Data Management
Master Data ManagementMaster Data Management
Master Data Management
Sreekanth Narendran
 
Business Intelligence and decision support system
Business Intelligence and decision support system Business Intelligence and decision support system
Business Intelligence and decision support system
Shrihari Shrihari
 
What are data products and why are they different from other products?
What are data products and why are they different from other products?What are data products and why are they different from other products?
What are data products and why are they different from other products?
inovex GmbH
 
Data Architecture Brief Overview
Data Architecture Brief OverviewData Architecture Brief Overview
Data Architecture Brief Overview
Hal Kalechofsky
 
Mongo db intro.pptx
Mongo db intro.pptxMongo db intro.pptx
Mongo db intro.pptx
JWORKS powered by Ordina
 

What's hot (17)

Developing Data Products
Developing Data ProductsDeveloping Data Products
Developing Data Products
 
Market Segmentation and Market Basket Analysis
Market Segmentation and Market Basket AnalysisMarket Segmentation and Market Basket Analysis
Market Segmentation and Market Basket Analysis
 
A Beginner's Guide to Building Data Pipelines with Luigi
A Beginner's Guide to Building Data Pipelines with LuigiA Beginner's Guide to Building Data Pipelines with Luigi
A Beginner's Guide to Building Data Pipelines with Luigi
 
Business Intelligence Presentation - Data Mining (2/2)
Business Intelligence Presentation - Data Mining (2/2)Business Intelligence Presentation - Data Mining (2/2)
Business Intelligence Presentation - Data Mining (2/2)
 
Version Stamps in NOSQL Databases
Version Stamps in NOSQL DatabasesVersion Stamps in NOSQL Databases
Version Stamps in NOSQL Databases
 
Impuls-Vortrag Data Strategy
Impuls-Vortrag Data StrategyImpuls-Vortrag Data Strategy
Impuls-Vortrag Data Strategy
 
Introduction aux bases de données NoSQL
Introduction aux bases de données NoSQLIntroduction aux bases de données NoSQL
Introduction aux bases de données NoSQL
 
Yeşil pazarlama
Yeşil pazarlamaYeşil pazarlama
Yeşil pazarlama
 
Big data components - Introduction to Flume, Pig and Sqoop
Big data components - Introduction to Flume, Pig and SqoopBig data components - Introduction to Flume, Pig and Sqoop
Big data components - Introduction to Flume, Pig and Sqoop
 
Designing Data Products
Designing Data ProductsDesigning Data Products
Designing Data Products
 
Designing Distributed Systems: Google Cas Study
Designing Distributed Systems: Google Cas StudyDesigning Distributed Systems: Google Cas Study
Designing Distributed Systems: Google Cas Study
 
The Persona-Based Value of Modern Data Governance
The Persona-Based Value of Modern Data Governance The Persona-Based Value of Modern Data Governance
The Persona-Based Value of Modern Data Governance
 
Master Data Management
Master Data ManagementMaster Data Management
Master Data Management
 
Business Intelligence and decision support system
Business Intelligence and decision support system Business Intelligence and decision support system
Business Intelligence and decision support system
 
What are data products and why are they different from other products?
What are data products and why are they different from other products?What are data products and why are they different from other products?
What are data products and why are they different from other products?
 
Data Architecture Brief Overview
Data Architecture Brief OverviewData Architecture Brief Overview
Data Architecture Brief Overview
 
Mongo db intro.pptx
Mongo db intro.pptxMongo db intro.pptx
Mongo db intro.pptx
 

Viewers also liked

Precision match ppt 2015
Precision match ppt 2015Precision match ppt 2015
Precision match ppt 2015
PrecisionMatch
 
集団的自衛権はいかにして容認されるか?
集団的自衛権はいかにして容認されるか?集団的自衛権はいかにして容認されるか?
集団的自衛権はいかにして容認されるか?
Masaki Hata
 
集団的自衛権はいかにして容認されるか?
集団的自衛権はいかにして容認されるか?集団的自衛権はいかにして容認されるか?
集団的自衛権はいかにして容認されるか?
Masaki Hata
 
Anahita_Khorrami_2014_english.do cx
Anahita_Khorrami_2014_english.do cxAnahita_Khorrami_2014_english.do cx
Anahita_Khorrami_2014_english.do cx
Anahita Khorrami
 
Untitled Presentation
Untitled PresentationUntitled Presentation
Untitled Presentation
Erik Peris
 
Group theory notes
Group theory notesGroup theory notes
Group theory notes
mkumaresan
 
The 5 Fundamentals of Content Marketing
The 5 Fundamentals of Content MarketingThe 5 Fundamentals of Content Marketing
The 5 Fundamentals of Content Marketing
Influence & Co.
 
7 easy ways to kickstart your metabolism
7 easy ways to kickstart your metabolism7 easy ways to kickstart your metabolism
7 easy ways to kickstart your metabolism
nappycadre3778
 
green belt , oracl
green belt , oraclgreen belt , oracl
green belt , oracl
abdurhman ALAKIL
 
SEO
SEOSEO

Viewers also liked (10)

Precision match ppt 2015
Precision match ppt 2015Precision match ppt 2015
Precision match ppt 2015
 
集団的自衛権はいかにして容認されるか?
集団的自衛権はいかにして容認されるか?集団的自衛権はいかにして容認されるか?
集団的自衛権はいかにして容認されるか?
 
集団的自衛権はいかにして容認されるか?
集団的自衛権はいかにして容認されるか?集団的自衛権はいかにして容認されるか?
集団的自衛権はいかにして容認されるか?
 
Anahita_Khorrami_2014_english.do cx
Anahita_Khorrami_2014_english.do cxAnahita_Khorrami_2014_english.do cx
Anahita_Khorrami_2014_english.do cx
 
Untitled Presentation
Untitled PresentationUntitled Presentation
Untitled Presentation
 
Group theory notes
Group theory notesGroup theory notes
Group theory notes
 
The 5 Fundamentals of Content Marketing
The 5 Fundamentals of Content MarketingThe 5 Fundamentals of Content Marketing
The 5 Fundamentals of Content Marketing
 
7 easy ways to kickstart your metabolism
7 easy ways to kickstart your metabolism7 easy ways to kickstart your metabolism
7 easy ways to kickstart your metabolism
 
green belt , oracl
green belt , oraclgreen belt , oracl
green belt , oracl
 
SEO
SEOSEO
SEO
 

Similar to Web Mining Nedir Genel Bilgilendirme

Web 1.0, Web 2.0, Web 3.0
Web 1.0, Web 2.0, Web 3.0 Web 1.0, Web 2.0, Web 3.0
Web 1.0, Web 2.0, Web 3.0
Ecrin Çiftçi
 
Kurumsal internet Siteleri Bilgi Mimari Yapısı (TR)
Kurumsal internet Siteleri Bilgi Mimari Yapısı (TR)Kurumsal internet Siteleri Bilgi Mimari Yapısı (TR)
Kurumsal internet Siteleri Bilgi Mimari Yapısı (TR)
Turgut Haspolat
 
Kişisel Web Site Uygulama Örneği:myWeb
Kişisel Web Site Uygulama Örneği:myWebKişisel Web Site Uygulama Örneği:myWeb
Kişisel Web Site Uygulama Örneği:myWeb
veliakcakaya
 
Uni stay 2017-2018
Uni stay 2017-2018 Uni stay 2017-2018
Uni stay 2017-2018
Muhammed GÖKKAYA
 
Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Veri Madenciliği ve Makine Öğrenmesi Konularına GirişVeri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Şadi Evren ŞEKER
 
B3S'17 - Kariyer.net Sunumu
B3S'17 - Kariyer.net SunumuB3S'17 - Kariyer.net Sunumu
B3S'17 - Kariyer.net Sunumu
Kemal Can Kara
 
Web Sitesi Geliştirme Adımları
Web Sitesi Geliştirme AdımlarıWeb Sitesi Geliştirme Adımları
Web Sitesi Geliştirme Adımları
cmkandemir
 
Temel SEO Eğitimi
Temel SEO EğitimiTemel SEO Eğitimi
Temel SEO Eğitimi
Uğur Eskici
 
Web 1.0-2.0-3.0 - Berk TURKSEVER - DOÇ. DR. Agah Tuğrul KORUCU
Web 1.0-2.0-3.0 - Berk TURKSEVER - DOÇ. DR. Agah Tuğrul KORUCUWeb 1.0-2.0-3.0 - Berk TURKSEVER - DOÇ. DR. Agah Tuğrul KORUCU
Web 1.0-2.0-3.0 - Berk TURKSEVER - DOÇ. DR. Agah Tuğrul KORUCU
BerkTrksever
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnıMustafa Tepe
 
Kütüphanelerde Web Sitesi Hazırlama ve Uygulama Semineri (FrontPage)
Kütüphanelerde Web Sitesi Hazırlama ve Uygulama Semineri (FrontPage)Kütüphanelerde Web Sitesi Hazırlama ve Uygulama Semineri (FrontPage)
Kütüphanelerde Web Sitesi Hazırlama ve Uygulama Semineri (FrontPage)Kamil Çömlekçi
 
Web' te Yeni Teknolojiler
Web' te Yeni TeknolojilerWeb' te Yeni Teknolojiler
Web' te Yeni Teknolojilerbote_iki
 
Web Sayfalarının Kişiselleştirilmesi
Web Sayfalarının KişiselleştirilmesiWeb Sayfalarının Kişiselleştirilmesi
Web Sayfalarının Kişiselleştirilmesi
Erhan Yaşar
 
Web 2.0 teknolojileri
Web 2.0 teknolojileriWeb 2.0 teknolojileri
Web 2.0 teknolojileriMeriç Olgun
 
İşletmeler İçin Google Apps Uygulamaları
İşletmeler İçin Google Apps Uygulamalarıİşletmeler İçin Google Apps Uygulamaları
İşletmeler İçin Google Apps Uygulamaları
Innovaktif Bulut Bilisim Hizmetleri
 
internet devrimi
internet devrimiinternet devrimi
internet devrimi
SenaYldrm8
 
Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)
Murat Azimli
 
Data Mining Presentation
Data Mining PresentationData Mining Presentation
Data Mining Presentation
Engin Çakir
 

Similar to Web Mining Nedir Genel Bilgilendirme (20)

Web 1.0, Web 2.0, Web 3.0
Web 1.0, Web 2.0, Web 3.0 Web 1.0, Web 2.0, Web 3.0
Web 1.0, Web 2.0, Web 3.0
 
Kurumsal internet Siteleri Bilgi Mimari Yapısı (TR)
Kurumsal internet Siteleri Bilgi Mimari Yapısı (TR)Kurumsal internet Siteleri Bilgi Mimari Yapısı (TR)
Kurumsal internet Siteleri Bilgi Mimari Yapısı (TR)
 
Kişisel Web Site Uygulama Örneği:myWeb
Kişisel Web Site Uygulama Örneği:myWebKişisel Web Site Uygulama Örneği:myWeb
Kişisel Web Site Uygulama Örneği:myWeb
 
Uni stay 2017-2018
Uni stay 2017-2018 Uni stay 2017-2018
Uni stay 2017-2018
 
Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Veri Madenciliği ve Makine Öğrenmesi Konularına GirişVeri Madenciliği ve Makine Öğrenmesi Konularına Giriş
Veri Madenciliği ve Makine Öğrenmesi Konularına Giriş
 
B3S'17 - Kariyer.net Sunumu
B3S'17 - Kariyer.net SunumuB3S'17 - Kariyer.net Sunumu
B3S'17 - Kariyer.net Sunumu
 
Web Sitesi Geliştirme Adımları
Web Sitesi Geliştirme AdımlarıWeb Sitesi Geliştirme Adımları
Web Sitesi Geliştirme Adımları
 
Temel SEO Eğitimi
Temel SEO EğitimiTemel SEO Eğitimi
Temel SEO Eğitimi
 
Web 1.0-2.0-3.0 - Berk TURKSEVER - DOÇ. DR. Agah Tuğrul KORUCU
Web 1.0-2.0-3.0 - Berk TURKSEVER - DOÇ. DR. Agah Tuğrul KORUCUWeb 1.0-2.0-3.0 - Berk TURKSEVER - DOÇ. DR. Agah Tuğrul KORUCU
Web 1.0-2.0-3.0 - Berk TURKSEVER - DOÇ. DR. Agah Tuğrul KORUCU
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnı
 
Kod günleri veritabnı
Kod günleri veritabnıKod günleri veritabnı
Kod günleri veritabnı
 
Kütüphanelerde Web Sitesi Hazırlama ve Uygulama Semineri (FrontPage)
Kütüphanelerde Web Sitesi Hazırlama ve Uygulama Semineri (FrontPage)Kütüphanelerde Web Sitesi Hazırlama ve Uygulama Semineri (FrontPage)
Kütüphanelerde Web Sitesi Hazırlama ve Uygulama Semineri (FrontPage)
 
Web' te Yeni Teknolojiler
Web' te Yeni TeknolojilerWeb' te Yeni Teknolojiler
Web' te Yeni Teknolojiler
 
Web Sayfalarının Kişiselleştirilmesi
Web Sayfalarının KişiselleştirilmesiWeb Sayfalarının Kişiselleştirilmesi
Web Sayfalarının Kişiselleştirilmesi
 
Web 2.0 teknolojileri
Web 2.0 teknolojileriWeb 2.0 teknolojileri
Web 2.0 teknolojileri
 
İşletmeler İçin Google Apps Uygulamaları
İşletmeler İçin Google Apps Uygulamalarıİşletmeler İçin Google Apps Uygulamaları
İşletmeler İçin Google Apps Uygulamaları
 
internet devrimi
internet devrimiinternet devrimi
internet devrimi
 
Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)Veri Madenciliği (Data Mining)
Veri Madenciliği (Data Mining)
 
Data Mining Presentation
Data Mining PresentationData Mining Presentation
Data Mining Presentation
 
Ajax
AjaxAjax
Ajax
 

Web Mining Nedir Genel Bilgilendirme

  • 2. WEB MİNİNG WEB MADENCİLİĞİ NEDİR? NERELERDE KULLANILIR?
  • 3. GİRİŞ • Web Madenciliği; birçok mühendisin görüşüne göre ilk kez Etzioni tarafından 1996’da ortaya atılmıştır[1] • Web Madenciliği, Veri Madenciliğinin alt dalıdır. • Veri Madenciliğinden yola çıkarak, Web Madenciliği, Metin Madenciliği gibi alt dallar ortaya çıkmıştır.
  • 4. GİRİŞ • Veri toplamanın önemini kavrayan her firma , kamu kuruluşu ve benzeri kuruluşlar, verileri depolayarak onlardan sonuçlar çıkarmaktadır. • Ancak veri tabanlarından sorgular yardımı ile elde edilen bilgiler sadece sorgu bazlı bilgiler olup en üst düzeyde faydaya ulaşılamamaktadır. Verilerden en yüksek şekilde faydalanabilmenin yolu veri madenciliğinden geçmektedir.
  • 5. Veri, Metin ve Web Madenciliği • Veri Madenciliği yerine göre alt dallara ayrılmaktadır. • Veri madenciliği mevcut veriden anlamlı bilgileri, ilişkileri çıkarmada kullanılan tekniklere verilen genel isimdir. Veri madenciliği yapısal veriyi analiz edebilmekte iken; metin ve web madenciliği yapısal olmayan verinin, veri madenciliğinde kullanılmak üzere, yapısal hale dönüştürülmesinde kullanılmaktadır.
  • 6. Veri, Metin ve Web Madenciliği • Farklı birçok alanda kullanılabilen veri madenciliğinin alt alanlarından Metin ve Web Madenciliği; yapısal olmayan verinin metin ve web madenciliği yöntemleri ile yapısal hale dönüştürülmesi ile başlar ve teknik işlemlerle devam eder. • Ancak her şeyden önce; yapısal olmayan verinin, veri,web veya metin madenciliğinde kullanılabilecek bir yapısal veri haline gelmesi gerekmektedir.
  • 7. Yapısal ve Yapısal Olmayan Veriler • Yapısal veri, bir yapı içerisinde organize edilebilen ve bundan dolayı tanımlanabilen veri için kullanılan bir terimdir. Yapısal veri, içerikteki veri tipine göre organize edilebilen ve arama yapılabilen veridir. • En yaygın kullanılan yapısal veri kaynakları SQL (Structured Query Language) ve Access gibi veri kaynaklarıdır. SQL kaynaklar için Oracle, PostgreSQL, Microsoft SQL Server gibi yardımcı database programları kullanılabilir.
  • 8. Yapısal ve Yapısal Olmayan Veriler • Buna karşın yapısal olmayan verinin tanımlanabilir bir yapısı yoktur. • En çok bilinen yapısal olmayan veri türleri; resim dosyaları, pdf, word ve text gibi metin dosyaları, web üzerinde tutulan log dosyaları ve epostalardır. Excel gibi hücre yapısına sahip veri türleri yapısal olmasına rağmen halen yapısal olma ve olmama konusundaki yeri tartışmalıdır.
  • 9. Veri Madenciliğinin Metin ve Web Madenciliğindeki Rolü • Veri madenciliği çözümleri ve algoritmalar metin veya web verisindeki kalıplar bulmadan veya model oluşturmadan önce metin veya web verisinin yapısal olması gerekmektedir. • Metin ve Web madenciliği işlemleri, veri madenciliğinde kullanılacak yapısal veriye ulaşmak için kullanılan araçlar olarak tanımlanabilir
  • 10. Metin ve Web Madenciliği • Metin ve web madenciliği son yıllarda oldukça fazla çalışılan birbiri ile ilişkili alanlardır. Metin madenciliği, çok büyük belgelerin analizi ve metin tabanlı verinin içerisindeki gizli kalıpların elde edilmesidir. • Web madenciliği ise, web içerikleri, sayfa yapıları ve web bağlantı istatistiklerinin de içinde olduğu web ile ilişkili olan verinin analizini içermektedir [10].
  • 11. Metin Madenciliği • Kısaca Metin Madenciliğinden bahsedersek; • Metin verisindeki anlamın ortaya çıkarılabilmesi için kullanılan yöntem metin madenciliğidir. • Metin yazımında standart kurallar olmadığından dolayı bilgisayar bunları anlayamamaktadır.
  • 12. Metin Madenciliği • Yapısal olmayan bilgiden içerik çıkarmak için kullanılan geleneksel yöntemler; dilbilimsel olmayan yöntemlerdir. • Bu yöntemler, hem sorgudaki hem de metindeki kelimelerin karakterlerini karşılaştıran bir temele dayanır. Bundan dolayı içeriği açıklayıcı sonuçlar elde edemez.
  • 13. Metin Madenciliği • Dili anlamanın temeli dilbilimsel yollara dayanır ve bu Natural Language Processing (NLP) olarak ifade edilir. • NLP’yi içeren bir sistemde, karmaşık yapıların bulunduğu ifadeler (örneğin; duştan akan soğuk su ile içilen soğuk su arasındaki fark gibi) akıllı olarak çıkarabilmekte ve terimleri sınıflayarak; ürünler, organizasyonlar veya kişiler gibi sınıflara atamaktadır.
  • 14. Web Madenciliği Giriş • Tüm bu özetlerden sonra asıl konumuz olan Web Madenciliğine giriş yapacağız. • Başta da belirtildiği gibi Web Madenciliğini anlayabilmek için Veri Madenciliğini anlamak ve Metin Madenciliği hakkında yüzeysel bilgi sahibi olmak gerekmektedir.
  • 15. Web Madenciliği • Web kullanım madenciliği, bir veya birçok web sunucusundan kullanıcı erişim desenlerinin otomatik keşfinin ve analizin yapıldığı bir tip veri madenciliği etkinliğidir. • Birçok kuruluş pazar analizleri için geliştirdikleri stratejileri ziyaretçi bilgilerine dayanarak yerine getirir. Kuruluşlar günlük operasyonlarla her gün yüzlerce MB veri toplamaktadır.
  • 16.
  • 17. Web Madenciliği • Bu bilgilerin çoğu web sunucuların otomatik olarak tuttuğu günlük dosyalarından elde edilir. Günlük dosyaları, istemciden sunucuya gönderilen her bir isteğin bir kayıt olarak eklenmesi ile meydana gelir. • Günlük dosyalarının analizi, müşterilerin ilgi alanları, ürünler üzerinden pazar stratejileri oluşturma, promosyon kampanyalarının etkisi gibi hususlarda, kurumlara karar süreçlerinde yardımcı olur.
  • 18. Web Madenciliği • Sunucu erişim kayıtlarının ve kullanıcı kaydı verilerinin analizi, aynı zamanda kurumun daha etkili bir sunumunun yapılabilmesi için Web sitesini nasıl daha iyi hale getirebileceği hakkında değerli bilgiler sağlar. • İntranet teknolojilerini kullanan kurumlarda, bu tür analizler çalışma grubu iletişimi ve kurumsal altyapının daha iyi işletilmesine ışık tutabilir.
  • 19. Web Madenciliği • Son olarak, World Wide Web üzerinden reklam yapan kurumlar için kullanıcı erişim desenlerini analiz etmek, reklamların belirli bir kullanıcı grubuna yönlendirilmesine yardımcı olur • Web madenciliği alanları ve web kullanım madenciliği aşamaları şeması bir sonraki slaytta verilmiştir.
  • 20. Web Madenciliği Web İçerik Madenciliği Web Yapı Madenciliği Web Kullanım Madenciliği Web Sayfa İçerik Madenciliği Arama Sonuç Madenciliği Genel Web Kullanım Madenciliği Site Güncelleme Sistemleri Sistem İyileştirme Kişiselleştirme
  • 21. Web Madenciliği Web İçerik Madenciliği Web Yapı Madenciliği Web Kullanım Madenciliği Erişilebilir web kaynaklarından faydalı bilgi bulmaya çalışır Web sitesi ve sayfalarının yapısal olarak özetini çıkarmaya çalışır Kullanıcı erişimleri esnasında oluşan hareket verisinden anlamlı ve faydalı paternler bulmaya çalışır
  • 22. 1. Web İçerik Madenciliği • Web içerik madenciliği ile web sayfalarının içerikleri incelenir ve kullanışlı bilgi çıkarımı sağlanır. • Web içerik madenciliği kullanarak web sayfalarının başlıklar, içerisinde geçen kelimeler, resimler veya müzik dosyalar incelenir. Bulunan içeriklere göre web siteleri belirli sınıflara veya kümelere ayrılabilir
  • 23. 1. Web İçerik Madenciliği • Web içerik madenciliği web kaynaklarından otomatik bilgi arama tekniklerini tanımlar. Verinin farklı tiplerde oluşu ve yapısal olmayışı bu konudaki tekniklere daha karışık yaklaşımlar kazandırır. • İki tip veri madenciliği stratejisi olabilir; metin içeriklerini doğrudan arama ya da arama motorları gibi araçların aramalarını yardımcı alan.
  • 24. 2. Web Yapı Madenciliği • Web erişim araçlarının çoğu çok değerli olabilecek bağlantı(link) verisini gözardı ederek sadece text verisine ulaşır, Web yapı madenciliğinin amacı web sitesi ve web sayfası hakkında bağlantı verisine bakarak bilgi üretmektir. • Teknik olarak, Web içerik madenciliği dökümanın içeriğine, yapı madenciliği ise dökümanlar arası bağlantılara yoğunlaşır
  • 25. 2. Web Yapı Madenciliği • Yani web yapı madenciliği ile internetin temel yapısını oluşturan web siteleri, web sayfaları arası ya da web sayfasındaki bağlantılar arasındaki ilişkiler incelenir.
  • 26. 3. Web Kullanım Madenciliği • Web kullanım madenciliği ile web sunucularında tutulan kullanıcı erişim kayıtları incelenerek anlamlı ve faydalı kalıplar bulunabilir. Web kullanım madenciliği yöntemleri uygulanarak web sitelerini ziyaret eden kişilerin davranış ve tutumları belirlenebilir
  • 27. 3. Web Kullanım Madenciliği • Web kullanım madenciliği kullanıcıların web’de dolaşırken yaptıkları erişim hareketlerince oluşturulan veriden bilgi üretmeyi hedefler. • Bu konudaki çalışmalar Genel Web Kullanım Madenciliği, Site Güncelleme Sistemleri, Sistem İyileştirme ve Kişiselleştirme başlıkları altında toplanabilir.
  • 28. 3. Web Kullanım Madenciliği 1. Genel Web Kullanım Madenciliği Sistemleri kullanıcıların genel davranış biçimerini bilinen ya da önerilen veri madenciliği algoritmalarını sunucu erişim dosyalarındaki veriye uygulayarak bulmaya çalışır. 2. Site Günçelleştirme Sistemlerinin hedefi ise site içerik ve yapısında yapılması gereken tadilatları bulmaktır. 3. Sistem İyileştirme üzerine yapılan araştırmalar web kullanım verisini kullanarak trafiği etkinleştirmeyi hedefler. 4. Son olarak, kişiselleştirme çalışmaları bireysel taleplere gore değişen siteler oluşturmaya çalışır
  • 29. Patern Bulma Teknikleri • Her web madenciliği işlemi çeşitli araştırma alanlarından uyarlanan patern bulma tekniğine ihtiyaç duyar.
  • 30. Veri Temizleme Veri Entegrasyonu İlgili Veri Seçim Veri Madenciliği Patern Tespiti Patern Değerlendirme Veritabanı Anlamlı Bilgi
  • 31. Patern Bulma Teknikleri • Tanımsal İstatistik : Web sitesindeki veriyi tanımlamakta ve bilgi elde etmekte kullanılan en güçlü teknikler istatistik metodlardır. Analist farklı değişkenleri baz alan tanımlayıcı istatistik analizler yapabilir.
  • 32. Patern Bulma Teknikleri • İlişkilendirme Kuralları (Association Rules): Web alanında beraber kullanılan sayfalar ilşkilendirme kuralları uygulanarak bulunup aynı sunucuya konulabilirler. İlişkilendirme kuralları genelllikle veri tabanındaki veriler arasındaki ilşkileri tespit etmeye çalışır.
  • 33. Patern Bulma Teknikleri • Gruplama (Clustering) : Gruplama(kümeleme) analizi veriler arasında benzer karakteristik değerler taşıyanları bir araya getirerek gruplar oluşturmayı hedefler. • Sınıflandırma (Classification) : Bu teknikler verileri ait oldukları tanımlı sınıflara koymaya çalışır..
  • 34. Patern Bulma Teknikleri • Sıralı Paternler : Zamana yayılan veri kümeleri arasında benzer paternler bulmaya çalışılır. • Bağımlılık Modellemesi : Web değikenleri arasındaki bağımlılıkları ortaya çıkaran modeler oluşturmak hedeflenir.
  • 35. SONUÇ • Web madenciliğinin günümüzde birçok alanda kullanılmasının en önemli sebebi; kişilerin web sayfalarında göstermiş oldukları davranışların, hareketlerin ve yapmış oldukları işlem bilgilerinin var olan iş süreçlerine entegrasyonunu sağlayarak müşterinin en iyi şekilde anlaşılmasını sağlayan müşteri odaklı bir sistem oluşturmasıdır.
  • 36. Örnek 2002-01-06 13:45:24 65.116.145.138 - 193.255.141.93 80 GET /dersler/grafik/Notes/default.html - 200 Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+98;+DigExt)
  • 38. Kaynaklar • [1] Chakrabarti, S. (2003), Mining the Web: Discovering Knowledge from Hypertext Data, Morgan Kaufmann • Publishers, San Francisco. • [2] Dolgun, M.Ö. (2006), Büyük Al$veri$ Merkezleri Kçin Veri Madencilii Uygulamalar, Yüksek Lisans Tezi, • Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara. • [3] Han, J., Kamber, M. (2001), Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, San • Francisco. • [4] Hearst, M. (2009), What is text mining, http://www.sims.berkeley.edu/~hearst/textmining.html. • [5] Introduction to Text Mining (2008), SPSS Inc. • [6] Liu, B. (2007), Web Data Mining: Exploring Hyperlinks, Contents and Usage Data, Springer. • [7] Özdemir Güzel, T., Dolgun, M.Ö., Patr, U., Delilolu, S., Korkmaz, H.E. (2007), 2005 Yl Örenci Seçme • Snav (ÖSS) Verileri Kullanlarak Örenci Profilinin Belirlenmesi, 5. +statistik Kongresi, Antalya. • [8] Shapiro-Piatetsky, G., Steingold, S. (2000), Measuring Lift Quality in Database Marketing, ACM SIGKDD • Explorations Newsletter, 2(2), 76-80. • [9] Sholom M.W., Indurkhya N., Zhang T., Damerau F. (2004), Text Mining: Predictive Methods for • Analyzing Unstructured Information, Springer. • [10] Tan, A.H., Yu, P.S. (2004), Guest Editorial: Text and Web Mining, Applied Intelligence 18, 239-241, • Kluwer Academic Publisher. • [11] Unstructured data (2009), http://en.wikipedia.org/wiki/Unstructured_data. • [12] W. Fan, L. Wallace, S. Rich, Z. Zhang. (2006), Tapping into the power of text mining, Communications of • ACM, 49(9), 76-82.

Editor's Notes

  1. Web Mining (Örün Madenciliği) nedir anlayabilmek için öncelikle Data Mining (Veri Madenciliği) nedir bunu bilmeliyiz. Çünkü Web Mining; Data Mining konusunun bir alt dalıdır.
  2. Kısaca Veri Madenciliği Nedir?
  3. Kısaca Veri Madenciliği Nedir?
  4. Kısaca Veri Madenciliği Nedir?
  5. Peki Yapısal Veri Nedir?
  6. Peki Yapısal Veri Nedir?
  7. Veri Madenciliği ile Web, Metin Madenciliği arasındaki ilişiki
  8. Metin ve Web Madenciliği nedir? Ön bilgilendirme
  9. Kısaca Metin Madenciliği
  10. Kısaca Metin Madenciliği
  11. Kısaca Metin Madenciliği
  12. Ve asıl konumuz olan Web Madenciliği
  13. Ve asıl konumuz olan Web Madenciliği
  14. Ve asıl konumuz olan Web Madenciliği
  15. Ve asıl konumuz olan Web Madenciliği
  16. Ve asıl konumuz olan Web Madenciliği
  17. Web Madenciliği Şeması
  18. Web Madenciliği Şeması
  19. Web İçerik Madenciliği
  20. Web İçerik Madenciliği
  21. Web Yapı Madenciliği
  22. Web Yapı Madenciliği
  23. Web Kullanım Madenciliği
  24. Web Kullanım Madenciliği
  25. Web Kullanım Madenciliği
  26. Web Kullanım Madenciliği
  27. Web Kullanım Madenciliği
  28. Web Kullanım Madenciliği
  29. Web Kullanım Madenciliği
  30. Web Kullanım Madenciliği