SlideShare a Scribd company logo
1 of 85
Download to read offline
Căutarea
resurselor Web
Dr. Sabin Buraga
Facultatea de Informatică
UAIC – Iași, România
profs.info.uaic.ro/~busaco/
www.worldometers.info
Ce activități realizează
un motor de căutare?
scop: localizarea resurselor existente pe Web
conținut textual
documente Web, știri, comentarii, cod-sursă,
însemnări în cadrul aplicațiilor Web sociale etc.
scop: localizarea resurselor existente pe Web
conținut multimedia
imagini (fotografii, diagrame, ilustrații),
audio, video, prezentări,…
(în formă fizică și/sau electronică – gratuite ori comerciale)
scop: localizarea resurselor existente pe Web
entități
persoane, organizații, evenimente, cunoaștere
(cărți, software), de interes personal/social
(bunuri reale/digitale – produse și/sau servicii),…
Tipuri de căutări – maniera tradițională:
pe bază de indecși de termeni
explorare a Web-ului (crawling) +
prelucrarea conținutului textual (indexing)
Lycos
(1994, proiect de cercetare al lui Michael Loren Mauldin,
CMU – Carnegie Mellon University)
AltaVista
(1995, Paul Flaherty, Louis Monier & Michael Burrows,
proiect de cercetare la DEC – Digital Equipment Corporation)
Tipuri de căutări – maniera tradițională:
pe baza ierarhiilor de termeni (cuvinte)
(servicii de tip catalog – topic directory, taxonomii)
Yahoo! – Yet Another Hierarchical Officious Oracle
fondat în 1994 de Jerry Yang and David Filo (absolvenți Stanford)
Jerry and David’s guide to the World Wide Web
Tipuri de căutări – maniera tradițională:
hibride
indecși + taxonomiiportal Web
Excite
inițial Architext, creat în 1994 de Graham Spencer, Joe Kraus,
Mark Van Haren, Ryan McIntyre, Ben Lutch, Martin Reinfried
(studenți la Stanford)
Tipuri de căutări – maniera tradițională:
pe baza legăturilor hipertext (hyperlink analysis)
Google
inițial BackRub, o inițiativă demarată în 1996, disponibilă din 1998
Sergey Brin și Larry Page (studenți la doctorat – Stanford)
Un motor de căutare trebuie să satisfacă
nevoia de informații a utilizatorului
(user information-seeking)
caracteristici ale unui motor de căutare ideal
scop
căutarea oricărei resurse existente
caracteristici ale unui motor de căutare ideal
viteză
rezultate disponibile imediat
caracteristici ale unui motor de căutare ideal
disponibilitate
orice modificare să fie indexată „instantaneu”
(în timp-real)
caracteristici ale unui motor de căutare ideal
„reamintire” – recall
găsirea tuturor resurselor relevante
pentru o cerere dată
caracteristici ale unui motor de căutare ideal
precizie
răspunsul oferit conține doar resurse relevante
caracteristici ale unui motor de căutare ideal
categorisire eficientă – ranking
cele mai relevante resurse Web
sunt plasate primele
Care sunt principalele componente
ale unui motor de căutare?
Robot Web
extrage informații
Index (catalog)
stochează – în mod persistent – (meta)date
despre resursele existente pe Web
Mecanism de evaluare
pe baza cererii utilizatorului,
oferă răspunsuri – de dorit, utile
structura generică a unui motor de căutare (Chakrabarti, 2003)
roboții Web
Roboți Web
programe ce traversează automat Web-ul,
cu scopul de a extrage date
spiders crawlers Web bots
robot Web  navigator Web
Roboți Web
pornind de la o adresă Web (URL – Uniform
Resource Locator), realizează o conexiune HTTP
la un server Web, pentru a întreprinde anumite
acțiuni privitoare la reprezentarea unei resurse
– uzual, HTML – și, recursiv, din toate resursele
(documentele) desemnate de legăturile existente
în cadrul reprezentării
Roboți Web
pornind de la o adresă Web (URL – Uniform
Resource Locator), realizează o conexiune HTTP
la un server Web, pentru a întreprinde anumite
acțiuni privitoare la reprezentarea unei resurse
– uzual, HTML – și, recursiv, din toate resursele
(documentele) desemnate de legăturile existente
în cadrul reprezentării
acțiuni: extrage de date, copiere, agregare de conținut,
monitorizare, realizare a unui rezumat etc.
Roboți Web
ai motoarelor de căutare majore
Baiduspider – www.baidu.com/search/spider.html
bingbot – www.bing.com/bingbot.htm
Googlebot – www.google.com/bot.html
Slurp – http://help.yahoo.com/help/us/ysearch/slurp
YandexBot – yandex.com/bots
Roboți Web
specializați
roluri:
validarea codului HTML, scurtarea lungimii URL-urilor,
scanare de vulnerabilități, statistici,…
exemple:
citeseerxbot, Page2RSS, extensii Nagios, W3C Validator
Roboți Web
personali
rulați de utilizatori
exemplificare: software de „oglindire” (copiere)
a conținutului unui (fragment de) sit Web
aplicații notorii disponibile în regim deschis:
curl – https://curl.haxx.se/
wget – www.gnu.org/software/wget/
Roboți Web
(potențial) malefici
pot cauza breșe de securitate, exploatând diverse
vulnerabilități ale siturilor/aplicațiilor Web
exemple tipice:
SQL injections
atacuri XSS – Cross-Site Scripting
statistici + detalii:
www.botsvsbrowsers.com
Roboți Web
trebuie să respecte standardul de excludere
„inhibă” vizitarea anumitor zone (secțiuni)
ale unui sit Web
Roboți Web
în rădăcina unui domeniu Web
se poate plasa fișierul robots.txt
www.robotstxt.org/robotstxt.html
# https://developer.mozilla.org/robots.txt
User-agent: *
Crawl-delay: 5
Sitemap: https://developer.mozilla.org/sitemap.xml
Request-rate: 1/5
Disallow: /admin/
Disallow: /*/dashboards/*
Disallow: /*docs/feeds
...
exemplu
indexul
Index
Necesitatea folosirii sistemelor de baze de date
depozit distribuit de stocare – actualmente, în cloud
aspect important: optimizarea regăsirii
context mai larg:
procesarea volumelor mari de date (big data)
Index
utilizarea nu doar a datelor propriu-zise
(conținutul textual),
ci și a meta-datelor asociate unei resurse Web
e.g., limbă, cuvinte-cheie, autor, format,
data ultimei actualizări, frecvența modificărilor,…
Index
indexare bazată pe cuvinte-cheie (termeni)
relevanță, plasament – e.g., context de apariție –,
meta-date, procesarea limbajului natural,
clasificare (semi-)automată via învățare automată
(machine learning) sau alte tehnici,...
Index
indexare semantică – recurgând la concepte
clasificare socială via adnotare de resurse – tagging
(folksonomy)
+
folosirea tehnologiilor Web-ului semantic
(RDF, RDFa, SKOS, OWL,…)
vezi și Sabin Buraga, „Dezvoltarea aplicațiilor Web”:
http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html
interogarea
Interfața de interogare
cererile sunt formulate via o interfață Web
unele motoare de căutare acceptă
folosirea unor operatori specifici
o parte dintre operatorii Google
"expresie" ~termen –termen
related: URL cache: URL link: URL
intitle: termen(i) allintitle: termen(i)
intext: termen(i) allintext: termen(i)
inurl: termen(i) allinurl: termen(i)
site: domeniu info: domeniu
define: termen filetype: extensie
um1 in um2 număr1 .. număr2
www.googleguide.com/advanced_operators_reference.html
digital camera $700 .. 1400
~book
intitle:design –intitle:web
"burse de merit" site:uaic.ro
inurl:art nouveau
allinurl:ES6 library
16 cm in inch
related:www.w3.org
php mvc inanchor:slideshare
define:design
cache:http://devdocs.io/
map:macea,arad
linux filetype:svg OR filetype:png
exemple
Mult succes!unii operatori sunt permiși
doar pentru anumite tipuri de căutări – aici: știri
exemplu
interacțiunea cu motorul de interogare poate fi
facilitată și de un agent software conversațional
Apple Siri, Google Now, Microsoft Cortana
Dragon Go, Sherpa, SpeakToIt Assistant
calculul relevanței
Evaluarea relevanței
1. Analizarea interogării (tokenizing)
2. Căutarea în indecșii termenilor
3. Procesarea documentelor
4. Evaluarea relevanței paginilor
5. Eliminarea duplicatelor + sortarea
6. Afișarea primelor N documente relevante
(URL + alte informații)
Evaluarea relevanței
se bazează pe…
clasificare umană
resurse categorisite de oameni
Evaluarea relevanței
se bazează pe…
informații vizând utilizarea unei resurse
factori: timp de viață, periodicitatea accesului la acea
resursă, frecvența actualizării conținutului,
importanța relativă etc.
Evaluarea relevanței
se bazează pe…
conectivitatea cu alte resurse
analiza relațiilor (legăturilor hipertext) cu alte pagini
reputația – e.g., importanța domeniului Internet
(sunt luați în calcul factori ca vechimea, localizarea,…)
timp strategie
înainte
de 2000
conținut – indexarea textului
(titlu, anteturi, URL, descriere via <meta>)
2000—2010
conținut
autoritate (via legături desemnate de URL-uri)
2010
—
prezent
conținut
autoritate
personalizare (social media + profil de utilizator)
2012
—
prezent
conținut
autoritate
personalizare
concepte (date structurate + Web of data)
context (localizare geo., limbă, timp, dispozitiv,…)
adaptare după (K. Bodnar & J. Hopkins, 2011)
de studiat și www.slideshare.net/randfish/presentations
vizând anonimitatea DuckDuckGo, Gibiru, Qwant, Unbubble,…
regionale
Baidu (China), Daum (Coreea), Goo (Japonia),
Guruji (India), MetaGer (Germania) etc.
meta-căutare Dogpile, Excite, Mamma, Searx, Yippy Search
enterprise search ElasticSearch, OpenSearchServer,…
răspunsuri
(answer-based)
umane: Stack Overflow, Quora etc.
automate: Evi, Wolfram Alpha
căutare de știri Daylife, Topix,…
hărți (maps) Nokia HERE, OpenStreetMap, WikiMapia
cod-sursă Open Hub, Krugle, Searchcode
folosind puterea
umană (crowd-search)
Dunno + abordări distribuite (P2P):
FAROO, Seeks, YaCy
desktop search
căutare pe dispozitiv
Dash, DocFetcher,
Recoll, Terrier, Tracker
https://searchcode.com/
instrumente software open source pentru implementatori:
Apache Lucene, Apache Nutch, Apache Solr,
mnoGoSearch, Namazu, Xapian,…
API-uri publice:
www.programmableweb.com/category/search
disponibilitatea datelor indexate în regim deschis
în vederea analizării ulterioare:
https://commoncrawl.org/
prezentarea rezultatelor
Prezentarea rezultatelor
SERP – Search Engine Result Page
specifică maniera de redare a rezultatelor
oferite de motorul de căutare
Prezentarea rezultatelor
se includ recomandări pe baza:
preferințelor utilizatorului
istoricului căutărilor
URL-urilor partajate via rețele sociale
meta-datelor (rich snippets)
adnotărilor realizate de utilizatori
localizării geografice (local search)
exemplu
dezvoltatorii pot participa la DuckDuckHack: duckduckhack.com
motorul de căutare
DuckDuckGo este axat
asupra asigurării intimității
utilizatorului în ceea ce privește
căutările acestuia pe Web
exemplu
Google
“At any one time you rank #1 or #8 or #40
based on who is searching, where they search,
and what is happening.”
K. Bodnar & J. Hopkins, 2011
Cum putem obține o relevanță
(mai) bună a conținutului indexat?
SEO – Search Engine Optimization
suită de strategii de redactare a codului HTML
în vederea obținerii unei relevanțe ridicate
a conținutului, astfel încât pagina/situl să fie
regăsite în urma unei căutări specifice efectuate
cu un instrument de căutare
Structurarea…
codului-sursă al paginilor Web
conținutului (textual, grafic,…)
legăturilor cu alte resurse
Se recurge la semnificația logică
a marcatorilor HTML
POSH (Plain Old Semantic HTML)
titluri plasate ierarhic via elementele <h1>, <h2>,…
conținut tabelar cu <table>
aranjament vizual (layout)
via stiluri CSS și nu tabele (<table>, <tr>,…)
Se recurge la semnificația logică
a marcatorilor HTML
POSH (Plain Old Semantic HTML)
divizarea conținutului:
<section>, <article>, <header>, <footer>, <aside> etc.
marcajarea elementelor vizând navigabilitatea cu <nav>
liste specificate cu <ul> <ol> <li>
…
detalii la HTML5 Doctor: html5doctor.com/element-index/
h1
nav
aside
section
h2
ul
h2
articlep
header
Se recurge la semnificația logică
a marcatorilor HTML
POSH (Plain Old Semantic HTML)
conținut textual alternativ pentru imagini
(<img alt="..." />), legături (<a title="...">),
tabele (<table summary="...">), multimedia,…
atașarea de meta-date externe în antetul paginii Web
via <head>, <meta /> și <link />
https://github.com/joshbuchea/HEAD
Se recurge la semnificația logică
a marcatorilor HTML
POSH (Plain Old Semantic HTML)
de evitat elementele învechite – e.g., cadre (frame-uri) –
sau proprietare (<blink> ori <marquee>)
documentul trebuie să fie bine-formatat
verificarea corectitudinii codului HTML cu instrumentul
oferit de Consorțiul Web – validator.w3.org
a se considera și https://github.com/h5bp/html5-boilerplate
Includerea de meta-date (date privind datele)
în cadrul documentelor HTML pentru a „explica”
resursele Web unui program
(software – e.g., motor de căutare)
soluții actuale aliniate problematicilor
Web-ului semantic – Web of Data
scheme de microdate HTML5 – schema.org
RDFa (standard al Consorțiului Web) – rdfa.info
pentru detalii, de parcurs:
S. Buraga, Why 5-Star Data? – www.slideshare.net/busaco/why-5star-data
http://profs.info.uaic.ro/~busaco/teach/courses/cliw/web-film.html#week6
Conținutul primează – content is king
o importanță majoră o are titlul paginii
Untitled Document – aproape 22 de milioane de rezultate
situl trebuie actualizat periodic, frecvent
numele fișierelor (imagini, stiluri,…) contează
tehnică utilă:
„transformarea” URL-urilor – mod_rewrite la Apache
anumite date pot fi „ascunse” de roboți
via robots.txt
Realizarea legăturilor între pagini (hipermedia)
obligatoriu, de inclus legături spre alte resurse
(ale sitului propriu ori ale altor situri)
dorim legături spre/de la situri importante
având conținut similar cu situl nostru
de verificat și menținut structura hipertextului
instrumentul LinkChecker – validator.w3.org/checklink
Realizarea legăturilor între pagini (hipermedia)
tehnici clasice – considerate „demodate”:
interschimb de adrese (link-uri) – banner-e, blogroll-uri
marketing bazat pe context – i.e. articole/produse înrudite
Realizarea legăturilor între pagini (hipermedia)
recurgerea la aplicații Web sociale
SMO – Social Media Optimization
partajare în rețeaua de „prieteni”,
apreciere, comentarii, opinii,…
S. Buraga, Design Patterns for Social (Web/mobile) Interactions, 2016
http://profs.info.uaic.ro/~busaco/teach/courses/hci/hci-film.html#week7
Social UX
Realizarea legăturilor între pagini (hipermedia)
de evitat paginile de eroare – 404 Not Found
orice pagină de eroare poate fi „convertită”
într-o resursă folositoare omului/robotului
uzual, se oferă harta sitului (site map),
legături relevante, motor intern de căutare,…
http://alistapart.com/article/perfect404
http://alistapart.com/article/amoreuseful404
Realizarea legăturilor între pagini (hipermedia)
a nu se folosi navigarea bazată pe JavaScript ori – mai
desuet – pe tehnologii proprietare (Flash/Silverlight)
<p>participanții: <a href="javascript:sari(1);">aici</a></p>
Alte aspecte de interes despre SEO?
Crearea documentului sitemap.xml
pentru a-l expedia la Google Sitemaps
http://sitemaps.org/
complementar fișierului robots.txt
furnizează structura hipertext a unui sit Web
formate acceptate: text obișnuit, XML (Extensible Markup
Language), RSS (Really Simple Syndication)
un instrument Web util:
www.xml-sitemaps.com
Regăsirea informațiilor disponibile pe Web
trebuie considerată într-un context mai larg
accesibilitatea – utilizatorii cu nevoi speciale
Web Accessibility Initiative
www.w3.org/WAI/
Web Accessibility in Mind
webaim.org
Regăsirea informațiilor disponibile pe Web
trebuie considerată într-un context mai larg
performanța aplicațiilor Web
aspect important:
timpul de încărcare a unei pagini Web
profs.info.uaic.ro/~busaco/teach/courses/cliw/web-film.html#week12
Invisible Web
(Deep Web)
acea parte a spațiului WWW
care nu este detectată de
motoarele de căutare sau
de alte tipuri de aplicații de
regăsire a resurselor
disponibile pe Web
S. Buraga, Proiectarea siturilor Web (ed. II), Polirom, 2005
www.slideshare.net/busaco/sabin-buraga-proiectarea-siturilor-web
Google Webmaster Central
https://developers.google.com/webmasters/
Learn SEO and Search Marketing
https://moz.com/learn/seo
Search Engine Land
http://searchengineland.com/
Search Engine Watch
http://searchenginewatch.com/
Search Engines @ VideoLectures
http://videolectures.net/Top/Computer_Science/Search_Engines
Căutarea resurselor Web
de la roboți Web și motoare de căutare la SEO
Dr. Sabin Buraga
Facultatea de Informatică, UAIC – Iași, România
http://profs.info.uaic.ro/~busaco/
ilustrații:
tango2010weibo.tumblr.com/

More Related Content

What's hot

CLIW 2014—2015 (10/12): Programare Web. Suita de tehnologii HTML5
CLIW 2014—2015 (10/12): Programare Web. Suita de tehnologii HTML5CLIW 2014—2015 (10/12): Programare Web. Suita de tehnologii HTML5
CLIW 2014—2015 (10/12): Programare Web. Suita de tehnologii HTML5Sabin Buraga
 
O lectie de anatomie Web. Disectia unui document HTML
O lectie de anatomie Web. Disectia unui document HTMLO lectie de anatomie Web. Disectia unui document HTML
O lectie de anatomie Web. Disectia unui document HTMLSabin Buraga
 
Web 2016 (04/13) Programare Web – Dezvoltarea aplicațiilor Web în PHP
Web 2016 (04/13) Programare Web – Dezvoltarea aplicațiilor Web în PHPWeb 2016 (04/13) Programare Web – Dezvoltarea aplicațiilor Web în PHP
Web 2016 (04/13) Programare Web – Dezvoltarea aplicațiilor Web în PHPSabin Buraga
 
Web 2020 03/12: Programare Web – Arhitectura aplicaţiilor Web. Inginerie Web
Web 2020 03/12: Programare Web – Arhitectura aplicaţiilor Web. Inginerie WebWeb 2020 03/12: Programare Web – Arhitectura aplicaţiilor Web. Inginerie Web
Web 2020 03/12: Programare Web – Arhitectura aplicaţiilor Web. Inginerie WebSabin Buraga
 
Web 2020 06/12: Procesarea datelor XML & HTML. Document Object Model
Web 2020 06/12: Procesarea datelor XML & HTML. Document Object ModelWeb 2020 06/12: Procesarea datelor XML & HTML. Document Object Model
Web 2020 06/12: Procesarea datelor XML & HTML. Document Object ModelSabin Buraga
 
Dezvoltarea aplicațiilor Web (3/12): Arhitectura aplicaţiilor Web orientate s...
Dezvoltarea aplicațiilor Web (3/12): Arhitectura aplicaţiilor Web orientate s...Dezvoltarea aplicațiilor Web (3/12): Arhitectura aplicaţiilor Web orientate s...
Dezvoltarea aplicațiilor Web (3/12): Arhitectura aplicaţiilor Web orientate s...Sabin Buraga
 
Web 2020 11/12: Interacţiune Web asincronă. Aplicaţii Web de tip mash-up. JAM...
Web 2020 11/12: Interacţiune Web asincronă. Aplicaţii Web de tip mash-up. JAM...Web 2020 11/12: Interacţiune Web asincronă. Aplicaţii Web de tip mash-up. JAM...
Web 2020 11/12: Interacţiune Web asincronă. Aplicaţii Web de tip mash-up. JAM...Sabin Buraga
 
Node.js: aspecte esențiale
Node.js: aspecte esențialeNode.js: aspecte esențiale
Node.js: aspecte esențialeSabin Buraga
 
Web 2020 01/12: World Wide Web – aspecte arhitecturale
Web 2020 01/12: World Wide Web – aspecte arhitecturaleWeb 2020 01/12: World Wide Web – aspecte arhitecturale
Web 2020 01/12: World Wide Web – aspecte arhitecturaleSabin Buraga
 
Web 2020 09/12: Servicii Web. Paradigma REST
Web 2020 09/12: Servicii Web. Paradigma RESTWeb 2020 09/12: Servicii Web. Paradigma REST
Web 2020 09/12: Servicii Web. Paradigma RESTSabin Buraga
 
Web 2020 07/12: Procesarea datelor XML & HTML – Simple API for XML. Procesări...
Web 2020 07/12: Procesarea datelor XML & HTML – Simple API for XML. Procesări...Web 2020 07/12: Procesarea datelor XML & HTML – Simple API for XML. Procesări...
Web 2020 07/12: Procesarea datelor XML & HTML – Simple API for XML. Procesări...Sabin Buraga
 
Web 2020 05/12: Modelarea datelor. Familia XML. Extragerea datelor cu XPath. ...
Web 2020 05/12: Modelarea datelor. Familia XML. Extragerea datelor cu XPath. ...Web 2020 05/12: Modelarea datelor. Familia XML. Extragerea datelor cu XPath. ...
Web 2020 05/12: Modelarea datelor. Familia XML. Extragerea datelor cu XPath. ...Sabin Buraga
 
STAW 12/12: (Re)găsirea resurselor Web. De la motoare de căutare şi SEO la da...
STAW 12/12: (Re)găsirea resurselor Web. De la motoare de căutare şi SEO la da...STAW 12/12: (Re)găsirea resurselor Web. De la motoare de căutare şi SEO la da...
STAW 12/12: (Re)găsirea resurselor Web. De la motoare de căutare şi SEO la da...Sabin Buraga
 
Dezvoltator Web?! (varianta 2015)
Dezvoltator Web?! (varianta 2015)Dezvoltator Web?! (varianta 2015)
Dezvoltator Web?! (varianta 2015)Sabin Buraga
 
WADe 2017-2018 (1/12) Web Application Development: Concepts & Vision
WADe 2017-2018 (1/12) Web Application Development: Concepts & VisionWADe 2017-2018 (1/12) Web Application Development: Concepts & Vision
WADe 2017-2018 (1/12) Web Application Development: Concepts & VisionSabin Buraga
 
Sabin Buraga – Dezvoltator Web (...în 2017)
Sabin Buraga – Dezvoltator Web (...în 2017)Sabin Buraga – Dezvoltator Web (...în 2017)
Sabin Buraga – Dezvoltator Web (...în 2017)Sabin Buraga
 
Web 2016 (01/13) Spațiul World Wide Web – aspecte arhitecturale
Web 2016 (01/13) Spațiul World Wide Web – aspecte arhitecturaleWeb 2016 (01/13) Spațiul World Wide Web – aspecte arhitecturale
Web 2016 (01/13) Spațiul World Wide Web – aspecte arhitecturaleSabin Buraga
 
CLIW 2015-2016 (6/13) (Re)găsirea resurselor Web. De la motoare de căutare și...
CLIW 2015-2016 (6/13) (Re)găsirea resurselor Web. De la motoare de căutare și...CLIW 2015-2016 (6/13) (Re)găsirea resurselor Web. De la motoare de căutare și...
CLIW 2015-2016 (6/13) (Re)găsirea resurselor Web. De la motoare de căutare și...Sabin Buraga
 
CLIW 2015-2016 (12/13) Performanța aplicaţiilor Web la nivel de client
CLIW 2015-2016 (12/13) Performanța aplicaţiilor Web la nivel de clientCLIW 2015-2016 (12/13) Performanța aplicaţiilor Web la nivel de client
CLIW 2015-2016 (12/13) Performanța aplicaţiilor Web la nivel de clientSabin Buraga
 

What's hot (20)

CLIW 2014—2015 (10/12): Programare Web. Suita de tehnologii HTML5
CLIW 2014—2015 (10/12): Programare Web. Suita de tehnologii HTML5CLIW 2014—2015 (10/12): Programare Web. Suita de tehnologii HTML5
CLIW 2014—2015 (10/12): Programare Web. Suita de tehnologii HTML5
 
O lectie de anatomie Web. Disectia unui document HTML
O lectie de anatomie Web. Disectia unui document HTMLO lectie de anatomie Web. Disectia unui document HTML
O lectie de anatomie Web. Disectia unui document HTML
 
Web 2016 (04/13) Programare Web – Dezvoltarea aplicațiilor Web în PHP
Web 2016 (04/13) Programare Web – Dezvoltarea aplicațiilor Web în PHPWeb 2016 (04/13) Programare Web – Dezvoltarea aplicațiilor Web în PHP
Web 2016 (04/13) Programare Web – Dezvoltarea aplicațiilor Web în PHP
 
HTML5? HTML5!
HTML5? HTML5!HTML5? HTML5!
HTML5? HTML5!
 
Web 2020 03/12: Programare Web – Arhitectura aplicaţiilor Web. Inginerie Web
Web 2020 03/12: Programare Web – Arhitectura aplicaţiilor Web. Inginerie WebWeb 2020 03/12: Programare Web – Arhitectura aplicaţiilor Web. Inginerie Web
Web 2020 03/12: Programare Web – Arhitectura aplicaţiilor Web. Inginerie Web
 
Web 2020 06/12: Procesarea datelor XML & HTML. Document Object Model
Web 2020 06/12: Procesarea datelor XML & HTML. Document Object ModelWeb 2020 06/12: Procesarea datelor XML & HTML. Document Object Model
Web 2020 06/12: Procesarea datelor XML & HTML. Document Object Model
 
Dezvoltarea aplicațiilor Web (3/12): Arhitectura aplicaţiilor Web orientate s...
Dezvoltarea aplicațiilor Web (3/12): Arhitectura aplicaţiilor Web orientate s...Dezvoltarea aplicațiilor Web (3/12): Arhitectura aplicaţiilor Web orientate s...
Dezvoltarea aplicațiilor Web (3/12): Arhitectura aplicaţiilor Web orientate s...
 
Web 2020 11/12: Interacţiune Web asincronă. Aplicaţii Web de tip mash-up. JAM...
Web 2020 11/12: Interacţiune Web asincronă. Aplicaţii Web de tip mash-up. JAM...Web 2020 11/12: Interacţiune Web asincronă. Aplicaţii Web de tip mash-up. JAM...
Web 2020 11/12: Interacţiune Web asincronă. Aplicaţii Web de tip mash-up. JAM...
 
Node.js: aspecte esențiale
Node.js: aspecte esențialeNode.js: aspecte esențiale
Node.js: aspecte esențiale
 
Web 2020 01/12: World Wide Web – aspecte arhitecturale
Web 2020 01/12: World Wide Web – aspecte arhitecturaleWeb 2020 01/12: World Wide Web – aspecte arhitecturale
Web 2020 01/12: World Wide Web – aspecte arhitecturale
 
Web 2020 09/12: Servicii Web. Paradigma REST
Web 2020 09/12: Servicii Web. Paradigma RESTWeb 2020 09/12: Servicii Web. Paradigma REST
Web 2020 09/12: Servicii Web. Paradigma REST
 
Web 2020 07/12: Procesarea datelor XML & HTML – Simple API for XML. Procesări...
Web 2020 07/12: Procesarea datelor XML & HTML – Simple API for XML. Procesări...Web 2020 07/12: Procesarea datelor XML & HTML – Simple API for XML. Procesări...
Web 2020 07/12: Procesarea datelor XML & HTML – Simple API for XML. Procesări...
 
Web 2020 05/12: Modelarea datelor. Familia XML. Extragerea datelor cu XPath. ...
Web 2020 05/12: Modelarea datelor. Familia XML. Extragerea datelor cu XPath. ...Web 2020 05/12: Modelarea datelor. Familia XML. Extragerea datelor cu XPath. ...
Web 2020 05/12: Modelarea datelor. Familia XML. Extragerea datelor cu XPath. ...
 
STAW 12/12: (Re)găsirea resurselor Web. De la motoare de căutare şi SEO la da...
STAW 12/12: (Re)găsirea resurselor Web. De la motoare de căutare şi SEO la da...STAW 12/12: (Re)găsirea resurselor Web. De la motoare de căutare şi SEO la da...
STAW 12/12: (Re)găsirea resurselor Web. De la motoare de căutare şi SEO la da...
 
Dezvoltator Web?! (varianta 2015)
Dezvoltator Web?! (varianta 2015)Dezvoltator Web?! (varianta 2015)
Dezvoltator Web?! (varianta 2015)
 
WADe 2017-2018 (1/12) Web Application Development: Concepts & Vision
WADe 2017-2018 (1/12) Web Application Development: Concepts & VisionWADe 2017-2018 (1/12) Web Application Development: Concepts & Vision
WADe 2017-2018 (1/12) Web Application Development: Concepts & Vision
 
Sabin Buraga – Dezvoltator Web (...în 2017)
Sabin Buraga – Dezvoltator Web (...în 2017)Sabin Buraga – Dezvoltator Web (...în 2017)
Sabin Buraga – Dezvoltator Web (...în 2017)
 
Web 2016 (01/13) Spațiul World Wide Web – aspecte arhitecturale
Web 2016 (01/13) Spațiul World Wide Web – aspecte arhitecturaleWeb 2016 (01/13) Spațiul World Wide Web – aspecte arhitecturale
Web 2016 (01/13) Spațiul World Wide Web – aspecte arhitecturale
 
CLIW 2015-2016 (6/13) (Re)găsirea resurselor Web. De la motoare de căutare și...
CLIW 2015-2016 (6/13) (Re)găsirea resurselor Web. De la motoare de căutare și...CLIW 2015-2016 (6/13) (Re)găsirea resurselor Web. De la motoare de căutare și...
CLIW 2015-2016 (6/13) (Re)găsirea resurselor Web. De la motoare de căutare și...
 
CLIW 2015-2016 (12/13) Performanța aplicaţiilor Web la nivel de client
CLIW 2015-2016 (12/13) Performanța aplicaţiilor Web la nivel de clientCLIW 2015-2016 (12/13) Performanța aplicaţiilor Web la nivel de client
CLIW 2015-2016 (12/13) Performanța aplicaţiilor Web la nivel de client
 

Viewers also liked

Design (Web) responsiv
Design (Web) responsivDesign (Web) responsiv
Design (Web) responsivSabin Buraga
 
Dezvoltator Web?! – ...în 2016
Dezvoltator Web?! – ...în 2016Dezvoltator Web?! – ...în 2016
Dezvoltator Web?! – ...în 2016Sabin Buraga
 
Esență de JavaScript pentru novici
Esență de JavaScript pentru noviciEsență de JavaScript pentru novici
Esență de JavaScript pentru noviciSabin Buraga
 
Limbajul JavaScript: o prezentare generală
Limbajul JavaScript: o prezentare generalăLimbajul JavaScript: o prezentare generală
Limbajul JavaScript: o prezentare generalăSabin Buraga
 
Arhitectura browser-ului Web
Arhitectura browser-ului WebArhitectura browser-ului Web
Arhitectura browser-ului WebSabin Buraga
 
Ce înseamnă să fii dezvoltator Web
Ce înseamnă să fii dezvoltator WebCe înseamnă să fii dezvoltator Web
Ce înseamnă să fii dezvoltator WebSabin Buraga
 
Programare Web - Arhitectura WWW
Programare Web - Arhitectura WWWProgramare Web - Arhitectura WWW
Programare Web - Arhitectura WWWSabin Buraga
 
Vin pietroasele
Vin pietroaseleVin pietroasele
Vin pietroaselecpostovei
 
Web 2016 (03/13) Programare Web – Servere de aplicații. Arhitectura aplicații...
Web 2016 (03/13) Programare Web – Servere de aplicații. Arhitectura aplicații...Web 2016 (03/13) Programare Web – Servere de aplicații. Arhitectura aplicații...
Web 2016 (03/13) Programare Web – Servere de aplicații. Arhitectura aplicații...Sabin Buraga
 
Web 2016 (11/13) Servicii Web. Paradigma REST
Web 2016 (11/13) Servicii Web. Paradigma RESTWeb 2016 (11/13) Servicii Web. Paradigma REST
Web 2016 (11/13) Servicii Web. Paradigma RESTSabin Buraga
 
Schema de tratament pentru samburoase
Schema de tratament pentru samburoaseSchema de tratament pentru samburoase
Schema de tratament pentru samburoaseAndrei Dei
 
Brosura horticulturan pomi vie legume tratamente tare 2014
Brosura horticulturan pomi vie legume tratamente tare 2014Brosura horticulturan pomi vie legume tratamente tare 2014
Brosura horticulturan pomi vie legume tratamente tare 2014greenaxl
 
Suport curs ae dupa un asm verificat de autor
Suport curs ae dupa un asm verificat de autorSuport curs ae dupa un asm verificat de autor
Suport curs ae dupa un asm verificat de autoreugencostin53
 
REST and some Python (or 'Python "sinners" must REST')
REST and some Python (or 'Python "sinners" must REST')REST and some Python (or 'Python "sinners" must REST')
REST and some Python (or 'Python "sinners" must REST')Sabin Buraga
 
Pomicultura generala si speciala
Pomicultura generala si specialaPomicultura generala si speciala
Pomicultura generala si specialaGherghescu Gabriel
 

Viewers also liked (20)

Design (Web) responsiv
Design (Web) responsivDesign (Web) responsiv
Design (Web) responsiv
 
Dezvoltator Web?! – ...în 2016
Dezvoltator Web?! – ...în 2016Dezvoltator Web?! – ...în 2016
Dezvoltator Web?! – ...în 2016
 
Esență de JavaScript pentru novici
Esență de JavaScript pentru noviciEsență de JavaScript pentru novici
Esență de JavaScript pentru novici
 
Limbajul JavaScript: o prezentare generală
Limbajul JavaScript: o prezentare generalăLimbajul JavaScript: o prezentare generală
Limbajul JavaScript: o prezentare generală
 
Arhitectura browser-ului Web
Arhitectura browser-ului WebArhitectura browser-ului Web
Arhitectura browser-ului Web
 
Ce înseamnă să fii dezvoltator Web
Ce înseamnă să fii dezvoltator WebCe înseamnă să fii dezvoltator Web
Ce înseamnă să fii dezvoltator Web
 
Programare Web - Arhitectura WWW
Programare Web - Arhitectura WWWProgramare Web - Arhitectura WWW
Programare Web - Arhitectura WWW
 
Vin pietroasele
Vin pietroaseleVin pietroasele
Vin pietroasele
 
Web 2016 (03/13) Programare Web – Servere de aplicații. Arhitectura aplicații...
Web 2016 (03/13) Programare Web – Servere de aplicații. Arhitectura aplicații...Web 2016 (03/13) Programare Web – Servere de aplicații. Arhitectura aplicații...
Web 2016 (03/13) Programare Web – Servere de aplicații. Arhitectura aplicații...
 
Web 2016 (11/13) Servicii Web. Paradigma REST
Web 2016 (11/13) Servicii Web. Paradigma RESTWeb 2016 (11/13) Servicii Web. Paradigma REST
Web 2016 (11/13) Servicii Web. Paradigma REST
 
Schema de tratament pentru samburoase
Schema de tratament pentru samburoaseSchema de tratament pentru samburoase
Schema de tratament pentru samburoase
 
ANTREC Moldova (ro)
ANTREC Moldova (ro)ANTREC Moldova (ro)
ANTREC Moldova (ro)
 
Studentii iau altitudine. FII pe vf. Lenin (august 2011)
Studentii iau altitudine. FII pe vf. Lenin (august 2011)Studentii iau altitudine. FII pe vf. Lenin (august 2011)
Studentii iau altitudine. FII pe vf. Lenin (august 2011)
 
Brosura horticulturan pomi vie legume tratamente tare 2014
Brosura horticulturan pomi vie legume tratamente tare 2014Brosura horticulturan pomi vie legume tratamente tare 2014
Brosura horticulturan pomi vie legume tratamente tare 2014
 
25 de ani de Web
25 de ani de Web 25 de ani de Web
25 de ani de Web
 
Suport curs ae dupa un asm verificat de autor
Suport curs ae dupa un asm verificat de autorSuport curs ae dupa un asm verificat de autor
Suport curs ae dupa un asm verificat de autor
 
REST and some Python (or 'Python "sinners" must REST')
REST and some Python (or 'Python "sinners" must REST')REST and some Python (or 'Python "sinners" must REST')
REST and some Python (or 'Python "sinners" must REST')
 
Pomicultura
Pomicultura Pomicultura
Pomicultura
 
Taierea pomilorfructiferi
Taierea pomilorfructiferiTaierea pomilorfructiferi
Taierea pomilorfructiferi
 
Pomicultura generala si speciala
Pomicultura generala si specialaPomicultura generala si speciala
Pomicultura generala si speciala
 

Similar to Căutarea resurselor Web

CLIW 2017-2018 (3/12) (Re)găsirea resurselor Web. De la motoare de căutare şi...
CLIW 2017-2018 (3/12) (Re)găsirea resurselor Web. De la motoare de căutare şi...CLIW 2017-2018 (3/12) (Re)găsirea resurselor Web. De la motoare de căutare şi...
CLIW 2017-2018 (3/12) (Re)găsirea resurselor Web. De la motoare de căutare şi...Sabin Buraga
 
De câte stele sunt datele d-voastră?
De câte stele sunt datele d-voastră?De câte stele sunt datele d-voastră?
De câte stele sunt datele d-voastră?Sabin Buraga
 
Modelarea datelor via XML. Design patterns in contextul specificarii document...
Modelarea datelor via XML. Design patterns in contextul specificarii document...Modelarea datelor via XML. Design patterns in contextul specificarii document...
Modelarea datelor via XML. Design patterns in contextul specificarii document...Sabin Buraga
 
CLIW 2014—2015 (6/12): Căutarea resurselor Web
CLIW 2014—2015 (6/12): Căutarea resurselor WebCLIW 2014—2015 (6/12): Căutarea resurselor Web
CLIW 2014—2015 (6/12): Căutarea resurselor WebSabin Buraga
 
WADe 2014—2015 (01/12): Dezvoltarea de aplicaţii Web: Concepte & viziune
WADe 2014—2015 (01/12): Dezvoltarea de aplicaţii Web: Concepte & viziuneWADe 2014—2015 (01/12): Dezvoltarea de aplicaţii Web: Concepte & viziune
WADe 2014—2015 (01/12): Dezvoltarea de aplicaţii Web: Concepte & viziuneSabin Buraga
 
Dezvoltarea Aplicatiilor Web
Dezvoltarea Aplicatiilor WebDezvoltarea Aplicatiilor Web
Dezvoltarea Aplicatiilor Webdanielnastase
 
WADe 2014—2015 (06/12): Semantic Web—Managementul datelor RDF. Interogarea da...
WADe 2014—2015 (06/12): Semantic Web—Managementul datelor RDF. Interogarea da...WADe 2014—2015 (06/12): Semantic Web—Managementul datelor RDF. Interogarea da...
WADe 2014—2015 (06/12): Semantic Web—Managementul datelor RDF. Interogarea da...Sabin Buraga
 
Dezvoltarea aplicaţiilor Web la nivel de client (cursul #6): Căutarea resurse...
Dezvoltarea aplicaţiilor Web la nivel de client (cursul #6): Căutarea resurse...Dezvoltarea aplicaţiilor Web la nivel de client (cursul #6): Căutarea resurse...
Dezvoltarea aplicaţiilor Web la nivel de client (cursul #6): Căutarea resurse...Sabin Buraga
 
WADe 2017-2018 (6/12) RDF Data Management. Accessing RDF Data via SPARQL
WADe 2017-2018 (6/12) RDF Data Management. Accessing RDF Data via SPARQLWADe 2017-2018 (6/12) RDF Data Management. Accessing RDF Data via SPARQL
WADe 2017-2018 (6/12) RDF Data Management. Accessing RDF Data via SPARQLSabin Buraga
 
Dezvoltarea aplicațiilor Web (1/12): Dezvoltarea de aplicaţii Web: Concepte &...
Dezvoltarea aplicațiilor Web (1/12): Dezvoltarea de aplicaţii Web: Concepte &...Dezvoltarea aplicațiilor Web (1/12): Dezvoltarea de aplicaţii Web: Concepte &...
Dezvoltarea aplicațiilor Web (1/12): Dezvoltarea de aplicaţii Web: Concepte &...Sabin Buraga
 
WADe 2017-2018 Tutorial (2/3): Data Modeling in HTML: Schema.org HTML5 Microdata
WADe 2017-2018 Tutorial (2/3): Data Modeling in HTML: Schema.org HTML5 MicrodataWADe 2017-2018 Tutorial (2/3): Data Modeling in HTML: Schema.org HTML5 Microdata
WADe 2017-2018 Tutorial (2/3): Data Modeling in HTML: Schema.org HTML5 MicrodataSabin Buraga
 
Dezvoltarea aplicațiilor Web (6/12): Managementul datelor RDF. Interogarea da...
Dezvoltarea aplicațiilor Web (6/12): Managementul datelor RDF. Interogarea da...Dezvoltarea aplicațiilor Web (6/12): Managementul datelor RDF. Interogarea da...
Dezvoltarea aplicațiilor Web (6/12): Managementul datelor RDF. Interogarea da...Sabin Buraga
 
Implementarea tehnologiei IR
Implementarea tehnologiei IRImplementarea tehnologiei IR
Implementarea tehnologiei IRNatalia Cheradi
 
WADe 2014—2015 (02/12): Dezvoltarea de servicii Web în stilul REST
WADe 2014—2015 (02/12): Dezvoltarea de servicii Web în stilul RESTWADe 2014—2015 (02/12): Dezvoltarea de servicii Web în stilul REST
WADe 2014—2015 (02/12): Dezvoltarea de servicii Web în stilul RESTSabin Buraga
 
Fii linked data
Fii linked dataFii linked data
Fii linked datateodora001
 
Fii linked data
Fii linked dataFii linked data
Fii linked datateodora001
 
Introducere baza de-date
Introducere baza de-dateIntroducere baza de-date
Introducere baza de-dateChelariu Mihai
 
Dezvoltarea aplicatiilor orientate spre servicii Web. De la REST la mash-up-u...
Dezvoltarea aplicatiilor orientate spre servicii Web. De la REST la mash-up-u...Dezvoltarea aplicatiilor orientate spre servicii Web. De la REST la mash-up-u...
Dezvoltarea aplicatiilor orientate spre servicii Web. De la REST la mash-up-u...Sabin Buraga
 

Similar to Căutarea resurselor Web (20)

CLIW 2017-2018 (3/12) (Re)găsirea resurselor Web. De la motoare de căutare şi...
CLIW 2017-2018 (3/12) (Re)găsirea resurselor Web. De la motoare de căutare şi...CLIW 2017-2018 (3/12) (Re)găsirea resurselor Web. De la motoare de căutare şi...
CLIW 2017-2018 (3/12) (Re)găsirea resurselor Web. De la motoare de căutare şi...
 
De câte stele sunt datele d-voastră?
De câte stele sunt datele d-voastră?De câte stele sunt datele d-voastră?
De câte stele sunt datele d-voastră?
 
Modelarea datelor via XML. Design patterns in contextul specificarii document...
Modelarea datelor via XML. Design patterns in contextul specificarii document...Modelarea datelor via XML. Design patterns in contextul specificarii document...
Modelarea datelor via XML. Design patterns in contextul specificarii document...
 
CLIW 2014—2015 (6/12): Căutarea resurselor Web
CLIW 2014—2015 (6/12): Căutarea resurselor WebCLIW 2014—2015 (6/12): Căutarea resurselor Web
CLIW 2014—2015 (6/12): Căutarea resurselor Web
 
WADe 2014—2015 (01/12): Dezvoltarea de aplicaţii Web: Concepte & viziune
WADe 2014—2015 (01/12): Dezvoltarea de aplicaţii Web: Concepte & viziuneWADe 2014—2015 (01/12): Dezvoltarea de aplicaţii Web: Concepte & viziune
WADe 2014—2015 (01/12): Dezvoltarea de aplicaţii Web: Concepte & viziune
 
Algoritm de crawling
Algoritm de crawlingAlgoritm de crawling
Algoritm de crawling
 
Dezvoltarea Aplicatiilor Web
Dezvoltarea Aplicatiilor WebDezvoltarea Aplicatiilor Web
Dezvoltarea Aplicatiilor Web
 
WADe 2014—2015 (06/12): Semantic Web—Managementul datelor RDF. Interogarea da...
WADe 2014—2015 (06/12): Semantic Web—Managementul datelor RDF. Interogarea da...WADe 2014—2015 (06/12): Semantic Web—Managementul datelor RDF. Interogarea da...
WADe 2014—2015 (06/12): Semantic Web—Managementul datelor RDF. Interogarea da...
 
Dezvoltarea aplicaţiilor Web la nivel de client (cursul #6): Căutarea resurse...
Dezvoltarea aplicaţiilor Web la nivel de client (cursul #6): Căutarea resurse...Dezvoltarea aplicaţiilor Web la nivel de client (cursul #6): Căutarea resurse...
Dezvoltarea aplicaţiilor Web la nivel de client (cursul #6): Căutarea resurse...
 
WADe 2017-2018 (6/12) RDF Data Management. Accessing RDF Data via SPARQL
WADe 2017-2018 (6/12) RDF Data Management. Accessing RDF Data via SPARQLWADe 2017-2018 (6/12) RDF Data Management. Accessing RDF Data via SPARQL
WADe 2017-2018 (6/12) RDF Data Management. Accessing RDF Data via SPARQL
 
Dezvoltarea aplicațiilor Web (1/12): Dezvoltarea de aplicaţii Web: Concepte &...
Dezvoltarea aplicațiilor Web (1/12): Dezvoltarea de aplicaţii Web: Concepte &...Dezvoltarea aplicațiilor Web (1/12): Dezvoltarea de aplicaţii Web: Concepte &...
Dezvoltarea aplicațiilor Web (1/12): Dezvoltarea de aplicaţii Web: Concepte &...
 
WADe 2017-2018 Tutorial (2/3): Data Modeling in HTML: Schema.org HTML5 Microdata
WADe 2017-2018 Tutorial (2/3): Data Modeling in HTML: Schema.org HTML5 MicrodataWADe 2017-2018 Tutorial (2/3): Data Modeling in HTML: Schema.org HTML5 Microdata
WADe 2017-2018 Tutorial (2/3): Data Modeling in HTML: Schema.org HTML5 Microdata
 
Dezvoltarea aplicațiilor Web (6/12): Managementul datelor RDF. Interogarea da...
Dezvoltarea aplicațiilor Web (6/12): Managementul datelor RDF. Interogarea da...Dezvoltarea aplicațiilor Web (6/12): Managementul datelor RDF. Interogarea da...
Dezvoltarea aplicațiilor Web (6/12): Managementul datelor RDF. Interogarea da...
 
Implementarea tehnologiei IR
Implementarea tehnologiei IRImplementarea tehnologiei IR
Implementarea tehnologiei IR
 
WADe 2014—2015 (02/12): Dezvoltarea de servicii Web în stilul REST
WADe 2014—2015 (02/12): Dezvoltarea de servicii Web în stilul RESTWADe 2014—2015 (02/12): Dezvoltarea de servicii Web în stilul REST
WADe 2014—2015 (02/12): Dezvoltarea de servicii Web în stilul REST
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
 
Fii linked data
Fii linked dataFii linked data
Fii linked data
 
Introducere baza de-date
Introducere baza de-dateIntroducere baza de-date
Introducere baza de-date
 
Dezvoltarea aplicatiilor orientate spre servicii Web. De la REST la mash-up-u...
Dezvoltarea aplicatiilor orientate spre servicii Web. De la REST la mash-up-u...Dezvoltarea aplicatiilor orientate spre servicii Web. De la REST la mash-up-u...
Dezvoltarea aplicatiilor orientate spre servicii Web. De la REST la mash-up-u...
 

More from Sabin Buraga

Web 2020 08/12: Servicii Web. De la arhitecturi orientate spre servicii la SO...
Web 2020 08/12: Servicii Web. De la arhitecturi orientate spre servicii la SO...Web 2020 08/12: Servicii Web. De la arhitecturi orientate spre servicii la SO...
Web 2020 08/12: Servicii Web. De la arhitecturi orientate spre servicii la SO...Sabin Buraga
 
Web 2020 10/12: Servicii Web. Micro-servicii. Serverless. Specificarea API-ur...
Web 2020 10/12: Servicii Web. Micro-servicii. Serverless. Specificarea API-ur...Web 2020 10/12: Servicii Web. Micro-servicii. Serverless. Specificarea API-ur...
Web 2020 10/12: Servicii Web. Micro-servicii. Serverless. Specificarea API-ur...Sabin Buraga
 
Web 2020 12/12: Securitatea aplicaţiilor Web. Aspecte esenţiale
Web 2020 12/12: Securitatea aplicaţiilor Web. Aspecte esenţialeWeb 2020 12/12: Securitatea aplicaţiilor Web. Aspecte esenţiale
Web 2020 12/12: Securitatea aplicaţiilor Web. Aspecte esenţialeSabin Buraga
 
STAW 01/12: Arhitectura aplicaţiilor Web
STAW 01/12: Arhitectura aplicaţiilor WebSTAW 01/12: Arhitectura aplicaţiilor Web
STAW 01/12: Arhitectura aplicaţiilor WebSabin Buraga
 
STAW 02/12: Programare Web: Limbajul JavaScript. Aspecte esenţiale
STAW 02/12: Programare Web: Limbajul JavaScript. Aspecte esenţialeSTAW 02/12: Programare Web: Limbajul JavaScript. Aspecte esenţiale
STAW 02/12: Programare Web: Limbajul JavaScript. Aspecte esenţialeSabin Buraga
 
STAW 03/12: Programare Web: Limbajul JavaScript. Aspecte moderne: ES6 et al.
STAW 03/12: Programare Web: Limbajul JavaScript. Aspecte moderne: ES6 et al.STAW 03/12: Programare Web: Limbajul JavaScript. Aspecte moderne: ES6 et al.
STAW 03/12: Programare Web: Limbajul JavaScript. Aspecte moderne: ES6 et al.Sabin Buraga
 
STAW 04/12: Programare Web: Node.js
STAW 04/12: Programare Web: Node.jsSTAW 04/12: Programare Web: Node.js
STAW 04/12: Programare Web: Node.jsSabin Buraga
 
STAW 05/12: Arhitectura navigatorului Web
STAW 05/12: Arhitectura navigatorului WebSTAW 05/12: Arhitectura navigatorului Web
STAW 05/12: Arhitectura navigatorului WebSabin Buraga
 
STAW 06/12: JavaScript în navigatorul Web. De la DOM la Ajax şi mash-up-uri
STAW 06/12: JavaScript în navigatorul Web. De la DOM la Ajax şi mash-up-uriSTAW 06/12: JavaScript în navigatorul Web. De la DOM la Ajax şi mash-up-uri
STAW 06/12: JavaScript în navigatorul Web. De la DOM la Ajax şi mash-up-uriSabin Buraga
 
STAW 07/12: Ingineria dezvoltării aplicaţiilor JavaScript
STAW 07/12: Ingineria dezvoltării aplicaţiilor JavaScriptSTAW 07/12: Ingineria dezvoltării aplicaţiilor JavaScript
STAW 07/12: Ingineria dezvoltării aplicaţiilor JavaScriptSabin Buraga
 
STAW 08/12: Programare Web. Suita de tehnologii HTML5
STAW 08/12: Programare Web. Suita de tehnologii HTML5STAW 08/12: Programare Web. Suita de tehnologii HTML5
STAW 08/12: Programare Web. Suita de tehnologii HTML5Sabin Buraga
 
STAW 09/12: Programare Web. API-uri JavaScript în contextul HTML5 (I)
STAW 09/12: Programare Web. API-uri JavaScript în contextul HTML5 (I)STAW 09/12: Programare Web. API-uri JavaScript în contextul HTML5 (I)
STAW 09/12: Programare Web. API-uri JavaScript în contextul HTML5 (I)Sabin Buraga
 
STAW 10/12: Programare Web. API-uri JavaScript în contextul HTML5 (II)
STAW 10/12: Programare Web. API-uri JavaScript în contextul HTML5 (II)STAW 10/12: Programare Web. API-uri JavaScript în contextul HTML5 (II)
STAW 10/12: Programare Web. API-uri JavaScript în contextul HTML5 (II)Sabin Buraga
 
STAW 11/12: Performanţa aplicaţiilor Web la nivel de client
STAW 11/12: Performanţa aplicaţiilor Web la nivel de clientSTAW 11/12: Performanţa aplicaţiilor Web la nivel de client
STAW 11/12: Performanţa aplicaţiilor Web la nivel de clientSabin Buraga
 
Sabin Buraga: Dezvoltator Web?! (2019)
Sabin Buraga: Dezvoltator Web?! (2019)Sabin Buraga: Dezvoltator Web?! (2019)
Sabin Buraga: Dezvoltator Web?! (2019)Sabin Buraga
 
HCI 2018 (2/10) Human Factor. From interaction idioms to human capacities & c...
HCI 2018 (2/10) Human Factor. From interaction idioms to human capacities & c...HCI 2018 (2/10) Human Factor. From interaction idioms to human capacities & c...
HCI 2018 (2/10) Human Factor. From interaction idioms to human capacities & c...Sabin Buraga
 
HCI 2018 (3/10) Design Models, Methodologies and Guidelines
HCI 2018 (3/10) Design Models, Methodologies and GuidelinesHCI 2018 (3/10) Design Models, Methodologies and Guidelines
HCI 2018 (3/10) Design Models, Methodologies and GuidelinesSabin Buraga
 
HCI 2018 (4/10) Information Architecture. From Design Patterns to Visual Design
HCI 2018 (4/10) Information Architecture. From Design Patterns to Visual DesignHCI 2018 (4/10) Information Architecture. From Design Patterns to Visual Design
HCI 2018 (4/10) Information Architecture. From Design Patterns to Visual DesignSabin Buraga
 
HCI 2018 (5/10) Information Architecture. From Design Patterns to Flow
HCI 2018 (5/10) Information Architecture. From Design Patterns to FlowHCI 2018 (5/10) Information Architecture. From Design Patterns to Flow
HCI 2018 (5/10) Information Architecture. From Design Patterns to FlowSabin Buraga
 
HCI 2018 (6/10) Design Patterns for Social (Web/mobile) Interactions
HCI 2018 (6/10) Design Patterns for Social (Web/mobile) InteractionsHCI 2018 (6/10) Design Patterns for Social (Web/mobile) Interactions
HCI 2018 (6/10) Design Patterns for Social (Web/mobile) InteractionsSabin Buraga
 

More from Sabin Buraga (20)

Web 2020 08/12: Servicii Web. De la arhitecturi orientate spre servicii la SO...
Web 2020 08/12: Servicii Web. De la arhitecturi orientate spre servicii la SO...Web 2020 08/12: Servicii Web. De la arhitecturi orientate spre servicii la SO...
Web 2020 08/12: Servicii Web. De la arhitecturi orientate spre servicii la SO...
 
Web 2020 10/12: Servicii Web. Micro-servicii. Serverless. Specificarea API-ur...
Web 2020 10/12: Servicii Web. Micro-servicii. Serverless. Specificarea API-ur...Web 2020 10/12: Servicii Web. Micro-servicii. Serverless. Specificarea API-ur...
Web 2020 10/12: Servicii Web. Micro-servicii. Serverless. Specificarea API-ur...
 
Web 2020 12/12: Securitatea aplicaţiilor Web. Aspecte esenţiale
Web 2020 12/12: Securitatea aplicaţiilor Web. Aspecte esenţialeWeb 2020 12/12: Securitatea aplicaţiilor Web. Aspecte esenţiale
Web 2020 12/12: Securitatea aplicaţiilor Web. Aspecte esenţiale
 
STAW 01/12: Arhitectura aplicaţiilor Web
STAW 01/12: Arhitectura aplicaţiilor WebSTAW 01/12: Arhitectura aplicaţiilor Web
STAW 01/12: Arhitectura aplicaţiilor Web
 
STAW 02/12: Programare Web: Limbajul JavaScript. Aspecte esenţiale
STAW 02/12: Programare Web: Limbajul JavaScript. Aspecte esenţialeSTAW 02/12: Programare Web: Limbajul JavaScript. Aspecte esenţiale
STAW 02/12: Programare Web: Limbajul JavaScript. Aspecte esenţiale
 
STAW 03/12: Programare Web: Limbajul JavaScript. Aspecte moderne: ES6 et al.
STAW 03/12: Programare Web: Limbajul JavaScript. Aspecte moderne: ES6 et al.STAW 03/12: Programare Web: Limbajul JavaScript. Aspecte moderne: ES6 et al.
STAW 03/12: Programare Web: Limbajul JavaScript. Aspecte moderne: ES6 et al.
 
STAW 04/12: Programare Web: Node.js
STAW 04/12: Programare Web: Node.jsSTAW 04/12: Programare Web: Node.js
STAW 04/12: Programare Web: Node.js
 
STAW 05/12: Arhitectura navigatorului Web
STAW 05/12: Arhitectura navigatorului WebSTAW 05/12: Arhitectura navigatorului Web
STAW 05/12: Arhitectura navigatorului Web
 
STAW 06/12: JavaScript în navigatorul Web. De la DOM la Ajax şi mash-up-uri
STAW 06/12: JavaScript în navigatorul Web. De la DOM la Ajax şi mash-up-uriSTAW 06/12: JavaScript în navigatorul Web. De la DOM la Ajax şi mash-up-uri
STAW 06/12: JavaScript în navigatorul Web. De la DOM la Ajax şi mash-up-uri
 
STAW 07/12: Ingineria dezvoltării aplicaţiilor JavaScript
STAW 07/12: Ingineria dezvoltării aplicaţiilor JavaScriptSTAW 07/12: Ingineria dezvoltării aplicaţiilor JavaScript
STAW 07/12: Ingineria dezvoltării aplicaţiilor JavaScript
 
STAW 08/12: Programare Web. Suita de tehnologii HTML5
STAW 08/12: Programare Web. Suita de tehnologii HTML5STAW 08/12: Programare Web. Suita de tehnologii HTML5
STAW 08/12: Programare Web. Suita de tehnologii HTML5
 
STAW 09/12: Programare Web. API-uri JavaScript în contextul HTML5 (I)
STAW 09/12: Programare Web. API-uri JavaScript în contextul HTML5 (I)STAW 09/12: Programare Web. API-uri JavaScript în contextul HTML5 (I)
STAW 09/12: Programare Web. API-uri JavaScript în contextul HTML5 (I)
 
STAW 10/12: Programare Web. API-uri JavaScript în contextul HTML5 (II)
STAW 10/12: Programare Web. API-uri JavaScript în contextul HTML5 (II)STAW 10/12: Programare Web. API-uri JavaScript în contextul HTML5 (II)
STAW 10/12: Programare Web. API-uri JavaScript în contextul HTML5 (II)
 
STAW 11/12: Performanţa aplicaţiilor Web la nivel de client
STAW 11/12: Performanţa aplicaţiilor Web la nivel de clientSTAW 11/12: Performanţa aplicaţiilor Web la nivel de client
STAW 11/12: Performanţa aplicaţiilor Web la nivel de client
 
Sabin Buraga: Dezvoltator Web?! (2019)
Sabin Buraga: Dezvoltator Web?! (2019)Sabin Buraga: Dezvoltator Web?! (2019)
Sabin Buraga: Dezvoltator Web?! (2019)
 
HCI 2018 (2/10) Human Factor. From interaction idioms to human capacities & c...
HCI 2018 (2/10) Human Factor. From interaction idioms to human capacities & c...HCI 2018 (2/10) Human Factor. From interaction idioms to human capacities & c...
HCI 2018 (2/10) Human Factor. From interaction idioms to human capacities & c...
 
HCI 2018 (3/10) Design Models, Methodologies and Guidelines
HCI 2018 (3/10) Design Models, Methodologies and GuidelinesHCI 2018 (3/10) Design Models, Methodologies and Guidelines
HCI 2018 (3/10) Design Models, Methodologies and Guidelines
 
HCI 2018 (4/10) Information Architecture. From Design Patterns to Visual Design
HCI 2018 (4/10) Information Architecture. From Design Patterns to Visual DesignHCI 2018 (4/10) Information Architecture. From Design Patterns to Visual Design
HCI 2018 (4/10) Information Architecture. From Design Patterns to Visual Design
 
HCI 2018 (5/10) Information Architecture. From Design Patterns to Flow
HCI 2018 (5/10) Information Architecture. From Design Patterns to FlowHCI 2018 (5/10) Information Architecture. From Design Patterns to Flow
HCI 2018 (5/10) Information Architecture. From Design Patterns to Flow
 
HCI 2018 (6/10) Design Patterns for Social (Web/mobile) Interactions
HCI 2018 (6/10) Design Patterns for Social (Web/mobile) InteractionsHCI 2018 (6/10) Design Patterns for Social (Web/mobile) Interactions
HCI 2018 (6/10) Design Patterns for Social (Web/mobile) Interactions
 

Căutarea resurselor Web

  • 1. Căutarea resurselor Web Dr. Sabin Buraga Facultatea de Informatică UAIC – Iași, România profs.info.uaic.ro/~busaco/
  • 3. Ce activități realizează un motor de căutare?
  • 4. scop: localizarea resurselor existente pe Web conținut textual documente Web, știri, comentarii, cod-sursă, însemnări în cadrul aplicațiilor Web sociale etc.
  • 5. scop: localizarea resurselor existente pe Web conținut multimedia imagini (fotografii, diagrame, ilustrații), audio, video, prezentări,… (în formă fizică și/sau electronică – gratuite ori comerciale)
  • 6. scop: localizarea resurselor existente pe Web entități persoane, organizații, evenimente, cunoaștere (cărți, software), de interes personal/social (bunuri reale/digitale – produse și/sau servicii),…
  • 7. Tipuri de căutări – maniera tradițională: pe bază de indecși de termeni explorare a Web-ului (crawling) + prelucrarea conținutului textual (indexing) Lycos (1994, proiect de cercetare al lui Michael Loren Mauldin, CMU – Carnegie Mellon University) AltaVista (1995, Paul Flaherty, Louis Monier & Michael Burrows, proiect de cercetare la DEC – Digital Equipment Corporation)
  • 8.
  • 9. Tipuri de căutări – maniera tradițională: pe baza ierarhiilor de termeni (cuvinte) (servicii de tip catalog – topic directory, taxonomii) Yahoo! – Yet Another Hierarchical Officious Oracle fondat în 1994 de Jerry Yang and David Filo (absolvenți Stanford) Jerry and David’s guide to the World Wide Web
  • 10.
  • 11. Tipuri de căutări – maniera tradițională: hibride indecși + taxonomiiportal Web Excite inițial Architext, creat în 1994 de Graham Spencer, Joe Kraus, Mark Van Haren, Ryan McIntyre, Ben Lutch, Martin Reinfried (studenți la Stanford)
  • 12.
  • 13. Tipuri de căutări – maniera tradițională: pe baza legăturilor hipertext (hyperlink analysis) Google inițial BackRub, o inițiativă demarată în 1996, disponibilă din 1998 Sergey Brin și Larry Page (studenți la doctorat – Stanford)
  • 14.
  • 15. Un motor de căutare trebuie să satisfacă nevoia de informații a utilizatorului (user information-seeking)
  • 16. caracteristici ale unui motor de căutare ideal scop căutarea oricărei resurse existente
  • 17. caracteristici ale unui motor de căutare ideal viteză rezultate disponibile imediat
  • 18. caracteristici ale unui motor de căutare ideal disponibilitate orice modificare să fie indexată „instantaneu” (în timp-real)
  • 19. caracteristici ale unui motor de căutare ideal „reamintire” – recall găsirea tuturor resurselor relevante pentru o cerere dată
  • 20. caracteristici ale unui motor de căutare ideal precizie răspunsul oferit conține doar resurse relevante
  • 21. caracteristici ale unui motor de căutare ideal categorisire eficientă – ranking cele mai relevante resurse Web sunt plasate primele
  • 22. Care sunt principalele componente ale unui motor de căutare?
  • 23. Robot Web extrage informații Index (catalog) stochează – în mod persistent – (meta)date despre resursele existente pe Web Mecanism de evaluare pe baza cererii utilizatorului, oferă răspunsuri – de dorit, utile
  • 24. structura generică a unui motor de căutare (Chakrabarti, 2003)
  • 26. Roboți Web programe ce traversează automat Web-ul, cu scopul de a extrage date spiders crawlers Web bots robot Web  navigator Web
  • 27. Roboți Web pornind de la o adresă Web (URL – Uniform Resource Locator), realizează o conexiune HTTP la un server Web, pentru a întreprinde anumite acțiuni privitoare la reprezentarea unei resurse – uzual, HTML – și, recursiv, din toate resursele (documentele) desemnate de legăturile existente în cadrul reprezentării
  • 28. Roboți Web pornind de la o adresă Web (URL – Uniform Resource Locator), realizează o conexiune HTTP la un server Web, pentru a întreprinde anumite acțiuni privitoare la reprezentarea unei resurse – uzual, HTML – și, recursiv, din toate resursele (documentele) desemnate de legăturile existente în cadrul reprezentării acțiuni: extrage de date, copiere, agregare de conținut, monitorizare, realizare a unui rezumat etc.
  • 29. Roboți Web ai motoarelor de căutare majore Baiduspider – www.baidu.com/search/spider.html bingbot – www.bing.com/bingbot.htm Googlebot – www.google.com/bot.html Slurp – http://help.yahoo.com/help/us/ysearch/slurp YandexBot – yandex.com/bots
  • 30. Roboți Web specializați roluri: validarea codului HTML, scurtarea lungimii URL-urilor, scanare de vulnerabilități, statistici,… exemple: citeseerxbot, Page2RSS, extensii Nagios, W3C Validator
  • 31. Roboți Web personali rulați de utilizatori exemplificare: software de „oglindire” (copiere) a conținutului unui (fragment de) sit Web aplicații notorii disponibile în regim deschis: curl – https://curl.haxx.se/ wget – www.gnu.org/software/wget/
  • 32. Roboți Web (potențial) malefici pot cauza breșe de securitate, exploatând diverse vulnerabilități ale siturilor/aplicațiilor Web exemple tipice: SQL injections atacuri XSS – Cross-Site Scripting
  • 34. Roboți Web trebuie să respecte standardul de excludere „inhibă” vizitarea anumitor zone (secțiuni) ale unui sit Web
  • 35. Roboți Web în rădăcina unui domeniu Web se poate plasa fișierul robots.txt www.robotstxt.org/robotstxt.html
  • 36. # https://developer.mozilla.org/robots.txt User-agent: * Crawl-delay: 5 Sitemap: https://developer.mozilla.org/sitemap.xml Request-rate: 1/5 Disallow: /admin/ Disallow: /*/dashboards/* Disallow: /*docs/feeds ... exemplu
  • 38. Index Necesitatea folosirii sistemelor de baze de date depozit distribuit de stocare – actualmente, în cloud aspect important: optimizarea regăsirii context mai larg: procesarea volumelor mari de date (big data)
  • 39. Index utilizarea nu doar a datelor propriu-zise (conținutul textual), ci și a meta-datelor asociate unei resurse Web e.g., limbă, cuvinte-cheie, autor, format, data ultimei actualizări, frecvența modificărilor,…
  • 40. Index indexare bazată pe cuvinte-cheie (termeni) relevanță, plasament – e.g., context de apariție –, meta-date, procesarea limbajului natural, clasificare (semi-)automată via învățare automată (machine learning) sau alte tehnici,...
  • 41. Index indexare semantică – recurgând la concepte clasificare socială via adnotare de resurse – tagging (folksonomy) + folosirea tehnologiilor Web-ului semantic (RDF, RDFa, SKOS, OWL,…) vezi și Sabin Buraga, „Dezvoltarea aplicațiilor Web”: http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html
  • 43. Interfața de interogare cererile sunt formulate via o interfață Web unele motoare de căutare acceptă folosirea unor operatori specifici
  • 44. o parte dintre operatorii Google "expresie" ~termen –termen related: URL cache: URL link: URL intitle: termen(i) allintitle: termen(i) intext: termen(i) allintext: termen(i) inurl: termen(i) allinurl: termen(i) site: domeniu info: domeniu define: termen filetype: extensie um1 in um2 număr1 .. număr2 www.googleguide.com/advanced_operators_reference.html
  • 45. digital camera $700 .. 1400 ~book intitle:design –intitle:web "burse de merit" site:uaic.ro inurl:art nouveau allinurl:ES6 library 16 cm in inch related:www.w3.org php mvc inanchor:slideshare define:design cache:http://devdocs.io/ map:macea,arad linux filetype:svg OR filetype:png exemple
  • 46. Mult succes!unii operatori sunt permiși doar pentru anumite tipuri de căutări – aici: știri exemplu
  • 47. interacțiunea cu motorul de interogare poate fi facilitată și de un agent software conversațional Apple Siri, Google Now, Microsoft Cortana Dragon Go, Sherpa, SpeakToIt Assistant
  • 49. Evaluarea relevanței 1. Analizarea interogării (tokenizing) 2. Căutarea în indecșii termenilor 3. Procesarea documentelor 4. Evaluarea relevanței paginilor 5. Eliminarea duplicatelor + sortarea 6. Afișarea primelor N documente relevante (URL + alte informații)
  • 50. Evaluarea relevanței se bazează pe… clasificare umană resurse categorisite de oameni
  • 51. Evaluarea relevanței se bazează pe… informații vizând utilizarea unei resurse factori: timp de viață, periodicitatea accesului la acea resursă, frecvența actualizării conținutului, importanța relativă etc.
  • 52. Evaluarea relevanței se bazează pe… conectivitatea cu alte resurse analiza relațiilor (legăturilor hipertext) cu alte pagini reputația – e.g., importanța domeniului Internet (sunt luați în calcul factori ca vechimea, localizarea,…)
  • 53. timp strategie înainte de 2000 conținut – indexarea textului (titlu, anteturi, URL, descriere via <meta>) 2000—2010 conținut autoritate (via legături desemnate de URL-uri) 2010 — prezent conținut autoritate personalizare (social media + profil de utilizator) 2012 — prezent conținut autoritate personalizare concepte (date structurate + Web of data) context (localizare geo., limbă, timp, dispozitiv,…) adaptare după (K. Bodnar & J. Hopkins, 2011) de studiat și www.slideshare.net/randfish/presentations
  • 54. vizând anonimitatea DuckDuckGo, Gibiru, Qwant, Unbubble,… regionale Baidu (China), Daum (Coreea), Goo (Japonia), Guruji (India), MetaGer (Germania) etc. meta-căutare Dogpile, Excite, Mamma, Searx, Yippy Search enterprise search ElasticSearch, OpenSearchServer,… răspunsuri (answer-based) umane: Stack Overflow, Quora etc. automate: Evi, Wolfram Alpha căutare de știri Daylife, Topix,… hărți (maps) Nokia HERE, OpenStreetMap, WikiMapia cod-sursă Open Hub, Krugle, Searchcode folosind puterea umană (crowd-search) Dunno + abordări distribuite (P2P): FAROO, Seeks, YaCy desktop search căutare pe dispozitiv Dash, DocFetcher, Recoll, Terrier, Tracker
  • 56. instrumente software open source pentru implementatori: Apache Lucene, Apache Nutch, Apache Solr, mnoGoSearch, Namazu, Xapian,… API-uri publice: www.programmableweb.com/category/search disponibilitatea datelor indexate în regim deschis în vederea analizării ulterioare: https://commoncrawl.org/
  • 58. Prezentarea rezultatelor SERP – Search Engine Result Page specifică maniera de redare a rezultatelor oferite de motorul de căutare
  • 59. Prezentarea rezultatelor se includ recomandări pe baza: preferințelor utilizatorului istoricului căutărilor URL-urilor partajate via rețele sociale meta-datelor (rich snippets) adnotărilor realizate de utilizatori localizării geografice (local search)
  • 60. exemplu dezvoltatorii pot participa la DuckDuckHack: duckduckhack.com motorul de căutare DuckDuckGo este axat asupra asigurării intimității utilizatorului în ceea ce privește căutările acestuia pe Web
  • 62. “At any one time you rank #1 or #8 or #40 based on who is searching, where they search, and what is happening.” K. Bodnar & J. Hopkins, 2011
  • 63. Cum putem obține o relevanță (mai) bună a conținutului indexat?
  • 64. SEO – Search Engine Optimization suită de strategii de redactare a codului HTML în vederea obținerii unei relevanțe ridicate a conținutului, astfel încât pagina/situl să fie regăsite în urma unei căutări specifice efectuate cu un instrument de căutare
  • 65. Structurarea… codului-sursă al paginilor Web conținutului (textual, grafic,…) legăturilor cu alte resurse
  • 66. Se recurge la semnificația logică a marcatorilor HTML POSH (Plain Old Semantic HTML) titluri plasate ierarhic via elementele <h1>, <h2>,… conținut tabelar cu <table> aranjament vizual (layout) via stiluri CSS și nu tabele (<table>, <tr>,…)
  • 67. Se recurge la semnificația logică a marcatorilor HTML POSH (Plain Old Semantic HTML) divizarea conținutului: <section>, <article>, <header>, <footer>, <aside> etc. marcajarea elementelor vizând navigabilitatea cu <nav> liste specificate cu <ul> <ol> <li> … detalii la HTML5 Doctor: html5doctor.com/element-index/
  • 69. Se recurge la semnificația logică a marcatorilor HTML POSH (Plain Old Semantic HTML) conținut textual alternativ pentru imagini (<img alt="..." />), legături (<a title="...">), tabele (<table summary="...">), multimedia,… atașarea de meta-date externe în antetul paginii Web via <head>, <meta /> și <link /> https://github.com/joshbuchea/HEAD
  • 70. Se recurge la semnificația logică a marcatorilor HTML POSH (Plain Old Semantic HTML) de evitat elementele învechite – e.g., cadre (frame-uri) – sau proprietare (<blink> ori <marquee>) documentul trebuie să fie bine-formatat verificarea corectitudinii codului HTML cu instrumentul oferit de Consorțiul Web – validator.w3.org a se considera și https://github.com/h5bp/html5-boilerplate
  • 71. Includerea de meta-date (date privind datele) în cadrul documentelor HTML pentru a „explica” resursele Web unui program (software – e.g., motor de căutare) soluții actuale aliniate problematicilor Web-ului semantic – Web of Data scheme de microdate HTML5 – schema.org RDFa (standard al Consorțiului Web) – rdfa.info pentru detalii, de parcurs: S. Buraga, Why 5-Star Data? – www.slideshare.net/busaco/why-5star-data http://profs.info.uaic.ro/~busaco/teach/courses/cliw/web-film.html#week6
  • 72. Conținutul primează – content is king o importanță majoră o are titlul paginii Untitled Document – aproape 22 de milioane de rezultate situl trebuie actualizat periodic, frecvent numele fișierelor (imagini, stiluri,…) contează tehnică utilă: „transformarea” URL-urilor – mod_rewrite la Apache anumite date pot fi „ascunse” de roboți via robots.txt
  • 73. Realizarea legăturilor între pagini (hipermedia) obligatoriu, de inclus legături spre alte resurse (ale sitului propriu ori ale altor situri) dorim legături spre/de la situri importante având conținut similar cu situl nostru de verificat și menținut structura hipertextului instrumentul LinkChecker – validator.w3.org/checklink
  • 74. Realizarea legăturilor între pagini (hipermedia) tehnici clasice – considerate „demodate”: interschimb de adrese (link-uri) – banner-e, blogroll-uri marketing bazat pe context – i.e. articole/produse înrudite
  • 75. Realizarea legăturilor între pagini (hipermedia) recurgerea la aplicații Web sociale SMO – Social Media Optimization partajare în rețeaua de „prieteni”, apreciere, comentarii, opinii,… S. Buraga, Design Patterns for Social (Web/mobile) Interactions, 2016 http://profs.info.uaic.ro/~busaco/teach/courses/hci/hci-film.html#week7
  • 77. Realizarea legăturilor între pagini (hipermedia) de evitat paginile de eroare – 404 Not Found orice pagină de eroare poate fi „convertită” într-o resursă folositoare omului/robotului uzual, se oferă harta sitului (site map), legături relevante, motor intern de căutare,… http://alistapart.com/article/perfect404 http://alistapart.com/article/amoreuseful404
  • 78. Realizarea legăturilor între pagini (hipermedia) a nu se folosi navigarea bazată pe JavaScript ori – mai desuet – pe tehnologii proprietare (Flash/Silverlight) <p>participanții: <a href="javascript:sari(1);">aici</a></p>
  • 79. Alte aspecte de interes despre SEO?
  • 80. Crearea documentului sitemap.xml pentru a-l expedia la Google Sitemaps http://sitemaps.org/ complementar fișierului robots.txt furnizează structura hipertext a unui sit Web formate acceptate: text obișnuit, XML (Extensible Markup Language), RSS (Really Simple Syndication) un instrument Web util: www.xml-sitemaps.com
  • 81. Regăsirea informațiilor disponibile pe Web trebuie considerată într-un context mai larg accesibilitatea – utilizatorii cu nevoi speciale Web Accessibility Initiative www.w3.org/WAI/ Web Accessibility in Mind webaim.org
  • 82. Regăsirea informațiilor disponibile pe Web trebuie considerată într-un context mai larg performanța aplicațiilor Web aspect important: timpul de încărcare a unei pagini Web profs.info.uaic.ro/~busaco/teach/courses/cliw/web-film.html#week12
  • 83. Invisible Web (Deep Web) acea parte a spațiului WWW care nu este detectată de motoarele de căutare sau de alte tipuri de aplicații de regăsire a resurselor disponibile pe Web
  • 84. S. Buraga, Proiectarea siturilor Web (ed. II), Polirom, 2005 www.slideshare.net/busaco/sabin-buraga-proiectarea-siturilor-web Google Webmaster Central https://developers.google.com/webmasters/ Learn SEO and Search Marketing https://moz.com/learn/seo Search Engine Land http://searchengineland.com/ Search Engine Watch http://searchenginewatch.com/ Search Engines @ VideoLectures http://videolectures.net/Top/Computer_Science/Search_Engines
  • 85. Căutarea resurselor Web de la roboți Web și motoare de căutare la SEO Dr. Sabin Buraga Facultatea de Informatică, UAIC – Iași, România http://profs.info.uaic.ro/~busaco/ ilustrații: tango2010weibo.tumblr.com/