Un'introduzione ai motori di ricerca nativi di TYPO3 e presentazione dei loro limiti. Presentazione di Apache Solr e delle modalità di integrazione in TYPO3
Luca Peressini: Integrare Apache Solr in Magento per migliorare la ricercaWEBFORMAT srl
Meet Magento Italy - 3 e 4 giugno 2014 - Milano
Luca Peressini: Talk Business
Integrare Apache Solr in Magento per migliorare la ricerca.
Gli utenti di un sito eCommerce che usano il motore di ricerca hanno un tasso di conversione molto più alto rispetto agli utenti che non lo usano. Lo dimostrano diversi studi. Alcuni parlano addirittura di un raddoppio del conversion rate quando l’utente passa attraverso la ricerca del sito. Qualora però l’utente non trovi subito il prodotto che cerca, è il bounce rate a crescere in modo pericoloso, trasformando così in un’arma a doppio taglio le funzionalità di ricerca, se non sono sufficientemente intelligenti.
Fornire, perciò, un servizio di ricerca semplice e veloce, e allo stesso tempo completo e ricco di funzionalità perché l’utente trovi il prodotto desiderato anche quando non sa esattamente cosa cercare, è fondamentale.
Il motore di ricerca offerto da Magento non è sufficiente a questo scopo, ma diviene molto performante se integrato con uno strumento come Apache Solr, ovvero una enterprise search platform che consente di indicizzare i prodotti del proprio sito eCommerce e di offrire funzionalità di ricerca veloci e pro-attive (in grado, tra le altre cose, di prevedere cosa l’utente sta cercando e di dargli dei suggerimenti).
Luca Peressini nel suo talk presenta un confronto tra le funzionalità di ricerca standard di Magento e quelle fornite dall’integrazione con Apache Solr, spunto da cui partire per analizzare i vantaggi, le potenzialità e le modalità di adozione di questa piattaforma.
Node js: che cos'è e a che cosa serve?
oppure
Node.js
Dimmi con quale contorno ti posso mangiare?
All'interno di queste slide, 25 di numero e per essere esatti, cerco di rispondere ad alcune domande che ho ricevuto e riguardavano NodeJS. Mi auguro che siano di vostro gradimento e spero che vi siano utili.
Aspetto i vostri commenti qui sotto, in più potete trovare anche altre informazioni all'interno delle pagine di InsiDevCode (http://www.insidevcode.eu/)
Luca Peressini: Integrare Apache Solr in Magento per migliorare la ricercaWEBFORMAT srl
Meet Magento Italy - 3 e 4 giugno 2014 - Milano
Luca Peressini: Talk Business
Integrare Apache Solr in Magento per migliorare la ricerca.
Gli utenti di un sito eCommerce che usano il motore di ricerca hanno un tasso di conversione molto più alto rispetto agli utenti che non lo usano. Lo dimostrano diversi studi. Alcuni parlano addirittura di un raddoppio del conversion rate quando l’utente passa attraverso la ricerca del sito. Qualora però l’utente non trovi subito il prodotto che cerca, è il bounce rate a crescere in modo pericoloso, trasformando così in un’arma a doppio taglio le funzionalità di ricerca, se non sono sufficientemente intelligenti.
Fornire, perciò, un servizio di ricerca semplice e veloce, e allo stesso tempo completo e ricco di funzionalità perché l’utente trovi il prodotto desiderato anche quando non sa esattamente cosa cercare, è fondamentale.
Il motore di ricerca offerto da Magento non è sufficiente a questo scopo, ma diviene molto performante se integrato con uno strumento come Apache Solr, ovvero una enterprise search platform che consente di indicizzare i prodotti del proprio sito eCommerce e di offrire funzionalità di ricerca veloci e pro-attive (in grado, tra le altre cose, di prevedere cosa l’utente sta cercando e di dargli dei suggerimenti).
Luca Peressini nel suo talk presenta un confronto tra le funzionalità di ricerca standard di Magento e quelle fornite dall’integrazione con Apache Solr, spunto da cui partire per analizzare i vantaggi, le potenzialità e le modalità di adozione di questa piattaforma.
Node js: che cos'è e a che cosa serve?
oppure
Node.js
Dimmi con quale contorno ti posso mangiare?
All'interno di queste slide, 25 di numero e per essere esatti, cerco di rispondere ad alcune domande che ho ricevuto e riguardavano NodeJS. Mi auguro che siano di vostro gradimento e spero che vi siano utili.
Aspetto i vostri commenti qui sotto, in più potete trovare anche altre informazioni all'interno delle pagine di InsiDevCode (http://www.insidevcode.eu/)
Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...Codemotion
La presentazione tenuta da Gian Luca Farina Perseu in occasione del Codemotion del 5 marzo 2011 a Roma - http://www.codemotion.it/
Verrà presentato il progetto Museo Torino, che implementa tutte le tecnologie per Web 3.0 (Web Semantico) grazie all'uso degli standard più recenti (RDFa e Open Graph) e alla progettazione basata sulla a filosofia dei Open Data. Il motore interno è invece basato su un GraphDB, una tecnologia perfetta per gestire linked data e con una struttura flessibile e mutevole nel tempo. Inoltre una architettura leggera e dinamica basata su servizi REST, rende semplice implementare moduli applicativi.
SEO ON SITE, CONTROLLARE INDICIZZAZIONE E DIRETTIVE PER GLI SPIDER - Giovanni...Giovanni Sacheli
Direttive di indicizzazione. In questo intervento approfondiremo l'uso degli strumenti e delle procedure che ci consentono di avere il controllo su tutta la comunicazione con i motori di ricerca: dalla classica Sitemap al Robots.txt, dal Prev-Next al Canonical, dall'HREF Lang alla Search Console. L'intervento mira ad approfondire le analisi rendendole più operative e veloci.
Il "Knowledge Graph" della Pubblica Amministrazione ItalianaGraphRM
Incontro del 15/10/2018
Un'unica strada ci porta solo a luoghi tra due località; il valore reale delle strade deriva dall'essere parte di una rete. I dati funzionano allo stesso modo: non è solo avere più dati che ne abilita il valore, ma anche collegarli tra loro” riporta l’autorità di statistica inglese.
A oggi, sempre più realtà industriali strutturano dati attraverso standard del web semantico (linked data). Basti pensare a Google e al suo “knowledge graph” largamente utilizzato e costruito sull’ontologia schema.org, conforme alla specifica JSON-LD.
E nel settore pubblico?
La presentazione mira a illustrare OntoPiA – la rete di ontologie e vocabolari controllati della pubblica amministrazione italiana. La rete fornisce gli schemi per creare e interrogare il knowledge graph della pubblica amministrazione, consentendo anche il suo collegamento nel web dei dati. Verranno presentati sia la metodologia adottata per la creazione di OntoPiA sia il processo di costruzione del knowledge graph, basato su OntoPiA, attraverso il Data & Analytics Framework (DAF) realizzato dal Team per la Trasformazione Digitale.
Speaker: Giorgia Lodi
Link video: https://youtu.be/B3dM_WMPi2Q
Siamo un gruppo di Teoria e Tecnologia della Comunicazione dell'università Bicocca e presentiamo i seguenti motori di ricerca semantici:
Wolfram Alpha
DuckDuck Go
Free Base
Bing
DeepDyve
What does Enterprise Software mean? In this presentation I show an integrated platform that provides cms, ecommerce, crm and document management functionalities based on the integration of 4 famous open source projects
Museo Torino - un esempio reale d'uso di NOSQL-GraphDB, Linked Data e Web Sem...Codemotion
La presentazione tenuta da Gian Luca Farina Perseu in occasione del Codemotion del 5 marzo 2011 a Roma - http://www.codemotion.it/
Verrà presentato il progetto Museo Torino, che implementa tutte le tecnologie per Web 3.0 (Web Semantico) grazie all'uso degli standard più recenti (RDFa e Open Graph) e alla progettazione basata sulla a filosofia dei Open Data. Il motore interno è invece basato su un GraphDB, una tecnologia perfetta per gestire linked data e con una struttura flessibile e mutevole nel tempo. Inoltre una architettura leggera e dinamica basata su servizi REST, rende semplice implementare moduli applicativi.
SEO ON SITE, CONTROLLARE INDICIZZAZIONE E DIRETTIVE PER GLI SPIDER - Giovanni...Giovanni Sacheli
Direttive di indicizzazione. In questo intervento approfondiremo l'uso degli strumenti e delle procedure che ci consentono di avere il controllo su tutta la comunicazione con i motori di ricerca: dalla classica Sitemap al Robots.txt, dal Prev-Next al Canonical, dall'HREF Lang alla Search Console. L'intervento mira ad approfondire le analisi rendendole più operative e veloci.
Il "Knowledge Graph" della Pubblica Amministrazione ItalianaGraphRM
Incontro del 15/10/2018
Un'unica strada ci porta solo a luoghi tra due località; il valore reale delle strade deriva dall'essere parte di una rete. I dati funzionano allo stesso modo: non è solo avere più dati che ne abilita il valore, ma anche collegarli tra loro” riporta l’autorità di statistica inglese.
A oggi, sempre più realtà industriali strutturano dati attraverso standard del web semantico (linked data). Basti pensare a Google e al suo “knowledge graph” largamente utilizzato e costruito sull’ontologia schema.org, conforme alla specifica JSON-LD.
E nel settore pubblico?
La presentazione mira a illustrare OntoPiA – la rete di ontologie e vocabolari controllati della pubblica amministrazione italiana. La rete fornisce gli schemi per creare e interrogare il knowledge graph della pubblica amministrazione, consentendo anche il suo collegamento nel web dei dati. Verranno presentati sia la metodologia adottata per la creazione di OntoPiA sia il processo di costruzione del knowledge graph, basato su OntoPiA, attraverso il Data & Analytics Framework (DAF) realizzato dal Team per la Trasformazione Digitale.
Speaker: Giorgia Lodi
Link video: https://youtu.be/B3dM_WMPi2Q
Siamo un gruppo di Teoria e Tecnologia della Comunicazione dell'università Bicocca e presentiamo i seguenti motori di ricerca semantici:
Wolfram Alpha
DuckDuck Go
Free Base
Bing
DeepDyve
What does Enterprise Software mean? In this presentation I show an integrated platform that provides cms, ecommerce, crm and document management functionalities based on the integration of 4 famous open source projects
Una presentazione del nuovo modulo di File Abstraction Layer di TYPO3 6.x, introduzione ai File Storage multipli con esempio pratico di integrazione di Dropbox
MageDay 2013 - Magento e TYPO3: una soluzione integrataMauro Lorenzutti
Il modulo CMS per la gestione dei contenuti integrato in Magento è piuttosto limitato e richiede un minimo di competenze per un suo utilizzo efficace. Se comparato poi con altri prodotti dedicati espressamente alla gestione di contenuti, bisogna ammettere che non è altrettanto facile e ricco di funzionalità. Proprio per questi motivi abbiamo deciso di sopperire alle mancanze di Magento integrando un CMS Open Source (TYPO3 nel nostro caso) che permettesse di gestire in modo semplice ed efficace tutta la parte di comunicazione che in un sito di ecommerce è ormai fondamentale. Durante il talk andremo quindi ad analizzare il modulo CMS di Magento e le ragioni che ci hanno spinto a realizzare questa integrazione. Quindi approfondiremo come è stata realizzata l'integrazione tra le due piattaforme, analizzando le modalità di integrazione del layout e di utilizzo delle API di Magento per l'inclusione delle sue componenti. Esperienza questa che può essere estesa ad altri CMS.
Uno sguardo sul mondo del TCA, il Table Configuration Array di TYPO3 che consente di integrare tabelle del database nella gestione di backend di TYPO3.
Come aumentare la sicurezza della propria installazione TYPO3 e delle proprie estensioni! Le slide del mio intervento al t3CampItalia 2011 dove ho parlato di come configurare al meglio TYPO3 in fase di installazione, su quali tecniche adottare per evitare gli attacchi più diffusi (es. sql injection e cross site scripting) e su quali estensioni possono aiutare a difendersi dagli attacchi (es. PHPIDS Intrusion Detection System).
La mia presentazione al T3campItalia 2011. Argomento della presentazione sono stati i sistemi di autenticazione in TYPO3, da LDAP a Facebook, fino allo sviluppo di un servizio di autenticazione custom.
Queste sono le slide della mia presentazione al T3CampItalia 2011. Argomento della presentazione è stata la sicurezza in TYPO3, dalle impostazioni in fase di installazione, alle estensioni utili (es. il PHPIDS: Intrusion detection system), fino alle tecniche di programmazione per evitare gli attacchi più comuni (es. sql injection e cross site scripting).
1. Milano 14/15 Marzo 2014
Ricerche evolute
mediante Apache Solr
Mauro Lorenzutti
T3Camp Italia
Il quarto evento italiano dedicato a TYPO3
2. Mauro Lorenzutti
CTO di Webformat
Sviluppatore e consulente TYPO3 dal 2004
TYPO3 Certified Integrator dal 2009
Sviluppatore di numerose estensioni, tra cui:
DB Integration (wfqbe)
Webformat Shop System (extendedshop)
TYPO3-Alfresco Connector
TYPO3-Magento Connector
Speaker in varie conferenze:
T3DD07
T3CON07
T3CON09US
Pag. 2Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
T3CON13DE
MageDay
4 x T3CampItalia ;-)
3. Di cosa parleremo
La ricerca integrata di TYPO3
Indexed Search Engine
Introduzione ad Apache Solr
Integrare Solr in TYPO3
Pag. 3Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
6. La ricerca nei siti
Molto spesso trascurata e sottovalutata
Ma…
Se ho un database con >100k eventi?
Se ho un catalogo con 20k prodotti strutturato in
categorie e con caratteristiche sulla base delle quali
vorrei che gli utenti potessero filtrare i prodotti?
…
Pag. 6Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
7. La ricerca standard di TYPO3
Pag. 7Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
11. Le funzionalità della ricerca standard
Consente all’utente di scegliere se cercare nelle keyword
della pagina o nel contenuto
Consente di configurare più tabelle via typoscript
Output configurabile via typoscript
La ricerca si basa sul operatore “LIKE %...%”
Pag. 11Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
12. Pro & Contro della ricerca standard
Pag. 12Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
+ Integrata
+ Facile da configurare
- Funzionalità di base
- Cerca solo nel database
- LIKE %...%
18. Le funzionalità della ricerca standard
Consente di indicizzare pagine, record nel database,
documenti, immagini, url esterni, ecc.
Costruisce un indice di parole chiave per ciascun
contenuto ed esegue la ricerca su questo
Fornisce una percentuale di pertinenza del risultato
I contenuti vengono indicizzati contestualmente alla prima
visualizzazione
È disponibile un crawler per indicizzare massivamente il
sito
Pag. 18Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
19.
20.
21. Pro & Contro di Indexed search engine
Pag. 21Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
+ Integrata
+ Indicizza pagine, record, file, url, …
+ Ordinamento per rilevanza
+ Statistiche di ricerca
+ Molte estensioni disponibili
- Configurazione non immediata
- Può rallentare la navigazione
- Solo le pagine in cache vengono
indicizzate
- Indice salvato nel db (problemi di
prestazioni)
23. Apache Solr?
• SolrTM is the popular, blazing fast open source enterprise
search platform from the Apache LuceneTM project. Its major
features include powerful full-text search, hit highlighting,
faceted search, near real-time indexing, dynamic clustering,
database integration, rich document (e.g., Word, PDF)
handling, and geospatial search. Solr is highly reliable,
scalable and fault tolerant, providing distributed indexing,
replication and load-balanced querying, automated failover
and recovery, centralized configuration and more. Solr powers
the search and navigation features of many of the world's
largest internet sites.
https://lucene.apache.org/solr/
Pag. 23Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
25. Ma cos’è Apache Solr?
Solr è un “enterprise search server”
Espone delle API REST per l’interazione
Vi si possono caricare documenti (ovvero qualsiasi tipo di
contenuto) via XML, JSON e CSV tramite chiamate HTTP
Si possono cercare e scaricare documenti in formato XML,
JSON e CSV tramite chiamate HTTP
Un database NoSQL?
Pag. 25Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
26. Funzionalità principali
Ricerche Full-text
Faceted navigation
Spellchecking: “Did you mean…”
Raccomandazioni: “More like this”
Indicizzazione di documenti (PDF, DOC, ecc.)
Gestione dei sinonimi e delle stopword
Ricerche geospaziali
Ottimizzato per elevato traffico e mole di dati
Estendibile mediante plugin
Pag. 26Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
27. Schemaless
Permette di definire dinamicamente i campi che descrivono
il documento
Pag. 27Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
29. Come integrarlo in TYPO3?
Due possibilità:
Apache Solr for TYPO3 (ext: solr)
DIY (ext: arrangiati)
Pag. 29Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
30. Apache Solr for TYPO3
Pag. 30Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
31. DIY
Sono disponibili diversi client PHP, ad es.:
http://www.solarium-project.org/
https://code.google.com/p/solr-php-client/
Due soluzioni “quick and dirty”:
cURL
file_get_contents()
Pag. 31Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
32. DIY
Costruiamo un esempio
molto semplice
Indicizziamo le news del
nostro sito
Implementiamo una
funzionalità di ricerca
Costruiamo dei filtri a
faccette
Pag. 32Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
48. Pro & Contro di Apache Solr
Pag. 48Mauro Lorenzutti: Ricerche evolute mediante Apache Solr
+ Tante tante tante tante funzionalità!
+ Adatto a gestire elevati volumi di dati
+ Molto veloce
- Non integrato in TYPO3
- Impegnativo da configurare
- Richiede Java
- C’è molto da studiare…
- Può creare dipendenza