© 2013 IBM Corporation
Buscas no IBM WebSphere Portal
Rodrigo Reis
IT Specialist & Application Architect
IBM Collaboration...
© 2013 IBM Corporation2
Agenda
Parte 1: Disponibilizando conteúdo do Portal na Internet
Parte 2: Como funciona o Portal Se...
© 2013 IBM Corporation
Parte 1: Disponibilizando conteúdo do
Portal na Internet
© 2013 IBM Corporation4
Como os motores de busca funcionam?
Os motores de busca coletam dados
sobre as informações publica...
© 2013 IBM Corporation5
Como os motores de busca funcionam?
1. Rastreamento (Crawlling) da Web
Os motores de busca (Search...
© 2013 IBM Corporation6
Como os motores de busca funcionam?
3. Processamento de consultas
Quando um pedido de informação c...
© 2013 IBM Corporation7
Desafios de crawlability no portal
Web Crawlers
Search Indexes
© 2013 IBM Corporation8
Desafios de crawlability no portal
© 2013 IBM Corporation9
Desafios de crawlability no portal
http://miamidade.gov/wps/portal/Main/home/!
ut/p/c5/04_SB8K8xLL...
© 2013 IBM Corporation10
Desafios de crawlability no portal
● O estado de navegação contém informações sobre o estado do
p...
© 2013 IBM Corporation11
Desafios de crawlability no portal
Home Página A Página C
Página B
URL A
URL
B
URL C
URL D
URL
E
...
© 2013 IBM Corporation12
Desafios de crawlability no portal
● O Portal está preparado para enfrentar os desafios de
rastre...
© 2013 IBM Corporation13
Desafios de crawlability no portal
Um crawler poderia assumir:
- URL A e URL D são iguais
- URL B...
© 2013 IBM Corporation14
Sitemaps
● Mapas do Site (Sitemaps) são uma
maneira fácil para webmasters
informarem aos motores ...
© 2013 IBM Corporation15
Sitemaps
● Usar o protocolo Sitemap não garante que as páginas web serão
incluídas nos motores de...
© 2013 IBM Corporation16
Sitemaps
● Informações adicionais, chamadas robot directives, podem ser
adicionadas a uma página ...
© 2013 IBM Corporation17
Sitemaps
● A melhor prática para o uso de robot directives no Portal é
colocá-las no tema, com a ...
© 2013 IBM Corporation18
Crawlability do Portal com conteúdo WCM
● Se o Portal inclui conteúdo WCM, consideração adicional...
© 2013 IBM Corporation19
Search Engine Optimization
● Fazer um site aparecer nos resultados dos buscadores se tornou
uma s...
© 2013 IBM Corporation20
O Google
● O Google é responsável pela maior
parte de todo o tráfego relacionado com
pesquisa na ...
© 2013 IBM Corporation21
Otimizando seu site para o Google
● Um dos segredos para ser bem rankeado no Google é otimizar as...
© 2013 IBM Corporation22
Otimizando seu site para o Google
● Além da estratégia de palavras-chave, diversos outros fatores...
© 2013 IBM Corporation23
Otimizando seu site para o Google
Objetivos e tarefas de SEO Tarefas do Portal
Utilizar a meta ta...
© 2013 IBM Corporation
Parte 2: Como funciona o Portal Search?
© 2013 IBM Corporation25
Buscando e indexando Sites com Portal Search
● Como visto, os serviços de busca na
Internet apena...
© 2013 IBM Corporation26
Entendendo Portal Search
● O Portal Search consiste de uma variedade de portlets para
administrar...
© 2013 IBM Corporation27
Arquitetura do Portal Search
● O serviço de busca do Portal pode ser configurado
para ser executa...
© 2013 IBM Corporation28
Arquitetura do Portal Search
● A “alta disponibilidade” do Portal Search pode ser obitida através...
© 2013 IBM Corporation29
Arquitetura do Portal Search
● Backup e Recuperação
- Se o Portal Search detecta uma configuração...
© 2013 IBM Corporation30
Arquitetura do Portal Search
● Existem dois protocolos de comunicação disponíveis;
EJB ou SOAP, q...
© 2013 IBM Corporation31
Serviços, Coletas e Escopos
Serviço de
Busca A
Serviço de
Busca B
© 2013 IBM Corporation32
Serviços, Coletas e Escopos
Serviço de
Busca A
Serviço de
Busca B
Coletas de Busca
© 2013 IBM Corporation33
Serviços, Coletas e Escopos
Serviço de
Busca A
Serviço de
Busca B
Portal
Crawler
WCM
Crawler
Web
...
© 2013 IBM Corporation34
Serviços, Coletas e Escopos
Serviço de
Busca A
Serviço de
Busca B
Portal
Crawler
WCM
Crawler
Web
...
© 2013 IBM Corporation35
Interfaces de Busca e Administração
● Centro de Procura
- Este portlet é utilizado para
exbir res...
© 2013 IBM Corporation36
Interfaces de Busca e Administração
● Links Sugeridos
- Este portlet pode ser configurado para ex...
© 2013 IBM Corporation37
Interfaces de Busca e Administração
● Resultados da Procura Externos
- Este portlet pode ser usad...
© 2013 IBM Corporation38
Interfaces de Busca e Administração
● Gerenciar Procura
Através deste portlet são feitas todas
co...
© 2013 IBM Corporation39
Interfaces de Busca e Administração
● Componente de Busca
- Este não é um portlet, mas um compone...
© 2013 IBM Corporation40
Portal Search API
● O Portal fornece o Search and Index API (SIAPI), que pode ser
usado para dese...
© 2013 IBM Corporation41
Seedlist framework
● Ao configurar uma fonte de conteúdo para rastrear conteúdo WCM
ou Portal, um...
© 2013 IBM Corporation
Parte 3: Mudanças do Portal Search no
WebSphere Portal 8
© 2013 IBM Corporation43
Coletas e Origem de Conteúdos padrões
● Coleta de Procura
● Default Search Collection
● JCRCollec...
© 2013 IBM Corporation44
Fontes de Conteúdo em Portais Virtuais
● Portal crawler:
http://<hostname>:<port>/wps/seedlist/my...
© 2013 IBM Corporation45
Fonte de conteúdo
● Reunir documentos da Fonte de Conteúdo
Isso exclui todos os documentos existe...
© 2013 IBM Corporation46
Mudanças no portlet Centro de Procura
● Seedlist – Configuração da Origem de Conteúdo
- A guia Pa...
© 2013 IBM Corporation47
Mudanças no portlet Centro de Procura
- Planejadores, apenas um agendamento pode ser definido
Sem...
© 2013 IBM Corporation48
- Portlet Busca e Navegação migrado para o Centro de Procura
- A opção de editar Metadados foi re...
© 2013 IBM Corporation49
Search Engine atualizado
● Foram adicionados novos arquivos jar na pasta
/PortalServer/search:
● ...
© 2013 IBM Corporation50
Links Sugeridos e serviço Tagging & Rating
● O administrador pode associar recursos do Portal com...
© 2013 IBM Corporation51
Links Sugeridos e serviço Tagging & Rating
● Usuários finais podem pesquisar e obter links sugeri...
© 2013 IBM Corporation52
Links Sugeridos e serviço Tagging & Rating
● O administrador pode visualizar os links Tagging & R...
© 2013 IBM Corporation53
Crawling bibliotecas WCM
● Por padrão, o WCM crawler rastreia todas as bibliotecas
existentes. Is...
© 2013 IBM Corporation54
Tornando um conteúdo do Portal não pesquisável
● Existe uma propriedade no portlet que deve ser a...
© 2013 IBM Corporation55
Tornando um conteúdo WCM não pesquisável
● No portlet de Autoria do
WCM, você pode clicar em
um c...
© 2013 IBM Corporation56
Portlet Procura e Navegação removido
● Como visto anteriormente, o portlet Procura e Navegação nã...
© 2013 IBM Corporation57
Atualização do portlet Centro de Procura
● Ordenar por data
© 2013 IBM Corporation58
Atualização do portlet Centro de Procura
● Busca utilizando tags
Pesquisando com tags
Tags nos re...
© 2013 IBM Corporation
Parte 4: Integração com ferramentas de
busca externas
© 2013 IBM Corporation60
Comentários gerais sobre integração
● Posso integrar “meu” motor de busca com o Portal?
● Portal ...
© 2013 IBM Corporation61
Tecnologia de busca embutida
● O motor de busca dentro do WebSphere Portal oferece uma
solução de...
© 2013 IBM Corporation62
Precisa de uma busca mas poderosa?
● Tecnologias de busca IBM:
- Busca básica - Portal Search
- B...
© 2013 IBM Corporation63
IBM Content Analytics com Enterprise Search
● Experiência de usuário
● Navegação de alto desempen...
© 2013 IBM Corporation64
ICA – Suporte a dezenas de fontes de conteúdo
• IBM Case Manager V5.0
• IBM Lotus Connections 2.5...
© 2013 IBM Corporation65
Integração do Centro de Procura com o ICA
© 2013 IBM Corporation66
IBM Content Analytics portlets
© 2013 IBM Corporation67
Integração com IBM Connections
● Opção 1 – Use seedlists do IBM Connections para rastrear seus
re...
© 2013 IBM Corporation68
© 2013 IBM Corporation69
Dúvidas?
© 2013 IBM Corporation
Para saber mais...
WebSphere Portal and IBM Web Content Manager Information Center
http://www.ibm.c...
© 2013 IBM Corporation
Referências

Understanding the Essentials of IBM Web Experience software Search services,
Excepcio...
© 2013 IBM Corporation
Obrigado!!!
Rodrigo Reis
rodrigoareis@br.ibm.com
IT Specialist & Application Architect
IBM Collabor...
© 2013 IBM Corporation
© IBM Corporation 2013. All Rights Reserved.
The information contained in this publication is provi...
Upcoming SlideShare
Loading in …5
×

Buscas no IBM WebSphere Portal

1,617 views

Published on

Published in: Technology
1 Comment
4 Likes
Statistics
Notes
No Downloads
Views
Total views
1,617
On SlideShare
0
From Embeds
0
Number of Embeds
3
Actions
Shares
0
Downloads
50
Comments
1
Likes
4
Embeds 0
No embeds

No notes for slide

Buscas no IBM WebSphere Portal

  1. 1. © 2013 IBM Corporation Buscas no IBM WebSphere Portal Rodrigo Reis IT Specialist & Application Architect IBM Collaboration Solutions
  2. 2. © 2013 IBM Corporation2 Agenda Parte 1: Disponibilizando conteúdo do Portal na Internet Parte 2: Como funciona o Portal Search? Parte 3: Mudanças do Portal Search no WebSphere Portal 8 Parte 4: Integração com ferramentas de busca externas
  3. 3. © 2013 IBM Corporation Parte 1: Disponibilizando conteúdo do Portal na Internet
  4. 4. © 2013 IBM Corporation4 Como os motores de busca funcionam? Os motores de busca coletam dados sobre as informações publicadas na web e constroem um enorme banco de dados que relacionam as páginas com os termos que elas contêm através de um processo de quatro etapas
  5. 5. © 2013 IBM Corporation5 Como os motores de busca funcionam? 1. Rastreamento (Crawlling) da Web Os motores de busca (Search engines) executam processos agendados chamados "bots" ou "spiders" que usam os links encontrados na web para "rastrear" (crawl) as páginas e documentos 2. Indexação de documentos Uma vez que uma página tenha sido rastreada, seu conteúdo é analisado e palavras-chave são extraídas para a construção de um banco de dados de documentos que compõe o "índice" de um motor de busca
  6. 6. © 2013 IBM Corporation6 Como os motores de busca funcionam? 3. Processamento de consultas Quando um pedido de informação chega ao motor de busca, o motor recupera de seu índice todos os documentos que correspondem a consulta 4. Classificação (Ranking) dos resultados Uma vez que o motor de busca determinou quais resultados correspondem a consulta, um algoritmo executa cálculos sobre cada um dos resultados para determinar o que é mais relevante para a consulta dada. Ele classifica estes resultados nas páginas de resultados, a partir do mais relevante ao menos relevante
  7. 7. © 2013 IBM Corporation7 Desafios de crawlability no portal Web Crawlers Search Indexes
  8. 8. © 2013 IBM Corporation8 Desafios de crawlability no portal
  9. 9. © 2013 IBM Corporation9 Desafios de crawlability no portal http://miamidade.gov/wps/portal/Main/home/! ut/p/c5/04_SB8K8xLLM9MSSzPy8xBz9CP0os3hnQ29jA38vF98 wk1ALA08fD1MPLzNfAwN_c_1wkA6gCndHDxNzH6CQUZiBgZ GfaXCgQWiwsYGnMUTeAAdwNND388jPTdUvyM5Oc3RUVAQ AZBGxdA!!/dl3/d3/L2dBISEvZ0FBIS9nQSEh/
  10. 10. © 2013 IBM Corporation10 Desafios de crawlability no portal ● O estado de navegação contém informações sobre o estado do portal, por exemplo, a página atual e o tema em uso. Ele também contém informações sobre estado de portlet, por exemplo, o modo de portlet (edit, view, help), estado da janela (minimized, maximized) e render parameters ● A principal razão para a inclusão de todas essas informações na URL é apoiar o bookmarking de páginas do Portal, mantendo o layout exato e estado das informações naquele momento
  11. 11. © 2013 IBM Corporation11 Desafios de crawlability no portal Home Página A Página C Página B URL A URL B URL C URL D URL E Um crawler poderia assumir: - URL A e URL D são diferentes - URL B e URL E são diferentes URLs com informações codificadas:
  12. 12. © 2013 IBM Corporation12 Desafios de crawlability no portal ● O Portal está preparado para enfrentar os desafios de rastreamento usando “URLs Normalizadas” ● Quando o Portal reconhece que está sendo visitado por um crawler, ajusta automaticamente as URLs para cada página, retirando a maioria das informações armazenadas no estado de navegação, deixando apenas informações exigidas para exibir a página ● O Portal é pré-configurado para reconhecer cerca de cinquenta motores de busca
  13. 13. © 2013 IBM Corporation13 Desafios de crawlability no portal Um crawler poderia assumir: - URL A e URL D são iguais - URL B e URL E são iguais Home Página A Página C Página B URL A URL B URL C URL D URL E URLs normalizadas:
  14. 14. © 2013 IBM Corporation14 Sitemaps ● Mapas do Site (Sitemaps) são uma maneira fácil para webmasters informarem aos motores de busca sobre as páginas dos sites que estão disponíveis para rastreamento ● De forma simples, um Sitemap é um arquivo XML que lista os URLs de um site junto com metadados adicionais sobre cada URL para que os motores de busca possam indexar o site de forma mais inteligente
  15. 15. © 2013 IBM Corporation15 Sitemaps ● Usar o protocolo Sitemap não garante que as páginas web serão incluídas nos motores de busca, mas ajudam os crawlers a fazer um melhor trabalho de rastreamento do seu site ● Os sites de busca sugerem apontar o crawler diretamente para um mapa do site, ou pelo menos ter um link para o mapa do site em algum lugar na página principal do site ● O IBM WebSphere Portal fornece um portlet Sitemap para ajudar no atendimento às melhores práticas recomendadas pela maioria dos motores de busca na Internet ● A melhor prática de uso do portlet Sitemap é colocar um link para ele no topo da página, por exemplo, dentro do tema Portal
  16. 16. © 2013 IBM Corporation16 Sitemaps ● Informações adicionais, chamadas robot directives, podem ser adicionadas a uma página instruindo o crawler para não rastrear nada além do mapa do site ● As diretivas são meta dados incluídos no HTML, ou um arquivo especial robots.txt, que fornece instruções ao crawler definindo se rastrear seções do site é permitido ou proibido ● A semântica das diretivas são estruturadas. Por exemplo, pode existir um instrução para permitir /home/publico/*, mas incluir uma exceção, não permitindo /home/publico/funcionarios ● URLs do Portal são menos estruturadas, embora elas possam começar de forma estruturada e "amigável" (para bookmarking), depois de clicar em outros links as URLs se tornam mais complexas e desestruturadas
  17. 17. © 2013 IBM Corporation17 Sitemaps ● A melhor prática para o uso de robot directives no Portal é colocá-las no tema, com a lógica para permitir ou proibir páginas individuais Por exemplo, se o Portal tem um mapa do site, o tema poderia gerar: <meta name="robots" content="noindex,follow"> Isso instrui o crawler a seguir todos os links da página com o mapa do site, mas não incluindo ela nos resultados. Para todas as outras páginas: <meta name="robots" content="index,nofollow"> Esta medida assegura que as páginas serão adicionadas ao índice, mas os links não serão rastreados, uma vez que o crawler já terá feito isso através da página com o mapa do site
  18. 18. © 2013 IBM Corporation18 Crawlability do Portal com conteúdo WCM ● Se o Portal inclui conteúdo WCM, consideração adicional é necessária para garantir a todo o conteúdo está indexado e os resultados mostram o conteúdo no contexto correto ● Se a página inclui componentes para selecionar o conteúdo (como um navegador WCM), a abordagem Sitemap e robot directives descritas anteriormente não vai funcionar bem ● Se estiver usando um navegador WCM ou qualquer outro componente que depende de request parameter, é necessário reconfigurar a maneira que o Portal apresenta URL normalizadas
  19. 19. © 2013 IBM Corporation19 Search Engine Optimization ● Fazer um site aparecer nos resultados dos buscadores se tornou uma sub-disciplina na construção de web sites. Na verdade, uma muito madura, por isso há muita documentação, ferramentas e sites disponíveis ● Search engine optimization (SEO) é definido na Wikipedia como o processo de melhorar o volume ou a qualidade do tráfego para um site a partir de sites de busca, através de resultados de pesquisa "naturais". O oposto de Search Engine Marketing (SEM), que lida com a inclusão paga
  20. 20. © 2013 IBM Corporation20 O Google ● O Google é responsável pela maior parte de todo o tráfego relacionado com pesquisa na Internet. De modo que começar a otimizar seu site para o Google, faz muito sentido ● O Google classifica os sites também por análise de links (PageRank), se o Google não é levado a seu site por outros sites indexados, o Google nunca irá lhe dar uma classificação alta
  21. 21. © 2013 IBM Corporation21 Otimizando seu site para o Google ● Um dos segredos para ser bem rankeado no Google é otimizar as palavras-chave (keywords) visíveis em uma página ● A estratégia envolvendo palavras-chave tem duas etapas: Seleção de palavras-chave: Determine quais palavras o seu público potencial pode usar para pesquisar sua página e crie palavras-chave com base nessas palavras Otimização de palavras-chave: Aplicar essas palavras-chave em todas páginas apropriadas (de 3 a 5 palavras-chave por página é a quantidade recomendada) e otimizá-las a partir do canto superior esquerdo para baixo. Frequentemente, estas serão as 200 primeiras palavras em sua página - tags title, heading, etc
  22. 22. © 2013 IBM Corporation22 Otimizando seu site para o Google ● Além da estratégia de palavras-chave, diversos outros fatores irão influenciar no raking do seu site no Google, a seguir são relacionadas algumas técnicas extraídas do documento: Search Engine Optimization Starter Guide http://www.google.com/webmasters/docs/search- engine-optimization-starter-guide.pdf
  23. 23. © 2013 IBM Corporation23 Otimizando seu site para o Google Objetivos e tarefas de SEO Tarefas do Portal Utilizar a meta tag "description": - Resumir precisamente o conteúdo da página - Utilize descrições únicas para cada página Use metadados nas páginas do Portal para permitir que os usuários finais escrever meta tags de descrição significativas Melhorar a estrutura das URLs: - Use palavras nas URLs - Criar uma estrutura de diretório simples - Fornecer uma única versão de um URL para chegar a um documento Use URLs amigáveis e mapeamentos de URLs para criar URLs semânticas para suas páginas Torne seu site fácil de navegar: - Criar uma hierarquia de fluxo natural - Usar principalmente texto para navegação - Usar "migalhas" (breadcrumb) na navegação - Mantenha a sua hierarquia de páginas o mais simples possível no Portal - Incorporar um componente de navegação (breadcrumb) nos seus temas
  24. 24. © 2013 IBM Corporation Parte 2: Como funciona o Portal Search?
  25. 25. © 2013 IBM Corporation25 Buscando e indexando Sites com Portal Search ● Como visto, os serviços de busca na Internet apenas incluem páginas do Portal que não necessitam de autenticação ● O Portal Search pode incluir conteúdo protegido e resultados de pesquisa adicionais de outros sistemas internos ou externos que podem complementar a pesquisa inicial ● Usuários podem encontrar conteúdo via os portlets de busca padrão ou o campo de pesquisa no tema
  26. 26. © 2013 IBM Corporation26 Entendendo Portal Search ● O Portal Search consiste de uma variedade de portlets para administrar as atividades de pesquisa e exibir resultados de pesquisa. Além disso, existe um serviço de pesquisa que inclui uma variedade de crawlers, incluindo Portal Site, WCM e Seedlist ● Os crawlers podem interpretar mais de 250 formatos de documentos ● Crawlers podem ser agendados periodicamente e sua saída é uma coleção de busca, também conhecido como um arquivo de índice ● Usar um crawler adequado é importante
  27. 27. © 2013 IBM Corporation27 Arquitetura do Portal Search ● O serviço de busca do Portal pode ser configurado para ser executado no Portal local, ou pode ser delegado a um ou mais servidores dedicados ● Cluster vertical não deve ser utilizado para execução do serviço de busca ● Em um ambiente de cluster horizontal, a busca remota deve ser utilizada, de outra forma nós individuais podem retornar diferentes resultados de busca
  28. 28. © 2013 IBM Corporation28 Arquitetura do Portal Search ● A “alta disponibilidade” do Portal Search pode ser obitida através de dois métodos: Maiores informações no artigo: http://www.ibm.com/developerworks/websphere/zones/portal/proddoc/dw-w-portalsearch/
  29. 29. © 2013 IBM Corporation29 Arquitetura do Portal Search ● Backup e Recuperação - Se o Portal Search detecta uma configuração de coleta corrompida ou até mesmo o indice de busca, automaticamente inicia a recuperação a partir de arquivos de backup - Configurações para todas as coletas sofrem backup automaticamente - A localização padrão do backup é: <wp_profile_root>/collections_config_backup/ - Ao recuperar uma configuração de coleta, crawlers associados com a coleção não serão reiniciados. Se houver crawlers agendados, eles serão executados como previsto
  30. 30. © 2013 IBM Corporation30 Arquitetura do Portal Search ● Existem dois protocolos de comunicação disponíveis; EJB ou SOAP, que têm diferenças relacionadas à segurança ● Independentemente do protocolo utilizado, o Portal manterá sempre dois tipos de segurança: Segurança em nível de coleção - usado para associar conjuntos com grupos de usuários autorizados. Apenas usuários autorizados podem procurar em uma coleção Segurança em nível de documento - garante que os usuários têm devidas autorizações em páginas e portlets antes que os resultados da pesquisa sejam apresentados a eles
  31. 31. © 2013 IBM Corporation31 Serviços, Coletas e Escopos Serviço de Busca A Serviço de Busca B
  32. 32. © 2013 IBM Corporation32 Serviços, Coletas e Escopos Serviço de Busca A Serviço de Busca B Coletas de Busca
  33. 33. © 2013 IBM Corporation33 Serviços, Coletas e Escopos Serviço de Busca A Serviço de Busca B Portal Crawler WCM Crawler Web Crawler Portal Crawler WCM Crawler Web Crawler Coletas de Busca Fontes de Busca
  34. 34. © 2013 IBM Corporation34 Serviços, Coletas e Escopos Serviço de Busca A Serviço de Busca B Portal Crawler WCM Crawler Web Crawler Portal Crawler WCM Crawler Web Crawler Escopo de Busca 1 Escopo de Busca 2 Coletas de Busca Fontes de Busca
  35. 35. © 2013 IBM Corporation35 Interfaces de Busca e Administração ● Centro de Procura - Este portlet é utilizado para exbir resultados de pesquisa a partir de multiplas coletas e disponibliza recursos como type-ahead - O usuário também pode fazer uma pesquisa a partir da caixa de pesquisa do tema Portal, e será redirecionado para uma página contendo este portlet - Os resultados são apresentados, junto com resumo e classificação para cada um
  36. 36. © 2013 IBM Corporation36 Interfaces de Busca e Administração ● Links Sugeridos - Este portlet pode ser configurado para exibir resultados de pesquisa recomendadas com base em palavras-chave digitadas na solicitação de pesquisa - Os administradores podem mapear manualmente as principais fontes de informação / documentos para procurar termos, e entregar resultados prioritários para os usuários - Os resultados são exibidos ao lado dos resultados de busca de outros portlets de pesquisa.
  37. 37. © 2013 IBM Corporation37 Interfaces de Busca e Administração ● Resultados da Procura Externos - Este portlet pode ser usado para exibir os resultados de pesquisa obtidos a partir de um serviço de busca interno ou externo - O serviço de busca deve fornecer uma interface Web pública e devolver o resultado da pesquisa como um feed RSS ou Atom - Os resultados são exibidos ao lado dos resultados de busca de outros portlets de pesquisa - Páginas de resultado em HTML não podem ser processadas pelo portlet
  38. 38. © 2013 IBM Corporation38 Interfaces de Busca e Administração ● Gerenciar Procura Através deste portlet são feitas todas configurações e gestão de serviços de busca, coletas e escopos, para busca local ou remota
  39. 39. © 2013 IBM Corporation39 Interfaces de Busca e Administração ● Componente de Busca - Este não é um portlet, mas um componente WCM que permite que os resultados da busca possam ser incorporados em conteúdo ou modelos de WCM - O componente está configurado para apresentar os resultados de uma coleção de pesquisa do Portal - É muito útil para sites baseados em conteúdo WCM
  40. 40. © 2013 IBM Corporation40 Portal Search API ● O Portal fornece o Search and Index API (SIAPI), que pode ser usado para desenvolver portlets de pesquisa personalizados para realizar operações de busca e indexação. ● Além da SIAPI, uma interface RESTful pode ser utilizada para retornar resultados de pesquisa. Um pedido REST é feito através de HTTP e uma variedade de parâmetros estão disponíveis Exemplo de uma consulta simples: http://www.<hostname>:<port>/searchfeed/myportal/search? query=testresults=10 Artigo sobre uso do Search REST API: http://www-10.lotus.com/ldd/portalwiki.nsf/dx/Leverage_Search_Expierence_based_on_Portal_Search_REST_API
  41. 41. © 2013 IBM Corporation41 Seedlist framework ● Ao configurar uma fonte de conteúdo para rastrear conteúdo WCM ou Portal, um seedlist é gerado automaticamente pelo Portal ● Um seedlist é como uma extensão de um mapa do site e é baseado no Atom Syndication Format [RFC4287] ● A IBM fornece um White paper e código fonte para facilitar a criação de seedlists para qualquer tipo de repositórios de conteúdo ● Fontes de conteúdo adicionais podem ser adicionados ao Portal para rastrear um novo feed seedlist, e adicionar os documentos para a coleta de busca
  42. 42. © 2013 IBM Corporation Parte 3: Mudanças do Portal Search no WebSphere Portal 8
  43. 43. © 2013 IBM Corporation43 Coletas e Origem de Conteúdos padrões ● Coleta de Procura ● Default Search Collection ● JCRCollection1
  44. 44. © 2013 IBM Corporation44 Fontes de Conteúdo em Portais Virtuais ● Portal crawler: http://<hostname>:<port>/wps/seedlist/myserver/<virtualPortalContext>? Source=com.ibm.lotus.search.plugins.seedlist.retriever.portal.PortalRetrieverFact ory&Action=GetDocuments&Range=100 ● WCM crawler : http://<hostname>:<port>/wps/seedlist/myserver/<virtualPortalContext>? SeedlistId=&Source=com.ibm.workplace.wcm.plugins.seedlist.retriever.WCMRetri everFactory&Action=GetDocuments ● JCR crawler: http://<hostname>:<port>/wps/seedlist/server? Action=GetDocuments&Format=ATOM&Locale=en_US&Range=100&Source=co m.ibm.lotus.search.plugins.seedlist.retriever.jcr.JCRRetrieverFactory&Start=0&Se edlistId=3@OOTB_CRAWLER3
  45. 45. © 2013 IBM Corporation45 Fonte de conteúdo ● Reunir documentos da Fonte de Conteúdo Isso exclui todos os documentos existentes a partir da fonte de conteúdo especificada e, em seguida, começa um rastreamento completo
  46. 46. © 2013 IBM Corporation46 Mudanças no portlet Centro de Procura ● Seedlist – Configuração da Origem de Conteúdo - A guia Parâmetros Gerais foi modificada: Menos opções de configuração (opções como: "Os níveis de links a seguir", "Número de documentos para coletar", "Pare de coleta depois", "Ligações expiram após" - foram removidos e existe somente para origem de conteúdo Web) - Guia Filtros removida Novo timeout
  47. 47. © 2013 IBM Corporation47 Mudanças no portlet Centro de Procura - Planejadores, apenas um agendamento pode ser definido Sem opção para criar novo agendamento
  48. 48. © 2013 IBM Corporation48 - Portlet Busca e Navegação migrado para o Centro de Procura - A opção de editar Metadados foi removida Portal 7: Portal 8: - Removido “Carregar documento manualmente para coleta” Portal 7: Portal 8: Mudanças no portlet Centro de Procura
  49. 49. © 2013 IBM Corporation49 Search Engine atualizado ● Foram adicionados novos arquivos jar na pasta /PortalServer/search: ● Como resultado, os traces de rastreamento foram alteradas de com.ibm.crawler. * = All para com.ibm.lotus.search.engine. * = All
  50. 50. © 2013 IBM Corporation50 Links Sugeridos e serviço Tagging & Rating ● O administrador pode associar recursos do Portal com palavras- chave Como um substituto para "atualização de metadados" (palavras-chave) que foi removido do Centro de Procura
  51. 51. © 2013 IBM Corporation51 Links Sugeridos e serviço Tagging & Rating ● Usuários finais podem pesquisar e obter links sugeridos na página de pesquisa principal: Portlet Links Sugeridos
  52. 52. © 2013 IBM Corporation52 Links Sugeridos e serviço Tagging & Rating ● O administrador pode visualizar os links Tagging & Rating filtrados pela categoria "Links sugeridos" Para ver a opção "Links Sugeridos", acesse "Editar Configurações Compartilhadas" do portlet Tags e escolha "Links sugeridos" Palavras-chave adicionadas a Link Sugeridos Opção Links sugeridos
  53. 53. © 2013 IBM Corporation53 Crawling bibliotecas WCM ● Por padrão, o WCM crawler rastreia todas as bibliotecas existentes. Isto é feito, deixando o parâmetro SeedlistId vazio: &SeedlistId=&Format=... ● Se o administrador desejar criar um crawler que rastreia apenas uma biblioteca específica, pode fazer usando o nome da biblioteca como parâmetro: &SeedlistId=mylibrary&Format=... ● É possível definir seedlist em mais de uma biblioteca, usando vírgula como separador: &SeedlistId=myLibrary1,myLibrary2&Format=... Para maiores informações: http://www-10.lotus.com/ldd/portalwiki.nsf/dx/Seedlist_1.0_REST_service_API_wcm7
  54. 54. © 2013 IBM Corporation54 Tornando um conteúdo do Portal não pesquisável ● Existe uma propriedade no portlet que deve ser adicionada ou atualizada - Se "INCLUDE_IN_SEARCH_INDEX = true" é definido para um portlet específico, este é adicionado à lista de portlets que devem ser indexados - Por padrão, o parâmetro não existe, se você quiser que o portlet não seja procurado, precisa adicionar esta propriedade com valor false
  55. 55. © 2013 IBM Corporation55 Tornando um conteúdo WCM não pesquisável ● No portlet de Autoria do WCM, você pode clicar em um conteúdo e excluí-lo da seedlist. Isto pode ser feito através de modelo de autoria. Para ver essa opção, você precisa clicar em "Mostrar campos ocultos". Por padrão é pesquisável
  56. 56. © 2013 IBM Corporation56 Portlet Procura e Navegação removido ● Como visto anteriormente, o portlet Procura e Navegação não existe no Portal 8 ● Como substituto para a busca avançada que ele oferecia, o portlet Centro de Procura pode ser usado - Os filtros personalizados foram adicionados ao Centro de Procura - Configure o portlet Centro de Procura e altere o valor do parâmetro displaySearchFilters para true. Isso permitirá seus usuários relizar buscas por filtros de metadados. Por padrão, título e descrição são fornecidos como filtros de pesquisa.
  57. 57. © 2013 IBM Corporation57 Atualização do portlet Centro de Procura ● Ordenar por data
  58. 58. © 2013 IBM Corporation58 Atualização do portlet Centro de Procura ● Busca utilizando tags Pesquisando com tags Tags nos resultados
  59. 59. © 2013 IBM Corporation Parte 4: Integração com ferramentas de busca externas
  60. 60. © 2013 IBM Corporation60 Comentários gerais sobre integração ● Posso integrar “meu” motor de busca com o Portal? ● Portal fornece frameworks que permitem utilização de motores de busca externos - Um framework para consumir Portal e outros recursos como WCM e IBM Connections (incluindo suporte a "segurança") - Um framework para acessar um serviço de busca para realizar pesquisas - Portlet que permite adicionar um serviço de busca e exibir os resultados ● Autonomy já fornece o "IBM Connector" (seedlist rastreador) ● Google Search Appliance está chegando lá com o seu 'feed crawler " mas ainda não é compatível
  61. 61. © 2013 IBM Corporation61 Tecnologia de busca embutida ● O motor de busca dentro do WebSphere Portal oferece uma solução de entrada, adequada para a pesquisas através de Sites e Conteúdos gerenciados de tamanho moderado. Ideal para pequenas e médias instalações do WebSphere Portal ● Algumas limitações do Portal Search: - Capacidade de pesquisa limitada a menos de 800 mil documentos por índice - Sem suporte nativo a alta disponibilidade - Sem suporte a busca semântica
  62. 62. © 2013 IBM Corporation62 Precisa de uma busca mas poderosa? ● Tecnologias de busca IBM: - Busca básica - Portal Search - Busca avançada - IBM Content Analytics com Enterprise Search open source Lucene IBM Lucene Extension Library Portal Search IBM Content Analytics with Enterprise Search IBM Search REST
  63. 63. © 2013 IBM Corporation63 IBM Content Analytics com Enterprise Search ● Experiência de usuário ● Navegação de alto desempenho ● Salvar pesquisas ● Perfis de busca ● Pre-visualização de documentos ● E muito mais ... ● Experiência administrativa ● Maior escalabilidade ● Suporte à indexação incremental ● Flexíbilidade scale-out & HA ● Opções de ajuste de relevância ● E muito mais ... Auto completar: - Termos sugeridos baseado no indice e buscas anteriores - Customizável pelos Administradores
  64. 64. © 2013 IBM Corporation64 ICA – Suporte a dezenas de fontes de conteúdo • IBM Case Manager V5.0 • IBM Lotus Connections 2.5, 3, 4 and 4.5 • IBM Lotus Domino DM 6.5.1, 7.0, • IBM Lotus Domino R7, R8, R8.5 and R9 • IBM Lotus Quickr (NSF & J2EE), 8.1, 8.2 and 8.5 • IBM Web Content Management 6.1, 7 and 8 • IBM WebSphere Portal 6.1, 7 and 8 • DB2 for iSeries 5.4 and 6.1 • DB2 UDB for Linux, UNIX, Windows 9.1, 9.5 and 9.7 • DB2 for z/OS 8.1, 9.1 • IMS 10.0 and 11.0.1 • Informix Dynamic Server 11.10 and 11.50 • Microsoft SQL Server 2005, 2008 • MySQL 5.0 • Oracle 10g and 11g • Software AG Adabas 7.1 • Sybase 11.9.2, 12.0, 12.5x Colaboração • IBM Case Manager V5.0 • IBM Content Manager Enterprise Edition 8.4, 8.4.1, 8.4.2 • FileNet Content Services 5.4, 5.5 • FileNet P8 Content Manager 4.0, 4.5, 4.5.1 and 5.0 • Hummingbird DM 5.1.0.5 with SR6 and 6.0.4 • EMC/Documentum 6.0 and 6.5 • CA-Datacom 10 • Open Text Livelink Enterprise Server 9.6, 9.7 and 9.7.1 Gerenciamento de Dados Outras fontes • Microsoft Exchange Server 2003 • Microsoft Windows SharePoint Services 3.0 • SharePoint Server 2003 SP2, 2007, 2010 Farm Support • Windows file systems: 2003 and 2008 servers • Network News Protocol Newsgroup • UNIX file systems • VSAM for z/OS 1.4 • Web (HTTP or HTTPS) Gerenciamento de Conteúdo
  65. 65. © 2013 IBM Corporation65 Integração do Centro de Procura com o ICA
  66. 66. © 2013 IBM Corporation66 IBM Content Analytics portlets
  67. 67. © 2013 IBM Corporation67 Integração com IBM Connections ● Opção 1 – Use seedlists do IBM Connections para rastrear seus repositórios - Uma seedlist por tipo de recurso, por exemplo, Wiki, blogs, perfis, arquivos, etc. ● Opção 2 – Integrar a busca do IBM Connections com o Centro de Procura do Portal - use o recurso 'Remote Content Search Service "(RCSS) para registrar a busca do Connections como um serviço de busca - IBM Connections e WebSphere Portal (e ICA) utilizam a IBM Search REST API
  68. 68. © 2013 IBM Corporation68
  69. 69. © 2013 IBM Corporation69 Dúvidas?
  70. 70. © 2013 IBM Corporation Para saber mais... WebSphere Portal and IBM Web Content Manager Information Center http://www.ibm.com/developerworks/websphere/zones/portal/proddoc.html WebSphere Portal and Web Content Manager Business Solutions Catalog https://greenhouse.lotus.com/catalog/ WebSphere Portal developerWorks forum http://www.ibm.com/developerworks/forums/forum.jspa?forumID=168 The WebSphere Portal wiki http://www-10.lotus.com/ldd/portalwiki.nsf/xpViewCategories.xsp?lookupNa me=IBM%20WebSphere%20Portal%208%20Product%20Documentation IBM Redbooks® publications http://www.redbooks.ibm.com/portals/websphere
  71. 71. © 2013 IBM Corporation Referências  Understanding the Essentials of IBM Web Experience software Search services, Excepcional Web Experience 2013 Americas - Todd Leyba, Andreas Prokoph  Integrating Search with WebSphere Portal – Best Practices, IBM Portal Excellence Conference - Andreas Prokoph  Creating External Facing Web Sites with WebSphere Portal - Adam de Leeuw, Ali Beklen, David Axinn, Fanie Korff, Graham Wallace, Janice Taylor, JP Thambuganipalle, Projjwal Saha, Rajaguru Balagurusamy, Raul Munoz Serrano, Bart Jacob  High availability options for IBM WebSphere Portal 6.1 search - Andreas Prokoph, Eitan Shapiro
  72. 72. © 2013 IBM Corporation Obrigado!!! Rodrigo Reis rodrigoareis@br.ibm.com IT Specialist & Application Architect IBM Collaboration Solutions
  73. 73. © 2013 IBM Corporation © IBM Corporation 2013. All Rights Reserved. The information contained in this publication is provided for informational purposes only. While efforts were made to verify the completeness and accuracy of the information contained in this publication, it is provided AS IS without warranty of any kind, express or implied. In addition, this information is based on IBM’s current product plans and strategy, which are subject to change by IBM without notice. IBM shall not be responsible for any damages arising out of the use of, or otherwise related to, this publication or any other materials. Nothing contained in this publication is intended to, nor shall have the effect of, creating any warranties or representations from IBM or its suppliers or licensors, or altering the terms and conditions of the applicable license agreement governing the use of IBM software . References in this presentation to IBM products, programs, or services do not imply that they will be available in all countries in which IBM operates. Product release dates and/or capabilities referenced in this presentation may change at any time at IBM’s sole discretion based on market opportunities or other factors, and are not intended to be a commitment to future product or feature availability in any way. Nothing contained in these materials is intended to, nor shall have the effect of, stating or implying that any activities undertaken by you will result in any specific sales, revenue growth or other results. Performance is based on measurements and projections using standard IBM benchmarks in a controlled environment. The actual throughput or performance that any user will experience will vary depending upon many factors, including considerations such as the amount of multiprogramming in the user's job stream, the I/O configuration, the storage configuration, and the workload processed. Therefore, no assurance can be given that an individual user will achieve results similar to those stated here. Adobe, the Adobe logo, PostScript, and the PostScript logo are either registered trademarks or trademarks of Adobe Systems Incorporated in the United States, and/or other countries. Java and all Java-based trademarks are trademarks of Sun Microsystems, Inc. in the United States, other countries, or both. Microsoft and Windows are trademarks of Microsoft Corporation in the United States, other countries, or both. ries in the United States and other countries. Linux is a registered trademark of Linus Torvalds in the United States, other countries, or both. Other company, product, or service names may be trademarks or service marks of others. All references to OpenFinancial, Greenwell and Open Bier refer to a fictitious company and are used for illustration purposes only.

×