Your SlideShare is downloading. ×
0
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Web semática clase 2
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Web semática clase 2

660

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
660
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
6
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Ing. Waleska Perdomo Cáceres Msc www.lineadeinvestigacion.blogspot.com
  • 2. De la Web 1.0 a laWeb 3.0
  • 3. • Confluencia de la Inteligencia Artificial y las tecnologías en línea, que proponenuevas técnicas y paradigmas para la representación del conocimiento.• Facilita la localización, distribución e integración de recursos en línea. [Berners-Lee 2001].• Estas nuevas técnicas se basan en la introducción de conocimiento semánticoexplícito que describa y/o estructure la información y servicios disponibles.• Procura la interconexión de usuarios, desarrolladores y servicios diversos. Tomando la ontología del campo de la Inteligencia Artificial como vehículo para ello [Gruber 1993].• Ontología: Clasificación de conceptos con atributos y relaciones, que proporciona un definición semántica de unidades de información interrelacionadas. Se han desarrollado diversos lenguajes y estándares para la definición de ontologías, entre ellos XML [Bray 2000], RDF [Lasilla 1999], DAML+OIL [Connoly 2001], y más recientemente OWL [Dean 2002],
  • 4. Para ello se esta invirtiendo un gran esfuerzo en desarrollara) La infraestructura necesaria para su despliegueb) Aplicaciones que demuestren la viabilidad y el beneficio de la web semántica y a la vez motiven el desarrollo y consumo de infraestructurac) Nuevas soluciones para resolver problemas específicos, e ideas que mejoren, amplíen y/o exploten las posibilidades de la web semántica. Entre las principales líneas de trabajo que están siendo objeto de atención cabe citar:  Lenguajes de definición de ontologías  Metodologías de desarrollo de ontologías  Integración de ontologías  Aprendizaje de ontologías  Desarrollo de vocabularios en dominios concretos  Agentes  Servicios web
  • 5. En el ámbito del acceso, recuperación y organización de información, la minería Web se utiliza para el estudio del comportamiento de la arquitectura de un sitio.Etzioni define la minería Web como el empleo de las técnicas de la minería de datos —datamining (DM) — Para descubrir y extraer información automáticamente del Web por medio de : ● Los motores de búsqueda. ● El comercio electrónico. ● El diseño Web. ● El posicionamiento Web. ● La seguridad digital
  • 6. • Definición. Lista alfabética de materias o temas acompañada de las referencias bibliográficas correspondientes para localizar los documentos completos.• Propósito. Señalan información localizada en otro lugar o documento.• Contenido. Cubren temas generales y algunos más específicos. Incluyen citas bibliográficas de revistas, boletines y documentos de gobierno.• Preguntas que pueden contestar al usuario: • Necesito libros sobre un tema específico. • Requiero tres artículos de revistas sobre un autor en especial.
  • 7. • Definición. Proporcionan referencias (“ligas”) para localizar los documentos en texto completo.• Propósito. Señalan información localizada en otro lugar o documento.• Contenido. Cubren desde temas generales hasta específicos.• Preguntas que pueden contestar al usuario: • Necesito documentos sobre un tema específico. • Requiero tres artículos de revistas sobre un autor en especial. • ¿Cuál es el mejor reproductor de MP3 en el mercado mexicano?
  • 8. • Definición. Programa de software diseñado para facilitar el acceso a la información en la web.• Kasi, Vijay and Radhika Jain. "Internet Search Engines. " Encyclopedia of E-Commerce, E-Government and Mobile Commerce. Mehdi Khosrow- Pour. Vol. 1. Hershey, PA: Idea Group Reference, 2006. [672]-677. Gale Virtual Reference Library. Gale. Universidad de Las Americas Puebla. 1 Sept. 2009 <http://go.galegroup.com/ps/start.do?p=GVRL&u=udlap>.• Propósito. Encontrar documentos y todo tipo de contenidos en la web.• Contenido. Temas generales hasta específicos.• Preguntas que pueden contestar al usuario: • Necesito documentos sobre un tema específico. • Requiero tres artículos sobre un autor en especial. • ¿Cuál es el mejor reproductor de MP3 en el mercado mexicano?
  • 9. • Google: http://www.google.com/• Yahoo: http://www.yahoo.com/• Altavista: http://www.altavista.com/• Ask antes “Ask Jeeves”: http://www.ask.com/
  • 10. • Definición. Motores de búsqueda que exploran y recuperan información de diferentes motores de búsqueda.• Kasi, Vijay and Radhika Jain. "Internet Search Engines. " Encyclopedia of E- Commerce, E-Government and Mobile Commerce. Mehdi Khosrow-Pour. Vol. 1. Hershey, PA: Idea Group Reference, 2006. [672]-677. Gale Virtual Reference Library. Gale. Universidad de Las Americas Puebla. 1 Sept. 2009 <http://go.galegroup.com/ps/start.do?p=GVRL&u=udlap>.• Propósito. Encontrar documentos en diferentes motores de búsqueda para integrarlos en una sola lista de resultados.• Contenido. Temas generales hasta específicos.• Preguntas que pueden contestar al usuario: • Necesito documentos de diferentes fuentes sobre un tema general. • Requiero tres artículos sobre un autor en especial.
  • 11. • Académicos • Scirus: http://www.scirus.com/ • Google Scholar: http://scholar.google.com/• Libros electrónicos • Google Books: http://books.google.com/• Temáticos • Negocios: Business: http://www.business.com/ • Química: Chemindustry: http://www.chemindustry.com/ • Fotografía: OpenPhoto: http://openphoto.net/ • Picsearch: http://www.picsearch.com/
  • 12. • Buscadores: es posible recuperar información más exacta pero tienen una menor cobertura.• Metabuscadores: Es posible recuperar mayor información no significativa pero tienen una mayor cobertura por acceder a diferentes bases de datos.
  • 13. • MetaCrawler: http://www.metacrawler.com/• DonBusca: http://www.donbusca.com/• Clusty: http://clusty.com/• KartOO: http://www.kartoo.com/• Dogpile: http://www.dogpile.com/
  • 14. • Definición. Listados (sistematizados) de vínculos a diferentes sitios en Internet.• Propósito. Proporcionar listados temáticos organizados por categorías sobre sitios en Internet.• Contenido. Temas generales hasta específicos.• Preguntas que pueden contestar al usuario: • Necesito consultar diferentes sitios sobre un tema en particular. • Quiero explorar los principales sitios de defensa del medio ambiente.
  • 15. • YellowPages: http://www.yellowpages.com/• The Environment Directory: http://www.webdirectory.com/
  • 16. • Definición. Información de producción local generada por las empresas, instituciones y organizaciones la cuál no ha sido publicada por ningún medio.• Propósito. Difundir de manera inmediata los resultados de estudios e investigaciones.• Contenido. Académico, oficial, institucional, económico y mercantil.• Preguntas que pueden contestar al usuario: • Necesito consultar información reciente sobre un tema. • Quiero consultar las tendencias de investigación en nanotecnología.
  • 17. ARXIV.ORG: Creado en la Universidad de Cornell.Materiales preimpresos en física, matemáticas eingeniería.http: //www.arxiv.org
  • 18. • Definición. Es una iniciativa para difundir y organizar la literatura gris disponible en la web.• "Digital Information Sources." Digital Libraries: Principles and Practices in a Global Environment. Ed. Lucy A. Tedd and Andrew Large. Munich: K. G. Saur, 2005. [49]-83. Gale Virtual Reference Library. Gale. Universidad de Las Americas Puebla. 1 Sept. 2009 .• Propósito. Proporcionar acceso gratuito a contenidos científicos, académicos y arbitrados a la comunidad científica internacional.• Contenido. Investigaciones, reportes y artículos académicos para la revisión por pares.• Preguntas que pueden contestar al usuario: • Necesito consultar las investigaciones más recientes sobre fractales.
  • 19. Citebase:http://www.citebase.orgSherpa:http://www.sherpa.ac.uk/archives.html
  • 20. • Definición. Información, generalmente almacenada y accesible mediante bases de datos, que no es recuperable utilizando los buscadores convencionales. Web invisible.(2009). Documento recuperado de Internet el 30 de junio de 2009. Disponible en: http://www.internetinvisible.com/ii/index.php?option=com_content&task=vie w&id=2633&Itemid=308• Propósito. Encontrar documentos no accesibles y no localizables por medio de los buscadores de la web tradicional.• Contenido. Temas generales hasta específicos.• Preguntas que pueden contestar al usuario: • Necesito documentos académicos sobre un tema específico. • Requiero artículos sobre las tendencias de investigación en determinada área del conocimiento.
  • 21. • SearchEngineWatch: http://www.searchenginewatch.com• Listados de buscadores especializados.• Evaluación mensual de buscadores.• Tips de búsqueda.• Estadísticas.
  • 22. Búsqueda Web de contenido. En el Web existen variados documentos, hipertexto, imágenes, vídeos,audio, símbolos, datos, meta-datos, link, textos, pdf y muchos otros, que dificulta su clasificación. Laminería de contenido del Web trata de extraer información relevante sobre el contenido del Web, convista a su clasificación y mejor organización de este, para posteriormente perfeccionar el acceso y larecuperación de la información.Búsqueda Web de estructura. Permite conocer cómo se organiza un Web, cómo se estructura y cómoocurre la navegación en ella.Búsqueda de uso Web. Tiene como principal objetivo extraer patrones de uso del Web por parte delos usuarios. Para esto, se utilizan los archivos Log (registros de sucesos/eventos) de los servidoresWeb. Este tipo de minería tiene dos objetivos principales:  Extraer patrones generales de uso de un sitio Web de manera que pueda reestructurarse para que sea más fácil de utilizar y mejore el acceso por parte de los usuarios.  Obtener perfiles de los distintos tipos de usuarios a partir de su comportamiento y navegación, para ofrecer una atención más personalizada.
  • 23. La minería de uso Web presenta cuatro fases fundamentales:1. Recolección de datos- búsqueda. Consiste en la recuperación automática de la información relevante para su posterior procesamiento.2. Procesamiento de los datos. Una vez recuperados los documentos, se ordenan y se preparan para la próxima etapa; se utilizan herramientas para obtener información valiosa en forma automática.3. Descubrimiento de patrones. Existen múltiples técnicas, aplicables al descubrimiento de patrones. Entre ellas, para el agrupamiento y clasificación, para el establecimiento de reglas de asociación y el hallazgo de secuencias frecuentes.4. Análisis de patrones. Comprende la interpretación y validación de los patrones.
  • 24. Entre las técnicas utilizadas se encuentran:3Agrupamiento y clasificación. Las técnicas de agrupamiento o clustering distribuyencomportamientos de individuos similares en grupos homogéneos, es decir, doselementos con características similares pertenecerán al mismo grupo y lascaracterísticas de un grupo (definidas por el elemento prototipo o ideal) serán diferentesa las de otro grupo. En dependencia de la información almacenada en los ficheros Log,es posible detectar grupos de usuarios como:  ● Aquellos que visitan gran cantidad de páginas con un tiempo de estancia similar en todas ellas.  ● Los que visitan un número pequeño de páginas en sesiones cortas.  ● Los que visitan un número pequeño-mediano de páginas con tiempo variable en cada una de ellas.
  • 25. • Una vez descubiertos los prototipos o perfiles de cada grupo, se pueden utilizar las características de cada uno de ellos para realizar la clasificación.• En las búsquedas Web, las técnicas de clasificación permiten desarrollar un perfil para clientes/usuarios que acceden a ficheros particulares del servidor, en función de sus patrones de acceso.• La información en los que ocurren transacciones de datos puede resultar como técnica que permite relacionarse sin que exista intervención alguna por parte de algún operador. El descubrimiento de estas reglas ayuda a las organizaciones dedicadas al desarrollo de plataformas en líneas como e- banking, e-commerce, e-learning todas permiten a definir estrategias de mercado efectivas y de desarrollo particular .
  • 26. 1. Extracción de los conjuntos de ítems que cumplen con la cobertura requerida a partir de los datos.2. Generación de las reglas a partir de estos documentos.Secuencias frecuentes. La minería de secuencias permite descubrir el tiempo de lassecuencias ordenadas de URLs que han seguido los usuarios y predecir los futuros. Engeneral, en las bases de datos de transacciones están disponibles los datos en unperíodo de tiempo y se dispone de la fecha en que se realizó la transacción. Eldescubrimiento de patrones de secuencia (sequential patterns) en el Log puede utilizarsepara predecir las futuras visitas y así poder organizar mejor los accesos y publicidadespara determinados períodos de tiempo. Por ejemplo, los días laborables entre las 9 a.m.y las 12 m., muchas de las personas que accedieron al servidor lo hicieron para ver lasofertas, y en los siguientes días la mayoría compró productos. Entonces, por lasmañanas se debería facilitar el acceso a las ofertas y brindar lapublicidad más llamativa posible.
  • 27. • Realice una propuesta informativa que pueda integrar los términos: Educación, Arte, Religión, Enfermería, consultoría, tecnología, deporte y militar.• La propuesta debe ser una revista digital de 2 o 3 páginas que debe ser diseñada en word o powerpoint.• Coloque un nombre atractivo para que su contenido sea leído.• Conformar grupos de 3 o 4 personas.• Enviarlo por correo de contacto. Ing. Waleska Perdomo Cáceres Msc www.lineadeinvestigacion.blogspot.com

×