Your SlideShare is downloading. ×
Bases de Datos Documentales
Bases de Datos Documentales
Bases de Datos Documentales
Bases de Datos Documentales
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Bases de Datos Documentales

2,566

Published on

Introducción a las Bases de Datos Documentales en Linux

Introducción a las Bases de Datos Documentales en Linux

Published in: Technology
0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
2,566
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
4
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Bases de datosdocumentalesEste tipo de base de datos esta orientada exclusivamente a gestionar de forma efectivael almacenamiento y acceso a documentos.Las bases de datos orientadas a documentos no almacenan datos en esquemasestrictos ni usan tablas con campos uniformes.Introducción Evolución de las bases deEl manejo de información a través de bases datosde datos ha sido unos de los campos de Desde sus inicios las bases de datos hanmayor aplicación dentro de la informática. A tenido una serie de cambios y características,lo largo de los años se han desarrollado que han determinado la presencia denumerosos manejadores de datos como: distintos tipos de base de datos yOracle, Informix, SQL server, PostgreSQL, almacenamiento, de entre las cualesMySQL, etc. que permiten de una manera podemos destacar:fácil y eficiente manipular los datos, es decir:introducir, modificar, buscar, eliminar, generar ✔ Bases de datos flatreportes etc.. ✔ Bases de datos JerárquicasPor lo general operan instalados en un ✔ Bases de datos de redservidor de datos al cual se conectannumerosos usuarios denominados clientes ✔ Bases de datos relacionalespor medio de un red local tipo Intranet. ✔ Bases de datos dimensionalesDesde hace varios años las herramientas ✔ Bases de datos orientadas a objetosinformáticas han avanzado enormemente, enrelación a los manejadores de datos vemos ✔ Bases de datos orientadas acomo podemos trabajar con nuevos tipos de documentoscampos como gráficos, animación y sonido,los cuales antes eran imposibles de manejar;esto ha producido verdaderas bases de datos Bases de datos relacionalesmultimedios. Hoy en día la mayoría de los SGBD sonOtro aspecto donde se ha notado una relacionales, éstas están diseñadas paraevolución importante es en la posibilidad de almacenar y hacer informes sobre datosconectar estas bases de datos a la Internet fuertemente estructurados (esquemasde manera directa y transparente. La estrictos) e interrelacionados. Su objetivo esinformación puede traspasar la barrera de la la de dotar mayor seguridad, másintranet y ser manejada de forma más amplia posibilidades y supuestamente estarpor un mayor número de usuarios usando un preparados para afrontar la sobrecarga,navegador (browser), a esto se ha sumado adicionalmente permiten disponer de unauna nueva forma de almacenar los datos, funcionalidad distribuida.pudiendo ser esta de forma natural (sincambios) y no estructurada, queparadójicamente parecería lo opuesto a lo Base de datos orientada aque estamos acostumbrados hasta hoy en documentosdía. A diferencia de las bases de datos relacionales, las bases de datos orientadas a
  • 2. documentos no almacenan datos en tablas un conjunto homogéneo de documentos quecon campos uniformes para cada fila o pueden encontrarse en cualquier soporteregistro (no tiene un esquema estricto). (papel, magnético, óptico, etc)Este tipo de base de datos esta orientadaexclusivamente a almacenar y gestionar Funciones básicas deldocumentos. Cada documento esalmacenado de forma que tenga ciertas análisis documentalcaracterísticas, cualquier número o tipo de Entre las funciones básicas del análisiscampos pueden ser añadidos a un documental se encuentran el:documento, e incluso contener varios tiposde datos.Dentro las bases de datos orientadas a ✔ Almacenar la información documentaldocumentos se hace un uso intensivo de ypares clave/valor, considerándose a la base ✔ Facilitar su recuperaciónde datos como un conjunto de identificadoresy documentos, y los documentos a su vezcomo un conjunto de de campos y valores. Conceptos básicos delLos pares clave/valor son muy usados en análisis documentalcloud computing (computación de la nube),un buen ejemplo de esto es el algoritmo Map/ Dos elementos importantes dentro delReduce; adicionalmente las bases de datos análisis documental son:documentales pueden ser consideradas ✔ La indexación ytambién como tablas hash y son optimizadaspara datos accedidos mediante clave ✔ El lenguaje documentalprimaria.El no contar con una estructura estricta las Niveles del análisishace mas eficientes al momento de manejar documentalgrandes volúmenes de documentos. Y laausencia de relaciones, facilita la replicación En el análisis documental se realiza a tresde datos, pero denota la dificultad para niveles de detalle:expresar modelos complejos. ✔ Asiento: Se determinan los identificadores de la informaciónSGBDD (título, autor, etc) ✔ Descriptores: Se extraen lasUna Sistema de Gestión de Bases de Datos palabras clave más representativasDocumentales se ocupa de la gestión de (indexación)documentos optimizando el almacenaje yfacilitando su recuperación. ✔ Resumen (o abstract): Resumen analítico del texto integro para hacerA diferencia de cualquier otro SGBD, un más fácil la consultaSGBDD no realiza ningún tratamiento sobrela información, simplemente la almacena y Tesauros es un lenguaje documental queposibilita su recuperación. incluye relaciones semánticas de tres tipos: ✔ Relaciones de equivalenciaQue es un documento ✔ Relaciones jerárquicas (términoUn conjunto de información o conocimiento general y término específico)humano: un libro, una revista, una factura, ✔ Relaciones asociativas (términosuna cédula de identidad, una conferencia relacionados)editada, una cinta de vídeo, un disco, etc.En consecuencia, un fondo documental será
  • 3. Bases de datos orientadas a Ventajasdocumentos o NoSQL ✔ No están sujetas a esquemas estrictosNoSQL es un término que representa yengloba a las bases de datos no relacionales ✔ Poseen un lenguaje de consultao las orientadas a documentos y cuyo uso se orientado al lenguaje naturalha extendido rápidamente, junto con la ✔ Extrema sencillez en el escaladopopularidad de este tipo de bases de datos. horizontal.Ejemplo de diferencias de SQL y NoSQLA continuación mostramos un ejemplo de las diferencias de almacenamiento y tratamiento entrelas bases de datos relacionales y no relacionales.Base de datos orientada a documentos: Clave Documento 63 Nombre: Esteban; Apellidos: Saavedra; Nacionalidad: Boliviana 64 Nombre: Francisco; Apellidos: Torrez; Nacionalidad: Portuguesa; Edad: 39; 65 Nombre: Jorge; Nacionalidad: ChilenaBase de datos relacional: Clave Nombre Apellidos Nacionalidad Edad 63 Esteban Saavedra Boliviana 64 Francisco Torrez Portuguesa 39 65 Jorge ChilenaEn el ejemplo podemos ver que en la base de datos NoSQL, los campos vacíos no se añaden yque se pueden añadir campos concretos a documentos concretos, sin tener que aumentar elnúmero de columnas.Tipos de almacenamiento Aplicaciones deEn la actualidad existen varios tipos de almacenamiento clave/valoralmacenamiento, entre los que destacan: ✔ Voldemort ✔ Clave/valor, almacenamiento ✔ Scalaris distribuido en tablas hash (DHT) ✔ Tokyo Cabinet ✔ Orientados a documentos ✔ Redis ✔ Orientados a columnas ✔ MemcacheDB
  • 4. Aplicaciones de de datos orientadas a documentos.almacenamiento orientados En el próximo número comenzaremos a describir algunas aplicaciones de origena documentos opensource orientadas a la gestión de ✔ CouchDB documentos, considerando sus características propias, su instalación y ✔ MongoDB manejo. ✔ SimpleDB (Amazon) AutorAplicaciones dealmacenamiento orientado acolumnas ✔ BigTable (Google) ✔ HBase (Hadoop Database) ✔ Hypertable (BigTable Open Source clone) Esteban Saavedra López ✔ Cassandra (Facebook) Presidente de la Fundación AtixLibre (Bolivia) Activista de Software Libre en Bolivia jesaavedra@opentelematics.orgConsideraciones esteban.saavedra@atixlibre.orgSiempre es recomendable que antes de http://jesaavedra.opentelematics.orgponer en marcha cualquier tipo de aplicación, http://www.atixlibre.orges recomendable inicialmente tener claroalgunos conceptos relacionados, por lo quehemos dedicado este primer número abrindar una pequeña introducción a las bases

×