Una breve panorámica sobre el contexto en el que surgen las bases de datos NoSQL, las limitaciones de los sistemas de gestión de bases de datos relacionales que las soluciones NoSQL intentan superar, así como una presentación de los principales productos NoSQL.
Este documento presenta una introducción a las bases de datos NoSQL y MongoDB. Explica brevemente qué son las bases de datos NoSQL, sus características principales como la escalabilidad horizontal y la consistencia eventual. Luego se enfoca en MongoDB describiendo sus componentes como Mongod y Mongos, y su modelo de datos basado en documentos con esquema flexible. Finalmente, menciona algunos videos demostrativos sobre MongoDB.
Curso impartido en Curso de Verano Big Data & Data Science, Universidade de Santiago de Compostela, CITIUS (http://www.citius.usc.es/), 18 de Julio 2013
Conceptos básicos de NoSQL. Introducción a Cassandra, CouchDB, MongoDB y Neo4j.
Estamos uniendo el internet de las cosas con Cassandra para crear espacios inteligentes que nos permitan ahorrar y optimizar nuestros recurso. Si te gusta Arduino y Big Data, esta es tu charla.
Marcos Vecino Rosado
Ingeniero en informática, trabajo en la Universidad de Extremadura en el departamento GIM (Grupo Ingeniería de Medios) diseñando dispositivos y el sistema de información de la iniciativa SmartPolitech.
Este documento introduce las bases de datos NoSQL orientadas a documentos, incluyendo que almacenan información en pares clave-valor y documentos en formato JSON, y describen el teorema CAP. También discute ejemplos como MongoDB y CouchDB, modelado con este tipo de bases de datos, y proyectos y artículos relacionados.
Te explicamos el qué se considera un Modelo No Relacional. Clasificando los tipos de Bases de Datos: Orientadas a Clave-Valor, Columna, Documentos o Grafos. Además te enseñamos con qué Bases de Datos trabajamos en BEEVA: Bases de Datos como Servicio en AWS y Bases de Datos Open Source.
Breve introducción a las bases de datos NoSQL, es decir, no relacionadas, que tuvo lugar en @cycle_it durante uno de los laboratorios de innovación.
Se trataron las bases de datos NoSQL, hablando de las principales categorías: Columna, Documento, Clave-Valor y Grafo. Se mencionan algunos ejemplos de vendedores en cada categoría como Cassandra, Hadoop/HBase, Redis, MongoDB, Riak, Neo4J, etc.
El segmento de la base de datos está evolucionando, al mismo tiempo que vemos como nuevos, almacenes escalables de datos emergen. Key value stores, grandes columnas de almacenamiento y bases de datos orientados en documentos, ofrecen una alternativa atractiva a la base de datos relacional tradicional. Evitando las suposiciones tradicionales sobre los cuales se construyeron las bases de datos anteriores, esta nueva clase de soluciones de no-relacionales o "NoSQL" adquieren la capacidad de escalar horizontalmente. Además, las soluciones NoSQL ofrecen alternativas interesantes al modelo tradicional de datos relacional.
Esta presentación mostrara a los asistentes, los conceptos claves y necesarios para comprender y evaluar los almacenes de datos NoSQL. Vamos a explorar las diferencias fundamentales que existen entre las diversas clases de soluciones NoSQL y que concluyen con un examen en profundidad, de la base de datos MongoDB orientada a documentos.
Esta presentación incluirá:
Orígenes del movimiento NoSQL
Una visión general del segmento de NoSQL
La filosofía y la creación de MongoDB
MongoDB, arquitectura del sistema
MongoDB, ejemplos de uso
describe las diferencias entre mongodb y couchdb respecto a varias caracterícticas:
•Capacidad de modelación.
•Capacidad de consulta
•Replicación
•Fragmentación
•Tiempos de Respuestas
Este documento presenta una introducción a las bases de datos NoSQL y MongoDB. Explica brevemente qué son las bases de datos NoSQL, sus características principales como la escalabilidad horizontal y la consistencia eventual. Luego se enfoca en MongoDB describiendo sus componentes como Mongod y Mongos, y su modelo de datos basado en documentos con esquema flexible. Finalmente, menciona algunos videos demostrativos sobre MongoDB.
Curso impartido en Curso de Verano Big Data & Data Science, Universidade de Santiago de Compostela, CITIUS (http://www.citius.usc.es/), 18 de Julio 2013
Conceptos básicos de NoSQL. Introducción a Cassandra, CouchDB, MongoDB y Neo4j.
Estamos uniendo el internet de las cosas con Cassandra para crear espacios inteligentes que nos permitan ahorrar y optimizar nuestros recurso. Si te gusta Arduino y Big Data, esta es tu charla.
Marcos Vecino Rosado
Ingeniero en informática, trabajo en la Universidad de Extremadura en el departamento GIM (Grupo Ingeniería de Medios) diseñando dispositivos y el sistema de información de la iniciativa SmartPolitech.
Este documento introduce las bases de datos NoSQL orientadas a documentos, incluyendo que almacenan información en pares clave-valor y documentos en formato JSON, y describen el teorema CAP. También discute ejemplos como MongoDB y CouchDB, modelado con este tipo de bases de datos, y proyectos y artículos relacionados.
Te explicamos el qué se considera un Modelo No Relacional. Clasificando los tipos de Bases de Datos: Orientadas a Clave-Valor, Columna, Documentos o Grafos. Además te enseñamos con qué Bases de Datos trabajamos en BEEVA: Bases de Datos como Servicio en AWS y Bases de Datos Open Source.
Breve introducción a las bases de datos NoSQL, es decir, no relacionadas, que tuvo lugar en @cycle_it durante uno de los laboratorios de innovación.
Se trataron las bases de datos NoSQL, hablando de las principales categorías: Columna, Documento, Clave-Valor y Grafo. Se mencionan algunos ejemplos de vendedores en cada categoría como Cassandra, Hadoop/HBase, Redis, MongoDB, Riak, Neo4J, etc.
El segmento de la base de datos está evolucionando, al mismo tiempo que vemos como nuevos, almacenes escalables de datos emergen. Key value stores, grandes columnas de almacenamiento y bases de datos orientados en documentos, ofrecen una alternativa atractiva a la base de datos relacional tradicional. Evitando las suposiciones tradicionales sobre los cuales se construyeron las bases de datos anteriores, esta nueva clase de soluciones de no-relacionales o "NoSQL" adquieren la capacidad de escalar horizontalmente. Además, las soluciones NoSQL ofrecen alternativas interesantes al modelo tradicional de datos relacional.
Esta presentación mostrara a los asistentes, los conceptos claves y necesarios para comprender y evaluar los almacenes de datos NoSQL. Vamos a explorar las diferencias fundamentales que existen entre las diversas clases de soluciones NoSQL y que concluyen con un examen en profundidad, de la base de datos MongoDB orientada a documentos.
Esta presentación incluirá:
Orígenes del movimiento NoSQL
Una visión general del segmento de NoSQL
La filosofía y la creación de MongoDB
MongoDB, arquitectura del sistema
MongoDB, ejemplos de uso
describe las diferencias entre mongodb y couchdb respecto a varias caracterícticas:
•Capacidad de modelación.
•Capacidad de consulta
•Replicación
•Fragmentación
•Tiempos de Respuestas
Este documento presenta MongoDB, una base de datos NoSQL orientada a documentos. Explica las características principales de MongoDB, incluyendo consultas ad hoc, indexación, replicación, balanceo de carga y almacenamiento de archivos. También introduce conceptos clave de bases de datos NoSQL como eventual consistency, sharding y replication.
El documento resume las diferencias entre bases de datos SQL y NoSQL. Explica que SQL es para bases de datos relacionales mientras que NoSQL incluye bases de datos clave-valor, columnares, de documentos y gráficas diseñadas para escalabilidad. También discute cómo el tamaño y complejidad crecientes de los datos, así como la necesidad de escalar horizontalmente, han llevado al surgimiento de bases de datos NoSQL.
Uso de CouchDB como base de datos para soluciones que ameriten el manejo de gran cantidad de información a través de aplicaciones Android.
La presentación muestra una pequeña introducción sobre ¿Cómo conectarse y manejar bases de datos CouchDB en Android?
Las diapositivas fueron desarrolladas por mi persona para ExpoTech 2013 (31-01 al 01-02-2013) , en Puerto Ordaz - Venezuela.
El exponencial crecimiento de aplicaciones web, móviles y la entrada permanente de dispositivos conectados a internet trajo consigo un cambio en la administración de los datos y una transformación sin precedentes con respecto a como se hacía décadas atrás y de la forma como se diseñaba y operaba a nivel plataformas tecnológicas. Requerimientos provenientes de la nueva economía de Internet presionaron a las empresas emprendedoras de nuevos proyectos y soluciones, más allá de los límites de las bases de datos relacionales (RDBMS) e introdujeron un nuevo tipo de base de datos al dominio de los entornos tecnológicos: Las Arquitecturas de Tipo NoSQL.
Hay un largo camino por recorrer antes de contemplar la posibilidad de implementar una solución en una plataforma que para nuestro entorno local es totalmente nueva y está relacionado con el hecho del poco o ningún conocimiento o referencia de implementaciones que se tiene sobre las mismas.
Es por eso que se habla de un cambio de paradigma, dado que es un nuevo planteamiento para construir, implementar y soportar arquitecturas de TI de alcance masivo. Hoy estamos acostumbrados que muchos temas sean hechos a veces incuestionables, es el resultado de campañas de mercadeo y ventas de la oferta, que unido a la resignación de la demanda que ha creído y crecido pensando que no hay nada mejor disponible.
El exponencial crecimiento de aplicaciones web, móviles y la entrada permanente de dispositivos conectados a internet trajo consigo un cambio en la administración de los datos y una transformación sin precedentes con respecto a como se hacía décadas atrás y de la forma como se diseñaba y operaba a nivel plataformas tecnológicas. Requerimientos provenientes de la nueva economía de Internet presionaron a las empresas emprendedoras de nuevos proyectos y soluciones, más allá de los límites de las bases de datos relacionales (RDBMS) e introdujeron un nuevo tipo de base de datos al dominio de los entornos tecnológicos: Las Arquitecturas de Tipo NoSQL.
Hay un largo camino por recorrer antes de contemplar la posibilidad de implementar una solución en una plataforma que para nuestro entorno local es totalmente nueva y está relacionado con el hecho del poco o ningún conocimiento o referencia de implementaciones que se tiene sobre las mismas.
Es por eso que se habla de un cambio de paradigma, dado que es un nuevo planteamiento para construir, implementar y soportar arquitecturas de TI de alcance masivo. Hoy estamos acostumbrados que muchos temas sean hechos a veces incuestionables, es el resultado de campañas de mercadeo y ventas de la oferta, que unido a la resignación de la demanda que ha creído y crecido pensando que no hay nada mejor disponible.
Este documento presenta conceptos básicos sobre bases de datos NoSQL. Explica el movimiento NoSQL y cómo surgió para satisfacer las necesidades de escalabilidad de aplicaciones con grandes volúmenes de datos. También introduce el Teorema CAP, que establece que un sistema distribuido solo puede proporcionar dos de las siguientes tres propiedades: consistencia, disponibilidad y tolerancia a particiones. Además, contrasta las propiedades ACID de las bases de datos relacionales con las propiedades BASE más flexibles de las bases de datos NoSQL.
Les presento una síntesis para comprender que son y en que se diferencian las bases de datos SQL y NoSQL ¿Puede un especialista en Informática Médica ignorar el estándar SQL?
Este documento presenta la licencia del libro MongoDB y proporciona información sobre el autor. El libro se distribuye bajo una licencia Creative Commons que permite la copia y distribución del libro siempre que se acredite al autor y no se use con fines comerciales. El autor Karl Seguin es un desarrollador con experiencia en varias tecnologías incluyendo .NET y Ruby, y ha contribuido a proyectos relacionados con MongoDB.
Este documento ofrece una introducción a las bases de datos NoSQL y Apache Cassandra. Explica que las bases de datos NoSQL difieren de las bases de datos relacionales tradicionales en que no requieren esquemas fijos, evitan operaciones JOIN y escalan horizontalmente. Luego describe las características clave de Cassandra, incluyendo su modelo de datos orientado a columnas y su capacidad de alta disponibilidad y tolerancia a fallos a través de la replicación distribuida de datos. Finalmente, contrasta el modelo de datos y consultas de Cassandra con las bases de datos rel
Este documento presenta una agenda para un curso sobre bases de datos NoSQL. El curso introducirá conceptos como cloud computing y bases de datos distribuidas, y luego cubrirá tipos específicos de bases de datos NoSQL como clave-valor, orientadas a documentos y sus ventajas y desventajas. También analizará ejemplos como Apache Cassandra, Apache CouchDB y MongoDB, y la integración con bases de datos relacionales.
El documento habla sobre diferentes tipos de bases de datos y arquitecturas para almacenar y procesar datos a gran escala. Explica las diferencias entre datos estructurados, semi-estructurados y no estructurados y describe varios enfoques como bases de datos orientadas a documentos, grafos, columnas, en memoria, distribuidas y su aplicación en sistemas como MongoDB, Neo4j, Cassandra y Hypertable. Finalmente, compara el rendimiento de Hypertable frente a HBase para diferentes tipos de operaciones.
MongoDB es un sistema de base de datos NoSQL orientado a documentos de alto rendimiento y esquema flexible. Ofrece características como velocidad, facilidad de uso, escalabilidad y replicación. Se puede descargar gratuitamente y ejecutar en varias plataformas. Almacena datos en documentos similares a registros, lo que lo hace fácil de entender para desarrolladores acostumbrados a bases de datos relacionales.
Este documento describe MapReduce y MongoDB. MapReduce es un modelo de programación para procesamiento paralelo de grandes conjuntos de datos. Consiste en dos funciones, Map y Reduce. MongoDB es una base de datos NoSQL orientada a documentos que almacena datos en formato BSON de manera similar a JSON. Se utiliza para casos que requieren alta escalabilidad horizontal y almacenamiento de datos semiestructurados. El documento también explica conceptos como shards, réplicas y colecciones en MongoDB.
También conocido como no sólo sql (Not only sql) es una amplia clase de sistemas de gestión de datos, caracterizado por no usar SQL como el principal lenguaje de consultas. Capaz de almacenar grandes cantidades de datos facilitando un crecimiento horizontal, enfocándose en rendimiento más que en consistencia.
“NoSQL realmente es NoREL, es decir, Base de Datos No-Relacional”
Windows Azure es una plataforma de Microsoft para la nube que permite construir y alojar aplicaciones en los centros de datos de Microsoft. Proporciona servicios de computación, almacenamiento y bases de datos SQL. Las aplicaciones se desarrollan usando roles web y trabajador con diferentes lenguajes de programación como .NET, Java, PHP y se ejecutan de forma escalable en la nube de Microsoft.
El documento describe la evolución de las bases de datos, incluyendo RDBMS, data warehouse, NoSQL y MongoDB. Explica que MongoDB es una base de datos documental multiplataforma que provee alta performance, disponibilidad y escalabilidad. Los datos se almacenan como documentos BSON similares a JSON, con operaciones CRUD como insert, find, update y delete.
The document compares SQL and NoSQL databases, discussing their characteristics and use cases. It provides details on SQL databases, the scalability arguments for NoSQL, and tradeoffs of SQL features like ACID compliance in NoSQL systems. It also outlines several major types of NoSQL databases like key-value, column-oriented, document, and graph stores, comparing their data models, performance, scalability, and functionality. The document advises considering factors like the problem, costs, programming needs, and performance requirements when choosing a database type.
Este documento presenta MongoDB, una base de datos NoSQL orientada a documentos. Explica las características principales de MongoDB, incluyendo consultas ad hoc, indexación, replicación, balanceo de carga y almacenamiento de archivos. También introduce conceptos clave de bases de datos NoSQL como eventual consistency, sharding y replication.
El documento resume las diferencias entre bases de datos SQL y NoSQL. Explica que SQL es para bases de datos relacionales mientras que NoSQL incluye bases de datos clave-valor, columnares, de documentos y gráficas diseñadas para escalabilidad. También discute cómo el tamaño y complejidad crecientes de los datos, así como la necesidad de escalar horizontalmente, han llevado al surgimiento de bases de datos NoSQL.
Uso de CouchDB como base de datos para soluciones que ameriten el manejo de gran cantidad de información a través de aplicaciones Android.
La presentación muestra una pequeña introducción sobre ¿Cómo conectarse y manejar bases de datos CouchDB en Android?
Las diapositivas fueron desarrolladas por mi persona para ExpoTech 2013 (31-01 al 01-02-2013) , en Puerto Ordaz - Venezuela.
El exponencial crecimiento de aplicaciones web, móviles y la entrada permanente de dispositivos conectados a internet trajo consigo un cambio en la administración de los datos y una transformación sin precedentes con respecto a como se hacía décadas atrás y de la forma como se diseñaba y operaba a nivel plataformas tecnológicas. Requerimientos provenientes de la nueva economía de Internet presionaron a las empresas emprendedoras de nuevos proyectos y soluciones, más allá de los límites de las bases de datos relacionales (RDBMS) e introdujeron un nuevo tipo de base de datos al dominio de los entornos tecnológicos: Las Arquitecturas de Tipo NoSQL.
Hay un largo camino por recorrer antes de contemplar la posibilidad de implementar una solución en una plataforma que para nuestro entorno local es totalmente nueva y está relacionado con el hecho del poco o ningún conocimiento o referencia de implementaciones que se tiene sobre las mismas.
Es por eso que se habla de un cambio de paradigma, dado que es un nuevo planteamiento para construir, implementar y soportar arquitecturas de TI de alcance masivo. Hoy estamos acostumbrados que muchos temas sean hechos a veces incuestionables, es el resultado de campañas de mercadeo y ventas de la oferta, que unido a la resignación de la demanda que ha creído y crecido pensando que no hay nada mejor disponible.
El exponencial crecimiento de aplicaciones web, móviles y la entrada permanente de dispositivos conectados a internet trajo consigo un cambio en la administración de los datos y una transformación sin precedentes con respecto a como se hacía décadas atrás y de la forma como se diseñaba y operaba a nivel plataformas tecnológicas. Requerimientos provenientes de la nueva economía de Internet presionaron a las empresas emprendedoras de nuevos proyectos y soluciones, más allá de los límites de las bases de datos relacionales (RDBMS) e introdujeron un nuevo tipo de base de datos al dominio de los entornos tecnológicos: Las Arquitecturas de Tipo NoSQL.
Hay un largo camino por recorrer antes de contemplar la posibilidad de implementar una solución en una plataforma que para nuestro entorno local es totalmente nueva y está relacionado con el hecho del poco o ningún conocimiento o referencia de implementaciones que se tiene sobre las mismas.
Es por eso que se habla de un cambio de paradigma, dado que es un nuevo planteamiento para construir, implementar y soportar arquitecturas de TI de alcance masivo. Hoy estamos acostumbrados que muchos temas sean hechos a veces incuestionables, es el resultado de campañas de mercadeo y ventas de la oferta, que unido a la resignación de la demanda que ha creído y crecido pensando que no hay nada mejor disponible.
Este documento presenta conceptos básicos sobre bases de datos NoSQL. Explica el movimiento NoSQL y cómo surgió para satisfacer las necesidades de escalabilidad de aplicaciones con grandes volúmenes de datos. También introduce el Teorema CAP, que establece que un sistema distribuido solo puede proporcionar dos de las siguientes tres propiedades: consistencia, disponibilidad y tolerancia a particiones. Además, contrasta las propiedades ACID de las bases de datos relacionales con las propiedades BASE más flexibles de las bases de datos NoSQL.
Les presento una síntesis para comprender que son y en que se diferencian las bases de datos SQL y NoSQL ¿Puede un especialista en Informática Médica ignorar el estándar SQL?
Este documento presenta la licencia del libro MongoDB y proporciona información sobre el autor. El libro se distribuye bajo una licencia Creative Commons que permite la copia y distribución del libro siempre que se acredite al autor y no se use con fines comerciales. El autor Karl Seguin es un desarrollador con experiencia en varias tecnologías incluyendo .NET y Ruby, y ha contribuido a proyectos relacionados con MongoDB.
Este documento ofrece una introducción a las bases de datos NoSQL y Apache Cassandra. Explica que las bases de datos NoSQL difieren de las bases de datos relacionales tradicionales en que no requieren esquemas fijos, evitan operaciones JOIN y escalan horizontalmente. Luego describe las características clave de Cassandra, incluyendo su modelo de datos orientado a columnas y su capacidad de alta disponibilidad y tolerancia a fallos a través de la replicación distribuida de datos. Finalmente, contrasta el modelo de datos y consultas de Cassandra con las bases de datos rel
Este documento presenta una agenda para un curso sobre bases de datos NoSQL. El curso introducirá conceptos como cloud computing y bases de datos distribuidas, y luego cubrirá tipos específicos de bases de datos NoSQL como clave-valor, orientadas a documentos y sus ventajas y desventajas. También analizará ejemplos como Apache Cassandra, Apache CouchDB y MongoDB, y la integración con bases de datos relacionales.
El documento habla sobre diferentes tipos de bases de datos y arquitecturas para almacenar y procesar datos a gran escala. Explica las diferencias entre datos estructurados, semi-estructurados y no estructurados y describe varios enfoques como bases de datos orientadas a documentos, grafos, columnas, en memoria, distribuidas y su aplicación en sistemas como MongoDB, Neo4j, Cassandra y Hypertable. Finalmente, compara el rendimiento de Hypertable frente a HBase para diferentes tipos de operaciones.
MongoDB es un sistema de base de datos NoSQL orientado a documentos de alto rendimiento y esquema flexible. Ofrece características como velocidad, facilidad de uso, escalabilidad y replicación. Se puede descargar gratuitamente y ejecutar en varias plataformas. Almacena datos en documentos similares a registros, lo que lo hace fácil de entender para desarrolladores acostumbrados a bases de datos relacionales.
Este documento describe MapReduce y MongoDB. MapReduce es un modelo de programación para procesamiento paralelo de grandes conjuntos de datos. Consiste en dos funciones, Map y Reduce. MongoDB es una base de datos NoSQL orientada a documentos que almacena datos en formato BSON de manera similar a JSON. Se utiliza para casos que requieren alta escalabilidad horizontal y almacenamiento de datos semiestructurados. El documento también explica conceptos como shards, réplicas y colecciones en MongoDB.
También conocido como no sólo sql (Not only sql) es una amplia clase de sistemas de gestión de datos, caracterizado por no usar SQL como el principal lenguaje de consultas. Capaz de almacenar grandes cantidades de datos facilitando un crecimiento horizontal, enfocándose en rendimiento más que en consistencia.
“NoSQL realmente es NoREL, es decir, Base de Datos No-Relacional”
Windows Azure es una plataforma de Microsoft para la nube que permite construir y alojar aplicaciones en los centros de datos de Microsoft. Proporciona servicios de computación, almacenamiento y bases de datos SQL. Las aplicaciones se desarrollan usando roles web y trabajador con diferentes lenguajes de programación como .NET, Java, PHP y se ejecutan de forma escalable en la nube de Microsoft.
El documento describe la evolución de las bases de datos, incluyendo RDBMS, data warehouse, NoSQL y MongoDB. Explica que MongoDB es una base de datos documental multiplataforma que provee alta performance, disponibilidad y escalabilidad. Los datos se almacenan como documentos BSON similares a JSON, con operaciones CRUD como insert, find, update y delete.
The document compares SQL and NoSQL databases, discussing their characteristics and use cases. It provides details on SQL databases, the scalability arguments for NoSQL, and tradeoffs of SQL features like ACID compliance in NoSQL systems. It also outlines several major types of NoSQL databases like key-value, column-oriented, document, and graph stores, comparing their data models, performance, scalability, and functionality. The document advises considering factors like the problem, costs, programming needs, and performance requirements when choosing a database type.
The document provides an overview of SQL vs NoSQL databases. It discusses how RDBMS systems focus on ACID properties to ensure consistency but sacrifice availability and scalability. NoSQL systems embrace the CAP theorem, prioritizing availability and partition tolerance over consistency to better support distributed and cloud-scale architectures. The document outlines different NoSQL database models and how they are suited for high volume operations through an asynchronous and eventually consistent approach.
NoSQL databases get a lot of press coverage, but there seems to be a lot of confusion surrounding them, as in which situations they work better than a Relational Database, and how to choose one over another. This talk will give an overview of the NoSQL landscape and a classification for the different architectural categories, clarifying the base concepts and the terminology, and will provide a comparison of the features, the strengths and the drawbacks of the most popular projects (CouchDB, MongoDB, Riak, Redis, Membase, Neo4j, Cassandra, HBase, Hypertable).
This document discusses how to use Hazelcast to speed up database queries and operations. It introduces Hazelcast as an in-memory data grid that provides horizontal scalability. The author then explains how Hazelcast can be used to cache database queries for faster reads by integrating a MapStore. Updates and inserts can also be made faster using Hazelcast's write-behind functionality, which stores records asynchronously and writes to the database in the background. The document walks through integrating Hazelcast into an application in 4 steps and includes examples of querying a Hazelcast map and performing write operations.
El documento describe MongoDB, una base de datos NoSQL orientada a documentos. MongoDB almacena datos en formato BSON y permite esquemas dinámicos. Ofrece características como consultas ad-hoc, indexación, replicación, balanceo de carga y ejecución de JavaScript en el servidor.
El documento presenta un libro sobre programación orientada a objetos en PHP5. El libro fue escrito por Enrique Place y ha sido actualizado varias veces, con revisiones y contribuciones de lectores. El objetivo del libro es enseñar POO en PHP5 de forma simple y definitiva para que programadores PHP se conviertan en desarrolladores de sistemas.
Este documento presenta conceptos básicos sobre sistemas distribuidos, incluyendo definiciones de sistemas distribuidos, arquitecturas físicas y tipos, cloud computing, fragmentación y replicación de datos, y el paradigma MapReduce. También describe características de sistemas distribuidos como transparencia, niveles de transparencia, y tipos de sistemas distribuidos como clústeres y P2P.
Este documento presenta información sobre técnicas de bases de datos NoSQL como la disponibilidad, el consenso, la partición y la replicación. Explica el modelo de ordenación con marcas de tiempo multiversión MVCC de Reed, incluyendo cómo se manejan las lecturas y escrituras. También cubre algoritmos de elección como el anillo y el matón, y protocolos de consenso como Paxos, incluyendo sus roles, fases y propiedades. Por último, revisa modelos de replicación como el síncrono, asíncrono, copia primaria
Este documento proporciona una introducción a MongoDB, una base de datos NoSQL orientada a documentos. Explica brevemente qué es MongoDB y NoSQL, y describe características clave como consultas ad hoc, indexación, replicación y balanceo de carga. También incluye ejemplos de comandos básicos en MongoDB.
The document discusses SQL versus NoSQL databases. It notes that while SQL has been stable for relational databases, it may not be the best fit for new big data workloads that involve huge datasets in multiple formats that need easy scaling. NoSQL databases provide more flexibility in storage and easier scaling capabilities that are better suited for big data. The document recommends learning NoSQL and preparing to migrate data and code from SQL to a NoSQL model.
Do you need to scale your application, share data across cluster, perform massive parallel processing on many JVMs or maybe consider alternative to your favorite NoSQL technology? Hazelcast to the rescue! With Hazelcast distributed development is much easier. This presentation will be useful to those who would like to get acquainted with Hazelcast top features and see some of them in action, e.g. how to cluster application, cache data in it, partition in-memory data, distribute workload onto many servers, take advantage of parallel processing, etc.
Presented on JavaDay Kyiv 2014 conference.
Column-oriented databases store data by column rather than by row. This allows fast retrieval of entire columns of data with one read operation. Column-oriented databases are well-suited for analytical queries that retrieve many rows but only a few columns, as only the needed columns are read from disk. Row-oriented databases are better for transactional queries that retrieve or update individual rows. The type of data storage - row-oriented or column-oriented - depends on the types of queries that will be run against the data.
Modelos de datos relacionales y no relacionalesBEEVA_es
Este documento describe los modelos de datos relacionales y no relacionales. Explica las características de los modelos de datos no relacionales y los divide en cuatro categorías principales: orientados a clave/valor, orientados a documentos, orientados a columna y orientados a grafos. También discute el Teorema CAP y sus implicaciones para los modelos de datos no relacionales.
Hbase: Introduction to column oriented databasesLuis Cipriani
Big Data is getting more attention each day, followed by new storage paradigms. This presentation shows a fast intro to HBase, a column oriented database used by Facebook and other big players to store and extract knowledge of high volume of data.
This document provides an overview and introduction to NoSQL databases. It begins with an agenda that explores key-value, document, column family, and graph databases. For each type, 1-2 specific databases are discussed in more detail, including their origins, features, and use cases. Key databases mentioned include Voldemort, CouchDB, MongoDB, HBase, Cassandra, and Neo4j. The document concludes with references for further reading on NoSQL databases and related topics.
Este documento presenta una introducción al modelo de datos clave-valor. Explica que este modelo asocia claves con valores de forma eficiente, permitiendo el acceso rápido a los elementos almacenados mediante una clave. También describe algunas técnicas comunes como el hashing consistente para la distribución de datos en sistemas distribuidos, y presenta Redis como un caso de estudio, explicando sus operaciones, arquitectura, replicación y usos comunes.
El documento presenta diferentes técnicas para el control de concurrencia en bases de datos NoSQL, incluyendo exclusion mutua distribuida, bloqueos, control optimista de concurrencia y ordenación por marcas de tiempo. Explica algoritmos como Ricart-Agrawala y Maekawa para exclusión mutua distribuida, y el uso de marcas de tiempo multiversión (MVCC) para permitir lecturas concurrentes sin bloqueos. También cubre elección de líderes mediante algoritmos basados en anillos ante la caída del coordinador.
Este documento presenta una introducción a las bases de datos no relacionales y MongoDB. Comienza con un índice de los temas cubiertos, incluyendo introducción, panorama actual, cambio de escala, NoSQL, MongoDB y cómo comenzar con MongoDB. Luego describe brevemente el enfoque tradicional de bases de datos relacionales y sus fortalezas antes de discutir cómo los nuevos desafíos de escalabilidad y estructuras de datos dinámicas han llevado al surgimiento de las bases de datos no relacionales y NoSQL.
El documento describe el modelo de datos BigTable de Google. BigTable es un sistema de almacenamiento de datos distribuido y de alto rendimiento construido sobre Google File System. Almacena datos en tablas multidimensionales divididas en "tabletas" de 100-200 MB almacenadas en nodos. Esto permite escalabilidad horizontal al agregar nodos y tolerancia a fallos si un nodo falla.
Este documento presenta la información de un curso sobre bases de datos. Explica brevemente qué son las bases de datos, las bases de datos SQL y No-SQL, y analiza las bases de datos más populares (SQL Server, Oracle, Mongo DB, Oracle NoSQL, Cassandra) comparando sus características y ventajas. El autor concluye que el desarrollo del tema le permitió ampliar sus conocimientos sobre los diferentes tipos de bases de datos.
Este documento presenta la información de un curso sobre bases de datos. Explica brevemente qué son las bases de datos, las bases de datos SQL y No-SQL, y analiza las bases de datos más populares (SQL Server, Oracle, Mongo DB, Oracle NoSQL, Cassandra) comparando sus características y ventajas. El autor concluye que el desarrollo del tema le permitió ampliar sus conocimientos sobre los diferentes tipos de bases de datos.
Este documento proporciona información sobre bases de datos SQL y NoSQL. Explica que una base de datos SQL usa tablas relacionales con filas y columnas, mientras que una base de datos NoSQL no requiere un esquema fijo y puede almacenar datos semiestructurados. Luego compara varias bases de datos populares como SQL Server, Oracle, MongoDB, Cassandra y Oracle NoSQL, destacando sus ventajas y diferencias.
CouchDB es una base de datos NoSQL de código abierto basada en estándares web como HTTP, JSON y JavaScript. Los datos se almacenan en formato JSON y se organizan en pares clave-valor. CouchDB es flexible y escalable horizontalmente, lo que le permite manejar grandes volúmenes de datos de forma rápida y eficiente. Sin embargo, carece de algunas funciones de fiabilidad propias de bases de datos relacionales y no es compatible con consultas SQL.
Bases de datos NoSQL Multi-Modelos, caso de estudio: OrientDBWilmer Gonzalez
Este documento presenta un resumen de OrientDB, una base de datos NoSQL multi-modelo. Describe los conceptos básicos de las bases de datos NoSQL, incluyendo la arquitectura poli-glota y las arquitecturas lambda. Luego profundiza en el caso de estudio de OrientDB, una base de datos desarrollada desde 1998 que soporta múltiples modelos como documentos y grafos dentro de su motor de almacenamiento nativo. Finalmente, compara OrientDB con otras bases de datos y resume sus ventajas.
Este documento introduce los conceptos fundamentales del diseño de bases de datos, incluyendo el modelo entidad-relación y la normalización. Explica que el primer paso es analizar el problema y hablar con el cliente para entender sus necesidades. Luego, se debe seguir un proceso de modelado conceptual para representar gráficamente los datos y sus relaciones antes de crear tablas físicas. El objetivo es diseñar una base de datos segura, fiable y con buen rendimiento.
Este documento presenta el inicio de un curso sobre MySQL. Explica que tratará sobre fundamentos teóricos de bases de datos como el modelo entidad-relación y el modelo relacional, el trabajo con servidores MySQL, y el lenguaje SQL. También cubrirá la instalación de MySQL y las ventajas de usar este motor de base de datos.
El documento introduce las bases de datos NoSQL, discutiendo su importancia para la escalabilidad, las limitaciones del teorema CAP, y los tipos principales (grafos, documentales, columnas, clave-valor). Examina ejemplos de uso por empresas como Google, Facebook y Amazon. Finalmente, resume las ventajas y desventajas de varias soluciones NoSQL específicas.
El documento compara diferentes tipos de bases de datos, incluyendo SQL, NoSQL y bases de datos populares como SQL Server de Microsoft, Oracle, Mongo, Oracle NoSQL y Cassandra. Describe las ventajas y desventajas de cada uno, como el rendimiento, escalabilidad, costo y facilidad de uso.
Este documento describe las principales características de las bases de datos SQL y NoSQL. Explica que SQL es un lenguaje de consulta estructurada para bases de datos relacionales, mientras que NoSQL no utiliza SQL como lenguaje de consultas principal y puede almacenar datos de forma no estructurada. También señala que NoSQL surgió para solucionar los problemas de escalabilidad de las bases de datos relacionales ante el gran crecimiento de datos en la web 2.0.
Este documento describe las principales características de las bases de datos SQL y NoSQL. Explica que SQL es un lenguaje de consulta estructurada para bases de datos relacionales, mientras que NoSQL no utiliza SQL como lenguaje de consultas principal y puede almacenar datos de forma no estructurada. También señala que NoSQL surgió para solucionar los problemas de escalabilidad de las bases de datos relacionales ante el gran crecimiento de datos en la web 2.0.
CouchDB es una base de datos NoSQL orientada a documentos que ofrece alta disponibilidad y tolerancia a particiones. Almacena datos en formato JSON y proporciona replicación de datos, indexación con JavaScript, y una interfaz web llamada Futon. CouchDB es adecuada para aplicaciones que requieran disponibilidad aun cuando haya fallos de nodos o particiones de red.
El documento describe las bases de datos NoSQL como una alternativa a las bases de datos relacionales tradicionales para almacenar y recuperar grandes volúmenes de datos. Explica que las bases de datos NoSQL ofrecen mayor flexibilidad en los esquemas de datos y mejor escalabilidad horizontal. Además, identifica cuatro tipos principales de bases de datos NoSQL: clave-valor, documentales, de grafos y orientadas a objetos.
Con la ciencia en las Nubes
Present y futuro de la Nube Privada Corporativa del CSIC
Talk held in Techday Madrid, 2017. More info:
https://opennebula.org/community/techdays/techday-madrid-2017/
MySQL es un sistema de gestión de bases de datos relacionales que permite ejecutar acciones sobre las bases de datos desde acciones básicas hasta complejas. Un servidor MySQL es un servidor multiusuario rápido y robusto que permite que múltiples usuarios accedan y ejecuten tareas sobre las bases de datos al mismo tiempo de forma distribuida. El servidor MySQL fue desarrollado originalmente para manejar grandes bases de datos de forma más rápida que las soluciones existentes y ofrece funciones útiles como conectividad, velocidad y seguridad que lo hacen
Similar to Un acercamiento a las bases de datos NoSQL (20)
LINEA DE TIEMPO Y PERIODO INTERTESTAMENTARIOAaronPleitez
linea de tiempo del antiguo testamento donde se detalla la cronología de todos los eventos, personas, sucesos, etc. Además se incluye una parte del periodo intertestamentario en orden cronológico donde se detalla todo lo que sucede en los 400 años del periodo del silencio. Basicamente es un resumen de todos los sucesos desde Abraham hasta Cristo
Reporte homicidio doloso descripción
Reporte que contiene información de las víctimas de homicidio doloso registradas en el municipio de Irapuato Guanajuato durante el periodo señalado, comprende información cualitativa y cuantitativa que hace referencia a las características principales de cada uno de los homicidios.
La información proviene tanto de medios de comunicación digitales e impresos como de los boletines que la propia Fiscalía del Estado de Guanajuato emite de manera diaria a los medios de comunicación quienes publican estas incidencias en sus distintos canales.
Podemos observar cantidad de personas fallecidas, lugar donde se registraron los eventos, colonia y calle así como un comparativo con el mismo periodo pero del año anterior.
Edades y género de las víctimas es parte de la información que incluye el reporte.
Minería de Datos e IA Conceptos, Fundamentos y Aplicaciones.pdfMedTechBiz
Este libro ofrece una introducción completa y accesible a los campos de la minería de datos y la inteligencia artificial. Cubre todo, desde conceptos básicos hasta estudios de casos avanzados, con énfasis en la aplicación práctica utilizando herramientas como Python y R.
También aborda cuestiones críticas de ética y responsabilidad en el uso de estas tecnologías, discutiendo temas como la privacidad, el sesgo algorítmico y transparencia.
El objetivo es permitir al lector aplicar técnicas de minería de datos e inteligencia artificial a problemas reales, contribuyendo a la innovación y el progreso en su área de especialización.
Este documento ha sido elaborado por el Observatorio Ciudadano de Seguridad Justicia y Legalidad de Irapuato siendo nuestro propósito conocer datos sociodemográficos en conjunto con información de incidencia delictiva de las 10 colonias y/o comunidades que del año 2020 a la fecha han tenido mayor incidencia.
Existen muchas más colonias que presentan cifras y datos en materia de seguridad, sin embargo, en este primer acercamiento lo que se prevées darle al lector una idea de como se encuentran las colonias analizadas, tomando como referencia los datos del INEGI 2020, datos del Secretariado Ejecutivo del Sistema Nacional de Seguridad Pública del 2020 al 2023 y las bases de datos propias que desde el 2017 el Observatorio Ciudadano ha recopilado de manera puntual con datos de las vıć timas de homicidio doloso, accidentes de tránsito, personas lesionadas por arma de fuego, entre otros indicadores.
Encuesta CATI Verdad Venezuela abril 2024 (PÚBLICO).pdf
Un acercamiento a las bases de datos NoSQL
1. Un acercamiento a las bases de datos NoSQL
MSc. Javier Guillot Jiménez
Departamento de Programación
Facultad de Matemática y Computación
Universidad de La Habana
4 de octubre de 2015
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 1
2. Sumario
1 Introducción
Contexto actual
Necesidades actuales
2 NoSQL
Primeras propuestas
El término “NoSQL”
SGBDs NoSQL
3 Conclusiones
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 2
4. Introducción Contexto actual
Contexto actual
Las aplicaciones han evolucionado mucho en los últimos 15 años
Las grandes compañías web han crecido vertiginosamente en:
Cantidad de usuarios concurrentes
Volúmenes de datos procesados y almacenados
Explotación de datos semi-estructurados y no estructurados
La computación en la nube ha facilitado el acceso a servicios de
Internet que explotan diversos e inmensos volúmenes de datos
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 4
5. Introducción Contexto actual
Big Users
Couchbase. (2014, junio). Why NoSQL? Disponible en: http://info.couchbase.com/whyNoSQL-LP.html (10/07/2014)
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 5
6. Introducción Contexto actual
Big Users
Ventas mundiales de dispositivos según su tipo (miles de unidades)
Gartner, Inc. (2013, abril). Forecast: Devices by Operating System and User Type, Worldwide, 2010-2017, 1Q13 Update.
Consultado el 5 de agosto de 2014 desde http://www.gartner.com/resId=2396815
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 6
7. Introducción Contexto actual
The Internet of Things
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 7
8. Introducción Contexto actual
Big Data
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 8
9. Introducción Contexto actual
Big Data
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 8
10. Introducción Contexto actual
Big Data
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 8
11. Introducción Contexto actual
Big Data
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 8
12. Introducción Contexto actual
Big Data
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 8
13. Introducción Contexto actual
Big Data
Couchbase. (2014, junio). Why NoSQL? Disponible en: http://info.couchbase.com/whyNoSQL-LP.html (10/07/2014)
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 8
14. Introducción Contexto actual
Big Data
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 8
15. Introducción Contexto actual
Cloud computing
Couchbase. (2014, junio). Why NoSQL? Disponible en: http://info.couchbase.com/whyNoSQL-LP.html (10/07/2014)
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 9
16. Introducción Necesidades actuales
Necesidades actuales
¿Qué características deben tener los SGBDs de hoy día?
Sistemas cada vez más escalables
Sistemas con modelos de datos más flexibles
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 10
17. Introducción Necesidades actuales
Necesidades actuales
¿Qué características deben tener los SGBDs de hoy día?
Sistemas cada vez más escalables
Sistemas con modelos de datos más flexibles
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 10
18. Introducción Necesidades actuales
Escalamiento vertical vs. escalamiento horizontal
McCreary, D. (2013, 19 de noviembre). Making Sense of NoSQL. Disponible en: http://manning.com/mccreary (03/05/2014)
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 11
19. Introducción Necesidades actuales
Escalamiento vertical
Couchbase. (2014, junio). Why NoSQL? Disponible en: http://info.couchbase.com/whyNoSQL-LP.html (10/07/2014)
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 12
20. Introducción Necesidades actuales
Escalamiento horizontal
Couchbase. (2014, junio). Why NoSQL? Disponible en: http://info.couchbase.com/whyNoSQL-LP.html (10/07/2014)
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 13
21. Introducción Necesidades actuales
ACID
Atomicity - Consistency - Isolation - Durability
Una secuencia de operaciones (transacción):
Se ejecutará del todo o nada (A)
Una vez completada, la BD quedará en un estado en el que no se
viola ninguna restricción de integridad (C)
Las transacciones concurrentes son independientes y no se afectan
unas a otras (I)
Las modificaciones efectuadas por una transacción podrán recuperarse
ante fallas del sistema (D)
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 14
22. Introducción Necesidades actuales
ACID
Ejemplo de transacción
McCreary, D. & Kelly, A. (2013). Making Sense of NoSQL: A guide for managers and the rest of us. Shelter Island, NY:
Manning Publications Co.
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 15
23. Introducción Necesidades actuales
Teorema CAP
Brewer, E. A. (2000). Towards robust distributed systems. Trabajo presentado en PODC 2000, 16-19 de julio, Portland, Oregon.
Gilbert, S. & Lynch, N. (2002). Brewer’s conjecture and the feasibility consistent, available, partition-tolerant web services.
Newsletter ACM SIGACT News, 33(2), pp. 51-59.
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 16
24. Introducción Necesidades actuales
Teorema CAP
(C) Consistencia: siempre que un dato es actualizado, todos los usuarios
tienen acceso a esa última versión
(A) Disponibilidad: cualquier operación puede ser ejecutada sin demora
(P) Tolerancia a particiones: los datos son distribuidos a través de dos o
más nodos de la red y el sistema puede seguir funcionando,
incluso, cuando algunos de estos nodos son totalmente
inaccesibles
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 16
25. Introducción Necesidades actuales
Teorema CAP
McCreary, D. (2013, 19 de noviembre). Making Sense of NoSQL. Disponible en: http://manning.com/mccreary (03/05/2014)
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 16
26. Introducción Necesidades actuales
BASE
Basically Available, Soft state and Eventually consistent
Las aplicaciones trabajan prácticamente todo el tiempo (basically
available)
La BD no tiene que ser consistente en todo momento (soft state)
Pero si no ocurren nuevas actualizaciones sobre un determinado dato,
en algún momento todos los usuarios tendrán acceso a la versión más
actual de este (eventually consistent)
Fox, A.; Gribble, S. D.; Chawathe, Y. Brewer, E. A. & Gauthier, P. (1997, octubre). Cluster-Based Scalable Network Services.
En Proceedings of the Sixteenth ACM Symposium on Operating Systems Principles (SOSP-16), Saint-Malo, Francia.
Pritchett, D. (2008). Base: An Acid Alternative. Queue, 6(3), pp. 48-55. ACM.
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 17
27. Introducción Necesidades actuales
Necesidades actuales
¿Qué características deben tener los SGBDs de hoy día?
Sistemas cada vez más escalables
Sistemas con modelos de datos más flexibles
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 18
28. Introducción Necesidades actuales
Limitaciones del modelo relacional
Las BDRs requieren la definición de un esquema rígido que dificulta
representar datos semi-estructurados y no estructurados
Modificar el diseño de una BDR una vez que ha sido poblada con
nuevos datos constituye una tarea ardua que se evita acometer
Se minimiza la cantidad de espacio requerido para el almacenamiento
a expensas de un aumento de la complejidad para consultar los datos
Complicada red de interrelaciones dificulta distribuir las BDRs en
múltiples servidores y garantizar a la vez el rendimiento en su gestión
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 19
29. Introducción Necesidades actuales
Limitaciones del modelo relacional
Se ajusta poco al paradigma OO utilizado en la mayoría de los
lenguajes de programación actuales
Esta situación ha intentado ser resuelta desde hace años con las
BDOOs (Atkinson et al., 1989; Atwood, 1985; Derret et al., 1985)
Estas no lograron ser ampliamente usadas por desarrolladores y
usuarios en general
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 19
30. NoSQL
Sumario
1 Introducción
Contexto actual
Necesidades actuales
2 NoSQL
Primeras propuestas
El término “NoSQL”
SGBDs NoSQL
3 Conclusiones
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 20
31. NoSQL Primeras propuestas
Primeras propuestas
Google, Amazon, Facebook y LinkedIn fueron de las primeras
compañías en experimentar las limitaciones que imponían las
tecnologías relacionales
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 21
32. NoSQL Primeras propuestas
Primeras propuestas
Google, Amazon, Facebook y LinkedIn fueron de las primeras
compañías en experimentar las limitaciones que imponían las
tecnologías relacionales
2004
MapReduce: Simplified Data Processing on Large Clusters
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 21
33. NoSQL Primeras propuestas
Primeras propuestas
2004
MapReduce: Simplified Data Processing on Large Clusters
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 21
34. NoSQL Primeras propuestas
Primeras propuestas
2004
MapReduce: Simplified Data Processing on Large Clusters
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 21
35. NoSQL Primeras propuestas
Primeras propuestas
Google, Amazon, Facebook y LinkedIn fueron de las primeras
compañías en experimentar las limitaciones que imponían las
tecnologías relacionales
2004
MapReduce: Simplified Data Processing on Large Clusters
2006
Bigtable: A Distributed Storage System for Structured Data
“Bigtable is a distributed storage system for managing structured data
that is designed to scale to a very large size: petabytes of data across
thousands of commodity servers.”
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 21
36. NoSQL Primeras propuestas
Primeras propuestas
Google, Amazon, Facebook y LinkedIn fueron de las primeras
compañías en experimentar las limitaciones que imponían las
tecnologías relacionales
2007
Dynamo: Amazon’s Highly Available Key-Value Store
“. . . customers should be able to view and add items to their shopping cart
even if disks are failing, network routes are flapping, or data centers are
being destroyed by tornados.”
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 21
37. NoSQL Primeras propuestas
Primeras propuestas
Google, Amazon, Facebook y LinkedIn fueron de las primeras
compañías en experimentar las limitaciones que imponían las
tecnologías relacionales
2008
Cassandra – A Decentralized Structured Storage System
Propuesta inspirada en Bigtable y Dynamo
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 21
38. NoSQL Primeras propuestas
Primeras propuestas
Google, Amazon, Facebook y LinkedIn fueron de las primeras
compañías en experimentar las limitaciones que imponían las
tecnologías relacionales
2008
Cassandra – A Decentralized Structured Storage System
Propuesta inspirada en Bigtable y Dynamo
2008
Project Voldemort
Propuesta inspirada en Dynamo
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 21
39. NoSQL El término “NoSQL”
El término “NoSQL”
Empleado por primera vez en el año 1998 por Carlo Strozzi, para
referirse a un SGBDR que no utilizaba SQL
Retomado en 2009 para nombrar los congresos de los partidarios de
las BDs no relacionales, distribuidas y de código abierto (NoSQL
2009, en San Francisco)
Revista Computerworld:
“NoSQLers came to share how they had overthrown the tyranny of slow,
expensive relational databases in favor of more efficient and cheaper ways
of managing data.”
Computerworld. (2009, junio). No to SQL? Anti-database movement gains steam. Consultado el 10 de julio de 2014 desde
http://www.computerworld.com/s/article/9135086/No_to_SQL_Anti_database_movement_gains_steam
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 22
40. NoSQL El término “NoSQL”
El término “NoSQL”
NoSQL = ¿?
NoSQL = No to SQL
NoSQL = Not only SQL
Evans, E. (2009, 30 de octubre). NoSQL: What’s in a name? Consultado el 10 de julio de 2014 desde
http://www.deadcafe.org/2009/10/30/nosql_whats_in_a_name.html
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 23
41. NoSQL
Algunas opiniones
Eric Evans:
“The whole point of seeking alternatives is that you need to solve a
problem that relational databases are a bad fit for”
Evans, E. (2009, 30 de octubre). NoSQL: What’s in a name? Consultado el 10 de julio de 2014 desde
http://www.deadcafe.org/2009/10/30/nosql_whats_in_a_name.html
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 24
42. NoSQL
Algunas opiniones
Javier Soltero:
“Oracle would tell you that with the right degree of hardware and the right
configuration of Oracle RAC (Real Application Clusters) and other
associated magic software, you can achieve the same scalability. But at
what cost?”
Computerworld. (2009, junio). No to SQL? Anti-database movement gains steam. Consultado el 10 de julio de 2014 desde
http://www.computerworld.com/s/article/9135086/No_to_SQL_Anti_database_movement_gains_steam
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 24
43. NoSQL
Algunas opiniones
Nati Shalom:
“Cost pressure also forced many organizations to look at more
cost-effective alternatives, and with that came research that showed that
distributed storage based on commodity hardware can be even more
reliable than many of the existing high end databases”
Shalom, N. (2009, 15 de diciembre). The Common Principles Behind The NOSQL Alternatives. Consultado el 10 de julio de 2014
desde http://natishalom.typepad.com/nati_shaloms_blog/2009/12/the-common-principles-behind-the-nosql-alternatives.html
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 24
44. NoSQL
Tendencias de búsqueda de Google de los términos
“RDBMS” y “NoSQL”
Google. (2014, 13 de noviembre). Tendencias de búsqueda de Google - Interés en Búsqueda en la Web: nosql, rdbms - Todo el
mundo, 2004 - hoy. Consultado el 13/11/2014 desde http://www.google.com/trends/explore?q=NoSQL%2C+RDBMS
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 25
45. NoSQL SGBDs NoSQL
SGBDs NoSQL
Características generales
No requieren de la definición de un esquema de la BD
Almacenan los datos de forma no relacional
Están diseñados para arquitecturas distribuidas
Pueden ser instalados en servidores de bajo costo
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 26
46. NoSQL SGBDs NoSQL
Principales exponentes según su modelo de datos
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 27
47. NoSQL SGBDs NoSQL
Principales exponentes en el Cuadrante Mágico de Gartner
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 28
48. NoSQL SGBDs NoSQL
Principales exponentes en el Cuadrante Mágico de Gartner
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 28
49. NoSQL SGBDs NoSQL
SGBDs llave/valor
Características generales
Poseen un modelo de datos sencillo que permite almacenar y
recuperar valores de cualquier tipo a partir de una llave
Son ideales para el manejo de datos no estructurados
Favorecen una alta disponibilidad de los datos
Las operaciones de lectura y escritura tienen un desempeño altísimo
En general, no hay forma de recuperar un registro basándose en el
contenido de su valor
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 29
50. NoSQL SGBDs NoSQL
SGBDs llave/valor
Ejemplo
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 30
51. NoSQL SGBDs NoSQL
Voldemort (2008)
SGBDs llave/valor
Inspirado en Dynamo
Desarrollado por LinkedIn bajo una licencia libre de Apache
Realiza automáticamente la replicación y fragmentación de los datos
Escrito en Java
Existen bibliotecas para Java, Python, Ruby, C, C++, Lua y otros
¿Quién lo utiliza?: LinkedIn
Sitio oficial: http://project-voldemort.com/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 31
52. NoSQL SGBDs NoSQL
Riak (2008)
SGBDs llave/valor
Inspirado en Dynamo
Desarrollado por Basho bajo una licencia dual: una versión de código
abierto y otra comercial con soporte garantizado
Realiza automáticamente la replicación y fragmentación de los datos
Admite consultas MapReduce e índices secundarios
Escrito en Erlang
Ofrece una API HTTP RESTful y existen bibliotecas para Java,
Python, Perl, Erlang, Ruby, PHP, .NET y otros
¿Quién lo utiliza?: Comcast y Mochi Media
Sitio oficial: http://riak.basho.com/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 32
53. NoSQL SGBDs NoSQL
Redis (2009)
SGBDs llave/valor
Desarrollado por Salvatore Sanfilippo bajo la licencia BSD
Brinda un alto desempeño pues mayormente trabaja sobre la RAM
Escrito en C
Ofrece una interfaz de línea de comandos y existen bibliotecas para
Java, Python, Ruby, C, C++, Lua, Haskell y otros
¿Quién lo utiliza?: Craigslist
Sitio oficial: http://redis.io/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 33
54. NoSQL SGBDs NoSQL
Aerospike (2012)
SGBDs llave/valor
Liberado bajo la licencia AGPL en 2014
Enfocado en la alta disponibilidad y la tolerancia a fallas
Optimizado para el trabajo en discos de estado sólido (SSD)
Ofrece soporte para la replicación entre diversos centros de datos
Escrito en C
Existen bibliotecas para C, C#, Java, Ruby, PHP y Python
Sitio oficial: http://www.aerospike.com/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 34
55. NoSQL SGBDs NoSQL
SGBDs orientadas a columnas
Características generales
Poseen una estructura tabular en las que las filas admiten un número
variable de columnas (familias de columnas)
Facilitan la representación de datos semi-estructurados
Optimizadas para operaciones a nivel de columnas (contar, sumar,
promediar, etc.)
Logran altos niveles de escalabilidad al dividir las filas (partición
horizontal) y las columnas (partición vertical) y distribuirlas a través
de múltiples nodos
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 35
56. NoSQL SGBDs NoSQL
SGBDs orientadas a columnas
Modelo de datos
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 36
57. NoSQL SGBDs NoSQL
SGBDs orientadas a columnas
Modelo de datos
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 36
58. NoSQL SGBDs NoSQL
SGBDs orientadas a columnas
Modelo de datos
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 36
59. NoSQL SGBDs NoSQL
Cassandra (2008)
SGBDs orientadas a columnas
Inspirado en Bigtable y Dynamo
Proyecto de código abierto de Apache
Desarrollado inicialmente por Facebook
Ofrece un lenguaje de consultas –CQL– similar a SQL
Escrito en Java
Ofrece una interfaz de línea de comandos y una API para Java,
además existen bibliotecas para Python, PHP, .NET, Ruby y otros
¿Quién lo utiliza?: Facebook, Digg, Reddit, Twitter y otros
Sitio oficial: http://cassandra.apache.org/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 37
60. NoSQL SGBDs NoSQL
HBase (2011)
SGBDs orientadas a columnas
Inspirado en Bigtable
Desarrollado como parte de Hadoop
Hadoop es una implementación de código abierto de MapReduce,
desarrollado inicialmente por Yahoo!
Ofrece un lenguaje de consultas de alto nivel: Pig
Escrito en Java
¿Quién lo utiliza?: Facebook, Yahoo! y otros
Sitio oficial: http://hbase.apache.org/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 38
61. NoSQL SGBDs NoSQL
SGBDs orientadas a documentos
Características generales
Almacenan los datos en documentos XML, JSON u otros formatos
Ofrecen soporte para índices secundarios
Permiten trabajar con datos más complejos, admitiéndose
documentos (objetos) anidados
Se corresponde con la manera en que se modelan los objetos y sus
propiedades en los lenguajes OO
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 39
62. NoSQL SGBDs NoSQL
MongoDB (2009)
SGBDs orientadas a documentos
Desarrollado por 10gen bajo la licencia libre AGPL y soporte comercial
Almacena los datos en documentos en formato BSON (Binary JSON)
Realiza automáticamente la fragmentación de los datos
Ofrece un lenguaje de consultas similar a SQL
Escrito en C++
Ofrece una interfaz de línea de comandos JavaScript y una API
REST, además existen bibliotecas para C, C++, C#, Java,
JavaScript, Perl, Python, PHP, Ruby y otros
¿Quién lo utiliza?: Foursquare, Github, MTV Networks y otros
Sitio oficial: https://www.mongodb.org/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 40
63. NoSQL SGBDs NoSQL
CouchDB (2005)
SGBDs orientadas a documentos
Es un proyecto de Apache desde 2008
Almacena los datos en documentos JSON
Brinda una alta disponibilidad y replicación peer-to-peer
Escrito en Erlang
Ofrece una interfaz web para la administración y una API REST
¿Quién lo utiliza?: Apple, BBC, Canonical y otros
Sitio oficial: http://couchdb.apache.org/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 41
64. NoSQL SGBDs NoSQL
Couchbase (2011)
SGBDs orientadas a documentos
Desarrollado por Couchbase bajo una licencia libre de Apache con
soporte comercial
Combina las mejores características de CouchDB y Membase
Almacena los datos en documentos JSON
Su arquitectura se adapta automáticamente a los cambios en la
topología del clúster
Escrito en C, C++ y Erlang
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 42
65. NoSQL SGBDs NoSQL
Couchbase (2011)
SGBDs orientadas a documentos
Ofrece una interfaz web de administración y una API HTTP RESTful
Existen bibliotecas para Java, Ruby, .NET, C, PHP, Python y otros
Couchbase Lite: versión ligera para su uso en dispositivos móviles
¿Quién lo utiliza?: Adidas, Adobe, Beats Music, Disney, eBay, Honda,
Intel, LinkedIn, Mozilla, Nokia, Vodafone, Walmart y otros
Sitio oficial: http://www.couchbase.com/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 42
66. NoSQL SGBDs NoSQL
eXist (2001)
SGBDs orientadas a documentos
Desarrollado bajo una licencia libre (LGPL)
Almacena los datos en documentos XML
Brinda soporte para consultas XQuery y XSLT
Incorpora Lucene para búsquedas a texto completo
Escrito en Java
¿Quién lo utiliza?: Tibetan Buddhist Resource Center (TBRC),
ScoutDragon, Semanta y otros
Sitio oficial: http://exist-db.org/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 43
67. NoSQL SGBDs NoSQL
MarkLogic Server (2001)
SGBDs orientadas a documentos
Considerado un SGBD NoSQL híbrido (múltiples modelos de datos)
Desarrollado por MarkLogic bajo licencia dual: una versión libre y otra
comercial con soporte garantizado
Ofrece indexado universal
Satisface las propiedades ACID
Escrito en C++
¿Quién lo utiliza?: Springer, Condé Nast y otros
Sitio oficial: http://www.marklogic.com/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 44
68. NoSQL SGBDs NoSQL
SGBDs orientadas a grafos
Características generales
Los datos son almacenados en nodos interrelacionados unos con otros
Ideales para aquellos contextos en los que las relaciones son
fundamentales (ej: redes sociales)
Aplican algoritmos de búsqueda optimizados para grafos
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 45
69. NoSQL SGBDs NoSQL
SGBDs orientadas a grafos
Ejemplo: representando relaciones de amistad
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 46
70. NoSQL SGBDs NoSQL
SGBDs orientadas a grafos
Ejemplo: representando relaciones de amistad
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 46
71. NoSQL SGBDs NoSQL
SGBDs orientadas a grafos
Ejemplo: representando relaciones de amistad
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 46
72. NoSQL SGBDs NoSQL
SGBDs orientadas a grafos
Clasificación según métodos de almacenamiento y procesamiento
Robinson, I.; Webber, J. & Eifrem, E. (2013). Graph Databases. Sebastopol, CA: O’Reilly Media, Inc.
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 47
73. NoSQL SGBDs NoSQL
Neo4j (2007)
SGBDs orientadas a grafos
Desarrollado por Neo Technology bajo una licencia dual: una versión
libre (GPL) y otra comercial con soporte garantizado
Soporta consultas SPARQL
Satisface las propiedades ACID
Escrito en Java
Ofrece una interfaz web para la administración y una API REST,
además existen bibliotecas para Java, Python, Ruby, PHP y otros
¿Quién lo utiliza?: eBay, Walmart, Box.net y otros
Sitio oficial: http://www.neo4j.com/
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 48
74. NoSQL SGBDs NoSQL
Neo4j (2007)
SGBDs orientadas a grafos
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 49
76. Conclusiones
Conclusiones
Los SGBDs NoSQL constituyen una excelente opción para el
desarrollo de sistemas que requieren de una alta disponibilidad y el
trabajo eficiente con datos semi-estructurados y no estructurados
Existen múltiples opciones en el mundo de las tecnologías NoSQL y
resulta una tarea difícil seleccionar la más indicada según el caso
Deben considerarse las características del contexto de aplicación antes
de elegir una u otra variante
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 51
77. Lecturas recomendadas
Lecturas recomendadas I
Bhat, U. & Jadhav, S. (2010).
Moving Towards Non-Relational Databases.
2010 International Journal of Computer Applications, 1(13),
pp. 40-46. ISSN: 0975-8887.
Cattell, R. (2011).
Scalable SQL and NoSQL data stores.
ACM SIGMOD Record, 39(4), pp. 12-27.
Gajendran, S. K. (2012).
A Survey on NoSQL Databases
Reporte técnico extraído el 1/07/2013 desde
http://masters.donntu.edu.ua/2013/fknt/babich/library/article10.pdf
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 52
78. Lecturas recomendadas
Lecturas recomendadas II
Pokorný, J. (2013).
NoSQL databases: a step to database scalability in web environment.
International Journal of Web Information Systems, 9(1), pp. 69-82.
Strauch, C. & Kriha, W. (2011).
NoSQL Databases.
Lecture Notes on Selected Topics on Software-Technology Ultra-Large
Scale Sites, Stuttgart Media University. Extraído el 10/06/2013 desde
http://home.aubg.bg/students/ENL100/Cloud%20Computing
/Research%20Paper/nosqldbs.pdf
Vogels, W. (2008, 22 de diciembre).
Eventually Consistent - Revisited.
Consultado el 6/10/2014 desde http://www.allthingsdistributed.com
/2008/12/eventually_consistent.html
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 53
79. Lecturas recomendadas
Lecturas recomendadas III
Fowler, A. (2015).
NoSQL For Dummies.
Hoboken, NJ: John Wiley & Sons, Inc.
Hurwitz, J.; Nugent, A.; Halper, F. & Kaufman, M. (2013).
Big Data For Dummies.
Hoboken, NJ: John Wiley & Sons, Inc.
McCreary, D. & Kelly, A. (2013).
Making Sense of NoSQL: A guide for managers and the rest of us.
Shelter Island, NY: Manning Publications Co.
Tiwari, S. (2011).
Professional NoSQL.
Indianapolis, IN: John Wiley & Sons, Inc.
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 54
80. Lecturas recomendadas
Lecturas recomendadas IV
Robinson, I.; Webber, J. & Eifrem, E. (2013).
Graph Databases.
Sebastopol, CA: O’Reilly Media, Inc.
Vaish, G. (2013).
Getting Started with NoSQL.
Birmingham, UK: Packt Publishing.
Warden, P. (2011).
Big Data Glossary.
Sebastopol, CA: O’Reilly Media, Inc.
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 55
81. Un acercamiento a las bases de datos NoSQL
MSc. Javier Guillot Jiménez
Departamento de Programación
Facultad de Matemática y Computación
Universidad de La Habana
4 de octubre de 2015
MSc. Javier Guillot Jiménez Universidad de La Habana
Un acercamiento a las bases de datos NoSQL 56