Este documento describe el enfoque para adoptar la ciencia de datos en la Librería Iztaccihuatl. Se procesarán datos de ventas, calificaciones y preferencias de lectura usando Python para generar recomendaciones personalizadas y predecir tendencias. Los datos se almacenarán en una base de datos PostgreSQL en la nube de Azure. Esto permitirá optimizar el inventario, diseñar programas de fidelización y realizar campañas de marketing dirigidas.
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Reporte_practica_2.pdf
1. Instituto Tecnológico y de Estudios Superiores de Monterrey
Aplicando la Ciencia de Datos en una organización
Librería Iztaccihuatl
Por
Juan José Triviño Zambrano
Para el curso
Herramientas para el Análisis de Big Data
3. 1. Introducción
Hoy en día más que antes, la tecnología y la información juegan un papel crucial en todos los aspectos
del negocio, la Librería Iztaccihuatl se embarca en una travesía transformadora hacia la digitalización y el
análisis de datos. Este proyecto representa un esfuerzo estratégico para integrar la ciencia de datos en las
operaciones diarias de la librería, con el objetivo de mejorar la toma de decisiones, optimizar el rendimiento
y enriquecer la experiencia del cliente.
A lo largo de este proyecto, hemos explorado diversas herramientas y metodologías para recopilar,
procesar y analizar los datos generados por la librería. Central a nuestro enfoque es el uso de Python, un
lenguaje de programación ampliamente reconocido por su eficacia y flexibilidad en el análisis de datos. La
elección de Python se basa en su rica biblioteca de ciencia de datos, su comunidad de apoyo global y su
capacidad para integrarse a la perfección con una variedad de plataformas y bases de datos.
Este documento describe nuestro enfoque integral hacia la adopción de la ciencia de datos en la Librería
Iztaccihuatl. Desde el desarrollo de un sistema de recomendación personalizado hasta la implementación de
estrategias de marketing dirigidas por datos, abarcamos una gama de aplicaciones prácticas que prometen
transformar no solo la gestión interna de la librería, sino también cómo interactúa y se involucra con su
valiosa clientela. Con estas iniciativas, nos preparamos no solo para enfrentar los desafíos del presente,
sino también para capitalizar las oportunidades del futuro en el dinámico mundo del comercio de libros.
2. Objetivo
Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube
para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una
organización.
3. Metodología
La analítica predictiva es un campo crucial en el análisis de datos que se enfoca en utilizar datos
históricos y algoritmos estadísticos para predecir eventos o resultados futuros. En el contexto del proyecto
para la Librería Iztaccihuatl, la analítica predictiva puede desempeñar un papel esencial en anticipar
tendencias de ventas, preferencias de lectura y patrones de compra, entre otros. Para esta labor utilizaremos
Python 3, pues es considerado uno de los lenguajes de programación más potentes y adecuados para la
analítica predictiva por varias razones:
Python permite a los usuarios aplicar una amplia variedad de técnicas estadísticas y de aprendizaje
automático. Desde modelos lineales simples hasta algoritmos complejos de aprendizaje profundo,
Python proporciona la flexibilidad necesaria para abordar diferentes tipos de problemas predictivos.
Python se integra fácilmente con diferentes plataformas y servicios, lo que es vital para manejar
grandes volúmenes de datos y realizar cálculos intensivos. Esta integración facilita la escalabilidad
de proyectos de analítica predictiva desde prototipos pequeños hasta implementaciones a gran escala.
La capacidad de visualizar datos y resultados es fundamental en la analítica predictiva. Python, con
bibliotecas como Matplotlib y Seaborn, ofrece capacidades avanzadas de visualización, permitiendo
a los usuarios interpretar y presentar los resultados de sus modelos de manera efectiva.
2
4. La enorme comunidad de Python proporciona un recurso invaluable en términos de colaboración,
intercambio de conocimientos y resolución de problemas. Además, la vasta cantidad de documen-
tación, tutoriales y foros disponibles facilita el aprendizaje y la aplicación de técnicas de analítica
predictiva.
Python está en constante evolución, con actualizaciones regulares y nuevas bibliotecas que se desa-
rrollan para satisfacer las demandas cambiantes del campo de la ciencia de datos. Esto asegura que
Python se mantenga a la vanguardia de la tecnología en analítica predictiva.
4. Resultados esperados
Con la ayuda de Python se pueden aplicar no solamente técnicas de analítica descriptiva sino predic-
ciones tales como:
Analizar patrones históricos de ventas para prever futuras demandas de libros, permitiendo una
mejor gestión del inventario.
Utilizar los datos de calificaciones y preferencias de los usuarios para generar recomendaciones per-
sonalizadas, mejorando la experiencia del cliente.
Identificar géneros o autores populares entre los clientes, lo que puede guiar las decisiones de stock
y marketing
Prever cambios en la demanda de libros durante diferentes épocas del año, lo que puede ayudar en
la planificación de promociones y eventos
Comprender mejor el comportamiento de compra de los clientes para optimizar las estrategias de
venta y marketing.
5. Procesamiento y análisis de datos
5.1. Procesamiento
Tras revisar los registros de los archivos, se proponen las siguientes adecuaciones para realizar un
análisis predictivo eficaz:
5.1.1. Archivo books.csv
Normalizar formatos de fechas y ISBNs. Revisar y corregir posibles errores en autores y títulos.
Evaluar y tratar los campos con datos faltantes, especialmente en el año de publicación y códigos de
idioma.
Convertir datos textuales como ‘authors’ a formatos numéricos, posiblemente a través de codificación
de categorías o técnicas de procesamiento de lenguaje natural.
Generar nuevas variables, como la antigüedad del libro desde su publicación, o agrupar libros por
géneros o autores.
3
5. 5.1.2. Archivo ratings.csv
Asegurar que las combinaciones de ‘book_id’ y ‘user_id’ sean únicas y coherentes.
Explorar la distribución de las calificaciones para identificar patrones o tendencias.
5.1.3. Archivo to_read.csv
Vincular ‘book_id’ con books.csv para obtener detalles adicionales del libro.
Identificar los libros más populares o tendencias en las preferencias de lectura.
5.1.4. Archivo top_books.csv
Normalizar datos a estándares uniformes para ‘Value’, ‘RRP’, ‘ASP’ y otros datos numéricos.
Asociar ‘ISBN’ con ‘book_id’ en books.csv para análisis más profundos.
6. Almacenamiento
6.1. Tipo de Base de Datos õ
Elegimos una base de datos relacional con motor PostgreSQL como sistema de gestión de bases
de datos relacionales para el análisis de datos de la Librería Iztaccihuatl ya que tiene varias ventajas
que la hacen una opción robusta y eficiente pues ofrece un equilibrio ideal entre funcionalidad avanzada,
rendimiento, seguridad y costo, lo que lo convierte en una opción sólida y futura para las necesidades de
análisis de datos de la Librería Iztaccihuatl.
6.2. Proveedor del servicio en la Nube
Seleccionamos a Microsoft Azure como proveedor de servicios en la nube para el almacenamiento
y procesamiento de datos de la Librería Iztaccihuatl que se justifica por varios motivos estratégicos y
técnicos como:
Integración con herramientas existentes
Flexibilidad y escalabilidad
Servicios de análisis avanzados
Soporte para Bases de Datos Relacionales
Como vemos Azure ofrece una solución completa, segura y escalable para las necesidades de almace-
namiento y procesamiento de datos de la Librería Iztaccihuatl, alineada con las herramientas de negocio
existentes, y apoyada por la fiabilidad y la innovación continua de Microsoft.
4
6. 7. Conclusiones
Utilizando los datos de calificaciones y preferencias de los usuarios, la librería podría desarrollar un
sistema de recomendación personalizado. Este sistema no solo mejoraría la experiencia del cliente al
sugerir libros alineados con sus intereses, sino que también podría impulsar las ventas al destacar
títulos menos conocidos pero relevantes.
Aplicando técnicas de análisis predictivo a los datos de ventas y popularidad de libros, la librería
puede optimizar su gestión de inventario. Esto implicaría prever la demanda de diferentes títulos y
géneros, lo que ayudaría a reducir el exceso de stock y a asegurar la disponibilidad de libros con alta
demanda.
A partir de los patrones de compra y preferencias de lectura, la librería podría diseñar programas
de fidelización más efectivos. Por ejemplo, ofrecer descuentos o promociones en géneros o autores
preferidos por el cliente, o recompensar a los clientes regulares con acceso anticipado a lanzamientos
de libros.
Analizar los datos para identificar temas o autores populares y organizar eventos en torno a ellos,
como clubs de lectura, talleres o encuentros con autores. Esto no solo aumentaría la participación
de la comunidad, sino que también podría atraer a nuevos clientes.
Aprovechar la plataforma Azure no solo para el almacenamiento y análisis de datos, sino también
para explorar nuevas tecnologías como la inteligencia artificial y el Internet de las Cosas (IoT). Por
ejemplo, implementar chatbots para asistencia al cliente o análisis de sentimientos para entender
mejor las reseñas de los usuarios.
Utilizar insights derivados del análisis de datos para crear campañas de marketing más dirigidas y
eficientes. Por ejemplo, segmentar el mercado según las preferencias de lectura y dirigir anuncios y
promociones específicas a cada segmento.
Invertir en la formación del personal en el uso de herramientas de análisis de datos y tendencias de
la industria del libro. Esto no solo aumenta la eficiencia operativa, sino que también fomenta una
cultura de toma de decisiones basada en datos dentro de la organización.
5