SlideShare a Scribd company logo
1 of 6
Download to read offline
Instituto Tecnológico y de Estudios Superiores de Monterrey
Aplicando la Ciencia de Datos en una organización
Librería Iztaccihuatl
Por
Juan José Triviño Zambrano
Para el curso
Herramientas para el Análisis de Big Data
Índice
1. Introducción 2
2. Objetivo 2
3. Metodología 2
4. Resultados esperados 3
5. Procesamiento y análisis de datos 3
5.1. Procesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
5.1.1. Archivo books.csv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
5.1.2. Archivo ratings.csv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
5.1.3. Archivo to_read.csv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
5.1.4. Archivo top_books.csv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
6. Almacenamiento 4
6.1. Tipo de Base de Datos õ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
6.2. Proveedor del servicio en la Nube  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
7. Conclusiones 5
1
1. Introducción
Hoy en día más que antes, la tecnología y la información juegan un papel crucial en todos los aspectos
del negocio, la Librería Iztaccihuatl se embarca en una travesía transformadora hacia la digitalización y el
análisis de datos. Este proyecto representa un esfuerzo estratégico para integrar la ciencia de datos en las
operaciones diarias de la librería, con el objetivo de mejorar la toma de decisiones, optimizar el rendimiento
y enriquecer la experiencia del cliente.
A lo largo de este proyecto, hemos explorado diversas herramientas y metodologías para recopilar,
procesar y analizar los datos generados por la librería. Central a nuestro enfoque es el uso de Python, un
lenguaje de programación ampliamente reconocido por su eficacia y flexibilidad en el análisis de datos. La
elección de Python se basa en su rica biblioteca de ciencia de datos, su comunidad de apoyo global y su
capacidad para integrarse a la perfección con una variedad de plataformas y bases de datos.
Este documento describe nuestro enfoque integral hacia la adopción de la ciencia de datos en la Librería
Iztaccihuatl. Desde el desarrollo de un sistema de recomendación personalizado hasta la implementación de
estrategias de marketing dirigidas por datos, abarcamos una gama de aplicaciones prácticas que prometen
transformar no solo la gestión interna de la librería, sino también cómo interactúa y se involucra con su
valiosa clientela. Con estas iniciativas, nos preparamos no solo para enfrentar los desafíos del presente,
sino también para capitalizar las oportunidades del futuro en el dinámico mundo del comercio de libros.
2. Objetivo
Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube
para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una
organización.
3. Metodología
La analítica predictiva es un campo crucial en el análisis de datos que se enfoca en utilizar datos
históricos y algoritmos estadísticos para predecir eventos o resultados futuros. En el contexto del proyecto
para la Librería Iztaccihuatl, la analítica predictiva puede desempeñar un papel esencial en anticipar
tendencias de ventas, preferencias de lectura y patrones de compra, entre otros. Para esta labor utilizaremos
Python 3, pues es considerado uno de los lenguajes de programación más potentes y adecuados para la
analítica predictiva por varias razones:
Python permite a los usuarios aplicar una amplia variedad de técnicas estadísticas y de aprendizaje
automático. Desde modelos lineales simples hasta algoritmos complejos de aprendizaje profundo,
Python proporciona la flexibilidad necesaria para abordar diferentes tipos de problemas predictivos.
Python se integra fácilmente con diferentes plataformas y servicios, lo que es vital para manejar
grandes volúmenes de datos y realizar cálculos intensivos. Esta integración facilita la escalabilidad
de proyectos de analítica predictiva desde prototipos pequeños hasta implementaciones a gran escala.
La capacidad de visualizar datos y resultados es fundamental en la analítica predictiva. Python, con
bibliotecas como Matplotlib y Seaborn, ofrece capacidades avanzadas de visualización, permitiendo
a los usuarios interpretar y presentar los resultados de sus modelos de manera efectiva.
2
La enorme comunidad de Python proporciona un recurso invaluable en términos de colaboración,
intercambio de conocimientos y resolución de problemas. Además, la vasta cantidad de documen-
tación, tutoriales y foros disponibles facilita el aprendizaje y la aplicación de técnicas de analítica
predictiva.
Python está en constante evolución, con actualizaciones regulares y nuevas bibliotecas que se desa-
rrollan para satisfacer las demandas cambiantes del campo de la ciencia de datos. Esto asegura que
Python se mantenga a la vanguardia de la tecnología en analítica predictiva.
4. Resultados esperados
Con la ayuda de Python se pueden aplicar no solamente técnicas de analítica descriptiva sino predic-
ciones tales como:
Analizar patrones históricos de ventas para prever futuras demandas de libros, permitiendo una
mejor gestión del inventario.
Utilizar los datos de calificaciones y preferencias de los usuarios para generar recomendaciones per-
sonalizadas, mejorando la experiencia del cliente.
Identificar géneros o autores populares entre los clientes, lo que puede guiar las decisiones de stock
y marketing
Prever cambios en la demanda de libros durante diferentes épocas del año, lo que puede ayudar en
la planificación de promociones y eventos
Comprender mejor el comportamiento de compra de los clientes para optimizar las estrategias de
venta y marketing.
5. Procesamiento y análisis de datos
5.1. Procesamiento
Tras revisar los registros de los archivos, se proponen las siguientes adecuaciones para realizar un
análisis predictivo eficaz:
5.1.1. Archivo books.csv
Normalizar formatos de fechas y ISBNs. Revisar y corregir posibles errores en autores y títulos.
Evaluar y tratar los campos con datos faltantes, especialmente en el año de publicación y códigos de
idioma.
Convertir datos textuales como ‘authors’ a formatos numéricos, posiblemente a través de codificación
de categorías o técnicas de procesamiento de lenguaje natural.
Generar nuevas variables, como la antigüedad del libro desde su publicación, o agrupar libros por
géneros o autores.
3
5.1.2. Archivo ratings.csv
Asegurar que las combinaciones de ‘book_id’ y ‘user_id’ sean únicas y coherentes.
Explorar la distribución de las calificaciones para identificar patrones o tendencias.
5.1.3. Archivo to_read.csv
Vincular ‘book_id’ con books.csv para obtener detalles adicionales del libro.
Identificar los libros más populares o tendencias en las preferencias de lectura.
5.1.4. Archivo top_books.csv
Normalizar datos a estándares uniformes para ‘Value’, ‘RRP’, ‘ASP’ y otros datos numéricos.
Asociar ‘ISBN’ con ‘book_id’ en books.csv para análisis más profundos.
6. Almacenamiento
6.1. Tipo de Base de Datos õ
Elegimos una base de datos relacional con motor PostgreSQL como sistema de gestión de bases
de datos relacionales para el análisis de datos de la Librería Iztaccihuatl ya que tiene varias ventajas
que la hacen una opción robusta y eficiente pues ofrece un equilibrio ideal entre funcionalidad avanzada,
rendimiento, seguridad y costo, lo que lo convierte en una opción sólida y futura para las necesidades de
análisis de datos de la Librería Iztaccihuatl.
6.2. Proveedor del servicio en la Nube 
Seleccionamos a Microsoft Azure como proveedor de servicios en la nube para el almacenamiento
y procesamiento de datos de la Librería Iztaccihuatl que se justifica por varios motivos estratégicos y
técnicos como:
Integración con herramientas existentes
Flexibilidad y escalabilidad
Servicios de análisis avanzados
Soporte para Bases de Datos Relacionales
Como vemos Azure ofrece una solución completa, segura y escalable para las necesidades de almace-
namiento y procesamiento de datos de la Librería Iztaccihuatl, alineada con las herramientas de negocio
existentes, y apoyada por la fiabilidad y la innovación continua de Microsoft.
4
7. Conclusiones
Utilizando los datos de calificaciones y preferencias de los usuarios, la librería podría desarrollar un
sistema de recomendación personalizado. Este sistema no solo mejoraría la experiencia del cliente al
sugerir libros alineados con sus intereses, sino que también podría impulsar las ventas al destacar
títulos menos conocidos pero relevantes.
Aplicando técnicas de análisis predictivo a los datos de ventas y popularidad de libros, la librería
puede optimizar su gestión de inventario. Esto implicaría prever la demanda de diferentes títulos y
géneros, lo que ayudaría a reducir el exceso de stock y a asegurar la disponibilidad de libros con alta
demanda.
A partir de los patrones de compra y preferencias de lectura, la librería podría diseñar programas
de fidelización más efectivos. Por ejemplo, ofrecer descuentos o promociones en géneros o autores
preferidos por el cliente, o recompensar a los clientes regulares con acceso anticipado a lanzamientos
de libros.
Analizar los datos para identificar temas o autores populares y organizar eventos en torno a ellos,
como clubs de lectura, talleres o encuentros con autores. Esto no solo aumentaría la participación
de la comunidad, sino que también podría atraer a nuevos clientes.
Aprovechar la plataforma Azure no solo para el almacenamiento y análisis de datos, sino también
para explorar nuevas tecnologías como la inteligencia artificial y el Internet de las Cosas (IoT). Por
ejemplo, implementar chatbots para asistencia al cliente o análisis de sentimientos para entender
mejor las reseñas de los usuarios.
Utilizar insights derivados del análisis de datos para crear campañas de marketing más dirigidas y
eficientes. Por ejemplo, segmentar el mercado según las preferencias de lectura y dirigir anuncios y
promociones específicas a cada segmento.
Invertir en la formación del personal en el uso de herramientas de análisis de datos y tendencias de
la industria del libro. Esto no solo aumenta la eficiencia operativa, sino que también fomenta una
cultura de toma de decisiones basada en datos dentro de la organización.
5

More Related Content

Similar to Reporte_practica_2.pdf

Similar to Reporte_practica_2.pdf (20)

Bigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria IztaccihuatlBigdata Herramientas Caso Libreria Iztaccihuatl
Bigdata Herramientas Caso Libreria Iztaccihuatl
 
Proyecto evaluado por pares
Proyecto evaluado por paresProyecto evaluado por pares
Proyecto evaluado por pares
 
evaluacion por pares
evaluacion por paresevaluacion por pares
evaluacion por pares
 
Aplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una OrganizaciónAplicación de La ciencia de datos en una Organización
Aplicación de La ciencia de datos en una Organización
 
3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf3 Visualización de Datos y Storytelling.pdf
3 Visualización de Datos y Storytelling.pdf
 
Actividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez RochaActividad 1 - Jesus Axel Dominguez Rocha
Actividad 1 - Jesus Axel Dominguez Rocha
 
Proyecto individual
Proyecto individualProyecto individual
Proyecto individual
 
Proyecto Jaime Salinas
Proyecto Jaime SalinasProyecto Jaime Salinas
Proyecto Jaime Salinas
 
Proyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big dataProyecto herramientas para el análisis de big data
Proyecto herramientas para el análisis de big data
 
Project.docx
Project.docxProject.docx
Project.docx
 
Recomendador de artículos científicos basado en metadatos de repositorios dig...
Recomendador de artículos científicos basado en metadatos de repositorios dig...Recomendador de artículos científicos basado en metadatos de repositorios dig...
Recomendador de artículos científicos basado en metadatos de repositorios dig...
 
Tarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datosTarea Introducción a la ciencia de datos
Tarea Introducción a la ciencia de datos
 
Propuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO IztaccíhuatlPropuesta PROYECTO Iztaccíhuatl
Propuesta PROYECTO Iztaccíhuatl
 
Aplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una OrganizaciónAplicando Ciencia de Datos en una Organización
Aplicando Ciencia de Datos en una Organización
 
Trabajo de pares
Trabajo de paresTrabajo de pares
Trabajo de pares
 
Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.Evaluacion entre pares - Ciencia de datos.
Evaluacion entre pares - Ciencia de datos.
 
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdfAPLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
APLICANDO LA CIENCIA DE DATOS EN UNA ORGANIZACIÓN - práctica.pdf
 
202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares202005 rrg proyecto individual con evaluacion por pares
202005 rrg proyecto individual con evaluacion por pares
 
Trabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhuezaTrabajo ciencia de datos camilo sanhueza
Trabajo ciencia de datos camilo sanhueza
 
ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1
ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1
ANALÍTICA DE DATOS EN INSTITUCIONES EDUCATIVAS 1
 

Recently uploaded

My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
FeliGamarra1
 
2287-Texto del artículo-1259innova9-1-10-20230909.pdf
2287-Texto del artículo-1259innova9-1-10-20230909.pdf2287-Texto del artículo-1259innova9-1-10-20230909.pdf
2287-Texto del artículo-1259innova9-1-10-20230909.pdf
CamiloVasconez
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
matiasccoyllomarca
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
analiticaydatos
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
JuanmanuelYapitamani
 
REVISTAA - CONSTRUCCION SOSTENIBLE ESTUDIO DE CASOS
REVISTAA - CONSTRUCCION SOSTENIBLE ESTUDIO DE CASOSREVISTAA - CONSTRUCCION SOSTENIBLE ESTUDIO DE CASOS
REVISTAA - CONSTRUCCION SOSTENIBLE ESTUDIO DE CASOS
Alexander VA
 

Recently uploaded (20)

Guía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico JamoviGuía rápida del uso del paquete estadístico Jamovi
Guía rápida del uso del paquete estadístico Jamovi
 
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
My loft y ciencia uso de My loft. Explica cómo usar My loft para la ucv.
 
Análisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdfAnálisis integral de puesto de trabajo AFRO.pdf
Análisis integral de puesto de trabajo AFRO.pdf
 
Análisis estructural del restaurante submarino de Valencia oceanographic
Análisis estructural del restaurante submarino de Valencia oceanographicAnálisis estructural del restaurante submarino de Valencia oceanographic
Análisis estructural del restaurante submarino de Valencia oceanographic
 
2287-Texto del artículo-1259innova9-1-10-20230909.pdf
2287-Texto del artículo-1259innova9-1-10-20230909.pdf2287-Texto del artículo-1259innova9-1-10-20230909.pdf
2287-Texto del artículo-1259innova9-1-10-20230909.pdf
 
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...¿Qué es el texto científico? Presentación para la clase de comunicación escri...
¿Qué es el texto científico? Presentación para la clase de comunicación escri...
 
Posición global del PIB per cápita Israelí (1948-2024).pdf
Posición global  del PIB per cápita  Israelí  (1948-2024).pdfPosición global  del PIB per cápita  Israelí  (1948-2024).pdf
Posición global del PIB per cápita Israelí (1948-2024).pdf
 
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj01 SIMULACRO 2024.pdf unijjajajajjaaaajj
01 SIMULACRO 2024.pdf unijjajajajjaaaajj
 
Seguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoahSeguridad y privacidad (1).pptx OdayYoah
Seguridad y privacidad (1).pptx OdayYoah
 
GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdf
GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdfGRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdf
GRUPO 3 ACTIVIDADES Integradoras Universidad cesar vallejo.pdf
 
Ideas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechileIdeas liberales en Chile.pptx2019historiadechile
Ideas liberales en Chile.pptx2019historiadechile
 
Paisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historiaPaisajismo Chino - Vegetacion y su historia
Paisajismo Chino - Vegetacion y su historia
 
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdfLa Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
La Inteligencia Artificial -AnaliticayDatos-BeatrizGarcia-Abril2024-D.pdf
 
La semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomasLa semiología se encarga de estudiar los síntomas
La semiología se encarga de estudiar los síntomas
 
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdkXNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
XNXX.pptxjsjssjsjsjjsjsjsjsjjsjejejejkdkdk
 
EJERCICIOS PARA MODELAR BASES DE DATOS.docx.docx
EJERCICIOS PARA MODELAR BASES DE DATOS.docx.docxEJERCICIOS PARA MODELAR BASES DE DATOS.docx.docx
EJERCICIOS PARA MODELAR BASES DE DATOS.docx.docx
 
REVISTAA - CONSTRUCCION SOSTENIBLE ESTUDIO DE CASOS
REVISTAA - CONSTRUCCION SOSTENIBLE ESTUDIO DE CASOSREVISTAA - CONSTRUCCION SOSTENIBLE ESTUDIO DE CASOS
REVISTAA - CONSTRUCCION SOSTENIBLE ESTUDIO DE CASOS
 
El siglo de Asia en pocos datos relevantes año (2024).pdf
El siglo de Asia en pocos datos relevantes año (2024).pdfEl siglo de Asia en pocos datos relevantes año (2024).pdf
El siglo de Asia en pocos datos relevantes año (2024).pdf
 
Diapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especificoDiapositivas de recolección de datos tema en especifico
Diapositivas de recolección de datos tema en especifico
 
Países con mayores líneas de trenes de alta velocidad (2021).pdf
Países con  mayores líneas de trenes de alta velocidad  (2021).pdfPaíses con  mayores líneas de trenes de alta velocidad  (2021).pdf
Países con mayores líneas de trenes de alta velocidad (2021).pdf
 

Reporte_practica_2.pdf

  • 1. Instituto Tecnológico y de Estudios Superiores de Monterrey Aplicando la Ciencia de Datos en una organización Librería Iztaccihuatl Por Juan José Triviño Zambrano Para el curso Herramientas para el Análisis de Big Data
  • 2. Índice 1. Introducción 2 2. Objetivo 2 3. Metodología 2 4. Resultados esperados 3 5. Procesamiento y análisis de datos 3 5.1. Procesamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 5.1.1. Archivo books.csv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 5.1.2. Archivo ratings.csv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 5.1.3. Archivo to_read.csv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 5.1.4. Archivo top_books.csv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 6. Almacenamiento 4 6.1. Tipo de Base de Datos õ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 6.2. Proveedor del servicio en la Nube . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 7. Conclusiones 5 1
  • 3. 1. Introducción Hoy en día más que antes, la tecnología y la información juegan un papel crucial en todos los aspectos del negocio, la Librería Iztaccihuatl se embarca en una travesía transformadora hacia la digitalización y el análisis de datos. Este proyecto representa un esfuerzo estratégico para integrar la ciencia de datos en las operaciones diarias de la librería, con el objetivo de mejorar la toma de decisiones, optimizar el rendimiento y enriquecer la experiencia del cliente. A lo largo de este proyecto, hemos explorado diversas herramientas y metodologías para recopilar, procesar y analizar los datos generados por la librería. Central a nuestro enfoque es el uso de Python, un lenguaje de programación ampliamente reconocido por su eficacia y flexibilidad en el análisis de datos. La elección de Python se basa en su rica biblioteca de ciencia de datos, su comunidad de apoyo global y su capacidad para integrarse a la perfección con una variedad de plataformas y bases de datos. Este documento describe nuestro enfoque integral hacia la adopción de la ciencia de datos en la Librería Iztaccihuatl. Desde el desarrollo de un sistema de recomendación personalizado hasta la implementación de estrategias de marketing dirigidas por datos, abarcamos una gama de aplicaciones prácticas que prometen transformar no solo la gestión interna de la librería, sino también cómo interactúa y se involucra con su valiosa clientela. Con estas iniciativas, nos preparamos no solo para enfrentar los desafíos del presente, sino también para capitalizar las oportunidades del futuro en el dinámico mundo del comercio de libros. 2. Objetivo Identificar las herramientas necesarias para el análisis; estructuras de datos y servicios de la nube para desarrollar un modelo basado en Ciencia de Datos como apoyo a la toma de decisiones para una organización. 3. Metodología La analítica predictiva es un campo crucial en el análisis de datos que se enfoca en utilizar datos históricos y algoritmos estadísticos para predecir eventos o resultados futuros. En el contexto del proyecto para la Librería Iztaccihuatl, la analítica predictiva puede desempeñar un papel esencial en anticipar tendencias de ventas, preferencias de lectura y patrones de compra, entre otros. Para esta labor utilizaremos Python 3, pues es considerado uno de los lenguajes de programación más potentes y adecuados para la analítica predictiva por varias razones: Python permite a los usuarios aplicar una amplia variedad de técnicas estadísticas y de aprendizaje automático. Desde modelos lineales simples hasta algoritmos complejos de aprendizaje profundo, Python proporciona la flexibilidad necesaria para abordar diferentes tipos de problemas predictivos. Python se integra fácilmente con diferentes plataformas y servicios, lo que es vital para manejar grandes volúmenes de datos y realizar cálculos intensivos. Esta integración facilita la escalabilidad de proyectos de analítica predictiva desde prototipos pequeños hasta implementaciones a gran escala. La capacidad de visualizar datos y resultados es fundamental en la analítica predictiva. Python, con bibliotecas como Matplotlib y Seaborn, ofrece capacidades avanzadas de visualización, permitiendo a los usuarios interpretar y presentar los resultados de sus modelos de manera efectiva. 2
  • 4. La enorme comunidad de Python proporciona un recurso invaluable en términos de colaboración, intercambio de conocimientos y resolución de problemas. Además, la vasta cantidad de documen- tación, tutoriales y foros disponibles facilita el aprendizaje y la aplicación de técnicas de analítica predictiva. Python está en constante evolución, con actualizaciones regulares y nuevas bibliotecas que se desa- rrollan para satisfacer las demandas cambiantes del campo de la ciencia de datos. Esto asegura que Python se mantenga a la vanguardia de la tecnología en analítica predictiva. 4. Resultados esperados Con la ayuda de Python se pueden aplicar no solamente técnicas de analítica descriptiva sino predic- ciones tales como: Analizar patrones históricos de ventas para prever futuras demandas de libros, permitiendo una mejor gestión del inventario. Utilizar los datos de calificaciones y preferencias de los usuarios para generar recomendaciones per- sonalizadas, mejorando la experiencia del cliente. Identificar géneros o autores populares entre los clientes, lo que puede guiar las decisiones de stock y marketing Prever cambios en la demanda de libros durante diferentes épocas del año, lo que puede ayudar en la planificación de promociones y eventos Comprender mejor el comportamiento de compra de los clientes para optimizar las estrategias de venta y marketing. 5. Procesamiento y análisis de datos 5.1. Procesamiento Tras revisar los registros de los archivos, se proponen las siguientes adecuaciones para realizar un análisis predictivo eficaz: 5.1.1. Archivo books.csv Normalizar formatos de fechas y ISBNs. Revisar y corregir posibles errores en autores y títulos. Evaluar y tratar los campos con datos faltantes, especialmente en el año de publicación y códigos de idioma. Convertir datos textuales como ‘authors’ a formatos numéricos, posiblemente a través de codificación de categorías o técnicas de procesamiento de lenguaje natural. Generar nuevas variables, como la antigüedad del libro desde su publicación, o agrupar libros por géneros o autores. 3
  • 5. 5.1.2. Archivo ratings.csv Asegurar que las combinaciones de ‘book_id’ y ‘user_id’ sean únicas y coherentes. Explorar la distribución de las calificaciones para identificar patrones o tendencias. 5.1.3. Archivo to_read.csv Vincular ‘book_id’ con books.csv para obtener detalles adicionales del libro. Identificar los libros más populares o tendencias en las preferencias de lectura. 5.1.4. Archivo top_books.csv Normalizar datos a estándares uniformes para ‘Value’, ‘RRP’, ‘ASP’ y otros datos numéricos. Asociar ‘ISBN’ con ‘book_id’ en books.csv para análisis más profundos. 6. Almacenamiento 6.1. Tipo de Base de Datos õ Elegimos una base de datos relacional con motor PostgreSQL como sistema de gestión de bases de datos relacionales para el análisis de datos de la Librería Iztaccihuatl ya que tiene varias ventajas que la hacen una opción robusta y eficiente pues ofrece un equilibrio ideal entre funcionalidad avanzada, rendimiento, seguridad y costo, lo que lo convierte en una opción sólida y futura para las necesidades de análisis de datos de la Librería Iztaccihuatl. 6.2. Proveedor del servicio en la Nube Seleccionamos a Microsoft Azure como proveedor de servicios en la nube para el almacenamiento y procesamiento de datos de la Librería Iztaccihuatl que se justifica por varios motivos estratégicos y técnicos como: Integración con herramientas existentes Flexibilidad y escalabilidad Servicios de análisis avanzados Soporte para Bases de Datos Relacionales Como vemos Azure ofrece una solución completa, segura y escalable para las necesidades de almace- namiento y procesamiento de datos de la Librería Iztaccihuatl, alineada con las herramientas de negocio existentes, y apoyada por la fiabilidad y la innovación continua de Microsoft. 4
  • 6. 7. Conclusiones Utilizando los datos de calificaciones y preferencias de los usuarios, la librería podría desarrollar un sistema de recomendación personalizado. Este sistema no solo mejoraría la experiencia del cliente al sugerir libros alineados con sus intereses, sino que también podría impulsar las ventas al destacar títulos menos conocidos pero relevantes. Aplicando técnicas de análisis predictivo a los datos de ventas y popularidad de libros, la librería puede optimizar su gestión de inventario. Esto implicaría prever la demanda de diferentes títulos y géneros, lo que ayudaría a reducir el exceso de stock y a asegurar la disponibilidad de libros con alta demanda. A partir de los patrones de compra y preferencias de lectura, la librería podría diseñar programas de fidelización más efectivos. Por ejemplo, ofrecer descuentos o promociones en géneros o autores preferidos por el cliente, o recompensar a los clientes regulares con acceso anticipado a lanzamientos de libros. Analizar los datos para identificar temas o autores populares y organizar eventos en torno a ellos, como clubs de lectura, talleres o encuentros con autores. Esto no solo aumentaría la participación de la comunidad, sino que también podría atraer a nuevos clientes. Aprovechar la plataforma Azure no solo para el almacenamiento y análisis de datos, sino también para explorar nuevas tecnologías como la inteligencia artificial y el Internet de las Cosas (IoT). Por ejemplo, implementar chatbots para asistencia al cliente o análisis de sentimientos para entender mejor las reseñas de los usuarios. Utilizar insights derivados del análisis de datos para crear campañas de marketing más dirigidas y eficientes. Por ejemplo, segmentar el mercado según las preferencias de lectura y dirigir anuncios y promociones específicas a cada segmento. Invertir en la formación del personal en el uso de herramientas de análisis de datos y tendencias de la industria del libro. Esto no solo aumenta la eficiencia operativa, sino que también fomenta una cultura de toma de decisiones basada en datos dentro de la organización. 5