Junnasandra Call Girls: 🍓 7737669865 🍓 High Profile Model Escorts | Bangalore...
Proyecto Libreria Iztaccihuatl
1. EDX Curso: Introducción a la Ciencia de Datos y el Big
Data (Tecnológico de Monterrey)
Proyecto individual evaluado por pares
Caso: Utilizando la Ciencia de Datos en una organización,
Librería Iztaccihuatl
Elaborado por: Harley Andrés Herrera Castillo
Colombia, julio 2021
2. Contenido
Introducción............................................................................................................. 3
Problema planteado ................................................................................................ 4
Identificación de indicadores ................................................................................... 6
Tipo de análisis y justificación ................................................................................. 7
Propuesta de decisión............................................................................................. 8
Conclusiones......................................................................................................... 10
3. Introducción
A partir de los temas, conceptos y análisis propuestos a lo largo del curso
Introducción a la Ciencia de Datos y el Big Data, a continuación, se presenta un
proyecto basado en una situación, en la cual se pondrán en práctica los
conocimientos adquiridos.
De acuerdo a la situación planteada de la Librería Iztaccihuatl, se desea obtener a
partir de los datos disponibles una serie de indicadores de desempeño (KPI’s) que
permitan establecer una estrategia para la toma de decisiones organizacionales, en
este sentido, es importante comprender los datos que a priori han sido dispuestos
para facilitar la comprensión del negocio, lo que permitirá formular las acciones
recomendables para la librería.
4. Problema planteado
La Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México ha
decidido desarrollar un proyecto basada en ciencia de datos para mejorar sus
indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la
toma de decisiones.
En la carpeta denominada “datasets_books” se encuentran los siguientes archivos:
books; top_books; raitings; to_read.
Una vez analizada la información de la carpeta “datasets_books” deberás presentar
en un documento Word la respuesta a las siguientes preguntas:
¿Qué indicadores serían los más importantes a determinar de acuerdo a la
información presentada?
¿Qué tipo de análisis sería el más adecuado y por qué?
¿Qué decisiones se podrían tomar basadas en los descubrimientos o inferencias de
la información analizada?
El archivo “books” contiene los siguientes datos:
• Id - Identificador del registro
• Book Id - Identificador del libro
• Number Editions - Número de ediciones
• ISBN - Clave estándar internacional del libro
• ISBN13 - Clave estándar extendida internacional del libro
• Authors - Autor del libro
• Original Publication - Fecha de publicación
• Original Title - Título original del libro
• Title - Título del libro
• Language Code - Clave de idioma del libro
• Average Rating - Promedio de la clasificación del libro
• Image - Enlace a la imagen de la portada del libro
• Small Image - Enlace a la imagen en versión optimizada de la portada del
libro.
El archivo “top_books” contiene los siguientes datos:
• Position - Posición del libro en la clasificación del libro
5. • ISBN - Clave estándar extendida internacional del libro
• Title - Título del libro
• Author - Autor del libro
• Imprint - Editorial
• Publisher Group - Grupo Editorial
• Volume - Volumen de ventas hasta el 2010
• Value - Ventas determinadas por el volumen
• RRP - Precio recomendado para minoristas
• ASP - Precio promedio para venta
• Binding - Tipo de encuadernación
• Publ Date - Fecha de publicación
• Product Class - Clasificación del libro
• Classification - Clasificación General del libro
El archivo “ratings” contiene los siguientes datos:
• Book Id - Identificador del libro
• User Id - Identificador del cliente/usuario que clasifico un libro
• Rating - Nivel de clasificación del libro.
El archivo “to_read” contiene los siguientes datos:
• User Id - Identificador del cliente/usuario que clasifico un libro
• Book Id - Identificador del libro
El archivo “books” contiene los datos generales de cada libro existente en la librería
y además menciona el promedio de clasificación de cada libro de acuerdo a las
votaciones y compras del cliente.
El archivo “top_books” contiene el top 20 de los libros más vendidos de acuerdo a
una clasificación general.
El archivo “ratings” contiene los datos de los libros más votados por los clientes
dentro del sitio web de la librería.
El archivo “to_read” contiene las recomendaciones que cada cliente o usuario
realiza en el sitio web sobre libros para leer.
6. Identificación de indicadores
Para lograr identificar los indicadores de desempeño es relevante conocer todos y
cada de los datos incluidos dentro de los archivos “books”, “top_books”, “ratings” y
“to_read” que a grandes rasgos ya fueron descritos en el problema planteado.
Los siguientes son los indicadores de desempeño que se han propuesto:
1. El indicador se toma de la suma del campo “Value” de acuerdo al filtro que
se haga del campo “Classification” del archivo “top_books” y se representa
así:
𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑑𝑖𝑛𝑒𝑟𝑜 𝑒𝑛 𝑣𝑒𝑛𝑡𝑎𝑠 𝑝𝑜𝑟 𝑐𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛 =
𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑐𝑖ó𝑛(𝑐𝑎𝑡𝑒𝑔𝑜𝑟í𝑎)
𝑣𝑎𝑙𝑜𝑟 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑐𝑙𝑎𝑠𝑖𝑓𝑖𝑐𝑎𝑐𝑖𝑜𝑛𝑒𝑠(𝑐𝑎𝑡𝑒𝑔𝑜𝑟í𝑎𝑠)
∗ 100
2. El indicador se toma de la suma del campo “Volume” de acuerdo al filtro que
se haga del campo “Product Class” del archivo “top_books” y se representa
así:
𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑣𝑜𝑙ú𝑚𝑒𝑛𝑒𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠 𝑝𝑜𝑟 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜 =
𝑣𝑜𝑙ú𝑚𝑒𝑛𝑒𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒𝑙 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜
𝑣𝑜𝑙ú𝑚𝑒𝑛𝑒𝑠 𝑡𝑜𝑡𝑎𝑙𝑒𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠 𝑝𝑜𝑟 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑐𝑙𝑎𝑠𝑒𝑠 𝑑𝑒 𝑝𝑟𝑜𝑑𝑢𝑐𝑡𝑜𝑠
∗ 100
3. El indicador se toma de los distintos identificadores de libros del campo
“book_id” del archivo “to_read” y del total de libros del campo “book_id” del
archivo “books” y se representa así:
𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑙𝑖𝑏𝑟𝑜𝑠 𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑑𝑜𝑠 𝑝𝑎𝑟𝑎 𝑙𝑒𝑒𝑟 =
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑑𝑖𝑠𝑡𝑖𝑛𝑡𝑜𝑠 𝑖𝑑𝑒𝑛𝑡𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑟𝑒𝑠 𝑑𝑒 𝑙𝑖𝑏𝑟𝑜𝑠 𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑑𝑜𝑠 𝑝𝑎𝑟𝑎 𝑙𝑒𝑒𝑟
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑖𝑏𝑟𝑜𝑠
∗ 100
7. Tipo de análisis y justificación
De acuerdo a la información disponible para la elaboración del proyecto de la
Librería Iztaccihuatl se procedió a realizar inicialmente un análisis a los datos
suministrados en los diferentes archivos y de esta manera lograr identificar campos
que pudieran indicar el alcance de los mismos, sin embargo y debido al grado de
generalidad se considera que se puede lograr realizar un análisis de tipo descriptivo
desde el cual se observa lo que ha venido sucediendo con la librería, identificando
por ejemplo las preferencias de los clientes, lo cual podría en un momento
determinado categorizarlos para proponer estrategias comerciales u otro tipo de
acciones encaminadas a vender mas libros, pero en términos generales con los
datos disponibles en los archivos es muy complejo realizar un análisis de tipo
predictivo o prescriptivo que ayuden a determinar que puede llegar a pasar o a
determinar alguna recomendación para la librería.
Es por ello que se propusieron los 3 indicadores de desempeño anteriores que a
grandes rasgos se relacionan directamente con el estado actual de la librería y
desde los cuales se pueden llegar a determinar objetivos y metas para próximas
vigencias en su desempeño.
8. Propuesta de decisión
Aunque en la descripción del proyecto para la Librería Iztaccihuatl no se define
específicamente un objetivo que la librería desee lograr y que este alineado con la
información disponible en los archivos, es importante establecer a donde desea
llegar en un periodo razonable de tiempo, en este sentido, el objetivo que se ha
propuesto en este proyecto para la librería es el de aumentar sus ventas ya que
con los datos que se encuentran en los archivos se lograron proponer 3 indicadores
de desempeño que se ajustan a este objetivo.
A través de los indicadores de desempeño se pueden tomar las siguientes
decisiones:
1. Porcentaje de dinero en ventas por clasificación, por medio de este indicador
el departamento comercial de la librería podrá tomar decisiones con respecto
a los libros con cierto tipo de clasificación (categorías) que están siendo muy
vendidos, con esta información se lograrán proponer acciones para fortalecer
ciertas categorías de libros o potenciar las categorías que no están siendo
tan vendidas.
2. Porcentaje de volúmenes vendidos por clase de producto, es claro que para
cualquier organización es muy importante mantener sus existencias en
rotación para no incurrir en gastos de almacenamiento, en este sentido, este
indicador sugiere dos elementos muy importantes, el primero es poder
optimizar su stock ya que de acuerdo al porcentaje de volúmenes vendidos
por clase de producto tendrá en inventario lo estrictamente necesario, y el
segundo elemento es el de poder determinar cual clase de producto es el
que más volúmenes vende y con ello encaminar acciones que fortalezcan el
volumen de ventas.
3. Porcentaje de libros recomendados para leer, a través de este indicador se
recopilan las sensaciones de los usuarios de acuerdo a sus gustos de lectura,
9. por ende, se hace indispensable generar acciones de valor a partir de la
interacción con los usuarios. Por lo tanto, en términos comerciales se pueden
desarrollar estrategias de venta con los libros mas recomendados para leer
ya que están categorizados de acuerdo a las preferencias de los usuarios.
10. Conclusiones
De acuerdo a los datos e información resultante de los archivos y del proyecto
planteado para la Librería Iztaccihuatl se ha logrado desarrollar un análisis
descriptivo que como su nombre lo indica, representa un contexto a priori de una
situación, proceso u organización en particular, no obstante, también se elaboraron
3 indicadores de desempeño que buscan cumplir con el objetivo (aumentar las
ventas) que se planteó para este proyecto.