SlideShare a Scribd company logo
Introducción a la Ciencia de Datos y el Big Data
Proyecto individual evaluado por pares:
Utilizando la ciencia de Datos en una organización
Para la empresa:
Librería Iztaccihuatl
Presenta:
Ismael Pérez Mena
Mayo 2021
Introducción
La Ciencia de Datos es una ciencia dedicada a extraer información
valiosa a partir de los datos en bruto. Es interdisciplinaria, se apoya en las
matemáticas, la estadística y la informática, y también en el Data Mining y el
Machine Learning, entre otros.
En el presente documento se presenta la propuesta del proyecto de
ciencia de datos para la Librería Iztaccihuatl ubicada en la ciudad de
Monterrey, Nuevo León, México que le permita mejorar sus indicadores de
desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de
decisiones.
Se definen cuales son los indicadores más importantes a tener en
cuenta, el tipo de análisis que se va a desarrollar, así como las decisiones que
se podrán tomar en base a los descubrimientos obtenidos.
Indicadores
A continuación, se describen los principales indicadores a tener en cuenta en
el proyecto.
• Número de nuevos Leads/Usuarios Registrados
Cantidad de usuarios que se registraron voluntariamente mediante su
nombre y correo electrónico a través de una landig page.
• Tasa de conversión de Leads a ventas
Porcentaje de leads que se convirtieron en ventas o nuevos clientes.
Calculado mediante la siguiente formula.
𝑇𝑎𝑠𝑎 𝑑𝑒 𝑐𝑜𝑛𝑣𝑒𝑟𝑠𝑖ó𝑛 =
𝑙𝑒𝑎𝑑𝑠 𝑐𝑜𝑛𝑣𝑒𝑟𝑡𝑖𝑑𝑜𝑠 𝑒𝑛 𝑣𝑒𝑛𝑡𝑎𝑠
𝑙𝑒𝑎𝑑 𝑐𝑢𝑎𝑙𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑠
𝑥 100
• Número de ventas mensuales
Se refiere a la cantidad de ventas que se realizaron en 30 días.
Tipo de Análisis
Los archivos con los que se cuenta permiten obtener información sobre
los datos generales de los libros que ofrece la Librería, su clasificación con base
a las calificaciones de los usuarios, y los libros recomendados.
Se decidió utilizar un análisis de tipo Descriptivo buscando encontrar
patrones, relaciones entre variables, diferencias significativas entre grupos de
productos. Principalmente para mejorar las recomendaciones que el sistema
hace a los usuarios cuando ingresan a al sitio web, y los libros que están
marcando tendencia actualmente todo con el objetivo de brindar un mejor
servicio al usuario, así mismo sería importante identificar aquellos libros que
no se están vendiendo, o que no están teniendo una buena aceptación por
parte de los clientes.
Para ello se proponen realizar los siguientes análisis de los datos:
1. Del archivo top_books se propone obtener los datos de los primeros
5 libros de cada top.
2. Cruzar los datos del archivo toread con los datos el archivo ratings
para obtener los id’s de aquellos libros que son recomendados para
leer por los usuarios y que además son clasificados por los usuarios.
3. Para persuadir a los usuarios a registrarse en el sitio se propone
ofrecerles el tener acceso a poder ver las recomendaciones de los
libros y así obtener nuevos leads.
4. Utilizando técnicas como web scraping, extraer las palabras clave de
los temas que están marcando tendencia en las redes sociales,
almacenar esta información y utilizando herramientas de
procesamiento de lenguaje natural recuperar aquellos libros cuya
temática vaya acorde a dichos temas.
Propuesta de decisiones que la empresa podrá tomar en base a la
información analizada.
1. Con base la lista de libros obtenida de primer análisis el sistema
puede mostrarlos como sugerencias al momento de que un usuario
realice una compra en línea, o bien colocar ejemplares de dichos
libros a primera vista en los mostradores de la tienda física. Esta
información deberá actualizarse periódicamente.
2. Una vez realizados los cruces se contará con información que se
puede utilizar para determinar cuáles son los libros más
referenciados por que se deben de mostrar en las primeras páginas
del sitio.
3. Los usuarios generalmente se sienten intrigados cuando les ofreces
un beneficio, actualmente los nuevos compradores sobre todo de la
generación milenial suelen guiarse mucho por las recomendaciones
o comentarios de otros usuarios por los comentarios en redes
sociales, por lo que el poder acceder a ellos es un buen incentivo para
que los usuarios se sientan motivados a proporcionarnos sus datos,
e incrementar los leads.
4. Una de las recomendaciones más importantes para obtener un sitio
web atractivo es el mantener actualizado el contenido del sitio, y que
mejor que además de mostrar los nuevos libros, mostrar aquellos
que hablan sobre los temas de actualidad.
Conclusiones
La ciencia de datos está encaminada a encontrar información útil para las
organizaciones a partir de los datos, el tipo de análisis elegido permite conocer
mejor a la organización, cual es su estado actual, lo que se pretende
principalmente es aprovechar mejor los datos con los que ya cuenta la
empresa para tomar mejores decisiones, como a que libros darles mayor
atención y mostrarle mejores recomendaciones a los clientes, también
mantener un contenido actualizado en el sitio web que es una empresa a la
vanguardia y al tanto de los temas de actualidad y así atraer cada vez a mas
usuarios interesados y así a nuevos compradores.

More Related Content

Similar to Utilizando ciencia de datos en una Organizacion

Chapter 4 - Marketing Research Process
Chapter 4 - Marketing Research ProcessChapter 4 - Marketing Research Process
Chapter 4 - Marketing Research Process
Dr. Ankit Kesharwani
 
The Fundamentals of Content Marketing
The Fundamentals of Content MarketingThe Fundamentals of Content Marketing
The Fundamentals of Content Marketing
Myspeedhub
 
Text Analysis in Retail
Text Analysis in RetailText Analysis in Retail
Text Analysis in Retail
Bytesview
 
Digi marketing session 2
Digi marketing session 2Digi marketing session 2
Digi marketing session 2
Vinaytosh Mishra
 
How to 'right' a white paper (1)
How to 'right' a white paper (1)How to 'right' a white paper (1)
How to 'right' a white paper (1)
abbydoxiq
 
How to 'right' a white paper
How to 'right' a white paperHow to 'right' a white paper
How to 'right' a white paper
abbydoxiq
 
Big Data & Marketing Analytics - How to Use Available Data, and How to Prepar...
Big Data & Marketing Analytics - How to Use Available Data, and How to Prepar...Big Data & Marketing Analytics - How to Use Available Data, and How to Prepar...
Big Data & Marketing Analytics - How to Use Available Data, and How to Prepar...
Luciano Pesci, PhD
 
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
Productdata Scrape
 
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
Productdata Scrape
 
6 Steps To Solid Content Marketing Plan
6 Steps To Solid Content Marketing Plan6 Steps To Solid Content Marketing Plan
6 Steps To Solid Content Marketing Plan
Stephen Bateman DipM CIM
 
Guide to Data Analytics for Marketing.pptx
Guide to Data Analytics for Marketing.pptxGuide to Data Analytics for Marketing.pptx
Guide to Data Analytics for Marketing.pptx
Andrea Powell
 
PresentationThe capability of enormous information - or the new .pdf
PresentationThe capability of enormous information - or the new .pdfPresentationThe capability of enormous information - or the new .pdf
PresentationThe capability of enormous information - or the new .pdf
aradhana9856
 
Lehigh Valley HUG- The Value of Buyer Personas
Lehigh Valley HUG- The Value of Buyer Personas Lehigh Valley HUG- The Value of Buyer Personas
Lehigh Valley HUG- The Value of Buyer Personas
Lehigh Valley HubSpot User Group
 
Social media Enabling Smart Decisions
Social media Enabling Smart DecisionsSocial media Enabling Smart Decisions
Social media Enabling Smart Decisions
Orchestrate Mortgage and Title Solutions, LLC
 
Big data can be used at SME's too
Big data can be used at SME's tooBig data can be used at SME's too
Big data can be used at SME's too
George Antony
 
Unit 2 types of Marketing Research notes.pdf
Unit 2 types of Marketing Research notes.pdfUnit 2 types of Marketing Research notes.pdf
Unit 2 types of Marketing Research notes.pdf
KrishJaiswal23
 
A Guide to Modern B2B Content Marketing
A Guide to Modern B2B Content Marketing A Guide to Modern B2B Content Marketing
A Guide to Modern B2B Content Marketing
Modern Marketing Partners
 
Marketing data
Marketing dataMarketing data
Marketing data
TEMPLA73
 
Start up and new venture management customer discovery
Start up and new venture management customer discoveryStart up and new venture management customer discovery
Start up and new venture management customer discovery
Priyanka Naik-Darekar
 
Marketing Assignment Help | Marketing Assignment Help with Onlineassignemnt.net
Marketing Assignment Help | Marketing Assignment Help with Onlineassignemnt.net Marketing Assignment Help | Marketing Assignment Help with Onlineassignemnt.net
Marketing Assignment Help | Marketing Assignment Help with Onlineassignemnt.net
Online
 

Similar to Utilizando ciencia de datos en una Organizacion (20)

Chapter 4 - Marketing Research Process
Chapter 4 - Marketing Research ProcessChapter 4 - Marketing Research Process
Chapter 4 - Marketing Research Process
 
The Fundamentals of Content Marketing
The Fundamentals of Content MarketingThe Fundamentals of Content Marketing
The Fundamentals of Content Marketing
 
Text Analysis in Retail
Text Analysis in RetailText Analysis in Retail
Text Analysis in Retail
 
Digi marketing session 2
Digi marketing session 2Digi marketing session 2
Digi marketing session 2
 
How to 'right' a white paper (1)
How to 'right' a white paper (1)How to 'right' a white paper (1)
How to 'right' a white paper (1)
 
How to 'right' a white paper
How to 'right' a white paperHow to 'right' a white paper
How to 'right' a white paper
 
Big Data & Marketing Analytics - How to Use Available Data, and How to Prepar...
Big Data & Marketing Analytics - How to Use Available Data, and How to Prepar...Big Data & Marketing Analytics - How to Use Available Data, and How to Prepar...
Big Data & Marketing Analytics - How to Use Available Data, and How to Prepar...
 
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
 
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
How Does Scraping Shopee and Lazada Product Review Data Impact Decision-Makin...
 
6 Steps To Solid Content Marketing Plan
6 Steps To Solid Content Marketing Plan6 Steps To Solid Content Marketing Plan
6 Steps To Solid Content Marketing Plan
 
Guide to Data Analytics for Marketing.pptx
Guide to Data Analytics for Marketing.pptxGuide to Data Analytics for Marketing.pptx
Guide to Data Analytics for Marketing.pptx
 
PresentationThe capability of enormous information - or the new .pdf
PresentationThe capability of enormous information - or the new .pdfPresentationThe capability of enormous information - or the new .pdf
PresentationThe capability of enormous information - or the new .pdf
 
Lehigh Valley HUG- The Value of Buyer Personas
Lehigh Valley HUG- The Value of Buyer Personas Lehigh Valley HUG- The Value of Buyer Personas
Lehigh Valley HUG- The Value of Buyer Personas
 
Social media Enabling Smart Decisions
Social media Enabling Smart DecisionsSocial media Enabling Smart Decisions
Social media Enabling Smart Decisions
 
Big data can be used at SME's too
Big data can be used at SME's tooBig data can be used at SME's too
Big data can be used at SME's too
 
Unit 2 types of Marketing Research notes.pdf
Unit 2 types of Marketing Research notes.pdfUnit 2 types of Marketing Research notes.pdf
Unit 2 types of Marketing Research notes.pdf
 
A Guide to Modern B2B Content Marketing
A Guide to Modern B2B Content Marketing A Guide to Modern B2B Content Marketing
A Guide to Modern B2B Content Marketing
 
Marketing data
Marketing dataMarketing data
Marketing data
 
Start up and new venture management customer discovery
Start up and new venture management customer discoveryStart up and new venture management customer discovery
Start up and new venture management customer discovery
 
Marketing Assignment Help | Marketing Assignment Help with Onlineassignemnt.net
Marketing Assignment Help | Marketing Assignment Help with Onlineassignemnt.net Marketing Assignment Help | Marketing Assignment Help with Onlineassignemnt.net
Marketing Assignment Help | Marketing Assignment Help with Onlineassignemnt.net
 

Recently uploaded

Learn SQL from basic queries to Advance queries
Learn SQL from basic queries to Advance queriesLearn SQL from basic queries to Advance queries
Learn SQL from basic queries to Advance queries
manishkhaire30
 
STATATHON: Unleashing the Power of Statistics in a 48-Hour Knowledge Extravag...
STATATHON: Unleashing the Power of Statistics in a 48-Hour Knowledge Extravag...STATATHON: Unleashing the Power of Statistics in a 48-Hour Knowledge Extravag...
STATATHON: Unleashing the Power of Statistics in a 48-Hour Knowledge Extravag...
sameer shah
 
A presentation that explain the Power BI Licensing
A presentation that explain the Power BI LicensingA presentation that explain the Power BI Licensing
A presentation that explain the Power BI Licensing
AlessioFois2
 
Global Situational Awareness of A.I. and where its headed
Global Situational Awareness of A.I. and where its headedGlobal Situational Awareness of A.I. and where its headed
Global Situational Awareness of A.I. and where its headed
vikram sood
 
The Building Blocks of QuestDB, a Time Series Database
The Building Blocks of QuestDB, a Time Series DatabaseThe Building Blocks of QuestDB, a Time Series Database
The Building Blocks of QuestDB, a Time Series Database
javier ramirez
 
一比一原版(Chester毕业证书)切斯特大学毕业证如何办理
一比一原版(Chester毕业证书)切斯特大学毕业证如何办理一比一原版(Chester毕业证书)切斯特大学毕业证如何办理
一比一原版(Chester毕业证书)切斯特大学毕业证如何办理
74nqk8xf
 
Analysis insight about a Flyball dog competition team's performance
Analysis insight about a Flyball dog competition team's performanceAnalysis insight about a Flyball dog competition team's performance
Analysis insight about a Flyball dog competition team's performance
roli9797
 
一比一原版(爱大毕业证书)爱丁堡大学毕业证如何办理
一比一原版(爱大毕业证书)爱丁堡大学毕业证如何办理一比一原版(爱大毕业证书)爱丁堡大学毕业证如何办理
一比一原版(爱大毕业证书)爱丁堡大学毕业证如何办理
g4dpvqap0
 
在线办理(英国UCA毕业证书)创意艺术大学毕业证在读证明一模一样
在线办理(英国UCA毕业证书)创意艺术大学毕业证在读证明一模一样在线办理(英国UCA毕业证书)创意艺术大学毕业证在读证明一模一样
在线办理(英国UCA毕业证书)创意艺术大学毕业证在读证明一模一样
v7oacc3l
 
Challenges of Nation Building-1.pptx with more important
Challenges of Nation Building-1.pptx with more importantChallenges of Nation Building-1.pptx with more important
Challenges of Nation Building-1.pptx with more important
Sm321
 
一比一原版(UMN文凭证书)明尼苏达大学毕业证如何办理
一比一原版(UMN文凭证书)明尼苏达大学毕业证如何办理一比一原版(UMN文凭证书)明尼苏达大学毕业证如何办理
一比一原版(UMN文凭证书)明尼苏达大学毕业证如何办理
nyfuhyz
 
Intelligence supported media monitoring in veterinary medicine
Intelligence supported media monitoring in veterinary medicineIntelligence supported media monitoring in veterinary medicine
Intelligence supported media monitoring in veterinary medicine
AndrzejJarynowski
 
Beyond the Basics of A/B Tests: Highly Innovative Experimentation Tactics You...
Beyond the Basics of A/B Tests: Highly Innovative Experimentation Tactics You...Beyond the Basics of A/B Tests: Highly Innovative Experimentation Tactics You...
Beyond the Basics of A/B Tests: Highly Innovative Experimentation Tactics You...
Aggregage
 
My burning issue is homelessness K.C.M.O.
My burning issue is homelessness K.C.M.O.My burning issue is homelessness K.C.M.O.
My burning issue is homelessness K.C.M.O.
rwarrenll
 
State of Artificial intelligence Report 2023
State of Artificial intelligence Report 2023State of Artificial intelligence Report 2023
State of Artificial intelligence Report 2023
kuntobimo2016
 
ViewShift: Hassle-free Dynamic Policy Enforcement for Every Data Lake
ViewShift: Hassle-free Dynamic Policy Enforcement for Every Data LakeViewShift: Hassle-free Dynamic Policy Enforcement for Every Data Lake
ViewShift: Hassle-free Dynamic Policy Enforcement for Every Data Lake
Walaa Eldin Moustafa
 
Everything you wanted to know about LIHTC
Everything you wanted to know about LIHTCEverything you wanted to know about LIHTC
Everything you wanted to know about LIHTC
Roger Valdez
 
Udemy_2024_Global_Learning_Skills_Trends_Report (1).pdf
Udemy_2024_Global_Learning_Skills_Trends_Report (1).pdfUdemy_2024_Global_Learning_Skills_Trends_Report (1).pdf
Udemy_2024_Global_Learning_Skills_Trends_Report (1).pdf
Fernanda Palhano
 
End-to-end pipeline agility - Berlin Buzzwords 2024
End-to-end pipeline agility - Berlin Buzzwords 2024End-to-end pipeline agility - Berlin Buzzwords 2024
End-to-end pipeline agility - Berlin Buzzwords 2024
Lars Albertsson
 
一比一原版(Harvard毕业证书)哈佛大学毕业证如何办理
一比一原版(Harvard毕业证书)哈佛大学毕业证如何办理一比一原版(Harvard毕业证书)哈佛大学毕业证如何办理
一比一原版(Harvard毕业证书)哈佛大学毕业证如何办理
zsjl4mimo
 

Recently uploaded (20)

Learn SQL from basic queries to Advance queries
Learn SQL from basic queries to Advance queriesLearn SQL from basic queries to Advance queries
Learn SQL from basic queries to Advance queries
 
STATATHON: Unleashing the Power of Statistics in a 48-Hour Knowledge Extravag...
STATATHON: Unleashing the Power of Statistics in a 48-Hour Knowledge Extravag...STATATHON: Unleashing the Power of Statistics in a 48-Hour Knowledge Extravag...
STATATHON: Unleashing the Power of Statistics in a 48-Hour Knowledge Extravag...
 
A presentation that explain the Power BI Licensing
A presentation that explain the Power BI LicensingA presentation that explain the Power BI Licensing
A presentation that explain the Power BI Licensing
 
Global Situational Awareness of A.I. and where its headed
Global Situational Awareness of A.I. and where its headedGlobal Situational Awareness of A.I. and where its headed
Global Situational Awareness of A.I. and where its headed
 
The Building Blocks of QuestDB, a Time Series Database
The Building Blocks of QuestDB, a Time Series DatabaseThe Building Blocks of QuestDB, a Time Series Database
The Building Blocks of QuestDB, a Time Series Database
 
一比一原版(Chester毕业证书)切斯特大学毕业证如何办理
一比一原版(Chester毕业证书)切斯特大学毕业证如何办理一比一原版(Chester毕业证书)切斯特大学毕业证如何办理
一比一原版(Chester毕业证书)切斯特大学毕业证如何办理
 
Analysis insight about a Flyball dog competition team's performance
Analysis insight about a Flyball dog competition team's performanceAnalysis insight about a Flyball dog competition team's performance
Analysis insight about a Flyball dog competition team's performance
 
一比一原版(爱大毕业证书)爱丁堡大学毕业证如何办理
一比一原版(爱大毕业证书)爱丁堡大学毕业证如何办理一比一原版(爱大毕业证书)爱丁堡大学毕业证如何办理
一比一原版(爱大毕业证书)爱丁堡大学毕业证如何办理
 
在线办理(英国UCA毕业证书)创意艺术大学毕业证在读证明一模一样
在线办理(英国UCA毕业证书)创意艺术大学毕业证在读证明一模一样在线办理(英国UCA毕业证书)创意艺术大学毕业证在读证明一模一样
在线办理(英国UCA毕业证书)创意艺术大学毕业证在读证明一模一样
 
Challenges of Nation Building-1.pptx with more important
Challenges of Nation Building-1.pptx with more importantChallenges of Nation Building-1.pptx with more important
Challenges of Nation Building-1.pptx with more important
 
一比一原版(UMN文凭证书)明尼苏达大学毕业证如何办理
一比一原版(UMN文凭证书)明尼苏达大学毕业证如何办理一比一原版(UMN文凭证书)明尼苏达大学毕业证如何办理
一比一原版(UMN文凭证书)明尼苏达大学毕业证如何办理
 
Intelligence supported media monitoring in veterinary medicine
Intelligence supported media monitoring in veterinary medicineIntelligence supported media monitoring in veterinary medicine
Intelligence supported media monitoring in veterinary medicine
 
Beyond the Basics of A/B Tests: Highly Innovative Experimentation Tactics You...
Beyond the Basics of A/B Tests: Highly Innovative Experimentation Tactics You...Beyond the Basics of A/B Tests: Highly Innovative Experimentation Tactics You...
Beyond the Basics of A/B Tests: Highly Innovative Experimentation Tactics You...
 
My burning issue is homelessness K.C.M.O.
My burning issue is homelessness K.C.M.O.My burning issue is homelessness K.C.M.O.
My burning issue is homelessness K.C.M.O.
 
State of Artificial intelligence Report 2023
State of Artificial intelligence Report 2023State of Artificial intelligence Report 2023
State of Artificial intelligence Report 2023
 
ViewShift: Hassle-free Dynamic Policy Enforcement for Every Data Lake
ViewShift: Hassle-free Dynamic Policy Enforcement for Every Data LakeViewShift: Hassle-free Dynamic Policy Enforcement for Every Data Lake
ViewShift: Hassle-free Dynamic Policy Enforcement for Every Data Lake
 
Everything you wanted to know about LIHTC
Everything you wanted to know about LIHTCEverything you wanted to know about LIHTC
Everything you wanted to know about LIHTC
 
Udemy_2024_Global_Learning_Skills_Trends_Report (1).pdf
Udemy_2024_Global_Learning_Skills_Trends_Report (1).pdfUdemy_2024_Global_Learning_Skills_Trends_Report (1).pdf
Udemy_2024_Global_Learning_Skills_Trends_Report (1).pdf
 
End-to-end pipeline agility - Berlin Buzzwords 2024
End-to-end pipeline agility - Berlin Buzzwords 2024End-to-end pipeline agility - Berlin Buzzwords 2024
End-to-end pipeline agility - Berlin Buzzwords 2024
 
一比一原版(Harvard毕业证书)哈佛大学毕业证如何办理
一比一原版(Harvard毕业证书)哈佛大学毕业证如何办理一比一原版(Harvard毕业证书)哈佛大学毕业证如何办理
一比一原版(Harvard毕业证书)哈佛大学毕业证如何办理
 

Utilizando ciencia de datos en una Organizacion

  • 1. Introducción a la Ciencia de Datos y el Big Data Proyecto individual evaluado por pares: Utilizando la ciencia de Datos en una organización Para la empresa: Librería Iztaccihuatl Presenta: Ismael Pérez Mena Mayo 2021
  • 2. Introducción La Ciencia de Datos es una ciencia dedicada a extraer información valiosa a partir de los datos en bruto. Es interdisciplinaria, se apoya en las matemáticas, la estadística y la informática, y también en el Data Mining y el Machine Learning, entre otros. En el presente documento se presenta la propuesta del proyecto de ciencia de datos para la Librería Iztaccihuatl ubicada en la ciudad de Monterrey, Nuevo León, México que le permita mejorar sus indicadores de desempeño (KPI’s) y a la vez desarrollar una mejor estrategia en la toma de decisiones. Se definen cuales son los indicadores más importantes a tener en cuenta, el tipo de análisis que se va a desarrollar, así como las decisiones que se podrán tomar en base a los descubrimientos obtenidos. Indicadores A continuación, se describen los principales indicadores a tener en cuenta en el proyecto. • Número de nuevos Leads/Usuarios Registrados Cantidad de usuarios que se registraron voluntariamente mediante su nombre y correo electrónico a través de una landig page. • Tasa de conversión de Leads a ventas Porcentaje de leads que se convirtieron en ventas o nuevos clientes. Calculado mediante la siguiente formula. 𝑇𝑎𝑠𝑎 𝑑𝑒 𝑐𝑜𝑛𝑣𝑒𝑟𝑠𝑖ó𝑛 = 𝑙𝑒𝑎𝑑𝑠 𝑐𝑜𝑛𝑣𝑒𝑟𝑡𝑖𝑑𝑜𝑠 𝑒𝑛 𝑣𝑒𝑛𝑡𝑎𝑠 𝑙𝑒𝑎𝑑 𝑐𝑢𝑎𝑙𝑖𝑓𝑖𝑐𝑎𝑑𝑜𝑠 𝑥 100 • Número de ventas mensuales Se refiere a la cantidad de ventas que se realizaron en 30 días.
  • 3. Tipo de Análisis Los archivos con los que se cuenta permiten obtener información sobre los datos generales de los libros que ofrece la Librería, su clasificación con base a las calificaciones de los usuarios, y los libros recomendados. Se decidió utilizar un análisis de tipo Descriptivo buscando encontrar patrones, relaciones entre variables, diferencias significativas entre grupos de productos. Principalmente para mejorar las recomendaciones que el sistema hace a los usuarios cuando ingresan a al sitio web, y los libros que están marcando tendencia actualmente todo con el objetivo de brindar un mejor servicio al usuario, así mismo sería importante identificar aquellos libros que no se están vendiendo, o que no están teniendo una buena aceptación por parte de los clientes. Para ello se proponen realizar los siguientes análisis de los datos: 1. Del archivo top_books se propone obtener los datos de los primeros 5 libros de cada top. 2. Cruzar los datos del archivo toread con los datos el archivo ratings para obtener los id’s de aquellos libros que son recomendados para leer por los usuarios y que además son clasificados por los usuarios. 3. Para persuadir a los usuarios a registrarse en el sitio se propone ofrecerles el tener acceso a poder ver las recomendaciones de los libros y así obtener nuevos leads. 4. Utilizando técnicas como web scraping, extraer las palabras clave de los temas que están marcando tendencia en las redes sociales, almacenar esta información y utilizando herramientas de procesamiento de lenguaje natural recuperar aquellos libros cuya temática vaya acorde a dichos temas. Propuesta de decisiones que la empresa podrá tomar en base a la información analizada. 1. Con base la lista de libros obtenida de primer análisis el sistema puede mostrarlos como sugerencias al momento de que un usuario realice una compra en línea, o bien colocar ejemplares de dichos
  • 4. libros a primera vista en los mostradores de la tienda física. Esta información deberá actualizarse periódicamente. 2. Una vez realizados los cruces se contará con información que se puede utilizar para determinar cuáles son los libros más referenciados por que se deben de mostrar en las primeras páginas del sitio. 3. Los usuarios generalmente se sienten intrigados cuando les ofreces un beneficio, actualmente los nuevos compradores sobre todo de la generación milenial suelen guiarse mucho por las recomendaciones o comentarios de otros usuarios por los comentarios en redes sociales, por lo que el poder acceder a ellos es un buen incentivo para que los usuarios se sientan motivados a proporcionarnos sus datos, e incrementar los leads. 4. Una de las recomendaciones más importantes para obtener un sitio web atractivo es el mantener actualizado el contenido del sitio, y que mejor que además de mostrar los nuevos libros, mostrar aquellos que hablan sobre los temas de actualidad. Conclusiones La ciencia de datos está encaminada a encontrar información útil para las organizaciones a partir de los datos, el tipo de análisis elegido permite conocer mejor a la organización, cual es su estado actual, lo que se pretende principalmente es aprovechar mejor los datos con los que ya cuenta la empresa para tomar mejores decisiones, como a que libros darles mayor atención y mostrarle mejores recomendaciones a los clientes, también mantener un contenido actualizado en el sitio web que es una empresa a la vanguardia y al tanto de los temas de actualidad y así atraer cada vez a mas usuarios interesados y así a nuevos compradores.