Big data vs expertos - Adrián Plattner  @adrianplattner
Upcoming SlideShare
Loading in...5
×
 

Big data vs expertos - Adrián Plattner @adrianplattner

on

  • 1,178 views

Big Data vs Expertos. ...

Big Data vs Expertos.
En un mundo donde cada vez se produce más información, cómo las instituciones deben recolectar y/o utilizar la información disponible en redes sociales para tomar mejores decisiones que en muchos casos superan a los expertos que llevan años trabajando en una determinada área.
Adrián Plattner @adrianplattner

Mas informacion: http://www.refreshmaracaibo.org

Statistics

Views

Total Views
1,178
Views on SlideShare
295
Embed Views
883

Actions

Likes
0
Downloads
0
Comments
0

3 Embeds 883

http://refreshmaracaibo.org 879
https://twitter.com 2
http://www.google.co.ve 2

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Big data vs expertos - Adrián Plattner  @adrianplattner Big data vs expertos - Adrián Plattner @adrianplattner Presentation Transcript

    • Big Data vs Expertos@adrianplattner
    • ¿Qué tienen en común todaslas empresas?Dependen en gran medida en tomar las decisiones correctas
    • ¿Qué decisiones son claves enlas empresas?O ¿Qué riesgos tomar?O ¿Qué productos hacer?O ¿Qué clientes abarcar y comomantenerlos el mayor tiempo posible?
    • Poder predecir el futuro seriade mucha ayuda
    • Algunos lo han intentado
    • Bueno, volvamos a la realidadLas decisiones que toman las empresashoy en día se basan en los conocimientos yexperiencia de expertos en un áreadeterminada.
    • Limitaciones de la formaconvencional
    • ¿Que otra alternativa tenemos?¿Que tal dejar que la información hable por nosotros?
    • Nada nuevoO Muchas empresas utilizan métodosestadísticos como apoyo para la toma dedecisiones.O En la practica la mayoría solo usansumatorias y promedios.
    • Alternativa
    • Ejemploshttp://commons.wikimedia.org/wiki/File:ElectoralCollege2012.svg
    • Ejemploshttp://www.google.org/flutrends/us/#US
    • Wallmart
    • Farecast
    • Big Data“Big Data is any data that is expensive tomanage and hard to extract value from.”Michael Franklin-University of Berkeley“Big” es relativo
    • Desafíos de Big DataO VolumenO VelocidadO Variedad
    • ¿Qué datos producen en laactualidad?O Cada día Google produce 24 petabytesde datos.O De la información actual 90% fuegenerada en los últimos dos años.O 32 billones de búsquedas en Twitter elultimo mes.O Mas de dos billones de videos fueronvistos ayer en Youtube.
    • Pasos a seguir para unaempresaO Analizar que procesos de tu negocioquieres mejorar.O Analizar que datos tienes que te puedenservir y cual tienes que recolectar.O Dividir la información en muestra yprueba.O Aplicar diferentes modelos de predicciónque dependen del problema en base a lamuestra.O Aplicar el modelo resultante en la prueba.O Volver al segundo paso.
    • ¿Que proceso puedo mejoraren base a los datos?O Segmentación de Clientes.O Determinar el precio optimo de unproducto.O La usabilidad de mi pagina web(Clickstream).O Detección de fraude.O Determinar el éxito de una campaña oproducto en las redes sociales.O Calcular una oferta académica de unauniversidad.
    • Machine LearningRegresión Linear, Regresión Logística, Redes Neuronales, etc.
    • Herramientas importantes.O Map-Reduce(Apache Hadoop).O SQL(MySQL) y NoSQL(HBase).O Lenguajes de programación comoPython, R y Java.O Hojas de calculo(Excel).O IaaS(AWS).
    • Personal NecesarioO Estadísticos, Matemáticos o Físicos.O Ingenieros o licenciados en Computacióno Informática.O Managers.O Economistas.O Data Scientist(El nuevo Web Master).
    • Análisis de SentimientoAnalizar la reacción del publico hacia un producto o campaña en lasRedes sociales(Twitter).
    • Análisis de SentimientoO Utilizar el API de Twitter para consultar y/oalmacenar los tweets sobre lo que nosinteresa.O search.twitter.com/search.json?q=XXXO Almacenarlos en una bases de datosorientad a documentos(mongodb).O Tomar una muestra aleatoria de lostweets y clasificarlos uno a unomanualmente.
    • Análisis de SentimientoO P(recomendado|+)=100/1000=0.10O P(recomendado|-)=1/500=0.002O P(malo | -)=150/500 = 0.3O Ejemplo si l tweet es “Hey ayer fui a XX,altamente recomendado!”O Aplicando Bayes podemos determinarque el tweet es positivo.
    • El Lado Oscuro de Big Data
    • Conclusión
    • Gracias (:@adrianplattner