Successfully reported this slideshow.
Your SlideShare is downloading. ×

Big data en entornos corporativos - CommCorp

Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Ad
Loading in …3
×

Check these out next

1 of 38 Ad
Advertisement

More Related Content

Slideshows for you (20)

Viewers also liked (20)

Advertisement

Similar to Big data en entornos corporativos - CommCorp (20)

More from Grupo DIRCOM (20)

Advertisement

Recently uploaded (20)

Big data en entornos corporativos - CommCorp

  1. 1. BIG DATA: Gestión estratégica de datos masivos en entornos corporativos.
  2. 2. 1. Agendar (como móvil) el número: +54 11 4521 8289 2. Enviar un chat con la palabra COMMCORP + Nombre y apellido 3. Recibirás las instrucciones para descargar gratis la última edición de Revista DIRCOM Pide Revista DIRCOM nº 106 via
  3. 3. ¿Qué es el Big Data? ■ TÉCNICO: captura, gestión y procesamiento de enormes volúmenes de datos. ■ NEGOCIO: procesos de flujos de información para el éxito de la empresa. ■ REFLEXIVO: es un cambio de concepción que debe tomar la empresa. Un desafío.
  4. 4. ¿Por qué es Big Data? Evolución en ■ Bases de datos: Transaccional, analítica, operativa. ■ Registros de información: logs, elementos webs o servidores. Mainframe, Servers, web servers, NetWorks, virtual machines, Databases, APP Servers, security devices, otros. ■ Información que generan las personas en las redes sociales, contactos, call center, otros.
  5. 5. Internet, en tiempo real…
  6. 6. Control total Director: D.J. Caruso Protagonista: Shia LaBeouf y Michelle Monaghan. País: Estados Unidos Año: 2008 youtu.be/IO3k9chchjw
  7. 7. 3 V del Big Data VOLUMEN VELOCIDA D VARIEDAD
  8. 8. ¿Cómo utilizar Big Data? Operational intelligence ■ Datos: fluyen ■ Tiempo real ■ Resultados - máquinas ■ Automatiza ■ Puede almacenar Business Intelligence ■ Base de datos ■ Analiza con tiempo ■ Resultados - Humanos. ■ Proyecta ■ Almacena
  9. 9. Rompiendo Las Reglas Protagonistas: Brad Pitt, Jonah Hill, Philip Seymour Hoffman Dirección: Bennett Miller País: Estados Unidos Año 2011
  10. 10. youtu.be/lLclCZsRGSk
  11. 11. Unidades de almacenamiento
  12. 12. Fuente: EMC 1 Exabyte = 1 000 000 000 gigabytes
  13. 13. 1 Petabyte = 1 000 000 Gigabytes ■ Google procesa alrededor de 24 Petabytes de información por día. ■ AT&T, transmite 19 Petabytes de datos x mes. ■ Facebook que almacena entorno a 100 Petabytes sólo en fotografías y vídeos. ■ El 90% de los datos existentes han sido creados en los 2 últimos años. (IBM)
  14. 14. Big Data: Equipo de Trabajo ■ “Big Data Analyst” o “Data scientist” ■ Antes sociólogos, encuestadores, otros … ■ Ahora también matemáticos, infógrafos, cartógrafos digitales, estadísticos.
  15. 15. Big Data: Equipo de Trabajo ■ Hay más datos complejos y diversos. ■ Se necesitan diseñar patrones especulativos de conductas. ■ Hay un desplazamiento de sociólogos a matemáticos.
  16. 16. Internet de las cosas ■ Más información en tiempo real ■ Integración al Big Data ■ Monitoreo salud en línea ■ Control de tránsito ■ Stock de mercaderías ■ Personalizar productos y servicios
  17. 17. Big Data: Oportunidades ■ Internet de las cosas ■ Geolocalización ■ Segmentaciones ■ Identificar comportamientos, patrones, relaciones, tendencias ■ Experimentar, observar y/o analizar en tiempo real ■ Tomar decisiones con mayor seguridad ■ Precisión en ofertas: día, hora, alcance ■ Visualizar y detener fraudes ■ Mayor personalización en los servicios
  18. 18. Análisis Predictivo ■ Reemplazando el estudio del historial de los sucesos por la verdadera prevención e influencia en las acciones futuras. ■ BI Tradicional: el usuario debía identificar las partes que utilizaría de esa información y definir cómo utilizarla. ■ Análisis BD: ¿Por qué está sucediendo esto? ¿Qué sucederá después? ¿Cómo se puede cambiar? ■ El análisis predictivo evita que ocurran ciertos hechos y posibilita cambiar el curso de las acciones.
  19. 19. youtu.be/8SJQtn4RO7I Análisis predictivo: para reducir la delincuencia
  20. 20. Análisis predictivo: para encontrar oportunidades ocultas youtu.be/pTNOY_aRtBk
  21. 21. Big Data y la Privacidad de Datos ■ Desconocimiento en los cuidados. ■ 62% Empresas evita utilizar datos obtenidos on line por temor a incumplir normas de privacidad. (Fuente: Silverpop) ■ Empresas & movimientos defensores. ■ Una empresa víctima de un ataque de seguridad pierde el 30% de su valor bursátil. (Serv. Seguridad de TI en HP)
  22. 22. Privacidad de Datos: Malte Spitz youtu.be/J1EKvWot-3c
  23. 23. Big Data y la Privacidad de Datos ¿Qué sienten los consumidores? ■ 84% de los consumidores reconoce ser monitoreado. ■ 65% acepta a cambio de un beneficio. ■ 72% abierta al diálogo con las marcas. ■ Preocupación por privacidad de datos. Fuente: “La verdad sobre la privacidad”, realizada a más de 6.500 personas x McCann Erickson.
  24. 24. Big Data y la Privacidad de Datos ■ Conocimiento. ■ Transparencia con los usuarios. ■ Incentivar buenas prácticas de comportamiento.
  25. 25. Soluciones Big Data
  26. 26. Soluciones Big Data
  27. 27. Big Data y las PyMES ■ No están preparadas. No disponen recursos. ■ Algunas carecen de CRM (sistemas para la relación con clientes) o ERP (sistemas de gestión). ■ Deben recibir el servicio fácil y “encapsulado”.
  28. 28. Organizaciones que usan Big Data
  29. 29. Big Data en Organismos Públicos USA: Salud Pública: inundadas en un maremoto de información biomédica, utilizan Big Data para mejora de resultados de la atención y la salud de la población.
  30. 30. Big Data en Organismos Públicos Italia: La administración ayuda a entidades públicas a cooperar, compartir buenas prácticas y optimizar procesos internos. Como resultado, ahorran tiempo, reducen costos y satisfacen las necesidades de los ciudadanos…
  31. 31. Posibles soluciones ofrecidas ■ Ventas inteligentes. ■ Demanda en tiempo real. ■ Construcción de marcas. ■ Mantenimiento predictivo. ■ Fidelización. ■ Personalización de casos. ■ Productos recomendados. ■ Detección de fraudes. ■ Ciudades inteligentes.
  32. 32. Empresa competitiva sería... ■ Big Data ■ Cloud ■ Experiencia de cliente ■ Internet de las Cosas - IoT ■ Movilidad
  33. 33. Algunos puntos negativos ■ Dudas de los usuarios sobre el uso de sus datos. ■ Ataque a la seguridad de las empresas. ■ Tácticas utilizadas para la recolección de datos de los públicos.
  34. 34. Algunos puntos positivos ■ Datos: pueden ser analizados en tiempo real. ■ La Nube: seguridad, bajo costo y actualizaciones. ■ Nuevas aplicaciones de datos permitiendo gestionar e integrar la información. ■ Perfil mayor del cliente o usuario. ■ Al integrar big data y almacenamiento, aumenta la eficiencia operativa.
  35. 35. ¡Gracias! jjlarrea@consultoradircom.com www.consultoradircom.com facebook.com/juanjoselarrea @jjlarrea
  36. 36. Descarga la presentación escaneando el código QR
  37. 37. ¡Gracias! jjlarrea@consultoradircom.com www.consultoradircom.com facebook.com/juanjoselarrea @jjlarrea

Editor's Notes

  • Macro datos según la real academia

    Tanto Cloud como Big Data están impulsando el desarrollo del mercado TI, empujando a Internet a posicionarse como un canal que trasciende la comunicación interpersonal para alzarse en el nexo entre máquinas, dispositivos, etc., lo que abre la puerta al establecimiento de nuevos negocios, en los que la movilidad desempeña un papel clave.

    ¿Qué pasó?
    En la década de 1990, los equipos de tecnología se centraban en obtener un rendimiento óptimo de las aplicaciones infraestructuras clave de sus empresas. Estos «sistemas de registro» en silo normalmente hacían un buen trabajo a la hora de mantener un registro de la información importante pero eran caros y no ofrecían una visión lo suficientemente detallada de los datos para que pudiera suponer una ventaja empresarial. En la década de 2000, el centro de interés de la tecnología cambió hacia la eficiencia cómo conseguir más con menos. Tecnologías como la virtualización, el uso compartido y la consolidación de la infraestructura existente de la empresa se convirtieron en los impulsores clave de la tecnología.

    Ahora estamos entrando en la era de la gran escala, donde la cantidad de datos procesados y almacenados por las empresas supera las construcciones arquitectónicas del sector del almacenamiento actual. Como resultado, los equipos de tecnología intentan convertir los sistemas de registro existentes, creados en las décadas de los 90 y 2000, en «sistemas de adquisición», que pueden proporcionar la información necesaria a las personas adecuadas de forma eficiente, y en tiempo real, para ayudarles a realizar análisis más sofisticados y a tomar mejores decisiones empresariales.

    Los datos por sí solos no tienen valor. El valor deriva del uso de los mismos para impulsar los resultados del negocio, ofrecer servicios a los clientes y aumentar los ingresos. El reto para el almacenamiento escalable consiste en hacer posibles estos resultados empresariales a partir de conjuntos de datos de dimensiones considerables.

    Fuente de aumento:
    Este aumento masivo a escala se produce por diversos motivos. Debido a la presión de los costes, muchas empresas están consolidando sus centros de datos ya que no pueden permitirse que cada unidad empresarial tenga su propia infraestructura tecnológica distribuida por todo el mundo. El paso a cloud computing también contribuye al aumento de la escala, lo cual añade a la demanda cientos de miles de usuarios en menos sistemas centralizados.
    Otra fuente del aumento de escala es el crecimiento masivo de datos generados por equipos y usuarios. Las tecnologías digitales se están pasando a medios más densos, las fotografías han pasado a ser digitales, los vídeos utilizan la resolución más alta y el análisis avanzado requiere más almacenamiento. Además, los datos generados por el equipo a partir de redes sensores, seguimiento del comportamiento de compra y otras fuentes, contribuyen a crear conjuntos de datos de mayor tamaño que deben comprenderse y comercializarse. En resumen, la cantidad de datos está aumentando y los objetos de datos en sí mismos están aumentando de tamaño. Todas estas fuerzas juntas crean una cantidad enorme de presión de escala sobre las infraestructuras existentes, especialmente en la plataforma de almacenamiento.



    Importancia extra de guardar los datos
    El cumplimiento de normativas también es un reto importante para muchas empresas. Las organizaciones reguladas pueden tener que mantener sus datos durante periodos muy largos de tiempo o para siempre. Y se les solicita que encuentren datos rápidamente cuando sean necesarios para informes o durante auditorías del sector.

    Uno de los problemas que enfrenta la empresa es el contenido. Su almacenamiento y acceso.

    La nueva era de la escala está superando las arquitecturas de almacenamiento existentes. Las empresas necesitan plantearse las siguientes preguntas: ¿existen oportunidades para que aprovechemos mejor nuestros datos? ¿Qué información interna puede ayudar realmente a nuestro negocio? ¿Dónde podemos utilizar los datos para obtener una ventaja competitiva? ¿Qué pasaría si pudiéramos vincular las tendencias de patrones de compra a la ubicación física de las personas en un momento concreto para proporcionarles una mejor experiencia? ¿Qué pasaría si pudiéramos detectar cuándo va a suceder un fraude? ¿Podemos identificar los puntos conflictivos de probabilidad de fallo antes de que sucedan?
  • Tecnológico: estaría resuelto.
    Negocio: La capacidad de la explotación de toda la información con el objetivo de mejorar.
    Reflexivo: Desafío para cambiar e imaginar el trabajo de manera distinta. Incluso entender que ahora se está en condiciones de obtener ciertos resultados y con ellos el desafío sería qué hacer.
    Un desafío: Adaptarse al cambio. Aprender a vivir en la nueva realidad.
    No podemos resolver problemas actuales con soluciones de hace 20 o 40 años. Todos los modelos de hardware y software habría que re pensarlos. Las típicas bases de datos relacionales, áreas de sistemas sin actualización.
    Es lindo el desafío de pensar QUE PODEMOS HACER CON TODO ESTO? y no como el elefante que por su memoria tiene un stopper mental que no lo deja mover con su traba.
    GANA el que sabe adaptarse.


  • hay que tomar este nuevo sistema como el big data, como un nuevo paradigma. Es un desafío.
    Que se hace con la información que se recolecta? Como se procesa?

    algunos datos se guardan (por regulaciones legales o por si pasa algo) y otros directamente no.
    Hoy existe en la mayoría de las empresas una inviabilidad para el procesamiento de los datos en su plenitud.
    No sólo los sistemas entregan información. también lo generan las personas y estos entregan valor. Crea una oportunidad en la mejora de la atención al cliente y del negocio.
    No obstante el problema en las empresas es creciente.
  • Las dimensiones de Big Data están denominadas con las tres V:
    Volumen de datos que se miden en Terabytes o Petabytes de información
    Velocidad- el dato debe responder de manera instantánea a las necesidades de información
    Variedad- los datos vienen en distintos soportes: audio, video o posts de Social Media

  • business intelligence
    Se denomina inteligencia empresarial, inteligencia de negocios o BI (del inglés business intelligence) al conjunto de estrategias y aspectos relevantes enfocadas a la administración y creación de conocimiento sobre el medio, a través del análisis de los datos existentes en una organización o empresa.
    Es posible diferenciar datos, informaciones y conocimientos, conceptos en los que se centra la inteligencia empresarial, ya que como sabemos, un dato es algo vago, por ejemplo "10 000", la información es algo más preciso, por ejemplo "Las ventas del mes de mayo fueron de 10 000", y el conocimiento se obtiene mediante el análisis de la información, por ejemplo "Las ventas del mes de mayo fueron 10 000. Mayo es el mes más bajo en ventas". Aquí es donde la BI entra en juego, ya que al obtener conocimiento del negocio una vez capturada la información de todas las áreas en la empresa, es posible establecer estrategias y determinar cuáles son las fortalezas y las debilidades.

    Operational intelligence - La inteligencia operativa
    es una categoría de análisis en tiempo real dinámico, de negocios que ofrece la visibilidad y la comprensión de los datos, streaming de eventos y operaciones de negocio. Soluciones de Inteligencia Operacional ejecutan consultas contra los datos de transmisión de datos se alimenta y eventos para ofrecer resultados analíticos en tiempo real como las instrucciones operativas. [ 1 ] Inteligencia Operacional proporciona a las organizaciones la capacidad de tomar decisiones y actuar inmediatamente en estos conocimientos analíticos, a través de acciones manuales o automatizados.

  • Gana aquel que sepa leer, interpretar, analizar, entender datos. Que sea capaz de hacer el mejor argumento basado en la evidencia empírica.

    “Moneyball: Rompiendo las reglas” está basada en la historia real de Billy Beane (Brad Pitt), una prometedora estrella del béisbol que, incitado por el fracaso de no haber demostrado en el campo todo lo que se esperaba de él, enfocó toda su naturaleza competitiva hacia el área de la dirección de equipos. Al comienzo de la temporada 2002, Billy se enfrenta a una situación deprimente: su modesto equipo, los Oakland Athletics, ha perdido, una vez más, a sus mejores jugadores a manos de los clubes grandes y encima tiene que reconstruirlo con sólo un tercio del presupuesto. Sin embargo, decidido a ganar, Billy se enfrenta al sistema desafiando a los más grandes de este deporte. Así, busca opciones fuera del mundo del béisbol y se topa con las teorías innovadoras de Bill James. Es entonces cuando se decide a contratar a Peter Brand (Jonah Hill), un economista de Yale, inteligente y con talento para los números. Juntos se enfrentan a las teorías establecidas para medir la actividad en el juego y las reexaminan apoyándose en el análisis estadístico por ordenador, hasta entonces despreciado por la clase dirigente del béisbol. Llegan a conclusiones que desafían la imaginación y van a por jugadores descartados por los demás por raros, mayores, lesionados o problemáticos, pero con habilidades claves poco valoradas. A medida que Billy y Peter avanzan, sus nuevos métodos y su lista de “inútiles” irritan a la vieja guardia, a los medios de comunicación, a los forofos y al propio director de campo (Philip Seymour Hoffman) que se niega a cooperar. Finalmente, el experimento no solo cambiará la forma de jugar, sino que también aportará a Billy una nueva comprensión que trasciende el juego y que le hará avanzar en el terreno personal.
  • 1 exabyte = 1 000. 000 000 gigabytes
  • ¿Cómo transformar la información en conocimiento?
    La información es la suma de los datos que tenemos a nuestro alcance y el conocimiento consiste en extraer lo valioso de esa información, su riqueza y su profundidad. Grandes volúmenes de datos son inútiles si no podemos sacar conclusiones. La información tiene poco valor si no se transforma en conocimiento. El conocimiento permite tomar decisiones razonadas y actuar en consecuencia. Es necesario pasar de la información al conocimiento. Los dos grandes desafíos de Big Data son: manejar cantidades enormes de información y desarrollar la capacidad analítica para entenderla y aplicarla a los negocios.
  • http://mundocontact.com/analista-de-big-data-la-profesion-mas-atractiva-del-siglo-xxi/
    El perfil formativo de los nuevos profesionales es diverso: un experto en Big Data puede proceder de carreras tan diferentes como Ingeniería, Economía o incluso Derecho, pero lo más relevante son las aptitudes personales concretas: se necesita una enorme capacidad de transversalidad y comprensión. Al mismo tiempo se ha perdido importancia del perfil puramente técnico.
  • http://mundocontact.com/analista-de-big-data-la-profesion-mas-atractiva-del-siglo-xxi/
    El perfil formativo de los nuevos profesionales es diverso: un experto en Big Data puede proceder de carreras tan diferentes como Ingeniería, Economía o incluso Derecho, pero lo más relevante son las aptitudes personales concretas: se necesita una enorme capacidad de transversalidad y comprensión. Al mismo tiempo se ha perdido importancia del perfil puramente técnico.
  • Las capacidades tecnológicas del Internet de las Cosas son la base para un cambio de los productos físicos hacia los servicios.
    Mediante el análisis predictivo los clientes buscan evitar problemas y que el dispositivo monitorice continuamente el producto para mantenerlo operativo. “Un buen servicio proactivo genera lealtad” http://www.networkworld.es/m2m/internet-de-las-cosas-podria-convertir-los-productos-en-servicios
    Definición: Internet de las cosas se refiere a una red de objetos cotidianos interconectados. Consiste en la unión de un sistema de comunicación ( PLC, RDSI, ADSL ,Wifi, Bluetooth, RFID) y la integración de un chip de pocos milímetros en cualquier objeto del hogar, del trabajo o de la ciudad para procesar y transmitir información a partir de él constantemente, con el fin de proporcionar a los ciudadanos una serie de servicios y aplicaciones inteligentes. http://www.aunclicdelastic.com/tendencia/internet-delas-cosas/
    Cuando el concepto de ciudad inteligente ya nos resulta familiar y cada vez más necesario, lo smart encuentra un nuevo nicho de acción en el patrimonio cultural. los dispositivos MHS (Monitoring Heritage System) una herramienta para “proteger el patrimonio” y evitar así su deterioro, que permite monitorizar en cada momento parámetros relevantes del edificio o de los objetos que contiene (cuadros, obras de arte) y hace posible una conservación preventiva. http://www.aunclicdelastic.com/un-fisurometro-en-el-triforio/
    En paralelo, y para facilitar la necesaria interacción entre objetos y máquinas (M2M), ha despuntado con fuerza Internet de las Cosas (IoT), un fenómeno basado en la referencia digital de todos los objetos cotidianos. Pese a que su recorrido promete ser largo, es un hecho que el número de dispositivos que intercambian información entre sí, usando tecnologías y entornos de almacenamiento virtuales capaces de procesar todo tipo de datos, es ya impresionante.
    la comunicación máquina a máquina, nos facilita la interrelación con los dispositivos que nos rodean. Sumémosle la rápida penetración de las aplicaciones móviles, y obtenemos el entorno perfecto para “comunicarnos” con los dispositivos más cotidianos. http://www.aunclicdelastic.com/las-plantas-nos-susurran-via-app/
    La Internet de las Cosas equivale a que, a partir de ahora, no sólo las computadoras, smartphones y tablets están conectadas a la red, sino que también se suman billones de equipos interconectados, que abarcan desde sistemas de irrigación utilizados en la agricultura, a parquímetros, o bien, desde sensores que monitorean la salud humana, a incontables controles industriales. Por tanto, lo que la IoT revolucionará, es la forma en que las empresas utilizan y se benefician de una amplia gama de datos y aplicaciones, incluyendo el análisis de big data.
    Por citar un ejemplo, en el sector de la logística, los datos ricos suplidos por sistemas analíticos están preparando el camino para un envío más rápido y seguro de todo tipo de productos. Una etiqueta inteligente adherida a un cartón puede enviar actualizaciones acerca de la temperatura, humedad, orientación y locación de un objeto frágil a medida que se mueve desde su origen a su destino. Estos insights permiten validar la integridad de esos productos a lo largo del ciclo de su transporte.
    Asimismo, la IoT está revolucionando la forma en que las empresas producen, proveen servicios, operan líneas de producción y mantienen equipamientos. Por ejemplo, los distribuidores de comida pueden utilizar los datos que reciben de las cocinas inteligentes (“smart kitchens”) comerciales y residenciales para enviar automáticamente mercadería fresca, tan pronto las provisiones de comida etiquetadas comienzan a vencerse. Por otra parte, mecánicos automotores pueden monitorear los autos de sus clientes, sus problemas técnicos o eléctricos en desarrollo y sugerir acciones preventivas antes de que una falla mayor ocurra.
  • Mantenimiento de activos gracias a señales que emiten componentes. Ya no por los datos de kilometrajes de un automóvil, sino por las señales que emiten sus componentes alertando una posible falla.
    Precisión en ofertas con día, hora y radio de alcance: el desafío es mantener al cliente y que compre. que no se vaya con el know house a otro lado. Hay que retenerlo y competir no solo en precio, sino también en servicio.
    Mayor personalización en los servicios: a una persona que visita siempre determinadas páginas webs, se la puede personalizar con promociones o novedades. Existen empresas proveedoras de servicios cubiertas (neumáticos) con sensores y aviso al cliente sobre algún posible desperfecto antes que ocurra. Existen proveedores de juegos gratuitos que analizan el comportamiento de las personas (usuarios) para ofrecerles luegos ventas en los momentos que saben son más propensos a comprar.
    KPI (Key Performance Indicators o Indicadores Clave de Desempeño)
  • ANÁLISIS PREDICTIVO
    Una de las grandes ventajas del uso de Big Data radica en la posibilidad de realizar análisis predictivo reemplazando el estudio del historial de los sucesos por la verdadera prevención e influencia en las acciones futuras. En la BI (Business Intelligence) tradicional, la analítica estudiaba y analizaba la historia para aprender del pasado buscando mejorar la eficiencia en el futuro, pero el usuario debía identificar las partes que utilizaría de esa información y definir cómo utilizarla. Los análisis de Big Data, en cambio, utilizan métodos que responden preguntas como: ¿Qué sucederá después? ¿Qué sucedería si estas tendencias continúan? ¿Porqué está sucediendo esto? ¿Cómo se puede cambiar?
    Los análisis predictivos nos permiten moldear e influir en el futuro al evitar que ocurran ciertos hechos y de esta forma cambiar el curso de las acciones.
  • La Policía analiza datos sobre la delincuencia, los patrones de manchas y averiguar dónde enviar patrullas. Analytics de IBM está ayudando a algunas ciudades de Estados Unidos redujo los delitos graves hasta en un 30%.
  • Tiendas europeas encontraron la conexión oculta entre el tiempo y las ventas. Analytics de IBM ayudan a aumentar su rentabilidad hasta en un 20%
  • Ver https://docs.google.com/document/d/1GhThquTv_U0j2Ey-CFYaEAxFpWu8x2pD-GzYzggWF3Y/edit#bookmark=id.f8hj0oyx4w3t
    El lado oscuro del Big Data: http://www.lavanguardia.com/tecnologia/internet/20140529/54408468908/lado-oscuro-big-data.html
    La industria vende privacidad http://www.dattamagazine.com/gracias-a-snowden-ahora-la-industria-vende-privacidad

    Se considera que conociendo datos personales se pueden personalizar anuncios, el tema es que no se personalicen otros temas como por ejemplo un seguro de automóvil. Esa persona puede recibir publicidad de su hobby pero no por eso ser catalogada como alguien inseguro y pagar más caro su seguro.

    La agencia llegaba a estas conclusiones a partir de un reciente estudio (pdf) en el que ha analizado la actividad de nueve de los más importantes ‘data brokers’ estadounidenses: Acxiom, CoreLogic, Datalogix, eBureau, ID Analytics, Intelius, PeekYou, Rapleaf y Recorded Future. Estas empresas analizan y venden enormes cantidades de información del consumidor para propósitos de marketing. Un ‘data broker’, recogido en el informe, tenía hasta 3.000 categorías de casi todos los consumidores americanos, según reporta The New York Times.


  • Político alemán Malte Spitz fue a la corte con el fin de obtener toda la información que su compañía de teléfono celular Deutsche Telekom tenía sobre su actividad. Los resultados lo sorprendieron. A lo largo de cinco meses que habían rastreado su ubicación geográfica y lo que estaba haciendo con su teléfono 35.000 veces. Trabajar con el periódico alemán Die Zeit, una infografía fue creado que muestra la actividad de Spitz a través de una línea de tiempo interactiva. Este screencast muestra dos días a partir de ella.
    https://www.youtube.com/watch?v=J1EKvWot-3c
  • ¿Y qué ocurre con nuestra privacidad? Pues que se ha visto sustituida por la "comodidad conveniente". Las neveras, gracias al análisis que hacen de los productos que consumes, pueden pedir directa y automáticamente más suministros a nuestro supermercado de confianza sin que nosotros tengamos que hacer nada; las televisiones emitirán el contenido que más nos guste de acuerdo a nuestros hábitos de visionado y películas favoritas; las redes sociales nos sugerirá contenidos, amistades y productos de nuestro agrado según nuestro género y edad...
    http://cultura-geek.blogspot.com.ar/2014/07/los-peligros-del-big-data.html
  • El lado oscuro del Big Data: http://www.lavanguardia.com/tecnologia/internet/20140529/54408468908/lado-oscuro-big-data.html
    La industria vende privacidad http://www.dattamagazine.com/gracias-a-snowden-ahora-la-industria-vende-privacidad

    Se considera que conociendo datos personales se pueden personalizar anuncios, el tema es que no se personalicen otros temas como por ejemplo un seguro de automóvil. Esa persona puede recibir publicidad de su hobby pero no por eso ser catalogada como alguien inseguro y pagar más caro su seguro.

    La agencia llegaba a estas conclusiones a partir de un reciente estudio (pdf) en el que ha analizado la actividad de nueve de los más importantes ‘data brokers’ estadounidenses: Acxiom, CoreLogic, Datalogix, eBureau, ID Analytics, Intelius, PeekYou, Rapleaf y Recorded Future. Estas empresas analizan y venden enormes cantidades de información del consumidor para propósitos de marketing. Un ‘data broker’, recogido en el informe, tenía hasta 3.000 categorías de casi todos los consumidores americanos, según reporta The New York Times.

    si antes un smartphone era promocionado por la velocidad de su procesador, su memoria RAM, su estética exterior, la calidad de su pantalla, etc.; las nuevas tendencias de consumo apuntan, también, a la robustez de los sistemas de seguridad.

    Cómo manejar gran cantidad de datos en su empresa. Entre los factores a tener en cuenta hay que analizar los costos y la forma de implementación. http://reportedigital.com/tic-lo-que-te-interesa-conocer/big-data-como-manejar-gran-cantidad-datos-empresa-tic-28-jul-01-ago/
  • http://blogthinkbig.com/hadoop-open-source-big-data/
    El sistema más utilizado en esta industria para ofrecer capacidades analíticas avanzadas es Hadoop, un software de código abierto, cuyo desarrollo coordina la Apache Foundation, que facilita el almacenamiento de información y permite hacer consultas complejas sobre las bases de datos existentes, resolviendolas con rapidez.

    El big data ha pasado en poco tiempo de ser una tecnología innovadora a convertirse en un mercado y, ahora, a transformarse en una industria.
    El origen de Hadoop se remonta a 2004, cuando el ingeniero de software Doug Cutting, que por aquel entonces trabajaba en Google, describe en un documento técnicas para manejar grandes volúmenes de datos, desgranándolos en problemas cada vez más pequeños para hacerlos abordables. Poco después se marchó a Yahoo y allí siguió investigando hasta completar el desarrollo de la plataforma en 2008. El propio buscador utilizaría la tecnología para su negocio, así como otras grandes compañías de Internet, como Facebook, Twitter o eBay.

    La procedencia del nombre es mucho menos técnica de lo que se podía esperar. El hijo de tres años de Cutting llamaba a su peluche Hadoop y así bautizó su inventor a la plataforma, que también tomaría de ahí su logo, un elefante amarillo.


    Hadoop se inspiró inicialmente en la necesidad de manejo una gran cantidad de datos y se ha convertido en el estándar para el almacenamiento, procesamiento y análisis de cientos de terabytes e incluso petabytes de datos.
    Apache Hadoop es de código abierto 100%, y fue pionero en una forma fundamentalmente nueva de almacenamiento y procesamiento de datos. En lugar de depender el propietario de un hardware costoso y diferentes sistemas para almacenar y procesar datos, Hadoop permite el procesamiento en paralelo de grandes cantidades de datos a través de servidores de bajo costo, y que se puede ampliar sin límites. Con Hadoop, no hay cantidades de datos demasiado grandes. En el mundo hiperconectado de hoy, donde se están generando más y más datos todos los días, las ventajas revolucionarias de Hadoop significan que las empresas y las organizaciones ahora pueden encontrar valor en los datos que hasta hace poco tiempo le resultaban inùtiles.

    Hadoop puede manejar todo tipo de datos de diferentes sistemas: estructurados, no estructurados, archivos, imágenes, archivos de audio, registros de comunicaciones, correo electrónico log - casi cualquier cosa que se te ocurra, independientemente de su formato nativo. Aun cuando los diferentes tipos de datos se han almacenado en los sistemas no relacionados, se puede volcar todo en el clúster Hadoop sin necesidad previa de un esquema. En otras palabras, usted no necesita saber cómo va a consultar sus datos antes de guardarlo; Hadoop permite decidir más tarde y con el tiempo puede revelar cuestiones que ni siquiera pensado en preguntar.
    Al hacer que todos sus datos sean utilizables, no sólo lo que está en sus bases de datos, Hadoop permite ver las relaciones que antes estaban ocultas y revelar las respuestas que siempre han estado fuera de su alcance. Usted puede comenzar a tomar más decisiones basadas en datos concretos en lugar de corazonadas y mirar a los conjuntos de datos completos, no sólo muestras.

    ¿Qué es Hadoop?
    http://www.ibm.com/developerworks/ssa/data/library/techarticle/dm-1209hadoopbigdata/
    A continuación hay varias definiciones de Hadoop, cada una dirigida a una audiencia dentro de la empresa:
    Para los ejecutivos: Hadoop es un proyecto de software de código abierto de Apache para obtener valor de volumen/velocidad/variedad increíbles de datos acerca de su organización. Use los datos en vez de desechar la mayoría de ellos.
    Para los gerentes técnicos: Una suite de código abierto de software que extrae los BigData estructurados y no estructurados acerca de su compañía. Se integra con su ecosistema existente de Inteligencia de Negocios.
    Para el departamento legal: Una suite de código abierto de software que es empacado y cuenta con soporte de múltiples proveedores. Vea la sección Recursos en relación a indemnización IP.
    Ingeniería: Un entorno de ejecución paralelo masivamente, de nada compartido, basado en Java map-reduce. Piense en cientos a miles de computadoras trabajando en el mismo problema, con resiliencia a fallas incorporada. Los proyectos en el ecosistema Hadoop proporcionan cargado de datos, lenguajes de alto nivel, despliegue automatizado de nube, y otras posibilidades.
    Seguridad: Una suite de software con seguridad Kerberos.

  • http://www.cxo-community.com/articulos/blogs/blogs-el-abc-de/5721-los-15-grandes-del-big-data.html

    La siguiente es una lista de 15 empresas de Big Data a las que deberíamos prestarles atención, 10 de ellas son muy conocidas y las cinco restantes son nuevas.

    El mundo de los proveedores de Big Data está dividido en dos. Están las nuevas empresas de Big Data que están trayendo innovaciones y alboroto al mercado y están, también, los proveedores de bases de datos/almacenes de datos ya establecidos que se están moviendo hacia el mundo de Big Data con fuerza, ya que están en una buena posición tanto en términos de una base bien instalada y una línea de productos probada. La siguiente es una lista de 15 empresas de Big Data a las que deberíamos prestarles atención, 10 de ellas son muy conocidas y las cinco restantes son nuevas.

    IBM
    IBM fue el proveedor más grande de Big Data en el 2012 con un ingreso de 1,3 mil millones de dólares, según un reporte reciente de Wikibon, gracias a la venta de productos y servicios relacionados con Big Data. Las ofertas incluyen hardware de servidor y de almacenamiento, software de base de datos, aplicaciones analíticas y servicios asociados. Los productos más conocidos son las plataformas de base de datos DB2, Informix e InfoSphere, y las aplicaciones analíticas Cognos y SPSS. IBM también apoya la plataforma de análisis de datos de código abierto Hadoop.

    HP
    HP fue el segundo proveedor más grande de Big Data en el 2012 por sus ingresos de 664 millones de dólares. Esta empresa también ofrece una mezcla de hardware, software y servicios, y es conocida por la plataforma de análisis Vertica.

    Teradata
    Teradata fue el tercer proveedor más grande de Big Data del 2012 con un ingreso de 435 millones de dólares. Esta es conocida por sus plataformas de hardware, de software analítico y de base de datos. También ofrece herramientas analíticas específicas para industrias de distribución y transporte.

    Oracle
    Aunque Oracle es conocido principalmente por su conocida base de datos, también es un gran jugador en el ámbito de Big Data. Su Oracle Big Data Appliance combina un servidor Intel, distribución Hadoop de Cloudera y la base de datos NoSQL de Oracle. Fue el quinto gran proveedor en el 2012 con un ingreso de 415 millones de dólares.

    SAP
    SAP ofrece una variedad de herramientas analíticas, pero es más conocido por su base de datos en memoria, HANA. Fue el sexto gran proveedor de Big Data en el 2012 con un ingreso de 368 millones de dólares.

    EMC
    EMC ayuda a las compañías a almacenar y analizar Big Data y es también la sede del Marketing Science Lab, un think tnak en análisis de Big Data que se enfoca en analizar datos de marketing. Esta primavera ocupó los titulares con su spinf-off de Pivotal, también respaldado por VMware y General Electric. Pivotal combina el Hadoop con la base de datos Greenplum de EMC y herramientas de consulta HAWQ. EMC fue el séptimo gran proveedor de Big Data en el 2012 con un ingreso de 336 millones de dólares.

    Amazon
    Amazon es conocido por su plataforma en la nube, pero también ofrece un número de productos de Big Data, incluyendo el Elastic MapReduce basado en Hadoop, la base de datos Big Data DynamoDB, el almacén de datos paralelamente masivo RedShift, y todos funcionan bien con Amazon Web Services.

    Microsoft
    La estrategia de Big Data de Microsoft incluye una asociación con Hortonworks, una empresa nueva de Big Data, y la herramienta HDInsights basada en la plataforma de datos de Hortonworks. Microsoft también es conocida por su servidor de base de datos SQL y fue el noveno gran proveedor de Big Data en el 2012 con un ingreso de 196 millones de dólares.

    Google
    Las ofertas de Big Data de Google incluyen BigQuery, una plataforma de análisis de Big Data basada en la nube. La compañía recibió 36 millones de dólares en ingresos relacionados con Big Data el año pasado.

    VMware
    VMware es conocido por sus soluciones de virtualización y de nube, pero se está convirtiendo en un muy buen jugador de Big Data. En Junio publicó el anuncio de VMware vSphere Big Data Extensions, el cual permite que vSphere controle las implementaciones de Hadoop y hacer que lanzar proyectos de Big Data se vuelva mucho más sencillo para las empresas. VMware recibió, el año pasado, 32 millones de dólares en ingresos relacionados con Big Data, casi tanto como Google.

    Cloudera
    Cloudera está en la lista de los principales proveedores de Big Data con más de 141 millones de dólares en fondos de capital de riesgo y ha atraído a varios fundadores conocidos y de gran nombre en Big Data que vienen de Google, Facebook, Oracle y Yahoo. La compañía lanzó por primera vez la plataforma Apache Hadoop para clientes empresariales en el 2008.

    Hortonworks
    Hortonworks es otro proveedor de Hadoop y ha recibido más de 70 millones de dólares en inversiones de capital de riesgo luego de la escisión de Yahoo en el 2011. Está creciendo para ir directamente contra Cloudera, y es muy conocido por sus alianzas estratégicas con Microsoft, Rackspace, Red Hat, Teradata y otras compañías.

    Splunk
    Splunk tuvo la mayor cuota de mercado de todos los vendedores de Big Data únicamente, con un ingreso de 186 millones de dólares, según Wikibon. La compañía se especializa en análisis de datos de máquinas.

    10Gen
    10Gen es conocida por su código abierto MongoDB que es la base de datos NoSQL líder. Entre los inversores estratégicos se encuentra Intel, Red Hat e In-Q-Tel. El año pasado, 10Gen quedó tercero entre los vendedores de Hadoop y NoSQL únicamente, con un ingreso de 36 millones de dólares.

    MapR
    Conocido por M7, su base de datos NoSQL, MapR funciona con la plataforma de Amazon en la nube y con Google Compute Engine. El año pasado quedó cuarto entre los vendedores de Hadoop y NoSQL únicamente, con un ingreso de 23 millones de dólares.
  • http://www.bidoop.es/casos_estudio

    BD EN DIFERENTES ORGANIZACIONES
    Gracias a la posibilidad de acceder a la información de sus usuarios y clientes, las organizaciones tienen la posibilidad de vender más pero además de generar relaciones a largo plazo y ganar la lealtad de los clientes.

    Ford - http://goo.gl/Aemsdi
    La industria del automóvil (He incluido los coches, camiones, autobuses, semirremolques, maquinaria agrícola y equipos de construcción en esta categoría) está en la cúspide de una revolución Big Data. Las empresas de automoción tienen la oportunidad de aprovechar nuevas fuentes de Big Data para acelerar el diseño de productos, mejorar el rendimiento del vehículo y mejorar la experiencia del conductor. Estas fuentes de datos incluyen:
    Internamente generadas datos no estructurados (correos electrónicos, comentarios de los consumidores, notas de diseño, notas de servicio y mantenimiento)
    Datos no estructurados externamente disponibles (redes sociales, blogs, comentarios de productos)
    Datos del sensor generados (sensores, comunicaciones a bordo, GPS, telemática) sobre todo porque los fabricantes se mueven hacia el "vehículo conectado" con más de 10.000 sensores por vehículo que generan datos incluidos MPH, MPG, RPM, presión de aceite, temperatura del agua, temperatura del motor, desgaste de los neumáticos, la viscosidad del aceite, la eficiencia del combustible, etc
    Amazon
    Casi todas las organizaciones cuentan con bases de datos para recopilar información acerca de sus clientes y sus hábitos de consumo. Algunas además utilizan estos datos para mejorar su experiencia y generar engagement como Amazon.
    Con la información que esta organización almacena realiza las llamadas por reclamos y consultas de atención al cliente donde sus representantes de atención conocen no solamente los datos estructurados de sus clientes sino también sus gustos y preferencias y la frecuencia de compra o preferencias de pago.
    Con la información sobre los hábitos de consumo del cliente, combinada con la información de los hábitos de consumo del resto de los clientes, sumada a la información técnica de los productos, relacionada con la experiencia de uso y reclamos, sugerencias y casos anteriores Amazon puede definir por ejemplo si hemos realizado una compra por error, equivocando el nombre del libro ya que otra publicación con título similar resulta más adaptable a nuestro perfil.

    Coca-Cola
    Como la organización número uno en comercialización de bebidas no alcohólicas en el mundo, Coca-cola genera petabytes de datos anualmente.
    Con un enfoque estratégico han adoptado el uso de big data para ir desde un enfoque descentralizado a un enfoque centralizado donde los datos y la información se combinan a través de una plataforma común a toda la organización.
    Un ejemplo de esta aplicación es lo que llaman el modelo Black Book que es un algoritmo que combina: imágenes por satélite, fecha, clima, cosechas esperadas, preferencias de los consumidores regionales, variables económicas, y variables como la acidez o el dulzor del jugo que luego pueden producir manteniendo un sabor consistente todo el año aunque las naranjas utilizadas tengan una temporada alta de crecimiento de tan solo 3 meses.
    Este análisis de negocio requiere de hasta 1 trillón de variables para entregar siempre la mezcla óptima.
    Además Coca-Cola ha desarrollado un sistema de empresas que es capaz de generar una vista única de toda la información del comercio al por menor, permitiendo operar con mayor eficiencia ante las condiciones cambiantes del mercado buscando la satisfacción del usuario final a través de las tiendas de sus clientes directos.
    Además cuentan con una política de respeto por las diferencias culturales dentro de los 206 países en los cuales operan y para ello se valen de la información propia de cada país en interacción constante con los usos y consumos de sus productos.

    Telefónica
    Hacia un uso inteligente de datos: video conferencia
    Telefónica Dynamic Insights es la nueva unidad de negocio de Telefónica que permitirá utilizar el Big Data para el análisis de datos agregados y totalmente anónimos. Su producto Smart Steps utiliza estos datos para medir, comparar y comprender qué factores influyen en el rendimiento de los diversos negocios. Comparativas con otros sectores, los mejores horarios y perfiles de vendedores para cada tienda ubicada en cada lugar.

    WalMart
    Uno de los pioneros en el sector en utilizar Big Data: Están observando todo en su negocio prácticamente en tiempo real. A través del análisis de los datos pueden predecir a eventos y ofrecer una respuesta antes de cualquiera, garantizando que su producto estará disponible donde lo necesitan. Ellos entendieron antes que nadie que todos los datos que tenían sobre sus clientes representaban una ventaja competitiva, predecir el comportamiento del cliente.
    Para todas las decisiones en el negocio utilizan la combinación de datos propios y externos que provee big data:
    Almacenamiento de productos en base a la demanda esperada en un momento específico (basado además en factores como día, hora, pronóstico climático, eventos especiales, etc.)
    Reposición al proveedor: El inventario es costoso y para optimizar ese recurso se mantiene solo lo suficiente para satisfacer la demanda y su ubicación en la cadena de suministro.
    Comportamiento de compra de los clientes.
    Walmart analiza los datos en tiempo real y es capaz de responder antes que nadie y contar con abastecimiento para cada situación en forma proactiva.
    Luego del huracán Charlie, se analizaron los patrones de compra antes del paso del huracán descubrieron que las ventas de una marca particular de galletitas, Strawberry Pop-Tart, aumentaron 7 veces su número habitual en conjunto con las cervezas. Se aseguraron entonces que ante el próximo huracán, todas las tiendas en su camino contaran con sobrestock de estos dos productos que se vendieron rápidamente.

    PayPal utiliza herramientas Big Data para combatir el fraude en tiempo real: Aplicando diversos filtros de "Fraud Management" la compañia desarrolló un proceso de detección de fraude basados en datasets masivos que son analizados a través de herramientas de Big Data

    http://dynamicinsights.telefonica.com/488/smart-steps
    Telefónica presenta su nueva unidad de negócio "Big Data" llamada Telefónica Dynamic Insights: Permitirá utilizar el Big Data para el análisis de datos agregados y totalmente anónimos.
    Smart Steps es un producto único que proporciona conocimientos basados ​​en el comportamiento de las multitudes para ayudar a las empresas y organizaciones del sector público a tomar decisiones informadas de negocio. Con Smart Steps puede analizar pisada en cualquier ubicación especificada y ver la influencia de cualquier área especificada.
  • USA
    Hoy en día, la atención sanitaria en los EE.UU. es un mercado de $ 2.6 billón. Según los últimos informes, por lo menos $ 600-850 billion del gasto sanitario se destina a ineficiencias incrustados que aumentan el costo y disminuyen la calidad general de la salud pública.
    Estas ineficiencias incluyen el uso fuera de mérito de los servicios de salud, el fraude y el abuso criminal, ineficiencias administrativas, ineficiencias de proveedores, como los errores médicos, la falta de atención coordinada en general, y las condiciones prevenibles / cuidado evitable.
    Si se gestiona adecuadamente, modelado y compartida, sin embargo, la misma ola de datos de salud o agencias gubernamentales que inundan "Big Data" también será la clave para la mejora de resultados de la atención y en última instancia la salud de la población.
    http://www.govhealthit.com/news/how-harness-big-data-improving-public-health
  • Italia
    En la región del Piamonte en el noroeste de Italia, la administración pública de la región ha empezado a hacer un uso eficaz de los datos grandes en una variedad de maneras que utilizan las soluciones de SAS. Todo en la Nube.
  • http://abcblogs.abc.es/vision-oracle/2014/07/15/cloud-big-data-cx-iot-y-movilidad-los-cinco-pilares-tecnologicos-de-la-empresa-competitiva/

    Superados los estadios iniciales de adopción de tecnología, ha llegado el momento de avanzar un paso más allá. Escalar un nuevo peldaño desde el que se pueda, por ejemplo, sacar el máximo provecho a la información residente en las bases de datos de las empresas e instituciones, cuyos repositorios se estima que crezcan en torno al 4.000% hasta 2020, y combinarla con la información desestructurada de otras fuentes (Big Data); acceder al software más avanzado y a la infraestructura tecnológica mediante un modelo de pago por uso (Cloud), que facilite a las pequeñas empresas acceder a servicios tecnológicos antes solo accesibles para las grandes corporaciones; comunicar, en cualquier momento y lugar, con objetos del mismo modo que lo hacemos con otras personas (Internet de las Cosas); dotar a los profesionales de todo tipo de capacidades informáticas en entornos y dispositivos móviles (Movilidad) y, al final del recorrido, ofrecer al usuario una experiencia de cliente realmente satisfactoria (Customer Experience o CX).

    Tanto Cloud como Big Data están impulsando el desarrollo del mercado TI, empujando a Internet a posicionarse como un canal que trasciende la comunicación interpersonal para alzarse en el nexo entre máquinas, dispositivos, etc., lo que abre la puerta al establecimiento de nuevos negocios, en los que la movilidad desempeña un papel clave.

    En paralelo, y para facilitar la necesaria interacción entre objetos y máquinas (M2M), ha despuntado con fuerza Internet de las Cosas (IoT), un fenómeno basado en la referencia digital de todos los objetos cotidianos. Pese a que su recorrido promete ser largo, es un hecho que el número de dispositivos que intercambian información entre sí, usando tecnologías y entornos de almacenamiento virtuales capaces de procesar todo tipo de datos, es ya impresionante.

    Finalmente la ubicuidad de internet y de los dispositivos móviles ha provocado la asunción de una nueva clase de consumidores más informados, exigentes y activos que esperan una experiencia de usuario plenamente satisfactoria. En este punto, la tecnología juega, como no podría ser de otro modo, un papel igualmente básico, al sentar las bases para ampliar el conocimiento en torno a las necesidades, demandas y gustos de los clientes de cara a ofrecerle lo que busca en el momento y lugar oportunos.

    Conseguir estos objetivos está, hoy en día, al alcance de todo tipo de empresas e instituciones. No obstante son las entidades que colocan la innovación en el centro de su estrategia de crecimiento y que persiguen la simplificación de las TI de cara a reducir costes, el time to market y a elevar la eficiencia de sus procesos, las que pueden presumir de estar situándose a la vanguardia de la innovación. Serán esas entidades las que consigan explotar al máximo los beneficios que ofrecen estas cinco tendencias clave de las tecnologías de la información.
  • Ataque a la seguridad de las empresas. Firmas como eBay, Sony y Apple han recibido ataques en los que les han extraído importantes volúmenes de información, cosa que deja los datos de los usuarios inertes ante grupos que podrían tener intereses criminales y por desgracia, tras dichos ataques ya no se puede garantizar que los datos de los consumidores sean resguardados como se podría esperar.

×