Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Neo4j y Fraude Spanish

102 views

Published on

Los estafadores ahora están utilizando métodos más sofisticados y dinámicos con tarjetas de crédito, el blanqueo de dinero y otros tipos de fraude. El aprovechamiento de la tecnología gráfica le permitirá ver más allá de los puntos de datos individuales y descubrir patrones difíciles de detectar.

Published in: Technology
  • Be the first to comment

Neo4j y Fraude Spanish

  1. 1. github.com/maxdemarzi Cerca de 200 repositorios públicos Max De Marzi Neo4j Ingeniero de Ventas Sobre Mi ! 01 02 03 04 maxdemarzi.com @maxdemarzi
  2. 2. Experiencia Técnica No Importa 75 % 50% 95%
  3. 3. Te vas a casa, pensando acerca de grafos Todo lo que importa Te
  4. 4. Grafo de Propiedades 
 Es super simple.
 Todo lo que tienes es: Modelo Grafo de Propiedades Propiedades Nodos Relaciones
  5. 5. Lo que (probablemente) ya sabes: Clientes tienen Direcciones Direcciones tienen Clientes
  6. 6. Las uniones se ejecutan cada vez que se consulta la relación Ejecutar una unión significa buscar una clave Índice B-Tree: O(log(n)) Tus datos crecen 10 veces, tu velocidad se reduce a la mitad Más datos = más búsquedas Más lento El Problema 1 2 3 4
  7. 7. Las bases de datos Relacionales no pueden manejar las Relaciones Más Lentos La velocidad cae cuando los datos o las uniones crecen Idioma Equivocado SQL se construyó con la teoría de conjuntos, no de grafos No es Flexible Nuevos tipos de datos y relaciones requieren un rediseño del esquema Modelo Equivocado No pueden modelar o almacenar relaciones sin complejidad1 2 3 4
  8. 8. Las bases de datos NoSQL no pueden manejar las Relaciones Más Lentos La velocidad cae al intentar de unir datos en la aplicación Idiomas Incorrectos Muchos idiomas raros "casi sql" terribles para las uniones No ACID (no tienen transacciones) Eventualmente Consistente significa Eventualmente Corrupto Modelo Equivocado No pueden modelar o almacenar relaciones sin complejidad1 2 3 4
  9. 9. Neo4j: Misma información, diseño diferente No más tablas, no más claves externas, no más uniones
  10. 10. ¿Cuál es la receta secreta?
  11. 11. Registros de tamaño fijo en dos formaciones “Uniones” desde la creación A través de esta estructura de datos Acceso directo en lugar de búsquedas 1 2 3 4 La Receta Secreta de Neo4j Saltamos de la colección de nodos a la colección de relaciones y otra vez a nodos
  12. 12. Se quedan igual no importa que los datos crecen Respuestas en Tiempo Real Connectedness and Size of Data Set Response Time 0 to 2 hops
 0 to 3 degrees
 Thousands of connections Tens to hundreds of hops
 Thousands of degrees
 Billions of connections Relational and
 Other NoSQL
 Databases Neo4j Neo4j is 
 1000x faster
 Reduces minutes 
 to milliseconds
  13. 13. Reimagina tus datos como un Grafo Más rápido Encuentra relaciones en tiempo real Lenguaje Correcto Cypher fue creado para Grafos Flexible y Consistente Desarrolla tu esquema sin problemas mientras mantiene transacciones Modelo Correcto Grafos simplifican cómo piensas 1 2 3 4 Ágil, alto rendimiento y escalable sin sacrificio
  14. 14. Cypher
  15. 15. Etiqueta Propiedad Etiqueta Propiedad Cypher: Lenguaje de Consulta Potente y Expresivo MATCH (:Persona { nombre:“Juan”} ) -[:AMA]-> (:Persona { nombre:“Maria”} ) AMA Juan Maria Nodo Nodo
  16. 16. MATCH (jefe)-[:MANEJA*0..3]->(empleado), (empleado)-[:MANEJA*1..3]->(otro) WHERE boss.name = “Fulano de Tal” RETURN empleado.name AS Empleado, 
 count(otro) AS Total Expresa Consultas Complejas fácilmente con Cypher Encuentra todos los empleados directos y aquellos que le reportan, hasta 3 niveles más abajo Cypher QuerySQL Query
  17. 17. Neo4j para Servicios Financieros
  18. 18. Plan Tipos de Fraude • Fraude de tarjeta de credito • Identidades Sintéticas y Anillos de Fraude • Fraude de Seguro Tipos de Análisis • Análisis Tradicional • Análisis basado en grafos Detección y Prevención de Fraude
  19. 19. …pero antes de entrar en eso … • ¿Qué no es fraude?
  20. 20. Aprende de los Expertos • Alex Beutel, CMU • Leman Akoglu, Stony Brook • Christos Faloutsos, CMU • Graph-Based User Behavior Modeling: From Prediction to Fraud Detection • http://www.cs.cmu.edu/~abeutel/kdd2015_tutorial/
  21. 21. Problemas de Comportamiento del Usuario • ¿Cómo podemos entender el comportamiento normal del usuario?
  22. 22. Problemas de Comportamiento del Usuario • ¿Cómo podemos entender el comportamiento normal del usuario? • ¿Cómo podemos encontrar un comportamiento sospechoso?
  23. 23. Problemas de Comportamiento del Usuario • ¿Cómo podemos entender el comportamiento normal del usuario? • ¿Cómo podemos encontrar un comportamiento sospechoso? • ¿Cómo podemos distinguir los dos?
  24. 24. Modelando Comportamiento "Normal" • Predecir Relaciones (usuarios similares) Si todos tus amigos tienen 35 años de edad tu probablemente tienes 35 años de edad también
  25. 25. Modelando Comportamiento "Normal" • Predecir relaciones (películas que debería ver) Qué acciones debes tomar?
  26. 26. ¿Cuántas estrellas debo dar a “Amores Perros”? MATCH (yo:Usuario {id:”max”})-[r1:VIO]->(m:Pelicula)
 <-[r2:VIO]-(:Usuario)-[r3:VIO]->
 (m2:Pelicula {titulo:”Amores Perros”})
 WHERE ABS(r1.stars-r2.stars) <=1
 RETURN AVG(r3.stars)
  27. 27. Modelando Comportamiento "Normal" • Predecir Relaciones • Predecir Atributos de Nodo • Predecir Atributos de Relaciones • Agrupamiento y detección de comunidad
  28. 28. Demografía: Edad
  29. 29. Demografía: Sexo
  30. 30. ¿A las niñas les gustan las películas que le gustan a otras niñas?
  31. 31. ¡Sí! A las niñas les gustan las películas que a otras niñas les gusta
  32. 32. Predecir la Clasificación de peliculas puramente basado en demografía MATCH (u:Usuario)-[r:VIO]->(m:Pelicula {titulo:”Diarios Motocicleta”})
 WHERE u.edad = “20-29” AND u.sexo = "M" 
 RETURN AVG(r.stars) El promedio =>
  33. 33. Modelando Comportamiento "Anormal" • Predecir Relaciones • Predecir Atributos de Nodo • Predecir Atributos de Relaciones • Agrupamiento y detección de comunidad • Detección de Fraude
  34. 34. Modelando el Comportamiento del Usuario • Modelar usuarios normales y detectar anomalías son dos aspectos para comprender el comportamiento del usuario
  35. 35. Modelando el Comportamiento del Usuario • Modelar usuarios normales y detectar anomalías son dos aspectos para comprender el comportamiento del usuario • Los modelos complejos pueden capturar patrones normales y anormales
  36. 36. Dos lados de la misma Moneda Recomendaciones • Agregue la relación que no existe Detección de Fraude • Encuentra las relaciones que no deberían existir
  37. 37. Sistemas de Recomendación
  38. 38. Recomendación Simple
  39. 39. Recomendación Simple
  40. 40. Modelo de Datos de Películas
  41. 41. Recomendación de Película MATCH (viste:Pelicula {titulo:"Toy Story”}) <-[r1:VIO]- () -[r2:VIO]-> (no_viste:Pelicula) WHERE r1.estrella > 7 AND r2.estrella > 7 AND viste.generos = no_viste.generos AND NOT( (p:Persona) -[:VIO]-> (no_viste) )
 AND p.usuario IN [“maxdemarzi”,”janedoe”,”jamesdean”] RETURN no_viste.titulo, COUNT(*) ORDER BY COUNT(*) DESC LIMIT 25 ¿Cuáles son las mejores 25 películas? • que no he visto • con los mismos géneros que Toy Story • con altas calificaciones • por personas que les gustó Toy Story
  42. 42. Sistemas de Fraude
  43. 43. Fraude de Tarjeta de Credito
  44. 44. Referencia Cruzada Una tarjeta Un correo electrónico Un telefono Una dirección IP
  45. 45. Subgrafos El vecindario de 
 un Nodo
  46. 46. Gráfos como Matrices
  47. 47. La Agrupación da Claridad Link Encontrando pandillas de Nodos

  48. 48. Patrones Egocéntricos
  49. 49. Patrones Egocéntricos Ni: numero de vecinos de nodo i Ei: numero de relaciones entre los vecinos de i Wi: peso total de las relaciones de i λw,i: valor propio principal de la matriz de adyacencia ponderada de i Relación mas fuerte
  50. 50. Densidad pendiente =2 pendiente =1 pendiente =1.35 Numero de relaciones contra el numero de vecinos
  51. 51. Peso Peso de los vecinos contra el numero de vecinos pendiente = 1.08 pendiente = 1
  52. 52. Valor Propio (Eigenvalue) pendiente =1 pendiente =0.64 pendiente =0.5 El peso mas fuerte contra peso total de los vecinos
  53. 53. Fraude de Credito • Objetivo fraudulento: solicitar líneas de crédito, actuar normalmente, extender crédito, y luego ... salir corriendo con el dinero • Fabricar una red de identificaciones sintéticas, agregar líneas de crédito más pequeñas en un valor sustancial • Es un problema oculto ya que solo los bancos son afectados
  54. 54. El Problema • $ 10 mil millones perdidos por los bancos cada año • 25% de las cancelaciones totales de créditos de consumo en los Estados Unidos • Alrededor del 20% de las deudas incobrables en EEUU y N.A están mal clasificadas • En realidad, es un fraude de crédito de primera parte
  55. 55. Anillo de Fraude
  56. 56. Entonces el Fraude ocurre… • Estrategia de puertas giratorias • El dinero se mueve de una cuenta a otra para proporcionar un historial de transacciones legítimo • Los bancos aumentan debidamente las líneas de crédito • Comportamiento de crédito responsable observado • Los defraudadores agotan al máximo todas las líneas de crédito y luego desaparecen
  57. 57. …y el Banco pierde • El proceso de colecciones empieza • Direcciones reales son visitadas • Los estafadores niegan todo el conocimiento de las identificaciones sintéticas • Banco cancela deuda • Dos estafadores pueden acumular fácilmente $ 80k • Los anillos del crimen bien organizados pueden acumular cantidades muchas veces mayores a eso
  58. 58. Cohabitantes Probablemente no Fraudulentos
  59. 59. Cadena de Aspecto Sospechoso
  60. 60. Fraude de Autos
  61. 61. Dolor por Dinero http://georgia-clinic.com/blog/wp-content/uploads/2013/10/whiplash.jpg http://cdn2.holytaco.com/wp-content/uploads/2012/06/lottery-winner.jpg
  62. 62. Dolor por Dinero Ejemplo Accidentes Carros Doctor Abogado Personas Drives Is Passenger Conductores, Pasajeros, Testigos
  63. 63. Fraude Interno Fraude de Autos • Fraude de Seguros en aumento en el norte de México • La cantidad de casos de fraude contra compañías de seguros en México ha crecido alrededor del 10% durante el último período de cinco años (March 2016) • De acuerdo con la información de OCRA, los delincuentes que cometen fraude están conectados con los empleados de las compañías de seguros en casi todos los casos http://www.bnamericas.com/en/news/insurance/insurance-fraud-on-the-rise-in-northern- mexico/
  64. 64. Conductores Regulares
  65. 65. Demandantes Genuinos
  66. 66. Estafadores
  67. 67. ¿Cómo encaja Neo4j con la prevención tradicional de fraude? http://www.gartner.com/newsroom/id/1695014 Gartner’s Layered Fraud Prevention Approach
  68. 68. Red Neural Profunda(DNN) por Fraude Bancario https://www.youtube.com/watch?v=TAer-PeIypI La detección de fraude comienza a mitad de camino (después de la introducción a redes neurales) Usando Métricas Gráficas como Señales
  69. 69. Gracias

×