SlideShare a Scribd company logo
Técnicas de
Agrupamiento
Medidas de semejanza.
Agrupamiento
! El agrupamiento es una técnica de aprendiza no
supervisado.
! El objetivo del agrupamiento es “juntar” un sub-
conjunto de datos en grupos, de tal forma que
Agrupamiento
! El agrupamiento es una técnica de aprendiza no
supervisado.
! El objetivo del agrupamiento es “juntar” un sub-
conjunto de datos en grupos, de tal forma que
! Los elementos del mismo grupo sean lo más parecido
posible.
Agrupamiento
! El agrupamiento es una técnica de aprendiza no
supervisado.
! El objetivo del agrupamiento es “juntar” un sub-
conjunto de datos en grupos, de tal forma que
! Los elementos del mismo grupo sean lo más parecido
posible.
! Los elementos de grupos diferentes sean lo más
diferente posible.
Agrupamiento
! Las técnicas de agrupamiento buscan crear
colecciones de datos con base en una medida de
semejanza.
! A través de una medida de semejanza son
comparados los elementos de todo el conjunto.
Medidas de Semejanza
! La semejanza puede ser vista como una cantidad
que refleja la relación entre dos elementos de un
conjunto.
Medidas de Semejanza
! La semejanza puede ser vista como una cantidad
que refleja la relación entre dos elementos de un
conjunto.
! Esta medida de semejanza está basada
comúnmente en una función de distancia,
Medidas de Semejanza
! La semejanza puede ser vista como una cantidad
que refleja la relación entre dos elementos de un
conjunto.
! Esta medida de semejanza está basada
comúnmente en una función de distancia,
! euclidiana,
! Manhatan,
! Minkowski,
! Coseno,
! etc.
Medidas de Semejanza
! Los grupos formados con base en estas medidas,
son de tal forma que dos datos en el mismo grupo
tiene un valor de distancia mínima, mientras que
dos datos de grupos diferentes presentan un valor
de distancia máximo, esta distancia se denomina
distancia del grupo.
Medidas de Semejanza
! La selección de la medida de semejanza está
directamente relacionada con la naturaleza del
conjunto de datos a agrupar
Conjunto de datos.
Medidas de Semejanza
! La selección de la medida de semejanza está
directamente relacionada con la naturaleza del
conjunto de datos a agrupar
Conjunto de datos.
Grupo1 Grupo2
Medidas de Semejanza
! La selección de la medida de semejanza está
directamente relacionada con la naturaleza del
conjunto de datos a agrupar
Conjunto de datos.
Grupo1 Grupo2
Distancia muy grande
entre puntos del
conjunto
Distancia
pequeña entre
puntos del
conjunto.
Medidas de Semejanza
Distancia Euclidiana
! Considerada como la métrica estándar para
problemas geométricos.
Medidas de Semejanza
Distancia Euclidiana
! Considerada como la métrica estándar para
problemas geométricos.
! La distancia euclidiana no es más que la raíz
cuadrada de la diferencia entre las coordenadas de
un par de objetos.
DXY = Xik − Xjk
( )
2
k=1
m
∑
Medidas de Semejanza
Distancia Coseno
! Determina la semejanza entre dos vectores
n-dimensionales a través del ángulo que se
forma entre ellos.
cosθ =
A⋅ B
A B
Medidas de Semejanza
Distancia Coseno
! Determina la semejanza entre dos vectores
n-dimensionales a través del ángulo que se
forma entre ellos.
! Esta medida va de [0, π], así que:
! Un valor de π significa que son opuestos.
! Un valor de π/2 significa independientes.
! Un valor de 0 significa iguales.
cosθ =
A⋅ B
A B
Medidas de Semejanza
Distancia Manhatan
! Es la distancia entre dos pares de puntos a lo largo
de ejes perpendiculares.
DXY = Xik − Xjk + Yik −Yjk
Medidas de Semejanza
Distancia Manhatan
! Es la distancia entre dos pares de puntos a lo largo
de ejes perpendiculares.
DXY = Xik − Xjk + Yik −Yjk
*Imagen tomada de internet
Figura 1*
Medidas de Semejanza
Distancia Jaccard
! La distancia Jaccard mide la semejanza de dos
conjuntos de datos y se calcula de la siguiente
forma:
J(A, B) =
A∩B
A∪B
Medidas de Semejanza
Distancia Jaccard
! Ejemplo:
J(A, B) =
A∩B
A∪B
= ?
Medidas de Semejanza
Distancia Jaccard
! Ejemplo:
A∪B =
A∩B =
Medidas de Semejanza
Distancia Jaccard
! Ejemplo:
J(A, B) =
A∩B
A∪B
=
2
7
= 0.286
A∪B =
A∩B =
Medidas de Semejanza
Distancia Minkowski
! La distancia de Minkowski es una métrica
generalizada de distancia euclidiana y distancia de
Manhattan.
DXY = Xik − Xjk
1
p
k=1
d
∑
⎛
⎝
⎜
⎞
⎠
⎟
p
Medidas de Semejanza
Distancia Minkowski
! La distancia de Minkowski es una métrica
generalizada de distancia euclidiana y distancia de
Manhattan.
! Si p=1 tenemos la distancia Manhatan.
! Si p=2 tenemos la distancia Euclidiana.
DXY = Xik − Xjk
p
k=1
d
∑
( )
1
p

More Related Content

More from Carlos Paredes

descriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptxdescriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptx
Carlos Paredes
 
Modelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfModelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdf
Carlos Paredes
 
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfMachine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
Carlos Paredes
 
Reglas y ejercicios de logica difusa para su comprencion
Reglas y ejercicios de logica difusa  para su comprencionReglas y ejercicios de logica difusa  para su comprencion
Reglas y ejercicios de logica difusa para su comprencion
Carlos Paredes
 
Metodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloMetodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencillo
Carlos Paredes
 
Sistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosSistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismos
Carlos Paredes
 
Definición de simulación.pdf
Definición de simulación.pdfDefinición de simulación.pdf
Definición de simulación.pdf
Carlos Paredes
 
Squim .pdf
Squim .pdfSquim .pdf
Squim .pdf
Carlos Paredes
 
Módulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxMódulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptx
Carlos Paredes
 
MAS1.pdf
MAS1.pdfMAS1.pdf
MAS1.pdf
Carlos Paredes
 
Modulo IV CV.pptx
Modulo IV CV.pptxModulo IV CV.pptx
Modulo IV CV.pptx
Carlos Paredes
 
Examen.docx
Examen.docxExamen.docx
Examen.docx
Carlos Paredes
 
Servidores.pptx
Servidores.pptxServidores.pptx
Servidores.pptx
Carlos Paredes
 

More from Carlos Paredes (13)

descriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptxdescriptores en identificacion de ellos.pptx
descriptores en identificacion de ellos.pptx
 
Modelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdfModelica-OpenModelica-slides para aprender.pdf
Modelica-OpenModelica-slides para aprender.pdf
 
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdfMachine_Learning_with_MATLAB_Seminar_Latest.pdf
Machine_Learning_with_MATLAB_Seminar_Latest.pdf
 
Reglas y ejercicios de logica difusa para su comprencion
Reglas y ejercicios de logica difusa  para su comprencionReglas y ejercicios de logica difusa  para su comprencion
Reglas y ejercicios de logica difusa para su comprencion
 
Metodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencilloMetodo de montecarlo es un mentodo sencillo
Metodo de montecarlo es un mentodo sencillo
 
Sistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismosSistemas Expertos para el conocimieto de los mismos
Sistemas Expertos para el conocimieto de los mismos
 
Definición de simulación.pdf
Definición de simulación.pdfDefinición de simulación.pdf
Definición de simulación.pdf
 
Squim .pdf
Squim .pdfSquim .pdf
Squim .pdf
 
Módulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptxMódulo III CVV clase 1(resuelto).pptx
Módulo III CVV clase 1(resuelto).pptx
 
MAS1.pdf
MAS1.pdfMAS1.pdf
MAS1.pdf
 
Modulo IV CV.pptx
Modulo IV CV.pptxModulo IV CV.pptx
Modulo IV CV.pptx
 
Examen.docx
Examen.docxExamen.docx
Examen.docx
 
Servidores.pptx
Servidores.pptxServidores.pptx
Servidores.pptx
 

Recently uploaded

Carlos Augusto da Silva Lins todosIngressantes2024-1.pdf
Carlos Augusto da Silva Lins todosIngressantes2024-1.pdfCarlos Augusto da Silva Lins todosIngressantes2024-1.pdf
Carlos Augusto da Silva Lins todosIngressantes2024-1.pdf
juntosvenceremosbras
 
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptxCARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
0602021003
 
SLIDEHARE.docx..........................
SLIDEHARE.docx..........................SLIDEHARE.docx..........................
SLIDEHARE.docx..........................
azulsarase
 
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptxJuzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Folke Claudio Tantahuillca Landeo
 
Aletas (Superficies extendidas) y aislantes térmicos
Aletas (Superficies extendidas) y aislantes térmicosAletas (Superficies extendidas) y aislantes térmicos
Aletas (Superficies extendidas) y aislantes térmicos
FrancelisFernandez
 
Unidad 2 - Cargas en las estructuras.pdf
Unidad 2 - Cargas en las estructuras.pdfUnidad 2 - Cargas en las estructuras.pdf
Unidad 2 - Cargas en las estructuras.pdf
oagalarraga
 
Características de los suelos como los histosoles.pptx
Características de los suelos como los histosoles.pptxCaracterísticas de los suelos como los histosoles.pptx
Características de los suelos como los histosoles.pptx
MONICADELROCIOMUNZON1
 
Presentación 01 Curso de Introducción a Python.pdf
Presentación 01 Curso de Introducción a Python.pdfPresentación 01 Curso de Introducción a Python.pdf
Presentación 01 Curso de Introducción a Python.pdf
jorgecuasapaz182
 
Operaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica MaizOperaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica Maiz
carolina838317
 
Presentación transferencia de calor Jesus Morales.pdf
Presentación transferencia de calor Jesus Morales.pdfPresentación transferencia de calor Jesus Morales.pdf
Presentación transferencia de calor Jesus Morales.pdf
jdcumarem02
 
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdfPRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
fabian28735081
 
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTOOPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
GERARDO GONZALEZ
 
Presentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calorPresentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calor
GerardoBracho3
 
Sistema de sobrealimentacion de un motor
Sistema de sobrealimentacion de un motorSistema de sobrealimentacion de un motor
Sistema de sobrealimentacion de un motor
mauriciok961
 
Clase Isometricos parA circuitos de ingenieria
Clase Isometricos parA circuitos de ingenieriaClase Isometricos parA circuitos de ingenieria
Clase Isometricos parA circuitos de ingenieria
leonidasbajalquepuch
 
1 ANALISIS DE MASA Y ENERGÍA DE VOLÚMENES DE CONTROL [Autoguardado].pptx
1 ANALISIS DE MASA Y ENERGÍA DE VOLÚMENES DE CONTROL [Autoguardado].pptx1 ANALISIS DE MASA Y ENERGÍA DE VOLÚMENES DE CONTROL [Autoguardado].pptx
1 ANALISIS DE MASA Y ENERGÍA DE VOLÚMENES DE CONTROL [Autoguardado].pptx
RenanWVargas
 
Control de Diaphania hyalinata en campo.pptx
Control de Diaphania hyalinata en campo.pptxControl de Diaphania hyalinata en campo.pptx
Control de Diaphania hyalinata en campo.pptx
alexanderlara1198
 
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptxINVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
FernandoRodrigoEscal
 
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdfS01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
Alex809116
 
MANUAL MONITOREO DEL SERVICIO DE INTERNET SATELITAL DEL MINEDU (CON ANTENAS ...
MANUAL MONITOREO DEL SERVICIO DE INTERNET  SATELITAL DEL MINEDU (CON ANTENAS ...MANUAL MONITOREO DEL SERVICIO DE INTERNET  SATELITAL DEL MINEDU (CON ANTENAS ...
MANUAL MONITOREO DEL SERVICIO DE INTERNET SATELITAL DEL MINEDU (CON ANTENAS ...
Ing. Julio Iván Mera Casas
 

Recently uploaded (20)

Carlos Augusto da Silva Lins todosIngressantes2024-1.pdf
Carlos Augusto da Silva Lins todosIngressantes2024-1.pdfCarlos Augusto da Silva Lins todosIngressantes2024-1.pdf
Carlos Augusto da Silva Lins todosIngressantes2024-1.pdf
 
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptxCARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
CARRETERAS MÁS IMPORTANTES DEL PERU ALESSANDRA.pptx
 
SLIDEHARE.docx..........................
SLIDEHARE.docx..........................SLIDEHARE.docx..........................
SLIDEHARE.docx..........................
 
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptxJuzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
Juzgamiento-de-Ganado-Lechero-CATEGORIA-B-SWISS.pptx
 
Aletas (Superficies extendidas) y aislantes térmicos
Aletas (Superficies extendidas) y aislantes térmicosAletas (Superficies extendidas) y aislantes térmicos
Aletas (Superficies extendidas) y aislantes térmicos
 
Unidad 2 - Cargas en las estructuras.pdf
Unidad 2 - Cargas en las estructuras.pdfUnidad 2 - Cargas en las estructuras.pdf
Unidad 2 - Cargas en las estructuras.pdf
 
Características de los suelos como los histosoles.pptx
Características de los suelos como los histosoles.pptxCaracterísticas de los suelos como los histosoles.pptx
Características de los suelos como los histosoles.pptx
 
Presentación 01 Curso de Introducción a Python.pdf
Presentación 01 Curso de Introducción a Python.pdfPresentación 01 Curso de Introducción a Python.pdf
Presentación 01 Curso de Introducción a Python.pdf
 
Operaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica MaizOperaciones Básicas creadora Veronica Maiz
Operaciones Básicas creadora Veronica Maiz
 
Presentación transferencia de calor Jesus Morales.pdf
Presentación transferencia de calor Jesus Morales.pdfPresentación transferencia de calor Jesus Morales.pdf
Presentación transferencia de calor Jesus Morales.pdf
 
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdfPRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
PRESENTACION TRANSFERENCIA FABIAN ALVAREZ.pdf
 
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTOOPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
OPERACIONES BÁSICAS (INFOGRAFIA) DOCUMENTO
 
Presentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calorPresentación Aislante térmico.pdf Transferencia de calor
Presentación Aislante térmico.pdf Transferencia de calor
 
Sistema de sobrealimentacion de un motor
Sistema de sobrealimentacion de un motorSistema de sobrealimentacion de un motor
Sistema de sobrealimentacion de un motor
 
Clase Isometricos parA circuitos de ingenieria
Clase Isometricos parA circuitos de ingenieriaClase Isometricos parA circuitos de ingenieria
Clase Isometricos parA circuitos de ingenieria
 
1 ANALISIS DE MASA Y ENERGÍA DE VOLÚMENES DE CONTROL [Autoguardado].pptx
1 ANALISIS DE MASA Y ENERGÍA DE VOLÚMENES DE CONTROL [Autoguardado].pptx1 ANALISIS DE MASA Y ENERGÍA DE VOLÚMENES DE CONTROL [Autoguardado].pptx
1 ANALISIS DE MASA Y ENERGÍA DE VOLÚMENES DE CONTROL [Autoguardado].pptx
 
Control de Diaphania hyalinata en campo.pptx
Control de Diaphania hyalinata en campo.pptxControl de Diaphania hyalinata en campo.pptx
Control de Diaphania hyalinata en campo.pptx
 
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptxINVENTARIO CEROO Y DINAMICAA FABRIL.pptx
INVENTARIO CEROO Y DINAMICAA FABRIL.pptx
 
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdfS01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
S01_CONTENIDO DE CLASE SENCICO, ADMINISTRACIÓN DE OBRAS.pdf
 
MANUAL MONITOREO DEL SERVICIO DE INTERNET SATELITAL DEL MINEDU (CON ANTENAS ...
MANUAL MONITOREO DEL SERVICIO DE INTERNET  SATELITAL DEL MINEDU (CON ANTENAS ...MANUAL MONITOREO DEL SERVICIO DE INTERNET  SATELITAL DEL MINEDU (CON ANTENAS ...
MANUAL MONITOREO DEL SERVICIO DE INTERNET SATELITAL DEL MINEDU (CON ANTENAS ...
 

tecnicas_agrupamiento de datos para analisis

  • 2. Agrupamiento ! El agrupamiento es una técnica de aprendiza no supervisado. ! El objetivo del agrupamiento es “juntar” un sub- conjunto de datos en grupos, de tal forma que
  • 3. Agrupamiento ! El agrupamiento es una técnica de aprendiza no supervisado. ! El objetivo del agrupamiento es “juntar” un sub- conjunto de datos en grupos, de tal forma que ! Los elementos del mismo grupo sean lo más parecido posible.
  • 4. Agrupamiento ! El agrupamiento es una técnica de aprendiza no supervisado. ! El objetivo del agrupamiento es “juntar” un sub- conjunto de datos en grupos, de tal forma que ! Los elementos del mismo grupo sean lo más parecido posible. ! Los elementos de grupos diferentes sean lo más diferente posible.
  • 5. Agrupamiento ! Las técnicas de agrupamiento buscan crear colecciones de datos con base en una medida de semejanza. ! A través de una medida de semejanza son comparados los elementos de todo el conjunto.
  • 6. Medidas de Semejanza ! La semejanza puede ser vista como una cantidad que refleja la relación entre dos elementos de un conjunto.
  • 7. Medidas de Semejanza ! La semejanza puede ser vista como una cantidad que refleja la relación entre dos elementos de un conjunto. ! Esta medida de semejanza está basada comúnmente en una función de distancia,
  • 8. Medidas de Semejanza ! La semejanza puede ser vista como una cantidad que refleja la relación entre dos elementos de un conjunto. ! Esta medida de semejanza está basada comúnmente en una función de distancia, ! euclidiana, ! Manhatan, ! Minkowski, ! Coseno, ! etc.
  • 9. Medidas de Semejanza ! Los grupos formados con base en estas medidas, son de tal forma que dos datos en el mismo grupo tiene un valor de distancia mínima, mientras que dos datos de grupos diferentes presentan un valor de distancia máximo, esta distancia se denomina distancia del grupo.
  • 10. Medidas de Semejanza ! La selección de la medida de semejanza está directamente relacionada con la naturaleza del conjunto de datos a agrupar Conjunto de datos.
  • 11. Medidas de Semejanza ! La selección de la medida de semejanza está directamente relacionada con la naturaleza del conjunto de datos a agrupar Conjunto de datos. Grupo1 Grupo2
  • 12. Medidas de Semejanza ! La selección de la medida de semejanza está directamente relacionada con la naturaleza del conjunto de datos a agrupar Conjunto de datos. Grupo1 Grupo2 Distancia muy grande entre puntos del conjunto Distancia pequeña entre puntos del conjunto.
  • 13. Medidas de Semejanza Distancia Euclidiana ! Considerada como la métrica estándar para problemas geométricos.
  • 14. Medidas de Semejanza Distancia Euclidiana ! Considerada como la métrica estándar para problemas geométricos. ! La distancia euclidiana no es más que la raíz cuadrada de la diferencia entre las coordenadas de un par de objetos. DXY = Xik − Xjk ( ) 2 k=1 m ∑
  • 15. Medidas de Semejanza Distancia Coseno ! Determina la semejanza entre dos vectores n-dimensionales a través del ángulo que se forma entre ellos. cosθ = A⋅ B A B
  • 16. Medidas de Semejanza Distancia Coseno ! Determina la semejanza entre dos vectores n-dimensionales a través del ángulo que se forma entre ellos. ! Esta medida va de [0, π], así que: ! Un valor de π significa que son opuestos. ! Un valor de π/2 significa independientes. ! Un valor de 0 significa iguales. cosθ = A⋅ B A B
  • 17. Medidas de Semejanza Distancia Manhatan ! Es la distancia entre dos pares de puntos a lo largo de ejes perpendiculares. DXY = Xik − Xjk + Yik −Yjk
  • 18. Medidas de Semejanza Distancia Manhatan ! Es la distancia entre dos pares de puntos a lo largo de ejes perpendiculares. DXY = Xik − Xjk + Yik −Yjk *Imagen tomada de internet Figura 1*
  • 19. Medidas de Semejanza Distancia Jaccard ! La distancia Jaccard mide la semejanza de dos conjuntos de datos y se calcula de la siguiente forma: J(A, B) = A∩B A∪B
  • 20. Medidas de Semejanza Distancia Jaccard ! Ejemplo: J(A, B) = A∩B A∪B = ?
  • 21. Medidas de Semejanza Distancia Jaccard ! Ejemplo: A∪B = A∩B =
  • 22. Medidas de Semejanza Distancia Jaccard ! Ejemplo: J(A, B) = A∩B A∪B = 2 7 = 0.286 A∪B = A∩B =
  • 23. Medidas de Semejanza Distancia Minkowski ! La distancia de Minkowski es una métrica generalizada de distancia euclidiana y distancia de Manhattan. DXY = Xik − Xjk 1 p k=1 d ∑ ⎛ ⎝ ⎜ ⎞ ⎠ ⎟ p
  • 24. Medidas de Semejanza Distancia Minkowski ! La distancia de Minkowski es una métrica generalizada de distancia euclidiana y distancia de Manhattan. ! Si p=1 tenemos la distancia Manhatan. ! Si p=2 tenemos la distancia Euclidiana. DXY = Xik − Xjk p k=1 d ∑ ( ) 1 p