1. Concepto( GUERRA)
Un diagrama de dispersión o gráfica de dispersión o gráfico de dispersión es un tipo de
diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos
variables para un conjunto de datos1.
Descripcion
Se emplea cuando una o varias variables está bajo el control del experimentador. Si existe un
parámetro que se incrementa o disminuye de forma sistemática por el experimentador, se le
denomina parámetro de control o variable independiente y habitualmente se representa a lo
largo del eje horizontal (eje de las abscisas). La variable medida o dependiente usualmente se
representa a lo largo del eje vertical (eje de las ordenadas). Si no existe una variable
dependiente, cualquier variable se puede representar en cada eje y el diagrama de dispersión
mostrará el grado de correlación (no causalidad) entre las dos variables.
Un diagrama de dispersión puede sugerir varios tipos de correlaciones entre las variables con
un intervalo de confianza determinado. La correlación puede ser positiva (aumento), negativa
(descenso), o nula (las variables no están correlacionadas). Se puede dibujar una línea
de ajuste (llamada también "línea de tendencia") con el fin de estudiar la correlación entre las
variables. Una ecuación para la correlación entre las variables puede ser determinada por
procedimientos de ajuste. Para una correlación lineal, el procedimiento de ajuste es conocido
como regresión lineal y garantiza una solución correcta en un tiempo finito.
Uno de los aspectos más poderosos de un gráfico de dispersión, sin embargo, es su
capacidad para mostrar las relaciones no lineales entre las variables. Además, si los datos son
representados por un modelo de mezcla de relaciones simples, estas relaciones son
visualmente evidentes como patrones superpuestos.
El diagrama de dispersión es una de las herramientas básicas de control de calidad, que
incluyen además el histograma, el diagrama de Pareto, la hoja de verificación, los gráficos de
control, el diagrama de Ishikawa y el diagrama de flujo.
CORRELACION (CORVACHO)
En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación
lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables
cuantitativas están correlacionadas cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables
(A y B) existe correlación entre ellas si al disminuir los valores de A lo hacen también los de B
y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de
causalidad
Relación Entre las Variables
La correlación puede decir algo acerca de la relación entre las variables. Se utiliza para
entender:
1. si la relación es positiva o negativa
2. la fuerza de la relación.
2. La correlación es una herramienta poderosa que brinda piezas vitales de información.
En el caso del ingreso familiar y el gasto familiar, es fácil ver que ambos suben o bajan juntos
en la misma dirección. Esto se denomina correlación positiva.
Desventajas
Si bien 'r' (coeficiente de correlación) es una herramienta poderosa, debe ser utilizada con
cuidado.
1. Los coeficientes de correlación más utilizados sólo miden una relación lineal. Por lo
tanto, es perfectamente posible que, si bien existe una fuerte relación no lineal entre
las variables, r está cerca de 0 o igual a 0. En tal caso, un diagrama de dispersión
puede indicar aproximadamente la existencia o no de una relación no lineal.
2. Hay que tener cuidado al interpretar el valor de 'r'. Por ejemplo, se podría calcular 'r'
entre el número de calzado y la inteligencia de las personas, la altura y los ingresos.
Cualquiera sea el valor de 'r', no tiene sentido y por lo tanto es llamado correlación
de oportunidad o sin sentido.
3. 'R' no debe ser utilizado para decir algo sobre la relación entre causa y efecto.
Dicho de otra manera, al examinar el valor de 'r' podríamos concluir que las
variables X e Y están relacionadas. Sin embargo, el mismo valor de 'r no nos dice si
X ínfluencia a Y o al revés. La correlación estadística no debe ser la herramienta
principal para estudiar la causalidad, por el problema con las terceras variables.
LINEA DE AJUSTE(SUAREZ)
es un modelo matemáticousado para aproximar la relación de dependencia entre una variable
dependiente Y, las variables independientes Xi y un término aleatorio ε. Este modelo puede
ser expresado como:
donde:
: variable dependiente, explicada o regresando.
: variables explicativas, independientes o regresores.
3. : parámetros, miden la influencia que las variables explicativas tienen sobre el
regrediendo.
donde es la intersección o término "constante", las son los parámetros
respectivos a cada variable independiente, y es el número de parámetros
independientes a tener en cuenta en la regresión. La regresión lineal puede ser
contrastada con la regresión no lineal.
Ejemplo:
Use el método de mínimos cuadrados para determinar la ecuación de la recta que
mejor se ajusta para los datos. Luego grafique la recta.
Solución:
Grafique los puntos en un plano coordenado .
Calcule las medias de los valores de x y los valores de y , la suma de los
cuadrados de los valores de x , y la suma de cada valor de xmultiplicado por su
valor correspondiente y .
4. Calcule la pendiente.
Calcule la intercepción en y .
Primero, calcule la media de los valores de x y la media de los valores de y .
Use la fórmula para calcular la intercepción en y .
5. Use la pendiente y la intercepción en y para formar la ecuación de la recta que
mejor se ajusta.
La pendiente de la recta es -1.1 y la intercepción en y es 14.0.
Por lo tanto, la ecuación es y = -1.1 x + 14.0.
Dibuje la recta en la gráfica de dispersión.