• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Estadistica para la investigación (sesión5) version mejorable
 

Estadistica para la investigación (sesión5) version mejorable

on

  • 2,414 views

 

Statistics

Views

Total Views
2,414
Views on SlideShare
1,206
Embed Views
1,208

Actions

Likes
1
Downloads
62
Comments
0

6 Embeds 1,208

http://www.ispa.edu.pe 1028
http://ispavirtual.org 97
http://protitulo.blogspot.com 61
http://protitulo.blogspot.ru 10
http://www.protitulo.blogspot.com 9
http://protitulo.blogspot.mx 3

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Estadistica para la investigación (sesión5) version mejorable Estadistica para la investigación (sesión5) version mejorable Presentation Transcript

    • Lenin H. Cari Mogrovejo zarlenin@gmail.com
    • ¿Se puede elegir concebir un niño o una niña?Introducción Según el Dr. Landrum Shettles, la dieta y el calendario influyen en el sexo de un bebé. Existe la posibilidad de 85% y 95%.
    • Niño entre más cerca sea el acto sexualdel día de la ovulación y niña, si el actosexual se realiza a 2-3 días de la ovulación.
    • No importa el sexo,lo que importa es que sea feliz
    • ¿Puedo relacionar el peso y la edad de una persona?
    • ANÁLISIS DE CORRELACIÓNY REGRESIÓN LINEAL
    • CORRELACIÓN ENTRE VARIABLES CUANTITATIVASVELOCIDAD B TIEMPO A
    • CORRELACIÓN YREGRESIÓN LINEAL (1) Estudian la existencia de una relación lineal entre dos variables de naturaleza cuantitativa. Sus objetivos, aunque complementarios, son diferentes.
    • CORRELACIÓN YREGRESIÓN LINEAL (2) El ACL estudia la relación lineal de intensidad y la dirección. Existe una relación lineal entre el coeficiente intelectual de una persona y sus ingresos? El ARL ayuda en la predicción de los valores de una variable cuantitativa (llamada dependiente) cuando se conoce el valor de otra variable cuantitativa (llamada independiente). ¿Cuál es el coeficiente intelectual de un niño con una buena nutrición?
    • ANÁLISIS DE CORRELACIÓN (1) El proceso para determinar el grado de relación lineal se puede resumir en los siguientes pasos: A. Elaboración del diagrama de dispersión. B. Inspección del diagrama en busca de una relación lineal. C. Cálculo de la covarianza entre las dos variables D. Cálculo de las desviaciones estándar E. Cálculo del coeficiente de correlación
    • A.- DIAGRAMA DE DISPERSIÓN Consiste en la representación en ejes de coordenadas de los puntos correspondientes a los pares de valores de cada individuo. Es indiferente qué variable representemos en abscisas y qué variable en ordenadas. En el análisis de correlación se da una simetría entre las dos variables. No cabe hablar, por tanto, de variable dependiente o independiente.
    • Diagrama de Dispersión Llamado también Ploteo de Datos, tiene como propósito mostrar la posible tendencia (en caso de existir) entre las variables “X” y “Y”. Consiste en llevar los pares de valores “x, y” a un sistema de coordenadas (bidimensional) Y (x, y) X
    • FORMAS TÍPICAS DE LOS DIAGRAMAS DE DISPERSIÓN ESTADÍSTICA
    • DIAGRAMA DE DISPERSIÓN (2) Diagram a de dispersión Diagram a de dispersión 100 100 90 90 80 80 70 70 VENTAS VENTAS 60 60 50 50 40 40 30 30 20 20 10 10 0 0 0 10 20 30 0 10 20 30 PUBLICIDAD PUBLICIDAD
    • b.-INSPECCIÓN DEL DIAGRAMA La relación entre dos variables cuantitativas puede ser de naturaleza no lineal, por ejemplo cuadrática, cúbica, logarítmica, etcétera. El análisis de correlación lineal sólo debe aplicarse cuando de la inspección del diagrama de dispersión se pueda deducir la existencia de una relación lineal.
    • c.-CÁLCULO DE LA COVARIANZA La covarianza es una medida del grado en que dos variables cuantitativas evolucionan paralelamente. N  X i   X Yi  Y   XY  i 1 N
    • INTERPRETACIÓN DE LA COVARIANZA Si Sxy > 0 hay dependencia directa (positiva), es decir, a grandes valores de x corresponden grandes valores de y. Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal entre las dos variables estudiadas. Si Sxy < 0 hay dependencia inversa o negativa, es decir, a grandes valores de x corresponden pequeños valores de y.  .
    • e.- EL COEFICIENTE DE CORRELACIÓN Surge ante los problemas que plantea la covarianza. Se designa con la letra griega ( ) Ventajas:  XY   Carece de unidades  Está acotado  X Y  1    1
    • EL COEFICIENTE DE CORRELACIÓN (2) Si el coeficiente de correlación vale -1 estamos ante una relación lineal perfecta e inversa entre las dos variables. Diagram a de dispersión 80 70 60 ¡Cuidado!: la pendiente 50 no es necesariamente -1 Y 40 30 20 10 0 0 5 10 15 20 X
    • EL COEFICIENTE DE CORRELACIÓN (3) Si el coeficiente de correlación vale +1 estamos ante una relación lineal perfecta y directa entre las dos variables. Diagram a de dispersión 90 80 70 60 ¡Cuidado!: la pendiente 50 no es necesariamente +1 Y 40 30 20 10 0 0 5 10 15 20 X
    • EL COEFICIENTE DE CORRELACIÓN (4) Si el coeficiente de correlación vale 0 no existe relación lineal entre las dos variables. Diagram a de dispersión 12 10 8 Y 6 4 2 0 0 5 10 15 X
    • Regresión lineal
    • REGRESIÓN LINEAL Es la técnica matemático – estadística que analiza la dependencia entre dos o más variables. Observa si las variaciones de una característica provocan variaciones en la magnitud de otra característica. Es la función matemática que, para un valor dado de una variable, da el valor esperado de una característica, con la cual está ligada. 23
    • Regresión Lineal Simple En el desarrollo de los eventos, puede X1 ser que una variable sea afectada por el comportamiento de otra (s) variable (s) Y X2 . . . Es de interés poder cuantificar este tipo Xi de relación de manera que se pueda predecir una variable en función de otraY: Variable Dependiente En Regresión Lineal Simple es de interés cuando una variable afecta elX: Variable Independiente comportamiento de otra variableY = f(X) Propósito de la R.L.S: Predicción
    • EJEMPLOS El precio de venta (VD; Y) depende del precio de costo de un artículo (VI; X). El costo total (VD; Y) depende de la producción total (VD; X). El tiempo de servicios (VD; Y) de un trabajador depende de su edad (VD; X). El consumo familiar (VD; Y) está en función del ingreso familiar VD; X).Donde: VD; Y = variable dependiente, predictando, explicativa. VI; X = variable independiente; predictor, explicativa. Esta relación se expresa: Y = f(X), “Y depende de X” 25
    • ANÁLISIS DE REGRESIÓN ElARL es una herramienta que persigue ayudar en la predicción de los valores de una variable cuantitativa supuestos conocidos los valores de otra variable cuantitativa con la que la primera tiene una relación de tipo lineal.
    • DIAGRAMA DE DISPERSIÓN Partimos del diagrama de dispersión (igual que en ACL), pero hemos de distinguir entre:  Variable dependiente: la que queremos predecir.  Variable independiente: la que nos va a servir para predecir. Situaremos la variable dependiente en ordenadas (Y) y la independiente en abscisas (X).
    • RECTA DE REGRESIÓN Diagram a de dispersión Diagrama de dispersión 40 120 35 y = 1,243x - 141,98 100 R2 = 0,8634 30 80 25 PESOY 20 60 15 40 10 20 5 0 0 0 5 10 15 160 170 180 190 200 X ALTURA
    • COEFICIENTE DE DETERMINACIÓN A la proporción de variabilidad eliminada por la recta de regresión se le llama coeficiente de determinación (R2) Como es una proporción, toma valores entre 0y1   N 2 ˆ Yi  Y VE R  2  i 1 N  Y  Y  VT 2 i i 1
    • COEFICIENTE DE DETERMINACIÓN (2) Coincide con el cuadrado del coeficiente de correlación.  Cuando el coeficiente de correlación es +1 o -1, la relación lineal es perfecta y la recta de regresión consigue eliminar toda la variabilidad de la variable a estimar, en consecuencia R2=1.  Cuando el coeficiente de correlación es 0, no existe relación lineal entre las variables. En consecuencia, el conocimiento de la variable independiente no ayuda a estimar la variable dependiente y la recta de regresión no consigue eliminar nada de la variación total. Así, R2=0 R 2 2
    • ¿Cómo estimo sin la recta de regresión? ALTURA PESO ¿Cuánto pesa un individuo ? 175 69 82,28 Kg. (el peso promedio del 184 85 conjunto de individuos) 192 93 ¿Me equivoco? 165 68 174 72 Seguro, el riesgo en la predicción es mayor cuanto mayor sea la 182 87 varianza del peso 191 102
    • ¿Cómo estimo con la recta de regresión? Diagrama de dispersión 120 ¿Cuánto pesa un individuo 100 y = 1,243x - 141,98 R2 = 0,8634 que mide 186 cm.? 80 1,243x186-141,98=89,218PESO 60 40 ¿Me equivoco? 20 0 160 170 180 190 200 Seguro, pero corres menos riesgo ALTURA que si no conocieras su altura. De hecho, has reducido la variabilidad del peso en un 86,34%
    •  APLICACIÓN A continuación se muestran los datos observados correspondiente a la función costo total (C = Yi) medida en millones de soles, con respecto a la producción total (Q = Xi) medida en miles de soles. PRODUCCIÓN (Xi) COSTO TOTAL (Yi) 10 30 20 36 30 40 40 48 50 54 60 58 70 66 80 68 33
    • DIAGRAMA DE DISPERSIÓN REGRESIÓN LINEAL ENTRE LA PRODUCCIÓN TOTAL Y EL COSTO TOTAL 80 70COSTO TOTAL 60 50 40 30 20 10 0 0 20 40 60 80 100 PRODUCCIÓN 34
    • PLANTEAR LA ECUACIÓN DE ESTIMACIÓN DE REGRESIÓN LINEAL Yi = b0 + b1Xi Ŷi = 24,5 + 0,5666667Xi COSTO TOTAL ESTIMADO = 24,5 + 0,5666667 * PRODUCCIÓN TOTALINTERPRETAR b0. Por cada mil unidades que se incremente la producción, el costo total se incrementará en 566 666,67 soles.ESTIMAR O PREDECIR CUÁNTO SERÁ EL COSTO TOTAL SI SE QUIERE PRODUCIR 85 000 ARTÍCULOS. Ŷi = 24,5 + 0,5666667 * 85 Ŷi = 72,66666667 * 1 000 000 Ŷi = 72 666 666,95 SOLES. 35
    • GRAFICAR LA RECTA DE REGRESIÓN LINEALESTIMADA REGRESIÓN LINEAL ENTRE LA PRODUCCIÓN TOTAL Y EL COSTO TOTAL 80 70 y = 0,5667x + 24,5 COSTO TOTAL 60 50 40 30 20 10 0 0 20 40 60 80 100 PRODUCCIÓN 36
    • Algunas consideraciones
    • DIAGRAMA DE DISPERSIÓN ONUBE DE PUNTOS (a) Lineal directa (b) Lineal inversa (c) Curvilínea directa Y Y Y • • •• • • •• • • • • • •• • • •• • •• X ••• X X Y • Y Y • •• • • • •• •• • •• • •• • • • • •• • • • • •• • •• •• •• •• • • • •• • •• • X X X (d) Curvilínea inversa (e) Lineal inversa (d) Ninguna relación con más dispersión 38
    • Coeficiente de PearsonEl coeficiente de correlación (r) mide el grado de afinidad o asociación entre n  XY -  X Y dos variables. r=Coeficiente de Pearson: [n  X 2 - ( X)2 ] [n  Y 2 - ( Y)2 ]Coeficiente de Determinación: CD = r2 * 100Propiedades de r: -1 ≤ r ≤ +1a) Si r > 0, existe “correlación directa positiva”.b) Si r < 0, existe una “correlación inversa negativa”.c) Si r2 = 1, los datos forman una línea recta.d) Si r = +1, entonce hay una correlación perfecta positiva.e) Si r = -1, Existe una correlación perfecta negativa.f) Si r = 0, las variables son independientes; no están correlacionadas. 39
    • GRADO DE ASOCIACIÓN O INTERRELACIÓNCOEFICIENTE r GRADO DE ASOCIACIÓN 0,0 ± 0,2 NULA± 0,2 ± 0,4 POCA SIGNIFICATIVA±0,4 ± 0,7 SIGNIFICATIVA BASTANTE± 0,7 ± 0,9 SIGNIFICATIVA± 0,9 ± 1,0 MUY SIGNIFICATIVA 40
    • APLICACIÓNCalcule el coeficiente de correlación y el coeficientede determinación del ejemplo anterior e interprete.r = 0,9958246Interpretación: Entre la producción total y el costototal existe una correlación o grado de asociaciónmuy significativa, es decir se acepta que el costototal esta influenciado por la producción total.CD =99,17%Interpretación: El 99,17% de la variación del costo esexplicada por la variación en la producción. 41
    • Conjunto de datos Rango de Sueldo (X) Inasistencias (Y) 11 18 10 17 8 29 5 36 9 11 9 26 7 28 3 35 11 14 8 20 7 32 2 39 9 16 8 26 6 31 3 40
    • Diagrama de Dispersión 45 40 35 30 Inasistencia 25 20 15 10 5 0 0 2 4 6 8 10 12 Rango de Salario
    • Muchas graciasLenin H. Cari MogrovejoCel. 959966199zarlenin@gmail.comlenin_9966199@hotmail.com