Guia organización de datos

16,938 views

Published on

Documento creado por el Licenciado Anthony Ramos (2011)

Published in: Education
2 Comments
13 Likes
Statistics
Notes
No Downloads
Views
Total views
16,938
On SlideShare
0
From Embeds
0
Number of Embeds
914
Actions
Shares
0
Downloads
0
Comments
2
Likes
13
Embeds 0
No embeds

No notes for slide

Guia organización de datos

  1. 1. ESTADÍSTICA ] APLICADA UNIVERSIDAD NACIONAL EXPERIMENTAL “FRANCISCO DE MIRANDA” ÁREA CIENCIAS DE LA EDUCACIÓN COMPLEJO ACADÉMICO “LOS PEROZOS” DEPARTAMENTO DE FÍSICA Y MATEMÁTICA CÁTEDRA: ESTADÍSTICA APLICADA SANTA ANA DE CORO; MAYO DE 2011 1 Licdo. Anthony Ramos
  2. 2. ESTADÍSTICA ] APLICADA Índice de Contenidos Tema 1.2 Organización de Datos Dato. Dato Cualitativo. Dato Cuantitativo. Variable Variable Cualitativa. Variable Cuantitativa. Variable Cuantitativa Discreta o Discontinua. Variable Cuantitativa Continua. Variable Simple Variable Compleja. Escalas de Medición Escala Nominal Escala Ordinal Escala Intervalo Escala Razón o Proporción Distribución de Frecuencia: Definición de Intervalo de clases. Elementos y Pasos para su construcción. Ejercicios resueltos. Ejercicios propuestos. 1 Licdo. Anthony Ramos
  3. 3. ESTADÍSTICA ] APLICADA Tema Nº 1.2 Organización de datos Datos: números o medidas que han sido recopiladas como resultado de observaciones. Datos cuantitativos: observaciones que generan valores numéricos. Ejemplo: 50 años, 12 Kg., 7 cm. Datos cualitativos: representan características observables más no medibles. Ejemplo: color de cabello, Sexo, Nacionalidad, Marcas de auto, Grado de Satisfacción con la Universidad, etc. Variable: característica o fenómeno que puede tomar distintos valores. Ejemplo: Edad= 20,13, 25 Variable cuantitativa: los valores que tomas son numéricos. Ejemplo: peso, edad, temperatura, estatura, Cantidad de Habitaciones, Número de hijos, Kilómetros recorridos, Tiempo de vuelo, Ingreso, etc. Variable cualitativa: valores que consisten en categorías de clasificación. Ejemplo: rojo, negro, castaño. Ejemplo: con datos y variables La familia González tiene “4” miembros, sus ingresos mensuales son de “685.000 Bs.”, “2” son de sexo femenino y “2” masculinos. Es importante señalar que las variables continuas se pueden “discretizar” (por ejemplo, tomando intervalos) y así ser tratadas como discretas. Igualmente, cuando una variable discreta asume una gran variedad de valores, como podría ser el caso de contar el número de pulgones en hojas de trigo, esta puede ser tratada como una variable continua. 1 Licdo. Anthony Ramos
  4. 4. ESTADÍSTICA ] APLICADA Variables Cuantitativas Discretas o Discontinuas: Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc., pero, por ejemplo, nunca podrá ser 3,45). Variables Cuantitativas Continuas: Pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc. Las variables también se clasifican según el grado de complejidad en:  Simples aquellas que se manifiestan directamente a través de un indicador o unidad de medida. No se descomponen en dimensiones. Por ejemplo la edad, se manifiesta en años cumplidos.  Complejas aquellas que se pueden descomponer en dos dimensiones como mínimo. Por ejemplo, la actitud. Escalas de medición Permiten agrupar datos de acuerdo a la naturaleza del mismo en categorías, existen cuatro tipos:  Escala Nominal: se pueden usar letras números y signo cualquiera y posee una característica que es MUTUA EXCLUSIVIDAD. Las observaciones únicamente se pueden clasificar o contar. No hay un orden particular para cada clase. Por ejemplo: clasificamos los dulces sólo por su color y podemos tomar primero los morados, los azules, o los de cualquier otro color; no hay un orden natural. Las categorías que se establecen son mutuamente excluyentes; es decir, un dulce no puede ser rojo y azul a la vez. Otra característica de estas categorías es que son colectivamente exhaustivas; es decir, que todos los dulces deben pertenecer a una categoría, en una bolsa de Freskas no puede haber un dulce que no sea rojo, ni azul, ni amarillo, ni morado, ya que sólo existen esos colores.  1 Licdo. Anthony Ramos
  5. 5. ESTADÍSTICA ] APLICADA  Ejemplo 2: Barrio de residencia de los alumnos, simpatizante de un club de fútbol o béisbol, profesiones laborales, ideología política, estado civil. ÁREA Nº de estudiantes Educación 500 Tecnología 300 Medicina 600 COLOR DE PIEL Nº de personas Negro 500 Blanco 300 Moreno 600 SEXO PERSONAS Masculino 25 Femenino 30 RELIGIÓN Nº de personas Católico 500 Judío 300 Evangélico 600 Nota: para esta escala no hay un orden especifico para las categorias.  Escala Ordinal: se organizan datos por categorias hay MUTUA EXCLUSIVIDAD, pero existe una realción “MAYOR QUE” (relevancia entre las categorias), si importa el orden de las categorias. Ejemplo: 1 Licdo. Anthony Ramos
  6. 6. ESTADÍSTICA ] APLICADA NIVEL ACADÉMICO Nº de personas Primaria 25 Secundaria 35 Diversificado 41 Universitario 41 RENDIMIENTO Nº de personas Excelente 15 Bueno 17 Regular 10 Deficiente 4 NIVELES DE DESNUTRICIÓN Nº de personas Leve 15 Moderada 17 Severa 10  Escala de Intervalo: tiene las mismas características de la anterior (ordinal) y tiene unidad constante de medición, es decir: entre las categorías va a existir una unidad o distancia que va a permanecer constante entre ellas. Ejemplo: Mensualidad Nº de días 200.000 Bs. – 400.000 Bs. 7 500.000 Bs. - 700.000 Bs. 2 Nota: la unidad constante es 300.000 Bs. TEMPERATURA Nº de días 20º - 29º 7 10º - 19º 2 0 º- 9º 4 1 Licdo. Anthony Ramos
  7. 7. ESTADÍSTICA ] APLICADA La unidad constante: 10 que es el intervalo. GRUPOS DE EDAD Nº de días Menores de 1 Año 7 1 a 5 años 2 6 a 10 años 4 11 a 15 años 5 Nota: en esta escala el cero (0) no indica perdida o ausencia del atributo o característica.  Escala de razón o proporción: posee las características del anterior, pero aquí el cero (0) si indica ausencia o perdida de la característica o atributo. Ejemplo: tiempo de vuelo. CALIFICACIÓN Nº de días 20-15 2 15-10 7 10-5 4 5-0 3 PESO Nº de personas 150Kg-100 Kg. 2 100 Kg.-50 Kg. 3 50 Kg.-0 Kg. 7 INGRESO Nº de personas 300.000 Bs. – 200.000 Bs. 3 200.000 Bs. – 100.000 Bs. 7 100.000 Bs. – 0 Bs. 2 1 Licdo. Anthony Ramos
  8. 8. ESTADÍSTICA ] APLICADA EDAD Nº de personas 25 – 15 12 15 – 5 14 5–0 1 Nota: en esta escala el cero (0) si indica perdida o ausencia del atributo. Distribución de Frecuencia  Ordenación tabular de datos en forma de intervalos con su respectiva frecuencia.  Usadas para describir un grupo de datos.  Establecer márgenes que nos permiten agrupar los datos por categorías. Ejemplos: 1. Categoría de edades. 2. Categoría de precios. 3. Categorías de temperaturas. Ejemplo de cuadro de distribución de frecuencias Categoría Porcentaje Debajo de 35% 9% 36-45 21 % 46-55 41 % 56-65 15% Definición de Intervalo de clases: Conjunto de datos que se encuentran ubicados entre dos límites establecidos. Por ejemplo: a) El intervalo: 3 – 6, incluye los valores: 3,4,5,6 (tiene un tamaño de 4) b) El intervalo: 2 – 6, incluye los valores: 2,3,4,5,6 (tiene un tamaño de 5) c) El intervalo: 40- 45, incluye los valores: 40,41,42,43,44,45 (tiene un tamaño de 6) d) El intervalo: (-2) – (-4), incluye los valores (-2), (-3), (-4), (tiene un tamaño de 3) 1 Licdo. Anthony Ramos
  9. 9. ESTADÍSTICA ] APLICADA Elementos para la construcción de la tabla de distribución de frecuencia:  Clases o intervalos de clases: son intervalos de valores ordenados en forma ascendente o descendente u que cubren todos los datos disponibles.  Limites de clases: extremos de las clases, el valor mayor se denomina límite superior de clase (L.S) y el menor límite inferior de clase (L.I), los extremos pueden ser abiertos o cerrados. Los elementos de un intervalo de clases son: LI LS Xi Donde: LI, LS: son los límites reales del intervalo de clases (inferior y superior). Xi: punto medio del intervalo, tomando en cuenta los intervalos aparentes.  Amplitud de clases o anchura del intervalo: longitud o tamaño de los intervalos de clases, es decir, cuantos valores caben dentro del intervalo o la unidad constante (A).  Marca de clase: punto o medio de los intervalos de clase y se calcula hallando la semisuma del limite superior e inferior, se denota (Xi) su fórmula es: Li  Ls Punto Xi  Ó 52 53 54 2 Medio  Frecuencia absoluta (fa): número de observaciones contenidas o incluidas e cada una de las clases. Ejemplo: 20, 50, 35, 70 ,88 Para calcular su frecuencia [ 20-30] 1 [ 31-41] 1 Intervalos semiabiertos [ ) Intervalos cerrados [ ] 1 Licdo. Anthony Ramos
  10. 10. ESTADÍSTICA ] APLICADA  Frecuencia relativa (fr): se obtiene dividiendo la frecuencia absoluta entre el número de observaciones, es decir: fa fr  , donde n es el nº de observaciones. Ejemplo: la frecuencia n relativa del ejemplo anterior: para 20-30 = 1/5  Frecuencia absoluta acumulada (fac): se obtiene sumando las frecuencias absolutas de clases anteriores a ellas y la de la clase considerada.  Frecuencia absoluta relativa (far): se obtiene dividiendo la frecuencia absoluta acumulada entre el número de observaciones. fac far  n Nota: si conozco el número de intervalos de clases (Nc), la amplitud se calcula con la siguiente fórmula: V max V min A Nc Y si no conozco el número de intervalos de clases (Nc), se calcula con las siguientes formulas: Nc  1  3,322Log(n) ; Nc  n 1 Licdo. Anthony Ramos
  11. 11. ESTADÍSTICA ] APLICADA Ejercicio resuelto: Se tienen las calificaciones de 12 alumnos de la unidad curricular Estadística aplicada a la Educación, construir una distribución de frecuencia que posea una Nc = 3, (Número de Intervalos o Clases) para ello deberán calcular la amplitud de cada intervalo tomando en cuenta el dato más pequeño y el más grande del conjunto de observaciones. 12 15 17 18 17 16 15 19 11 19 17 20 Solución: 1) Se ordenan los datos de menor a mayor: 12 12 15 15 16 17 17 17 18 19 19 20 2) Se calcula el valor de A (amplitud o tamaño de los intervalos): A = Valor Máximo - Valor Mínimo = 20 - 12 = 8 = 2,6= 3 Nc 3 3 3) Se construye la tabla de distribución de frecuencias: Intervalos Limites RealesN (Calificaci fa fr fac Far Xi %º L.I L.S ones)1 12,5 14,5 2 2/12=0,17 2 2/12=0,17 3 17 12 – 142 14,5 17,5 6 6/12=0,50 8 8/12=0,67 6 50 15 – 17 20,5 4/12=0,33 12/12=13 17,5 4 12 9 33 18 – 20 12 1 1 100 Deben ser iguales porque Siempre debe dar representan la cantidad de observaciones en su totalidad, en 1 o 0.99. este caso 12. 1 Licdo. Anthony Ramos
  12. 12. ESTADÍSTICA ] APLICADA Ejemplo 2: Se tienen 30 datos referidos a las calificaciones definitivas de una prueba de coeficiente intelectual aplicado a un grupo de 30 alumnos de la UNEFM. Construir una distribución de frecuencia que posea una Nc = 6. 60 61 62 62 62 63 64 67 68 69 70 71 73 75 78 79 80 81 82 83 83 83 83 84 85 86 87 88 89 89 a) Calcular la amplitud: b)Construir la tabla: Limites realesNº INTERVALOS fa fr fac far Xi % Li Ls1234567 ∑ ∑ Planteamientos: 1. Cuantos alumnos y qué porcentaje del total obtuvieron calificaciones inferiores a 75 puntos 2. Cuantos alumnos y qué porcentaje del total obtuvieron calificaciones comprendidas entre 65 y 80 puntos 3. Cuantos alumnos y qué porcentaje del total obtuvieron calificaciones mayores a 70 puntos 1 Licdo. Anthony Ramos
  13. 13. ESTADÍSTICA ] APLICADA Ejemplo 3: Se tienen 40 datos construir una distribución de frecuencia que posea una Nc = 6. 99 101 103 104 104 105 106 106 108 109 110 111 113 113 116 117 119 120 120 120 121 122 123 124 127 128 130 131 132 133 134 135 136 137 138 138 138 139 140 140 a) Calcular la amplitud: b)Construir la tabla: Limites realesNº INTERVALOS fa fr fac far Xi % Li Ls1234567 ∑ ∑ 1 Licdo. Anthony Ramos
  14. 14. ESTADÍSTICA ] APLICADA UTILIDAD DE LAS FRECUENCIAS a) La frecuencia absoluta indica cuál o cuáles valores son los más frecuentes en la distribución. b) Al multiplicar por cien la frecuencia relativa se obtiene un porcentaje. Esta representa un valor de la muestra en términos porcentuales. c) Al multiplicar por cien la frecuencia relativa acumulada se obtiene el porcentaje de valores menores o iguales a ese valor dado. d) La frecuencia absoluta acumulada indica cuantos valores hay por debajo del valor seleccionado. La frecuencia nos sirve para responder preguntas formuladas como:  ¿Cuántos estudiantes obtuvieron calificaciones entre 15 y 17 puntos? Revisamos la columna calificaciones (INTERVALOS DE CLASE), seguidamente fila Nº 2, luego en fa (FRECUENCIA ABSOLUTA) vemos que corresponde el número 6. Interpretación: 6 estudiantes tienes calificaciones entre 18 y 20 puntos.  ¿Cuál es el porcentaje de estudiantes con calificaciones entre 18 y 20 puntos?  Revisamos la columna calificaciones (INTERVALOS DE CLASE), seguidamente fila Nº 3, luego en fr (FRECUENCIA RELATIVA) vemos que corresponde con 4/12=0,33; 0,33 x 100= 33 % Interpretación: el 33 % de los estudiantes tienen calificaciones entre18 y 20 puntos. Si queremos saber en esta distribución que porcentaje de estudiantes tienen calificaciones menores a 18 puntos 1 Licdo. Anthony Ramos
  15. 15. ESTADÍSTICA ] APLICADA  Se ubica la clase que contenga el valor dado (18 puntos) y corresponde a la tercera fila o clase, pero como se quiere saber las calificaciones menores a este, entonces nos ubicamos en la segunda fila o clase.  Buscamos en la (FRECUENCIA ABSOLUTA REALTIVA), y se corresponde con 0,67 que al multiplicarse por 100, se obtiene un 67%.  Interpretación: Entonces el 67% de los estudiantes tienen calificaciones menores a 18 puntos. Ejercicios propuestos. 1) Se tienen 50 datos construir una distribución de frecuencia que posea una Nc = 10 27 27 27 28 28 28 29 30 31 31 32 32 33 34 36 36 37 38 38 40 42 42 43 45 48 48 48 49 51 52 54 57 58 58 59 60 60 60 61 66 67 67 67 68 68 69 71 74 74 76 2) Se tienen 50 datos construir una distribución de frecuencia que posea una Nc = 10 1 2 2 3 4 5 7 8 8 8 9 10 12 12 13 14 15 16 17 18 19 20 21 22 23 25 27 29 30 33 37 38 40 50 51 52 52 52 52 55 55 56 56 57 58 58 59 60 60 60 3) A continuación se presentan una serie de datos referentes a las edades de un grupo de estudiantes de Estadística aplicada a la Educación. 16 17 15 18 18 25 22 26 21 20 18 23 20 29 19 21 18 22 20 21 1 Licdo. Anthony Ramos
  16. 16. ESTADÍSTICA ] APLICADA 1 Licdo. Anthony Ramos

×