Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Estadistica

3,718 views

Published on

ESTADISTICA GENERALIDADES

Published in: Education

Estadistica

  1. 1. ESTADÍSTICA Compilado:Compilado: Ing. Msc. Wilson Velastegui Ojeda EmailEmail: wavo_33@yahoo.com.mx
  2. 2.  La Estadística es la disciplina de las matemáticas que se refiere a los métodos de recolección, clasificación, presentación, de información para el análisis e interpretación de un conjunto de datos para la toma de decisiones  ESTADÍSTICA Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de propiciar una toma de decisiones más eficaz.  Recopilar  Clasificar  Presentar  Analizar  Interpretar CONCLUSIONES LÓGICAS ESTADÍSTICAESTADÍSTICA ESTADÍSTICAESTADÍSTICA CLASIFICACIÓNCLASIFICACIÓN  DescriptivaDescriptiva : Consiste en un conjunto de procedimientos para organizar y resumir datos  InferencialInferencial : Implica tomar una muestra de una población y llevar a cabo cálculos relativos a ésta sobre la base de los resultados de la muestra
  3. 3. PRODUCCION Diseño de Procesos Control de Calidad Muestras de Adquisición MARKETING Investigación de Mercados Análisis de Gustos y Preferencias Búsqueda de Mercados Meta FINANZAS Análisis de Rendimientos Análisis de Riesgos RECURSOS HUMANOS Selección de Personal Evaluación de Personal APLICACIONES ESTADISTICAS EN LOS NEGOCIOS TOMA DETOMA DE DECISIONESDECISIONES
  4. 4.  Datos son hechos/informaciones y cifras que se recogen, analizan y resumen para su presentación e interpretación. A todos los datos reunidos para un determinado estudio se les llama conjunto de datos para el estudio.  Los datos se clasifican en cualitativos o cuantitativos. Los datos cualitativos emplean etiquetas o nombres para determinar categorías de elementos iguales. Los datos cuantitativos son números que indican cuánto o cuántos.  Los datos se clasifican por niveles de medición así:
  5. 5. N n POBLACION (N) Conjunto de individuos u objetos de interés o las medidas que se obtienen de todos los individuos u objetos de interés MUESTRA (n) Es una parte de la población Muestra: Ejemplos: 1.-Cadetes del 2do año de la Policía Nacional. 2.-Número de docentes de la Facultad de Administración de Empresas de la ESPOCH Población: Ejemplos: 1.- Conjunto de cadetes de la Policía Nacional. 2.- Número de docentes del la ESPOCH.
  6. 6. VARIABLEVARIABLE Es una característica que puede manifestarse según dos o más modalidades. Ejemplo: El peso, la estatura y la edad.  VARIABLES CUALITATIVAS (ATRIBUTOS): Son aquellas que no se pueden medir, es decir, no se pueden expresar mediante un número. Los atributos se expresan mediante conceptos (palabras). Ejemplo:  Religión: católica, evangélica, judía VARIABLES CUANTITATIVAS: Son aquellas que pueden ser medidas y se expresan por una cantidad (numero). Las variables cuantitativas las podemos clasificar en: Variables Discretas yVariables Discretas y Variables ContinuasVariables Continuas  Variables DiscretasVariables Discretas: Son aquellas que admiten únicamente valoresúnicamente valores numéricos enterosnuméricos enteros.. Ejemplo:  Numero de alumnos inscritos en la ESPOCH.  Variables Continuas:Variables Continuas: Una variable es continua si admite valores fraccionarios.admite valores fraccionarios. Ejemplo:  Peso de un alumno.
  7. 7. DISTRIBUCIÓN O TABLAS DE FRECUENCIAS: Es un resumen de los datos en el cual, cada opción de respuesta de la variable se relaciona con el número de datos correspondiente.  El primer procedimiento que se emplea para organizar y resumir un conjunto de datos es una tablatabla de frecuenciasde frecuencias.. La distribución de frecuencias para una variable cualitativa está constituida por: Clases:Clases: que corresponde a opiniones, gustos, preferencias, cualidades o características Frecuencia absoluta (ni):Frecuencia absoluta (ni): indica cuantos elementos pertenecen a cada clase. Frecuencia relativa (hi):Frecuencia relativa (hi): indica la proporción de elementos en cada clase, por lo tanto está dada por la razón entre la frecuencia absoluta de cada clase y el número total de observaciones. Obviamente, si se multiplica por 100 cada valor se obtiene la distribución de frecuencias porcentuales.
  8. 8. BARCO BARCO TREN TREN TREN CARRO AVION CARRO AVION CARRO AVION CARRO CARRO CARRO AVION CARRO AVION CARRO AVION AVION CARRO TREN AVION AVION AVION CARRO CARRO BARCO BARCO CARRO CARRO CARRO CARRO AVION BARCO AVION AVION BARCO BARCO BARCO Una agencia de viajes quiere saber cuál es el medio de transporte por el cuál viajan las personas en el país. Para ello, realizó un estudio a cuarenta personas a quienes se les preguntó por su medio de transporte preferido. Se obtuvo la siguiente lista de datos. TABLA DE FRECUENCIAS DE LA VARIABLE MEDIOS DE TRANSPORTE MT f fr % CARRO 15 15/40 = 0.38 38% AVION 13 13/40 = 0.33 33% TREN 4 4/40 = 0.10 10% BARCO 8 8/ 40 = 0.20 20% 4040 1.001.00 100%100%
  9. 9. DESCRIPCION DE DATOS U OBSERVACIONES   Al número de datos u observaciones se lo representan con n. Para describir los dates puede presentar dos casos:   1er CASO:- Cuando el conjunto de observación tiene pocos datos o valores   Ejemplo. Un estudiante durante un semestre dio diez exámenes parciales calificados sobre diez (10 puntos), obteniendo los siguientes resultados:   6 – 7 – 6 – 8 – 5 – 7 – 6 – 9 – 10 y 6. En este ejemplo, n = 10 (número de datos). Para este tipo de conjunto (o estadística) primero se hace un cuadro o una tabla, luego en la primera columna del cuadro se ordenan los datos o valores ya sea en forma ascendente o descendente (creciente o decreciente) en la segunda columna se ponen el número de los valores que se repiten, al número que se repite se llama frecuencia (f). Esto lo visualizamos mediante el siguiente cuadro.
  10. 10.  2do. CASO. - Cuando el conjunto de observación tiene muchos valores diferentes Para este caso se emplea un procedimiento llamado “Agrupamiento de datos". Esto es posible cuando el numero do datos es mayor que 30 (n >30)   OBSERVACIÓN:- El número de clases que se emplea para agrupar los datos en un conjunto depende del número de datos.    Si el número de datos es pequeño, el número de clases a emplear será cercano a cinco (5), pero generalmente nunca menos que cinco (5)    Si existe una cantidad elevada de datos, el número de clases debe encontrarse entre ocho (8) y doce (12) clases    En general el número de clases puede encontrarse entre 5 a 15 clases, el número de clases se puede elegir uno mismo (entre 5 a 15) Para saber en cuantos grupos o clases agrupamos estos datos, se utiliza la fórmula de Sturges K= 1+3,322 Log (n), donde K. es el número de clases y n es el número de dates u observaciones.
  11. 11. EJEMPLO: La demanda diaria, en unidades de un producto, durante 30 días de trabajo es:   105, 106, 105, 107, 109, 111, 110, 110, 107, 107, 104, 99, 103, 99, 103, 101, 100 101, 100, 103, 98, 92, 97, 94, 95, 95, 93, 95, 95, 95, 91, 82 ,91, 85, 90, 86, 87, 89, 87, 89 El número de datos u observaciones es n = 40. Como el número de datos es mayor que 30, agrupamos los datos utilizando la fórmula de Sturges: K = 1+3,322 log (n) K = 1+3.322 log (40) K = 1+3,322 (1.60205) K = 1+5,322 K = 6,32 = 6 Por tanto los 40 datos podernos agrupar en 6 grupos intervalos o clases
  12. 12. PROCEDIMIENTO PARA AGRUPAR LOS DATOS   Ordenamos los datos en forma creciente o decreciente (ascendente o descendente) Encontramos el dato mayor y el dato menor, llamado también observación mayor (OM) y observación menor (om). Con estos datos encontramos el rango o recorrido, en formula es: Rango = R = OM – om  Determinamos el numero de clases o grupos (K), utilizando la fórmula de Sturges, (en nuestro ejemplo anterior K=6).    Hallamos o determinamos la longitud o amplitud del intervalo de la clase, que se designa con la letra C, en formula es: C= es la amplitud de la clase  Preparamos un cuadro con 3 columnas, para las clases, limite de clases y en frecuencia, esto es
  13. 13.  En la columna de límites de clase anotamos como límite inferior (Li) de la clase a la observación menor. Luego de acuerdo a la amplitud del intervalo de la clase (C), incluimos tantos datos hasta el límite superior (Ls), así sucesivamente iremos anotando en clase, hasta llegar a la última clase en la que debe escribir incluido el dato mayor  Finalmente contamos cuantos datos están incluidos en cada clase y lo ponemos en la columna de las frecuencias (f)   Ejemplo. Dado conjunto anterior aplique los pasos y agrupe este conjunto de datos   105, 106, 105, 107, 109, 111, 110, 110, 107, 107, 104, 99, 103, 99, 103, 101, 100 101, 100, 103, 98, 92, 97, 94, 95, 95, 93, 95, 95, 95, 91, 82 ,91, 85, 90, 86, 87 89, 87, 89 1. Ordenamos los dates del ejemplo que estamos tratando en forma ascendente 82, 85, 86, 87, 87, 89, 89, 90, 91, 91, 92, 93, 94, 95 95, 95, 95, 95, 97, 98, 99, 99, 100, 100, 101,101 103, 103, 103, 104, 105, 105, 106, 107, 107, 107 109, 110, 110, 111 2. Hallamos el Rango R = OM – om R = 111 – 82 = 29  
  14. 14. 3.- Determinamos el número de clases. K = 1+3,322 log(40) = 6, (K=6)   4.- Determinamos la amplitud del intervalo de la clase. C = R/K 29/6 = 4.83 C = 5 5.- Preparamos una tabla con 3 columnas
  15. 15. DISTRIBUCIONES DE FRECUENCIAS, INTERVALOS Y MARCA DE CLASE. Para hacer la descripción gráfica de los datos es necesario conocer algunos elementos de la estadística   LIMITES DE INTERVALOS DE CLASE :: Todo grupo, intervalo o clases tiene dos límites: Límite inferior (Li) y límite superior (Ls)   PUNTOS MEDIOS 0 MARCAS DE CLASES (Xc) : Cuando estamos trabajando con datos agrupados es conveniente buscar para cada intervalo un valor que lo represente. Este valor se llama punto medio o marca de clase, que se representa con Xc, en formula es:  FRECUENCIA ABSOLUTA (f) Es el número de veces que se repite un dato, o el número de datos que se encuentre dentro de un intervalo o clase, se lo representa con la letra (“f”) minúscula, es decir a este tipo de frecuencia se llama Frecuencia Absoluta.
  16. 16.  FRECUENCIA RELATIVA (fr): Se obtiene dividiendo el número de datos u observaciones de la clase o grupo para el número total de datos u observaciones: Se representa con la letra (fr), en fórmula es:    FRECUENCIA ACUMULADA ( Fa ) Se obtiene de la siguiente forma: En la primera clase se pone la frecuencia absoluta del mismo, en la segunda clase se pone la suma de la frecuencia de la primera clase con la segunda clase, y así sucesivamente hasta la suma con la frecuencia de la última clase.    FRECUENCIA RELATIVA ACUMULADA Se obtiene de forma similar que la frecuencia acumulada, pero sumando las frecuencias relativas correspondientes. La suma de todas las frecuencias relativas es igual a 1en formula es:                                                       PORCENTAJE El porcentaje se obtiene multiplicando la frecuencia relativa por 100, en fórmula es:   Aplicando esta formula se obtiene el porcentaje, cuyo resultado debe expresarse con % (tanto por ciento). La suma de todos los porcentajes es igual a 100%  
  17. 17. EJEMPLO: Dada la siguiente tabla hallar: a) El punto medio, b) Frecuencia acumulada, c) frecuencia relativa, d) frecuencia relativa acumulada y e) el porcentaje.
  18. 18. REPRESENTACION GRAFICA DE LOS DATOS La representación gráfica de los datos es un medio eficaz para el análisis de las estadísticas, que nos permiten ver el comportamiento de los datos en mi conjunto del cual se esté investigando. Para luego sacar sus conclusiones. La representación gráfica de los datos constituye mi medio auxiliar de la investigación estadística pues esta se fluidamente en la descripción.   SISTEMAS DE REPRESENTACION.- El sistema de representación más usual es el PLANO CARTESIANO, en el eje X se ponen los valores distintos de la variable para dates no agrupados y los límites de clases para los datos agrupados, en el eje Y se ponen las frecuencias absolutas (o frecuencias relativas), Veamos las representaciones gráficas más usuales en la estadística HISTOGRAMA.- El histograma es un gráfico que tiene un conjunto de rectángulos de igual base y de altura igual a su respectiva frecuencia absoluta o frecuencias relativas. Para construir un histograma se traza primero en el primer cuadrando positivo del plano cartesiano, luego en el ej. X se anotan los limites inferiores; y superiores de las clases, procurando que haya una continuidad o coincidencia, Esto es que, el límite superior de una clase se constituye en límite inferior do In siguiente clase NOTA:- Para esto es necesario hallar los limites reales (L- R) de la clase. En el eje Y que corresponden a sus alturas se ponen sus respectivas (frecuencias.
  19. 19.   EJEMPLO: Dado los siguientes datos de la siguiente tabla grafique el histograma
  20. 20.  POLÍGONO DE FRECUENCIA.- Es un gráfico lineal, su construcción es similar al histograma; para su construcción se unen los puntos medios de cada clase, con sus respectivas frecuencias; de tal manera que al unir sus puntos medios por segmentos forman un polígono Ejemplo: dado los siguientes datos de la tabla construya el polígono de frecuencia POLÍGONO DE FRECUENCIA: DEMANDA DIARIA
  21. 21.  DIAGRAMA DE DISTRIBUCIÓN U OJIVA (CURVAS DE FRECUENCIAS ACUMULADAS)   El gráfico de una distribución de frecuencias acumuladas (se llaman OJIVA) o curva de distribución de frecuencias acumuladas   Para su construcción se procede de la siguiente manera. Se considera el plano cartesiano, en el eje X se anotan los limites reales (L – R) de la clase, en el eje Y se anotan las frecuencias acumuladas (desde la menor hasta la mayor)
  22. 22.  DIAGRAMA DE PASTEL O CICLOGRAMAS Los gráficos en sectores o diagramas de pastel se utilizan para representar los datos cuyo conjunto forman un todo. Pertenecen a este grupo los CIRCUNGRAMAS O CICLOGRAMAS, que son círculos que representan al número total de datos (n) divididos en tantos sectores circulares como categorías tiene el grupo. Cada sector circular es proporcional a la frecuencia de su clase o categoría. Para encontrar el número de grados de cada clase o categoría se utiliza la siguiente formula. GRADO = (fx360)/n Donde f es la frecuencia de la clase y n el número total de datos EJEMPLO: Dado los siguientes datos de la tabla construya el diagrama de pastel
  23. 23.  DIAGRAMA DE BARRAS O GRÁFICO DE BARRAS. El diagrama de barras es un gráfico que se representa por medio de rectángulos que se levantan desde el eje X, hasta una altura que corresponde al eje Y y que es igual a las frecuencias de las diferentes categorías de los datos.   La diferencia entre el diagrama de barras y el histograma está en que el histograma se refiere a una distribución de frecuencias y los diagramas de barras se utilizan para cualquier tipo de atributos cualidades o categorías.   Ejemplo: Los siguientes datos corresponden a los campos petroleros existentes en el Oriente Ecuatoriano.
  24. 24. MEDIDAS DE TENDENCIA CENTRAL
  25. 25.  MEDIA ARITMETICA O PROMEDIO PARA DATOS NO AGRUPADOS DEFINICION.- La media se define como la suma de los valores de un conjunto de datos dividido para el número total de datos. Existen dos tipos de medias aritméticas: La media poblacional que se representa por u (miu) y la media muestral que se representa por X (equis barra). La media para datos no agrupados está dada por la siguiente fórmula: Ejemplo: Dado el siguiente conjunto de datos hallas su media.   38 – 35 – 76 – 58 – 48 – 59 – 67 – 63 – 33 – 69 – 53 – 51 – 28 – 25 – 36 – 32 – 61 – 57 – 49 78 – 48 – 42 – 72 – 52 – 47 – 66 – 58 – 44 – 44 – 56 – 45   Aquí es este conjunto n = 30
  26. 26. MEDIANA PARA DATOS NO AGRUPADOS DEFINICIÓN.- La mediana es una colección de datos debidamente ordenados en forma ascendente o descendente (creciente o decreciente). Es el valor medio o la media aritmética de los dos valores medios.   La mediana está justamente en el 50% de los datos (en la mitad). Para hallar la mediana, puede presentar dos casos.   1er. CASO.- Cuando el número de datos es impar.- En este caso la mediana se encuentra en la mitad de la “serie ordenada” de los datos, se puede encontrar utilizando la siguiente fórmula El resultado de esta operación nos indica la posición o el lugar donde está la mediana (este valor no es la respuesta). EJEMPLO: 35, 76, 58, 45, 67, 63, 33, 69, 53, 59 , 28, 36, 32, 61, 51, 49, 78, 48, 42, 72, 57, 47, 66, 58, 44, 44, 52, 56, 48, Datos ordenados 28, 32, 33, 35, 36, 42, 44, 44, 45, 47, 48, 48, 49, 51, 5252, 53, 56, 57, 58, 58, 59 61, 63, 66, 67, 69, 72, 76, 78
  27. 27. n = 29 (NÚMERO DE DATOS IMPAR) El 15 no es la mediana, el 15 nos indica la posición o el lugar donde se encuentra ubicado la mediana en el ordenamiento de los datos, en nuestro ejemplo el puesto 115 ocupa el número 52. Por lo tanto la mediana es: Mdn = 52  2do. CASO.- Cuando el número de datos es par.- En este caso se utiliza el mismo procedimiento que el 1er. Caso, y se obtiene un número entero con decimales, en este caso la median se encuentra hallando la media aritmética de los dos valores medios EJEMPLO: 35, 76, 58, 45, 67, 63, 33, 69, 53, 59 , 28, 36, 32, 61, 51, 49, 78, 48, 42, 72, 57, 47, 66, 58, 44, 44, 52, 56, 48, 78 Datos ordenados 28, 32, 33, 35, 36, 42, 44, 44, 45, 47, 48, 48, 49, 51, 52, 53, 56, 57, 58, 58, 59 61, 63, 66, 67, 69, 72, 76, 78, 78 5,15 2 31 2 130 2 1 == + = + = n Mdn n = 30 (NÚMERO DE DATOS PAR)
  28. 28. El número 15, 5 no es la mediana, este valor nos dice que la mediana está entre el elemento 15 y el elemento 16 de los datos ordenados, esto es: El puesto 15 está ocupado por el número 52 y el puesto 16 por el número 53. Por lo tanto la mediana es: 5,52 2 105 2 5352 == + =Mdn MODA PARA DATOS NO AGRUPADOS   DEFINICIÓN.- La moda en un conjunto de datos u observaciones es el valor que se repite con mayor frecuencia. A la moda o modo se lo representa con Mo.   NOTA.- Si existe un solo valor que se repite, el conjunto tiene una sola moda y se llama UNIMODAL   Ejemplo: Hallar la moda del siguiente conjunto de datos 19, 1, 3, 4, 2, 5 , 7, 6, 6, 6, 6, 6, 20, 17, 8, 18, 9, 10 En este conjunto el número que se repite es el 6, por tanto la moda es Mo = 6  Ejemplo : Hallar la moda del siguiente conjunto de datos. 1, 2, 3, 3, 3, 3, 4, 5, 6, 7, 8, 9, 10, 11, 11, 11, 11, 12 En este conjunto los números que se repiten son el 3 y el 11, por tanto la moda es Mo = 3 Mo = 11 por lo tanto es bimodal (tiene dos modas)
  29. 29.  Si existen dos valores que se repiten, el conjunto tiene dos modas, es BIMODAL.  Si existen más de dos valores que se repiten, se dice que el conjunto tiene varias modas, en este caso se llama MULTIMODAL MEDIA ARITMÉTICA PARA DATOS AGRUPADOS  La media para datos agrupados se calcula por la siguiente fórmula: n XfXfXf n Xf X CkkCC k i Ci +++ = ∑ = = .....22111 Donde = a la suma del producto de las frecuencias por el punto medio o marca de clase. n = número total de datos u observaciones K = número de intervalos grupos o clases ∑= k i i Xcf 1  Para hallar la media de datos agrupados, primero encontramos los puntos medios o marca de clase XC, luego multiplicamos la frecuencia cada clase por el punto medio de la misma  Finalmente sumamos la columna de los productos y su resultado dividimos para el número total de datos
  30. 30. Ejemplo: Dado la siguiente tabla de frecuencias halle la media aritmética.
  31. 31. MEDIANA PARA DATOS AGRUPADOS PROCEDIMIENTO 1.- De la tabla hallamos las frecuencias acumuladas y límites de clases 2.- Dividimos el número total de datos para dos utilizando la expresión 3.- El resultado encontrado en numeral 2) localizamos en la columna de frecuencias acumuladas 4.- Aplicamos la fórmula de la mediana para datos agrupados que está dado por:   2 n
  32. 32. Ejemplo: Dado la siguiente tabla de frecuencias halle la mediana NOTA: La clave primero está en dividir el número total de datos para dos, esto es:
  33. 33. MODA PARA DATOS AGRUPADOS   Para hallar la moda para datos agrupados, primeramente se observa en columna da las frecuencias, el valor más alto (clase con la mayor frecuencia.) Luego se halla la moda utilizando la siguiente fórmula
  34. 34. Ejemplo: Dado la siguiente tabla de frecuencias halle la moda

×