Your SlideShare is downloading. ×
INTRODUCCIÓN A LA ESTADÍSTICA
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

INTRODUCCIÓN A LA ESTADÍSTICA

869
views

Published on

Se trata de una unidad didáctica sobre iniciación a la ESTADÍSTICA elaborada con hoja de cálculo OpenOffice.

Se trata de una unidad didáctica sobre iniciación a la ESTADÍSTICA elaborada con hoja de cálculo OpenOffice.

Published in: Technology, Economy & Finance

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
869
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
0
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Unidad didáctica T ADÍSTI ES C CA A Tratamiento de datos Por: MAR ROMO GONZÁLEZ
  • 2. CONCEPTOS BÁSICOS TABLAS DE FRECUENCIAS GRÁFICOS ESTADÍSTICOS PARÁMETROS ESTADÍSTICOS ESTADÍSTICA
  • 3. Definición: es la parte de las Matemáticas que estudia los métodos que tienen por objeto la obtención, tratamiento e interpretación de los datos observados en un grupo de individuos. CLASIFICACIÓN: se divide en dos partes fundamentales: a) Estadística DESCRIPTIVA: trata del recuento, ordenación y análisis de los datos de las observaciones; su finalidad es el diseño y obtención de tablas y gráficos que permitan clarificar la complejidad de los datos obtenidos. También tiene el objetivo de definir medidas que informen sobre la totalidad de los datos. b) Estadística INFERENCIAL: tiene la finalidad de obtener conclusiones generales de una población a partir de los datos observados sólo en una parte de la misma. Esta rama se apoya en la anterior y en el cálculo de probabilidades. Nos ocuparemos de la ESTADÍSTICA DESCRIPTIVA POBLACIÓN: conjunto de elementos sobre los que se quiere hacer el estudio de alguna característica. Ejemplo: supongamos que se desea conocer la intención de voto en cierto país en un momento determinado; la población sería el conjunto de personas que tienen derecho a voto en dicho país. INDIVIDUO: cada uno de los elementos de la población. Ejemplo: cada una de las personas con derecho a voto. MUESTRA: parte de la población sobre la que se va a realizar el estudio. Ejemplo: realizar una encuesta a toda la población con derecho a voto es imposible así que se selecciona una parte de la población con el fin de preguntar sólo a estos individuos, y esa parte es la muestra. La muestra ha de ser representativa. VARIABLE ESTADÍSTICA: es el carácter o aspecto que se desea estudiar en la población. Ejemplo: la intención de voto: partido A, partido B, etc o abstención. Cada una de estas posibilidades se llama modalidad y son excluyentes, es decir, si un individuo vota a un partido entonces no puede votar al otro. TIPOS DE VARIABLE ESTADÍSTICA: a) CUALITATIVAS: las modalidades no son numéricas. Ejemplo: los diferentes partidos
  • 4. a los que se puede votar b) CUANTITATIVAS: las modalidades son numéricas. Ejemplo: cuando queremos estudiar el número de hijos por unidad familiar en un determinado país. Estas variables a su vez se clasifican en: b1) DISCRETAS: las modalidades o valores de la variable toman valores concretos y entre dos de estos valores no puede haber valores intermedios. Ejemplo: el número de hijos por unidad familiar sólo puede ser 0, 1, 2, 3, etc. b2) CONTINUAS: las modalidades o valores de la variable pueden tomar cualquier valor decimal entre dos valores cualesquiera de la variable. Ejemplo: si estudiamos el carácter “tiempo de espera de una línea de autobuses en una parada determinada” los valores de la variable pueden ser: 3 min, 3,25 min, 3,5 min, 4 min, etc TABLAS DE FRECUENCIAS: son tablas que se utilizan para ordenar los datos de un estudio estadístico. xi fi hi % Fi Hi % acumulado ∑fi ∑hi ∑% 1. xi: distintas modalidades o valores que toma la variable estadística objeto de nuestro estudio 2. fi: valores de las frecuencias absolutas 3. ∑fi: suma de todos los valores de la columna fi; se trata del nº total de individuos de la población o de la muestra (tamaño de la población o de la muestra) 4. hi: valores de las frecuencias relativas; se calcula mediante los cocientes fi/∑fi 5. ∑hi: suma de todos los valores de la columna hi y es siempre 1 6. %: valores de los tantos por ciento de cada modalidad o valor de la variable; se calcula multiplicando cada valor de hi por 100, es decir, hi ∙ 100 7. ∑%: suma de todos los valores de la columna % y es siempre 100 8. Fi: valores de las frecuencias absolutas acumuladas; el primer valor es el de la primera frecuencia absoluta fi, el segundo valor es la suma de las dos primeras frecuencias
  • 5. absolutas, el tercer valor es la suma de las tres primeras frecuencias absolutas, y así sucesivamente hasta el último valor que coincide con ∑fi 9. Hi: valores de las frecuencias relativas acumuladas; el primer valor coincide con la primera frecuencia relativa hi, el segundo valor se calcula sumando las dos primeras frecuencias relativas, el tercer valor se calcula sumando las tres primeras frecuencias relativas, y así sucesivamente hasta el último valor que coincide con ∑Hi 10.% acumulado: valores de los % acumulados; el primer valor coincide con el primer %, el segundo valor se calcula sumando los dos primeros %, el tercer valor se calcula sumando los tres primeros %, y así sucesivamente hasta el último valor que coincide con ∑% que es siempre 100. También se puede calcular multiplicando por 100 a cada valor de la columna Hi Ejemplo: Se ha realizado un estudio sobre la intención de voto en una población en la que se han censado 25000 personas con derecho a voto; los partidos políticos candidatos son: PSOE, PP, IU y PL (Partido Local) y se ha conseguido entrevistar a las 25000 personas con derecho a voto. Los resultados de las entrevistas se han ordenado en la siguiente tabla de frecuencias (es decir, se han tabulado): PSOE 10500 0.42 42 10500 0.42 42 PP 8300 0.33 33.2 18800 0.75 75.2 IU 2200 0.09 8.8 21000 0.84 84 PL 3500 0.14 14 24500 0.98 98 ABSTENCIÓN 500 0.02 2 25000 1 100 25000 1 100 Esta manera de organizar los datos nos ofrece una información clara y cómoda de lo que ocurre en esa población con respecto a la característica que estamos estudiando (la intención de voto); así, podemos contestar con facilidad a preguntas como: 1. ¿Cuántos votos obtuvo el PP? 8300
  • 6. 2. ¿Qué porcentaje suponen esos 8300 individuos? 33,2% 3. ¿Cuántos individuos votaron a los partidos mayoritarios PSOE y PP? 18800 4. ¿Qué % supone esa cantidad? 75,2% 5. ¿Cuántos individuos no practicaron la abstención? 24500 6. ¿Qué porcentaje no se abstuvo de votar? 98% Debéis observar en qué filas y columnas están los valores de las respuestas y así daros cuenta del significado de cada columna. Puedes practicar con la tabla de datos cambiando los valores de fi y así observarás qué datos cambian y qué datos no cambian en la tabla. Para ello, haz click “aquí” Para ver un ejemplo correspondiente a variable estadística cuantitativa discreta te remitimos a la Hoja3 de la hoja de cálculo adjunta haciendo click en la palabra “cuantitativas” Nota importante: en la tabla de datos, en la columna correspondiente a los valores de la variable estadística, es decir, la que hemos designado como xi , cuando ésta es cuantitativa (discreta o continua) los correspondientes valores han de disponerse de menor a mayor valor. GRÁFICOS ESTADÍSTICOS: son representaciones gráficas de la distribución estadística cuya finalidad es tener una idea clara al 1er golpe de vista de lo que está ocurriendo con la/s variable/s estadística/s en la población objeto de nuestro estudio. TIPOS DE GRÁFICOS ESTADÍSTICOS: hay varios aunque nosotros utilizaremos principalmente 3:
  • 7. · Diagrama de barras: se utiliza con variables cualitativas o cuantitativas discretas. · Histograma de frecuencias: se utiliza con variables cuantitativas continuas o con variables cuantitativas discretas cuyos valores se agrupan en intervalos. · Diagrama de sectores: se utiliza fundamentalmente con variables cualitativas (aunque también se puede utilizar con variables cuantitativas). Veamos el diagrama de sectores y el diagrama de barras correspondiente a nuestro estudio sobre la intención de voto en las elecciones de una determinada localidad. INTENCIÓN DE VOTO INTENCIÓN DE VOTO 12000 10000 Frecuencia absoluta 8000 PSOE PP 6000 IU PL ABSTENCIÓN 4000 2000 0 PSOE PP IU PL AB- STE NCIÓ N Modalidades de la variable Para practicar con los graficos correspondientes a este ejercicio haz click en la palabra “Gráficos” y en la hoja de cálculo correspondiente podrás hacer las modificaciones que se te ocurran y que el programa te permita. PARÁMETROS ESTADÍSTICOS Son cálculos matemáticos que se hacen sobre los datos de una distribución estadística. Clasificación de los parámetros estadísticos: a) Medidas de posición: alrededor de ellas se distribuyen los valores de la distribución estadística. Son, por ejemplo: la media, los cuartiles (entre ellos, la mediana Me), la moda Mo
  • 8. b)Medidas de dispersión: nos dan idea de cómo de separados de la media están los datos. Son: la desviación típica σ y el coeficiente de variación CV a) Medidas de posición Media: como ya sabéis, es la suma de todos los distintos valores de la variable estadística dividida entre el número total de valores. Obviamente, sólo se puede calcular cuando la variable estadística es cuantitativa o numérica. Cuando tenemos los datos tabulados, para calcular este parámetro podemos añadir una columna más, fi ∙ xi, hallar su suma y aplicar la fórmula: (∑fi · xi) / ∑fi Mediana:es el cuartil 2, es decir, el valor de la variable por debajo del cual hay tantos valores como por encima. De modo similar se difiniría al cuartil 1 y al cuartil 3. Moda: Es el valor de la variable que tiene mayor frecuencia, es decir, lo que más se da. b) Medidas de dispersión Desviación típica: este es un parámetro que nos da idea del grado de dispersión o alejamiento de los datos sobre el valor promedio (o media). Podemos calcularla utilizando los operadores de OpenOffice o bien aplicando la fórmula tradicional para lo cual añadimos a la tabla de valores una nueva columna, fi · xi2 Coeficiente de variación: este parámetro mide la dispersión relativa a la media; se utiliza para comparar la dispersión de poblaciones muy heterogéneas. Su cálculo se obtiene aplicando la fórmula: CV=(σ / x)·100 A continuación vamos a ver un ejercicio en el que se calculan los parámetros mencionados y alguno más: Al contar el número de asignaturas suspendidas por cada alumno/a en la primera evaluación de un grupo de 3º de la E.S.O., hemos obtenido estos datos: 1-1-2-3-2-6-0-0-1-0-4-5-0-0-0-3-2-1-3-1-1-1-0-1-2-0-0-5-4-2 El ejercicio está resuelto en la Hoja que hemos denominado “parámetros estadísticos”

×