Estaditica
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

Estaditica

  • 15,184 views
Uploaded on

definiciones acerca de la estadistica

definiciones acerca de la estadistica

More in: Travel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
15,184
On Slideshare
15,050
From Embeds
134
Number of Embeds
5

Actions

Shares
Downloads
477
Comments
0
Likes
6

Embeds 134

http://andrewykylie.blogspot.com 53
http://matematicaebima.blogspot.com.ar 40
http://www.slideshare.net 22
http://matematicaebima.blogspot.com 11
http://62i014.blogspot.com 8

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Introducción a la Estadística Universidad Católica Santo Toribio de Mogrovejo Prof. Wilder Alvarado Castillo 18 de Agosto de 2008
  • 2. ¿Qué es la Estadística?
    • Es la ciencia que orienta la toma de decisiones a partir del análisis e interpretación de observaciones realizadas en forma directa o experimentalmente.
    • Es la ciencia que proporciona los métodos científicos para la recopilación, organización, resumen, representación y análisis de datos o hechos.
  • 3. Finalidad de la Estadística
    • En la actualidad es considerada como un poderoso auxiliar en las investigaciones científicas, que le permite a ésta aprovechar el material cuantitativo.
    • La estadística es indispensable en la formación de cualquier profesional universitario o técnico medio, ya que, por medio de esta se pueden realizar diagnósticos de cualquiera investigación que se desee realizar.
    • La estadística es indispensable para realizar cualquier trabajo de investigación que requiera una recolección de información. Ella permite resumir los resultados de una investigación en una forma significativa y cómoda. La misma permite deducir conclusiones generales y así afirmar hasta donde se puede ampliar una generalización de una investigación determinada.
    • De la misma forma permite predecir que sucederá algo tomando en cuenta ciertas condiciones que se han analizado con datos anteriores.
  • 4. Ramas de la Estadística
    • Estadística Descriptiva :
    • Método que contiene la recolección, organización, presentación y resumen de una serie de datos obtenidos en un estudio.
    El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta de los siguientes pasos:
    • Selección de caracteres a ser estudiados.
    • Obtención del valor en los caracteres seleccionados. (encuesta o medición)
  • 5.
    • Elaboración de tablas de frecuencias.
    • Representación gráfica de los resultados.
    • Obtención de parámetros estadísticos, números que sintetizan los aspectos más relevantes de una distribución estadística.
    Casos descriptivos
    • Diagnóstico de los Censos Nacionales.
    • Consumo de energía en los hogares.
    • Uso de redes en colegios particulares
    • Utilización de las TICs en universitarios
  • 6.
    • Estadística Inferencial :
    • Es aquella rama de la estadística que apoyándose en el cálculo de probabilidades y a partir de datos muéstrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
    • Es la rama de la estadística que hace posible la estimación de una característica de una población o la toma de una decisión referente a una población, fundamentándose sólo en los resultados de la muestra .
  • 7. Población (1) : En términos estadísticos, población es un conjunto finito o infinito de personas, animales o cosas que presentan características comunes, sobre los cuales se quiere efectuar un estudio determinado. Está integrado por la totalidad de todas las unidades de análisis. Muestra : La muestra es un subconjunto de la población, seleccionado de tal forma, que sea representativo de la población en estudio, obteniéndose con el fin de investigar alguna o algunas de las propiedades de la población de la cual procede. En otras palabras es una parte de la población que sirve para representarla . (1) Algunos autores utilizan Universo como sinónimo Conceptos básicos en Estadística
  • 8. Población y Muestra Población Muestra
  • 9. Muestreo : Es el procedimiento mediante el cual se obtiene una o más muestras de una población determinada. Existen dos tipos de muestreos a saber:
    • Muestreo no Probabilístico : Es aquel en el cual se toma la muestra según el criterio del investigador, estos pueden ser: muestreo intencional u opinático y el muestreo sin norma o circunstancial.
    • Muestreo Probabilístico : Es aquel que se selecciona utilizando métodos aleatorios en los que se utilizan las probabilidades matemáticas. Entre estos se pueden mencionar: Muestreo aleatorio simple, muestreo estratificado, muestreo por conglomerado o por área y muestreo sistemático.
  • 10.
    • Unidad de análisis : Es el objeto o elemento indivisible que será estudiado en una población, sobre los cuales se van a obtener datos. Es el que genera el fenómeno estudiado y proporciona datos concretos
    • Dato : Es el valor o respuesta que adquiere la variable en cada unidad de análisis. Es el resultado de la observación, entrevista o recopilación en general. Son la materia prima de la estadística. Es el elemento primario de toda observación o búsqueda.
    • Información : Es el resultado de los datos procesados de acuerdo a ciertos objetivos. No hay información sin datos.
  • 11. Variable : Es una característica que puede tomar distintos valores. Son características observables, susceptibles de adoptar distintos valores o ser expresados en varias categorías. Adquiere un valor determinado en cada unidad de análisis. Puede ser una característica medible (peso, ingresos, rendimiento, etc.) o una cualidad no medible (sexo, nacionalidad, etc.) Sexo Edad Peso Estatura Masculino 6 años 25 kg. 110 cm Unidad de análisis Variable Dato
  • 12.
    • Cualitativa o de Atributos : Cuando expresan una cualidad, característica o atributo, tienen un carácter cualitativo, sus datos se expresan mediante una palabra, es no numérico, por lo tanto las operaciones aritméticas, como sumar y obtener promedios, no son significativas.
    • Ejemplos:
      • Sexo
      • Nacionalidad
      • Marcas de computadora
      • Grado de satisfacción
      • Tipo de software
      • Estado civil, etc.
    Tipo de Variables
  • 13. Cuantitativa o Numérica : Cuando el valor de la variable se expresa por una cantidad, es de carácter numérico. El dato o valor puede resultar de la operación de contar o medir, por lo tanto las operaciones aritméticas, como sumar y obtener promedios, son significativas. Ejemplos: Número de computadoras Número de hijos Kilómetros recorridos Tiempo de vuelo Ingreso, etc .
  • 14.
    • Las variables cuantitativas se pueden clasificar a su vez en discretas o continuas .
    • Cuantitativas Discretas : cuando el valor de la variable resulta de la operación de contar, su valor está dado sólo por números (enteros positivos).
    • Ejemplos: cantidad de materias aprobadas, número hijos, número de computadoras, etc.
    • Cuantitativas Continuas : cuando la variable es susceptible de medirse, es toda variable cuyo valor se obtiene por medición o comparación con una unidad o patrón de medida. Puede asumir cualquier valor dentro del rango de medición, por tanto se expresa en cualquier número real. Normalmente se miden magnitudes como ser longitud, superficie, volumen, peso, tiempo, dinero.
    • Ejemplos: peso al nacer, tiempo de servicios, horas trabajadas, ingreso mensual, temperatura, etc.
  • 15. Escalas de medición de las variables : Son el conjunto de los posibles valores que determinada variable puede tomar. Por tal razón, los tipos de escala de medición están íntimamente ligados con los tipos de variables a estudiar. Las magnitudes de las observaciones cuantitativas se conocen como los valores que una variable puede asumir. Es una serie de graduaciones que permiten darle un valor numérico a las características que estamos midiendo. Las escalas de medición es el alma fundamental de toda Investigación Científica, puesto que, sólo a través de ellas es como se pueden calibrar los fenómenos, sus relaciones, entre otros. Es importante conocer el tipo de escala que representan los datos, debido a que, de su esencia dependen las técnicas estadísticas que se deberán aplicar para su análisis.
  • 16. Las escalas de medición se clasifican en: Escala de Medición Nominal: Es aquella en la que los números sólo se emplean para diferenciar los objetos de distintas categorías o cuando se emplean nombres. Se dice que los datos que se obtienen para una variable cualitativa se miden en una escala nominal. Los datos observados simplemente se clasifican en distintas categorías que no implican orden. Los números sirven como indicativos o etiquetas para identificar objetos o clases. Ejemplos: Color de ojos Estado civil Profesiones Lugar de nacimiento, etc.
  • 17. Propiedades de la Escala Nominal:
    • No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos.
    • Esta escala es considerada excluyente, es decir que la persona u objeto se incluye solamente en una categoría.
    • No existe un orden específico para esta categoría.
    • No presentan el cero.
    • No se basa en diferencia cuantitativa.
    • Los elementos de una categoría deben de ser equivalentes, idénticos.
  • 18. Escala de Medición Ordinal : Es aquella en la que los números se utilizan para diferenciar en orden de supremacía de acuerdo con cierto criterio jerárquico, como son los números que se emplean para clasificar los distintos estratos socio-económicos o para designar preferencias. L os datos observados se clasifican en categorías distintas en las que existe algún orden específico. La diferencia entre dos números ordinales no tiene significado cuantitativo, sólo expresan, por ejemplo, que una situación es mejor que otra, pero no cuanto. Ejemplos: Grado de instrucción Clases sociales Orden de mérito Grados militares, etc.
  • 19. Propiedades de la Escala Ordinal:
    • Las observaciones o elementos se les ordena en rangos o categorías diferentes.
    • Cada categoría o rango mantiene una relación entre si, estas relaciones se expresan en términos algebraicos de desigualdades (mayor que o menor que).
    • Las categorías son mayores o menores que otras categorías, es decir, que existe una clasificación de mayor a menor (jerarquía).
    • Las categorías son mutuamente excluyentes y exhaustivas.
    • No presentan el cero.
  • 20. Escala de Medición de Intervalos : Es una escala más especializada que las dos anteriores, puesto que es posible ordenar las mediciones y expresar además en cuánto difiere una situación de la otra. Esta escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La escala de intervalos a diferencia de la nominal y ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo es una escala ordenada en la cual la diferencia entre las mediciones es una cantidad significativa. Ejemplos: Coeficiente de inteligencia, temperatura, etc.
  • 21.
    • Esta escala implica la cuantificación de los datos
    • En estás medidas se utilizan unidades constantes de medición (capacidad, peso, grados fahrehért o centígrados) los cuales producen intervalos iguales entre puntos de la escala.
    • Proporcionan números que manifiestan diferencias palpables entre individuos, objetos o cosas.
    • En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario.
    • Se pueden aplicar todas las medidas estadísticas más conocidas, con excepción del coeficiente de variación.
    • Son mutuamente exclusivas y exhaustivas.
    Propiedades de la Escala de Intervalos
  • 22. Escala de Medición de Razón o Proporción: Esta constituye el nivel más alto de medición, posee todas las características de las escalas nominales, ordinales y de intervalos; además tiene un cero absoluto o natural que tiene significado físico. El cero, significa ausencia o inexistencia total de la propiedad considerada. Son posibles todas las operaciones aritméticas. Los números indican los valores concretos de la propiedad que sé esta midiendo; peso, estatura, ingresos monetarios y gastos directos, son ejemplos de medidas con una escala de razón.
  • 23.
    • La distancia entre los números es un tamaño conocido y constante.
    • Los datos tienen un punto cero significativo.
    • Puede utilizarse cualquier prueba de tipo estadístico, incluyendo el coeficiente de variación.
    • Permite hacer comparaciones entre los números verdaderos con un cero aritmético siendo arbitrario únicamente la unidad de medida.
    Propiedades de la Escala de Razón:
  • 24.
    • Parámetros : Son cualquiera característica que se pueda medir y cuya medición se lleve a cabo sobre todos los elementos que integran una población determinada, los mismos suelen representarse con letras griegas. El valor de un parámetro poblacional es un valor fijo en un momento dado.
    • Ejemplo: Media Aritmética =  (mu)
    • Desviación Típica =  , (Sigma) etc.
    • Estadígrafos (Estadísticos o Estimadores) : Son aquellas características medibles, cuya medición se realiza sobre los componentes de una muestra, los mismos se representan con letras del alfabeto castellano. Los estadígrafos no tienen un valor único, sino que pueden tomar distintos valores al ser calculados a partir de muestras diferentes.
    • Ejemplos: Media Aritmética = , Desviación Típica = S.
    Parámetros y Estadígrafos:
  • 25. Ejercicios : 1. De los siguientes enunciados, ¿cuál es probablemente exija el empleo de la estadística descriptiva y cuál de la inferencia estadística? a. Un profesor de expresión oral emplea diferentes métodos con cada uno de sus dos cursos. Al final del curso registra las calificaciones obtenidas por sus alumnos con el fin de establecer cuál es método más efectivo. b. Un ingeniero estudia la relación entre la satisfacción laboral de los empleados y la producción. c. Un demógrafo registra el crecimiento de la población en un área determinada. 2. Clasificar las siguientes variables: a. Temperaturas medidas en un laboratorio cada media hora. b. Ingresos anuales de los profesores universitarios. c. Longitudes de 100 tornillos producidos en una fábrica. d. Distancia diaria recorrida por estudiante para ir de su casa a la universidad. e. Tiempo que requiere un estudiante para responder a un examen. f. Llamadas que llegan a la central telefónica de la USAT por día. g. Preferencia por cierta marca de refresco. h. Extensión del cableado de red i. Número de computadoras por oficina. j. Peso de carga almacenada en los contenedores
  • 26.
    • 3. Un fabricante de piezas ensambladas está interesado en la proporción de piezas que resultan defectuosas, cuya condición puede estar afectada por el tipo de máquina que utilice. Seleccionó 2 000 piezas defectuosas y encontró que el 75 % de las piezas fueron hechas por la máquina A. I dentifique la población, muestra, unidad de análisis, parámetro y e stadígrafo.
    • 4. La Variable Estadística:
    • a) Es el valor o respuesta que adquiere la característica en cada unidad de análisis.
    • b) Es el objeto o elemento que será estudiado en una población, sobre los cuales se va obtener datos.
    • c) Es una característica observable, susceptible de adoptar distintos valores o ser expresados en varias categorías.
    • d) Es el valor obtenido para describir en forma resumida las características más importantes acerca de una población.
  • 27. Definición
      • La Estadística es la Ciencia de la
      • Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de
      • deducir las leyes que rigen esos fenómenos,
      • y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones .
    Descriptiva Probabilidad Inferencia
  • 28. ¿Para qué sirve la Estadística?
    • La Ciencia se ocupa en general de fenómenos observables
    • La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes
    • Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico)
    • La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza
  • 29. Pasos en un estudio estadístico
    • Plantear hipótesis sobre una población
        • Los fumadores tienen “más bajas” laborales que los no fumadores
        • ¿En qué sentido? ¿Mayor número? ¿Tiempo medio?
    • Decidir qué datos recoger (diseño de experimentos)
      • Qué individuos pertenecerán al estudio ( muestras )
        • Fumadores y no fumadores en edad laboral.
        • Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas?
      • Qué datos recoger de los mismos ( variables )
        • Número de bajas
        • Tiempo de duración de cada baja
        • ¿Sexo? ¿Sector laboral? ¿Otros factores?
    • Recoger los datos ( muestreo )
      • ¿Estratificado? ¿Sistemáticamente?
    • Describir (resumir) los datos obtenidos
        • tiempo medio de baja en fumadores y no ( estadísticos )
        • % de bajas por fumadores y sexo ( frecuencias ), gráficos,...
    • Realizar una inferencia sobre la población
        • Los fumadores están de baja al menos 10 días/año más de media que los no fumadores.
    • Cuantificar la confianza en la inferencia
      • Nivel de confianza del 95%
      • Significación del contraste : p=2%
    No tenéis que entenderlo (aún)
  • 30. Método científico y estadística Plantear hipótesis Obtener conclusiones Recoger datos y analizarlos Diseñar experimento
  • 31. Población y muestra
    • Población (‘ population’ ) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia).
      • Normalmente es demasiado grande para poder abarcarlo.
    • Muestra (‘ sample’ ) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones)
      • Debería ser “representativo”
      • Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales).
  • 32. Variables
    • Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables .
    • En los individuos de la población peruana, de uno a otro es variable :
      • El grupo sanguíneo
        • {A, B, AB, O}  Var. Cualitativa
      • Su nivel de felicidad “declarado”
        • {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal
      • El número de hijos
        • {0,1,2,3,...}  Var. Numérica discreta
      • La altura
        • {1,62 ; 1,74; ...}  Var. Numérica continua
  • 33.
    • Cualitativas Si sus valores ( modalidades ) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos)
      • Nominales : Si sus valores no se pueden ordenar
        • Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)
      • Ordinales : Si sus valores se pueden ordenar
        • Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor
    • Cuantitativas o Numéricas Si sus valores son numéricos ( tiene sentido hacer operaciones algebraicas con ellos )
      • Discretas : Si toma valores enteros
        • Número de hijos, Número de cigarrillos, Num. de “cumpleaños”
      • Continuas : Si entre dos valores, son posibles infinitos valores intermedios.
        • Altura, Presión intraocular, Dosis de medicamento administrado, edad
    Tipos de variables
  • 34.
    • Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador.
    • Es conveniente asignar “ etiquetas ” a los valores de las variables para recordar qué significan los códigos numéricos.
      • Sexo (Cualit: Códigos arbitrarios)
        • 1 = Hombre
        • 2 = Mujer
      • Raza (Cualit: Códigos arbitrarios)
        • 1 = Blanca
        • 2 = Negra,...
      • Felicidad Ordinal: Respetar un orden al codificar.
        • 1 = Muy feliz
        • 2 = Bastante feliz
        • 3 = No demasiado feliz
    • Se pueden asignar códigos a respuestas especiales como
        • 0 = No sabe
        • 99 = No contesta...
    • Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’)
  • 35.
    • Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de cálculo estadístico.
    • No todo está permitido con cualquier tipo de variable.
  • 36.
    • Los posibles valores de una variable suelen denominarse modalidades .
    • Las modalidades pueden agruparse en clases (intervalos)
      • Edades:
        • Menos de 20 años, de 20 a 50 años, más de 50 años
      • Hijos:
        • Menos de 3 hijos, De 3 a 5, 6 o más hijos
    • Las modalidades/clases deben forman un sistema exhaustivo y excluyente
      • Exhaustivo : No podemos olvidar ningún posible valor de la variable
          • Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?
          • Bien: ¿Cuál es su grupo sanguíneo?
      • Excluyente : Nadie puede presentar dos valores simultáneos de la variable
        • Estudio sobre el ocio
          • Mal: De los siguientes, qué le gusta: (deporte, cine)
          • Bien: Le gusta el deporte: (Sí, No)
          • Bien: Le gusta el cine: (Sí, No)
          • Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)
  • 37. Presentación ordenada de datos
    • Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra.
    6 Mujer 4 Hombre Frec. Género
  • 38. Tablas de frecuencia
    • Exponen la información recogida en la muestra, de forma que no se pierda nada de información (o poca).
      • Frecuencias absolutas : Contabilizan el número de individuos de cada modalidad
      • Frecuencias relativas (porcentajes) : Idem, pero dividido por el total
      • Frecuencias acumuladas : Sólo tienen sentido para variables ordinales y numéricas
        • Muy útiles para calcular cuantiles (ver más adelante)
          • ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8
          • ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6% . Soluc 2ª: 97,3% - 83,8% = 13,5%
  • 39. Datos desordenados y ordenados en tablas
    • Variable: Género
      • Modalidades:
        • H = Hombre
        • M = Mujer
    • Muestra:
      • M H H M M H M M M H
      • equivale a HHHH MMMMMM
    10=tamaño muestral 6/10=0,6=60% 6 Mujer 4/10=0,4=40% 4 Hombre Frec. relat. porcentaje Frec. Género
  • 40. Ejemplo
    • ¿Cuántos individuos tienen menos de 2 hijos?
      • frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos
    • ¿Qué porcentaje de individuos tiene 6 hijos o menos?
      • 97,3%
    • ¿Qué cantidad de hijos es tal que al menos el 50% de la población tiene una cantidad inferior o igual?
      • 2 hijos
    ≥ 50%
  • 41. Gráficos para v. cualitativas
    • Diagramas de barras
      • Alturas proporcionales a las frecuencias (abs. o rel.)
      • Se pueden aplicar también a variables discretas
    • Diagramas de sectores (tartas, polares)
      • No usarlo con variables ordinales.
      • El área de cada sector es proporcional a su frecuencia (abs. o rel.)
    • Pictogramas
      • Fáciles de entender.
      • El área de cada modalidad debe ser proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?.
  • 42. Gráficos diferenciales para variables numéricas
    • Son diferentes en función de que las variables sean discretas o continuas. Valen con frec. absolutas o relativas.
      • Diagramas barras para v. discretas
        • Se deja un hueco entre barras para indicar los valores que no son posibles
      • Histogramas para v. continuas
        • El área que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.
  • 43. ¿Qué hemos visto?
    • Definición de estadística
    • Población
    • Muestra
    • Variables
      • Cualitativas
      • Numéricas
    • Presentación ordenada de datos
      • Tablas de frecuencias
        • absolutas
        • relativas
        • acumuladas
      • Representaciones gráficas
        • Cualitativas
        • Numéricas