Este documento proporciona una introducción a los conceptos básicos de estadística. Explica que la estadística estudia la recolección, análisis e interpretación de datos y que se divide en estadística descriptiva, que se dedica a resumir y visualizar datos, y estadística inferencial, que genera modelos e inferencias. También describe los orígenes de la estadística, las técnicas de recolección de datos como entrevistas y encuestas, y los tipos de variables como cualitativas y cuantit
2. Definición de Estadística.
• La estadística es una ciencia formal que
estudia la recolección, análisis e interpretación
de datos.
• Sin embargo, la estadística es más que eso, es
decir, es el vehículo que permite llevar a cabo
el proceso relacionado con la investigación
científica.
3. La estadística se divide en dos grandes
áreas:
• La estadística descriptiva, se dedica a la
descripción, visualización y resumen de datos
originados a partir de los fenómenos de
estudio. Los datos pueden ser resumidos
numérica o gráficamente. Ejemplos básicos de
parámetros estadísticos son: la media y la
desviación estándar. Algunos ejemplos
gráficos son: histograma, pirámide
poblacional, gráfico circular, entre otros.
4. La estadística se divide en dos grandes
áreas:
• La estadística inferencial, se dedica a la generación de los
modelos, inferencias y predicciones asociadas a los
fenómenos en cuestión teniendo en cuenta la aleatoriedad
de las observaciones. Se usa para modelar patrones en los
datos y extraer inferencias acerca de la población bajo
estudio. Estas inferencias pueden tomar la forma de
respuestas a preguntas si/no (prueba de hipótesis),
estimaciones de unas características numéricas
(estimación), pronósticos de futuras observaciones,
descripciones de asociación (correlación) o modelamiento
de relaciones entre variables (análisis de regresión). Otras
técnicas de modelamiento incluyen anova, series de tiempo
y minería de datos.
5. Origen de la Estadística.
• El término alemán Statistik, introducido
originalmente por Gottfried Achenwall en 1749,
se refería al análisis de datos del Estado, es decir,
la “Ciencia del Estado” (o más bien, de la ciudad-
estado).
• También se llamó “aritmética política” de acuerdo
con la traducción literal del inglés. No fue hasta el
siglo XIX cuando el término estadística adquirió el
significado de recolectar y clasificar datos. Este
concepto fue introducido por el militar británico
Sir John Sinclair (1754-1835).
6. Origen de la Estadística.
• En su origen, por tanto, la Estadística estuvo asociada a los
Estados o ciudades libres, para ser utilizados por el
gobierno y cuerpos administrativos (a menudo
centralizados). La colección de datos acerca de estados y
localidades continúa ampliamente a través de los servicios
de estadística nacionales e internacionales. En particular,
los censos comenzaron a suministrar información regular
acerca de la población de cada país. Así pues, los datos
estadísticos se referían originalmente a los datos
demográficos de una ciudad o estado determinados. Y es
por ello que en la clasificación decimal de Melvil Dewey,
empleada en las bibliotecas, todas las obras sobre
estadística se encuentran ubicadas al lado de las obras
sobre la demografía.
7. Criticas a la Estadística.
• Hay una percepción general de que el conocimiento
estadístico es intencionado y frecuentemente mal usado,
encontrando maneras de interpretar los datos que sean
favorables al presentador.
• Un dicho famoso, al parecer de Benjamin Disraeli es: «Hay
tres tipos de mentiras: mentiras pequeñas, mentiras
grandes y estadísticas».
• El popular libro How to lie with statistics (Cómo mentir con
las estadísticas en la edición española) de Darrell Huff
discute muchos casos de mal uso de la estadística, con
énfasis en gráficas malintencionadas. Al escoger (o rechazar
o modificar) una cierta muestra, los resultados pueden ser
manipulados.
8. How to lie with statistics
• La tasa de natalidad es el doble que la
tasa de mortalidad; por lo tanto, una de
cada dos personas es inmortal.
• El no tener hijos es hereditario; si tus
padres no tuvieron ninguno, lo más
probable es que tu tampoco los tengas.
• La probabilidad de tener un accidente
de tráfico aumenta con el tiempo que
pasas en la calle. Por lo tanto, cuanto
mas rápido circules, menor es la
probabilidad de que tengas un
accidente.
9. How to lie with statistics
• En Nueva York un hombre es atropellado cada
diez minutos. El pobre tiene que estar hecho
polvo.
• El 33 % de los accidentes mortales involucran
a alguien que ha bebido. Por lo tanto, el 67 %
restante ha sido causado por alguien que no
había bebido. A la vista de esto y de lo
anterior, esta claro que la forma más segura
de conducir es ir borracho y a gran velocidad.
• La probabilidad de que en un avión haya una
bomba es de una entre mil y la de que haya
dos, es una entre cien mil. Consejo: Viaja
siempre con una bomba a cuestas.
10. Recolección de Datos.
La recolección de datos se refiere al uso de una
gran diversidad de técnicas y herramientas que
pueden ser utilizadas por el analista para
desarrollar los sistemas de información. Todas
estos instrumentos se aplicará en un momento
en particular, con la finalidad de buscar
información que será útil a una investigación en
común.
11. Técnicas de recolección de datos.
• Los analistas utilizan una variedad de métodos a fin de
recopilar los datos sobre una situación existente. Cada
uno tiene ventajas y desventajas. Generalmente, se
utilizan dos o tres para complementar el trabajo de
cada una y ayudar a asegurar una investigación
completa. las principales técnicas de recolección de
datos son:
• Entrevista.
• Observación.
• Encuesta.
• Sesión de Grupo.
12. La entrevista.
• Las entrevistas se utilizan para recabar
información en forma verbal, a través de
preguntas que propone el analista. Quienes
responden pueden ser gerentes o empleados, los
cuales son usuarios actuales del sistema
existente, usuarios potenciales del sistema
propuesto o aquellos que proporcionarán datos o
serán afectados por la aplicación propuesta. El
analista puede entrevistar al personal en forma
individual o en grupos. Sin embargo, las
entrevistas no siempre son la mejor fuente de
datos de aplicación.
13. La observación.
• Otra técnica útil para el analista en su progreso de
investigación, consiste en observar a las personas cuando
efectúan su trabajo. Como técnica de investigación, la
observación tiene amplia aceptación científica. Los
sociólogos, psicólogos e ingenieros industriales utilizan
extensamente ésta técnica con el fin de estudiar a las
personas en sus actividades de grupo y como miembros de
la organización. El propósito de la organización es múltiple:
permite al analista determinar que se está haciendo, como
se está haciendo, quien lo hace, cuando se lleva a cabo,
cuanto tiempo toma, dónde se hace y por que se hace.
• "¡Ver es creer! " Observar las operaciones le proporciona al
analista hechos que no podría obtener de otra forma.
14. La encuesta.
• Una encuesta es un conjunto de preguntas normalizadas dirigidas a
una muestra representativa de la población o instituciones, con el
fin de conocer estados de opinión o hechos específicos.
En la actualidad, existen al menos cuatro tipos de encuesta que
permiten obtener información primaria, por lo que es
imprescindible que investigadores de mercados y mercadólogos
conozcan cuáles son y en qué consiste cada uno de ellos.
• Encuestas basadas en entrevistas cara a cara o de profundidad
• Encuestas telefónicas.
• Encuestas postales.
• Encuestas por Internet.
15. Sesión de grupo.
• Un método desarrollado recientemente para
recolectar ideas e información valiosa son las
sesiones de grupo. En una sesión de grupo un
pequeño número de individuos es reunido para
conversar acerca de algún tema de interés para
alguna compañía, institución o persona. La
reunión, que dura aproximadamente una hora, es
dirigida por un moderador el cual asegura que en
la sesión se discutan los temas deseados y que se
formen discusiones acerca de las ideas
planteadas por los participantes.
16. Tipos de variables.
• Una variable es una característica que al ser medida en
diferentes individuos es susceptible de adoptar
diferentes valores.
• Los métodos estadísticos que usamos dependen del
tipo de variable.
• Existen diferentes tipos de clasificación de variables,
pero por el momento las estudiaremos según su
medición o forma de medir:
• Variables Cualitativas.
• Variables Cuantitativas.
17. Variables Cualitativas.
• Son las variables que expresan distintas cualidades,
características o modalidad. Cada modalidad que se
presenta se denomina atributo o categoría, y la
medición consiste en una clasificación de dichos
atributos. Las variables cualitativas pueden ser
dicotómicas cuando sólo pueden tomar dos valores
posibles, como sí y no, hombre y mujer o ser
politómicas cuando pueden adquirir tres o más valores.
Dentro de ellas podemos distinguir:
• Ordinales
• Nominales
18. Variables Cualitativas.
• Variable cualitativa ordinal o variable
cuasicuantitativa: La variable puede tomar
distintos valores ordenados siguiendo una escala
establecida, aunque no es necesario que el
intervalo entre mediciones sea uniforme, por
ejemplo: leve, moderado, fuerte.
• Variable cualitativa nominal: En esta variable los
valores no pueden ser sometidos a un criterio de
orden, como por ejemplo los colores.
19. Variables Cuantitativas.
• Son las variables que toman como argumento,
cantidades numéricas, son variables
matemáticas. Las variables cuantitativas
además pueden ser:
• Discretas
• Continuas
20. Variables Cuantitativas.
• Variable cuantitativa discreta: Es la variable que presenta
separaciones o interrupciones en la escala de valores que
puede tomar. Estas separaciones o interrupciones indican la
ausencia de valores entre los distintos valores específicos
que la variable pueda asumir. Ejemplo: El número de hijos
(1, 2, 3, 4, 5).
• Variable cuantitativa continua: Es la variable que puede
adquirir cualquier valor dentro de un intervalo especificado
de valores. Por ejemplo la masa (2,3 kg, 2,4 kg, 2,5 kg,...) o
la altura (1,64 m, 1,65 m, 1,66 m,...), o el salario. Solamente
se está limitado por la precisión del aparato medidor, en
teoría permiten que exista un valor entre dos variables.
21. Actividad 1
1. Identifica el tipo de variable, si es cualitativa
ordinal, cualitativa nominal, cuantitativa
discreta o cuantitativa continua.
2. Agrega en la parte final tres ejemplos de cada
tipo de variable que no este enunciada en la
lista.
22. Actividad 1
1. Comida favorita.
2. Profesión que te gusta.
3. Número de goles marcados por
tu equipo favorito.
4. Números de alumnos de la
PrepaUVAQ.
5. El color de los ojos de tus
compañeros de clases.
6. Coeficiente intelectual.
7. Litros de agua en un deposito.
8. Suma de puntos obtenidos en
el lanzamiento de un par de
dados.
9. Área de una pared que será
próxima a pintar.
10. Cantidad de amigos.
11. Numero de acciones vendidas
cada día en la bolsa.
12. Nacionalidad de una persona.
13. Temperaturas registradas cada
hora en un laboratorio.
14. Estado civil.
15. Kilometraje de un automóvil.
16. Cantidad de libros en la
biblioteca.
17. Números de hijos de las familia
en tu colonia.
18. Resultados del ultimo censo de
población y vivienda.
19. Talla de zapatos.
20. La altura de tus amigos.