Está en la página 1de 9

Estadística: requiere datos

Datos: se refieren a la información que se recopila, registra o mide en el contexto de un estudio o análisis. Los
datos pueden tomar muchas formas diferentes, y su recopilación es esencial para realizar análisis estadísticos
y tomar decisiones basadas en evidencia.
Variable: algo que puede obtener cualquier valor.
• Cualitativo
● Nominal: cumple o no cumple (Sí o no). No hay relación. Representan categorías o clases.
Ejemplos incluyen el género (masculino, femenino, otros), el color (rojo, azul, verde), o la marca
de un automóvil (Toyota, Ford, Honda).
● Ordinal: lleva un orden, si está relacionado. Aunque hay un orden, las diferencias entre las
categorías no son necesariamente iguales o significativas. Ejemplos incluyen niveles de
satisfacción (insatisfecho, neutral, satisfecho), niveles educativos (primaria, secundaria,
universidad) o clasificaciones de productos (bajo, medio, alto).
● Cuantitativo
● Intervalos: medidas por intervalos. Estos datos se expresan en una escala numérica donde las
diferencias entre los valores son significativas y tienen sentido. En estos datos, puedes realizar
operaciones de resta y suma, pero no tiene sentido realizar divisiones o multiplicaciones.
Ejemplos incluyen temperaturas en grados Celsius o grados Fahrenheit.
● Proporción o razón: podemos encontrar un cero. Tienen un punto de referencia absoluto o cero
real que indica la ausencia de la característica medida. Ejemplos incluyen la edad, el peso, la
altura y el ingreso. En datos de razón, puedes realizar todas las operaciones matemáticas,
incluidas divisiones y multiplicaciones.
Tipos de Estadística:
● Estadística Descriptiva: agrupamiento de datos en histogramas, gráfica de pastel.
● Estadística Inferencial: nos ayuda a decidir en qué momento actuar. Nos permite hacer inferencias para
mejoras de procesos.
Pasos para aplicar la estadística descriptiva:
1. Seleccionar caracteres dignos (individuos adecuados) de ser estudiados
2. Obtener los datos de cada una de las variables mediante una encuesta o medición
3. Elaborar tablas de frecuencia (indica que tanto se repite cada uno de los valores que tenemos)
4. Elaborar gráficas de resultados y concluir.

El director de una escuela primaria lleva un control de la edad en años de los alumnos de la escuela.
Población: alumnos de la escuela
Cuantitativo
Intervalos

El supervisor de una línea de producción de botes de jugo lleva el control sobre la cantidad de botellas
envasadas en la línea de producción que esté en algunos de los siguientes rangos: llenado alto, medio y bajo
establecidos por el campamento de control de calidad.
Población: botellas envasadas
Cualitativo
Ordinal
El gerente de mercadotecnia de una compañía recibe los informes sobre el volumen de ventas diarias de la
compañía durante un año y le interesa conocer su utilidad diaria.
Población: ventas diarias
Cuantitativo
Intervalos
Diagrama de puntos: gráfica muy útil para visualizar un conjunto pequeño de datos; por ejemplo de unas 20
observaciones. La gráfica permite ver rápidamente la tendencia y variabilidad de los datos

No, ya que este diagrama se recomienda utilizarlo únicamente cuando se presentan pocos datos y algunos de
éstos se repitan.
Diagrama de tallo y hojas: dado un conjunto de datos formado por “n” observaciones, las cuales pueden ser
representadas mediante (x1,x2 y x3) y donde cada dato tiene por lo menos 2 dígitos.
● Usado cuando hay un número no muy pequeño de datos. Encima de 20
● Pasos a seguir:
1. Seleccionar uno o más dígitos iniciales para los valores del tallo. El
dígito(s) final(es) se convierte(n) en hojas.
2. Hacer una lista de valores de tallo en una columna vertical
3. Registrar las hojas por cada observación junto al valor
correspondiente del tallo.
4. Indicar las unidades para tallos y hojas en algún lugar del
crucigrama.
● Tallo: decenas
● Hoja: unidades
32 1 5 6 7 8 9

33 1 1 4 5 6 6 6 6 6 6 8 8

34 0 1 1 1 2 2 3 5 5 6 6 6 6 6 7 7 7 7 7 7 9

35 0 0 1 1 1 2 3 4 4 5 6 7 8 9

36 2 3 4 8 8 8

37 1 3 6 8 9

Tallo= unidades, hojas= decimales

6 7

7 023

8 24479

9 12256

10 0 0 2 7

11 2 3

12 1 4 6 6
Tallo= decenas, hojas= unidades

Tablas de frecuencia: arreglo tabular de las frecuencias con que ocurre cada característica en que se han
dividido los datos.
● El número de mediciones que quedan dentro del intervalo se llama frecuencia del intervalo y se denota
por “fi”. La diferencia entre el extremo mayor y el extremo menor del intervalo se llama longitud o ancho
del intervalo.
● Regla de Sturges: I= 1 + 3.3log10(n)
● Nos indica cuántas veces se repite una variable
Exponen la información recogida en la muestra:

❖ Frecuencias absolutas: contabilizan el número de individuos de cada modalidad


❖ Frecuencias relativas (porcentajes): fa/total de frecuencia
❖ Frecuencias acumuladas: sólo tienen sentido para variables ordinales y numéricas.
Gráficos para variables cualitativas:
● Diagrama de barras:
➔ alturas proporcionales a las frecuencias (abs. o rel.)
➔ se pueden aplicar también a variables discretas
● Diagramas de sectores (tartas,polares)
➔ no usarlo con variables ordinales
➔ el área de cada sector es proporcional a su frecuencia(abs. o rel.)
● Pictogramas
➔ fáciles de entender
➔ el área de cada modalidad debe ser proporcional a la

Modelo normal:
● Descrita por Carl Gauss
● Una magnitud sufre la influencia de numerosas causas de variación, todas muy pequeñas e
independientes entre sí, de manera que los resultados se acumulan alrededor de la media, se distribuyen
de forma simétrica a su alrededor con una frecuencia que disminuye con rapidez al alejarse del centro.

Estandarización de la variable normal:


● El problema de la estandarización se resuelve con el cambio de variable aleatoria:
𝑋− 𝜇
Z=
!

Propiedades de la distribución normal:


1. Simetría
2. Propiedad del complemento
3. P(-1<Z<1)= 0.6827
4. P(-2<Z<2)=0.945
5. La suma de las probabilidad fuera del intervalo (-4.4), no puede ser mayor a 0-0001.(valen cero),
Estimación de parámetros y distribución de muestreo
No paramétrica: su distribución es libre, también se conoce como distribución sesgada, ya sea positiva o
negativa.
Grados de libertad: parámetro que nos va a permitir adaptar nuestros datos a unas pruebas no paramétricas.

Estimadores puntuales: en esta parte se revisan los conceptos fundamentales sobre los estimadores.
Intervalos de confianza: se presentan los inte bsld a los que se infiere la localización del parámetro de interés
conc cierts ´robsbilifsd
Estimación lineal: su objetivo es utilizar una muestra para calcular un número que represente en cierto sentido
una buena suposición del valor verdadero del parámetro. (dado un parámetro de interés: media, proporción de
la población, porcentaje que represente todos los datos de la muestra)

P= 15/25= 0.6 ó el 60%

El programa de apoyo a jubilados en la Ciudad de México permite realizar descuentos en el pago mensual del
servicio de agua. Se toma una muestra de 35 pagos (en pesos) hechos por los jubilados. Se quiere obtener una
estimación puntual de la media y la desviación estándar del pago que hace un jubilado por este servicio en la
Ciudad de México.
Estimador puntual: solamente da una idea de qué es lo que sucede en todo el experimento.
En estadística hay 4 criterios que permiten seleccionar un estadístico como el mejor estimador de un parámetro:
● Insesgabilidad: que no hay sesgo
● Eficiencia: es eficiente si se presenta el error estándar más pequeño de todos los estimadores.
● Consistencia: el valor estadístico se va a aproximar cada vez más al valor real
● Suficiencia: si utiliza tanta información que ningún otro estimador me va a dar tanta información como el
que me va a dar este
Intervalo de confianza: es el rango de valores dentro del cual se espera que esté el parámetro poblacional.
Dicho intervalo tendrá especificada la confianza o probabilidad de que la estimación sea correcta.

Caso: estimación de la media si conozco desviación estándar de la población.


n= 35
Desv std= $25
Intervalo de confianza: 95%
media= $240

El departamento de mantenimiento de la SSA desea estimar la vida media de los limpiadores de los parabrisas
de las ambulancias de la dependencia. Se ha estimado que la D.E. de la vida útil de esta población es de 6
meses. Se selecciona una muestra aleatoria de 95 limpiadores y se obtiene para ella una vida útil promedio de
22 meses ¿Cuál es el intervalo de 90% de confianza para la vida media útil de los limpiadores si se supone una
distribución normal?

Un estimador de intervalo consiste en expresar el valor que probablemente tenga un parámetro poblacional
dentro de un rango de valores (o amplitud).
● Intervalo de confianza: intervalo o rango de valores dentro del cual se espera que esté el parámetro
poblacional buscado.
● Dicho intervalo tendrá especificada la confianza o probabilidad de que la estimación del valor verdadero
del parámetro de la población sea la correcta.

Tener un intervalo de confianza más grande genera una desviación estándar más alta.

Nivel significancia: el complemento del intervalo de confianza. Los que no se encuentran dentro del intervalo.
Indica que la media de las muestras es diferente de la media poblacional.

Variables discretas (aleatorias, pueden tomar cualquier valor): toman un número limitado de valores,
generalmente números enteros que son productos de un conteo.
● Distribución de probabilidades de una variable aleatoria discreta: conjunto de todos los posibles
resultados numéricos de un experimento a los que se puede asignar un valor de ocurrencia o
probabilidad. Este conjunto de datos son mutuamente excluyentes y pueden expresarse mediante una
fórmula, una gráfica o por medio de un cuadro estadístico.
● P(x)= Xi/total
● Valor esperado: es una media ponderada de todos los resultados posibles que presenta esta variable
aleatoria.
Distribución Binomial: Es una distribución gran cantidad de variables aleatorias discretas cuyos resultados
experimentales son generados mediante un proceso conocido como de Bernoulli.

Ejemplo: en un cuestionario acerca del empleo se pregunta ¿Usted trabaja

Media y desviación estándar de una distribución binomial


Distribución de probabilidad hipergeométrica
Distribución de probabilidad hipergeométrica: surge al seleccionar una muestra sin reemplazo de una población
finita conocida y que representa una proporción relativamente grande de la población, de tal forma que la
probabilidad de éxito cambia de una selección a otra.

Una prueba de aptitudes para trabajadores de una maquiladora en ciudad Juárez tiene un nivel de significación
de 0.10 y se toma una muestra de 20 trabajadores para aplicar la prueba, encontrar el valor crítico de t para los
siguientes casos:
a) una prueba de una sola cola en el área superior de la distribución
b) una prueba de una sola cola en el área inferior de la distribución
c) una prueba de dos sola colas

También podría gustarte