Está en la página 1de 81

MODULO II

NOCIONES DE MUESTREO
E INFERENCIA ESTADÍSTICA
Muestreo. Tipos de muestreo. Aplicaciones. Inferencia Estadística: Definición. Nivel de
Significación, parámetros, estimación de Aplicaciones. Prueba de hipótesis para
variable cuantitativa y cualitativa. Aplicaciones

Docente
Dr. Paul Rubén Alfaro Fernández
La inferencia estadística se refiere a los métodos y/o
procesos para obtener conclusiones acerca de
poblaciones,
basados en la información muestral.

POBLACION
MUESTRA
X1,...........,XN X1....,Xn
PARTES A CONSIDERAR EN EL DISEÑO O
PLAN MUESTRAL
1. POBLACIÓN:
• POBLACIÓN UNIVERSO
• POBLACIÓN DE ESTUDIO
• UNIDAD DE ANALISIS
2. TAMAÑO DE MUESTRA
• Nivel de confianza, precisión, potencia, exposición a
la variable.
3. SELECCIÓN DE LA MUESTRA
• UNIDAD DE MUESTREO (Historia Clínica, reporte de laboratorio,
paciente).
• TIPO DE SELECCIÓN
1. POBLACIÓN
• Población Universo: es el total de la
población que tiene una serie de
características en común, el lugar, la fecha de
nacimiento, etc. Sobre la cual se quiere inferir
los resultados del estudio.
• Puede diferenciarse :
• La población blanco que es a la que se
infiere
• La población de estudio
• La población accesible al investigador.
• Muestra
MUESTRA
• Es un subconjunto de las unidades que componen la
población.
• La muestra puede estar conformada por todo el universo.
• Si el universo es muy grande, es necesario una muestra, ya
que el procesamiento y análisis es eficiente.
• El criterio para evaluar una muestra es su representatividad.
UNIDAD DE ANÁLISIS
• Es la unidad básica o elemento sobre el cual
se recaba información para el análisis.
• La unidad de análisis puede ser muy distinto
a la unidad de muestreo y a la fuente de
información.
• Ej: La unidad de análisis puede ser un caso
atendido en el hospital.
2. TAMAÑO DE LA MUESTRA
• Los factores que tienen que ver en general con el tamaño de la
muestra son:
a) La variabilidad del fenómeno
b) El error que se quiera cometer al medir el elemento de estudio.
c) El grado de confiabilidad de la muestra
d) El tipo de variable si es categórica o numérica
e) Grado de exposición
¿Cómo se puede medir la variabilidad?

La variabilidad es una medida de la dispersión de los datos en una


distribución, sea esta teórica o de una muestra; medidas de
variabilidad son la varianza, la desviación estándar, cuartiles o
deciles, y rango.
Varianza y desviación estándar
La varianza y la desviación estándar indican si los valores se
encuentran más o menos próximos a las medidas de
posición. La desviación estándar es simplemente la raíz
cuadrada positiva de la varianza.
¿Cuál es el símbolo de la Varianza?
Varianza (S2 o 2): Es el resultado de la división de la sumatoria de las
distancias existentes entre cada dato y su media aritmética elevadas al
cuadrado, y el número total de datos. Distinguimos dos símbolos para
identificar la varianza: S2 para datos muestrales, y σ2 para datos
poblacionales.

Varianza y desviación estándar


La varianza y la desviación estándar indican si los valores se encuentran
más o menos próximos a las medidas de posición. La desviación
estándar es simplemente la raíz cuadrada positiva de la varianza (S).
Un primer índice podría ser el promedio de las desviaciones o diferencias de
cada puntuación con su media.

X¯d = ∑(Xi - X¯) / n

El problema de este índice es que el sumatorio del numerador ∑(Xi - X¯),


siempre es igual a cero; para ello se han propuesto dos soluciones. La
primera consiste en calcular el valor absoluto de cada desviación antes de
realizar la suma “desviación suma”:

DM = ∑|Xi - X¯| / n
Una segunda alternativa consiste en basarnos en el cuadrado de las diferencias y así
obtenemos la varianza que se define de la siguiente manera:

La varianza de un conjunto de n puntuaciones en una variable X, denotada por Sx2 se defin


como el promedio de los cuadrados de las desviaciones de las puntuaciones con respecto a
la media:
2
S = ∑(Xi - X¯)2/ n

Varianza a partir de una distribución de frecuencias absolutas:


2 2
S = ∑ni(Xi - X¯) / n
Medidas de Dispersión

Medidas de Dispersión: se llaman medidas de dispersión aquellas


que permiten retratar la distancia de los valores de la variable a un
cierto valor central, o que permiten identificar la concentración de
los datos en un cierto sector del recorrido de la variable. Se trata de
coeficientes para variables cuantitativas. Las más usuales son el
desvío estándar y la varianza
Medidas de Dispersión
• Rango: Corresponde a la diferencia entre el dato mayor y el
dato menor.
𝑅𝑎𝑛𝑔𝑜 = 𝑋𝑚𝑎𝑦𝑜𝑟 − 𝑋𝑚𝑒𝑛𝑜𝑟
• Deviación (d) es asociada a un valor x1 de la variable con
respecto de la media aritmética x, se define como al diferencia
entre
𝑑 = 𝑥𝑖 − 𝑥ҧ
Desviación media: es la media aritmética de los valores
absolutos de las desviaciones de los datos respecto a la media
aritmética 𝑥.ҧ Se puede interpretar como la distancia promedio
de los datos y la media aritmética. Se calcula usando la siguiente
formula
σ𝑛
𝑖=1 𝑥𝑖 −𝑥ҧ
𝐷𝑚 = datos desagrupados
𝑛
MEDIA
ARITMÉTICA
VARIANZA
= 1.44
MEDIDAS DE DESVIACION
PARA DATOS AGRUPADOS.
Rango: Cuyos datos están agrupados en intervalos, corresponde a la diferencia
entre limite superior del ultimo intervalo y el limite inferior del primer intervalo.

La varianza 𝑆 2 : de una muestra de tamaño n, cuyos datos están agrupados en N


intervalos con frecuencia f1,f2,f3,…..fn y marcas de clase MC1, MC2,
MC3…..,MCn, se calcula de la siguiente manera.

𝑓1 (𝑀𝑐1 − 𝑥)ҧ 2 +𝑓2 (𝑀𝑐2 − 𝑥)ҧ 2 + ⋯ … … + 𝑓𝑛 (𝑀𝑐𝑛 − 𝑥)ҧ 2


𝑆2 =
𝑛

La desviación estándar (S)=de un conjunto de datos agrupados en intervalos


corresponde a la raíz cuadrada de la varianza y su unidad de medida es la misma
que la de la variable estudiada.

LA DESVIACION ESTANDAR INDICA QUE TAN DISPERSOS


ESTAN LOS DATOS CON RESPECTO A LA MEDIA.
PROPIEDADES DE LA VARIANZA Y LA DESVIACION
ESTANDAR.
• Ambos números son un numero no negativo.
• La 𝜎 2 𝑦 𝑙𝑎 𝜎 son cero cuando los datos son todos iguales.
• Si a cada dato de una muestra se aumenta o disminuye en
una constante K,las desviación estándar y la varianza
originales no cambia.
• Si a cada uno de los datos de una muestra se multiplica por
una constante K. entonces las nueva 𝜎 𝑦 𝜎 2 son 𝐾 𝜎 y
𝐾 2 𝜎 2 respectivamente.
• 𝜎 2 = 𝑥 2 − (𝑥)ҧ 2
• 𝜎2 = 𝜎 ⟺ 𝜎 = 0 𝑜 𝜎 = 1
• 𝜎2 < 𝜎 ⇔ 0 < 𝜎 < 1
• 𝜎2 > 𝜎 ⇔ 𝜎 > 1
Coeficiente de variación:
El coeficiente de variación corresponde a la razón existente
entre a desviación estándar y la media aritmética, y se denota
como CV. El coeficiente de variación se calcula mediante
𝜎
𝐶𝑉 = 𝑥ҧ

El CV no tiene unidad de medida, por lo que permite la


comparación de variables sin importar sus magnitudes, ni lo
que representan.

El CV se puede escribir como porcentaje, lo que representa el


grado de variabilidad de la desviación estándar.
Desviacion Media
Es la media aritmética de los valores absolutos de las desviaciones de los
datos respecto a la media aritmética. Se puede interpretar como la distancia
promedio de los daros y la media aritmética. Se calcula usando la formula

σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ
𝐷𝑀 =
𝑛

Para datos agrupados en clases se tiene


σ𝑛𝑖=1 𝑓𝑖 𝑀𝐶𝐼 − 𝑥ҧ
𝐷𝑀 =
𝑛
¿Qué es desviación y error estándar?

La desviación estándar es una medida de la dispersión de los datos.


Cuanto mayor sea la dispersión, mayor es la desviación estándar,
mientras que el error estándar de la media cuantifica las oscilaciones de la
media muestral alrededor de la media poblacional.

¿Cómo se calcula el error estándar?

Calcula el error estándar, que es la desviación estándar dividida


por la raíz cuadrada del tamaño de la muestra. Para concluir el
ejemplo, el error estándar es de 4,34 dividido por la raíz cuadrada de
4, o 4,34 dividido por 2 = 2,17.
Ejemplo de cálculo de la varianza
y Desviación estándar

Símbolo en población (sigma) Símbolo en la muestra es S Y


DESVIACIÓN ESTÁNDAR
Cv coeficiente de
variación si es 25%
o menos es
homogéneo la
dispersión de los
datos y si mayor
que 25 heterogéneo
¿Qué es el alfa estadístico?

El valor de alfa, también denominado nivel de


significación, es definido por el investigador antes
de recoger los datos, y la costumbre es hacer
alfa=0.05 o alfa=0.01 (en el ejemplo alfa es igual a
0.05).
¿Qué es el alfa estadístico?

El valor de significación, indicado por la letra griega


alpha ( α ), no es nada pero el valor de p máximo que
podemos aceptar para considerar el estudio como
estadísticamente significativo.
¿Cuánto es el nivel de confianza?

El nivel de confianza es la probabilidad de


que el parámetro a estimar se encuentre en
el intervalo de confianza. El nivel de
confianza (p) se designa mediante 1 − α, y
se suele tomar en tanto por ciento. Los
niveles de confianza más usuales son:
90%; 95% y 99%.
VARIABILIDAD x Z2
TAMAÑO DE LA MUESTRA =
ERROR 2

SI ES UNA VARIABLE NOMINAL DICOTÓMICA:

TAMAÑO DE LA MUESTRA= pq z2/E2


p = 1- q probabilidad que que este el efecto
q = es el complemento de su probabilidad.
• Error relativo ER
• Error absoluto
• Calculo del error absoluto teniendo en cuenta la media.
3. SELECCIÓN DE MUESTRA O MUESTREO
3.1. CRITERIOS DE SELECCIÓN:
Son las características que deben cumplir todas las unidades que se van a seleccionar para el estudio.
• Criterios de Inclusión: son aquellas características que deben tener todas las unidades del estudio.
Ejemplo: un rango de edad.
• Criterios de exclusión: son características que no deben tener las unidades de la población de estudio
ya que pueden alterar los resultados y el análisis del estudio. Ejemplo: no deben tener
complicaciones que sean graves. Se recomienda no redundar repitiendo solo con la negación de los
criterios de inclusión. Por ejemplo si el criterio de inclusión es de 14 a 18 años, no debe escribirse en
criterios de exclusión que deben ser las menores de 14 y las mayores de 18, ya que sería una
redundancia donde se niega solamente.
3. SELECCIÓN DE MUESTRA O MUESTREO
• 3.2. ESTRATEGIAS DE SELECCIÓN
• PROBABILÍSTICOS::
✓Selección aleatoria simple: todos los elementos
deben estar identificados y se selecciona al azar
de acuerdo al tamaño de la muestra.
✓Selección aleatoria sistemática:
▪ se calcula la K que es un cociente entre N que
es el tamaño de la población y n que es el
tamaño de la muestra.
▪ K es el número intervalo de selección de la
muestra. Para seleccionar el primer número
se realiza al azar entre la primera K
SELECCIÓN DE LA MUESTRA:
• Muestreo aleatorio estratificado: es una
variante del aleatorio simple en la cual la
población se divide en dos o más estratos
o subgrupos. Una variante es la selección
estratificada proporcional.
• Muestreo por conglomerados: es cuando
la población es homogénea y pueden ser
por grupos.
NOTA: TODOS ESTOS TIPOS SON
MUESTREO PROBABILISTICO
SELECCIÓN DE LA MUESTRA:

MUESTREO NO PROBABILÍSTICO:
Por conveniencia
Por cuotas : estratifica la población y
establece cuotas para los distintos
estratos.
UNIDAD DE MUESTREO
• Es el elemento donde se encuentra la unidad de
análisis pero facilita la selección de la muestra.
• Para ser considerada debe ser identificada y
fácilmente accesible.
• Ej: las historias clínicas, pacientes hospitalizados,
reportes de laboratorio, etc.

También podría gustarte