Está en la página 1de 44

POBLACION Y MUESTRA

Docentes:
Dra. Zoila Culquichicón Malpica
Dra. Bilmia Veneros Urbina
Semestre: I - 2023
Definición de población.

Población o universo:
Está constituida por todos los valores de una
variable. Allí se encuentran la totalidad de las
observaciones individuales de una variable
acerca de la cual se pueden realizar
inferencias, y que existen en cualquier lugar o
al menos dentro de un área de muestreo
limitada por el espacio y por el tiempo.
Clases de población
1. De acuerdo al número de sus elementos.-
a. Finita: Cuando todos sus elementos pueden ser
contados.
Se puede diferenciar:
1. Cuando N (Número de elementos en la población)
es pequeño. Por ejemplo el número de truchas
reproductoras en un estanque: 100 o 200.
2. Cuando N es grande, por ejemplo el número de
óvulos de bonito: 500,000.
b. Infinita: Cuando no se pueden contar todos los
elementos de la población. Por ejemplo el número de
individuos de anchoveta en la población frente a la Costa
Peruana.
2. De acuerdo a la variabilidad de los
elementos:
Homogénea: Cuando los elementos son
similares en valor.
Heterogénea: Cuando los elementos
presentan una gran variación en los
valores.
Definición de muestra
Es el subconjunto de una población
estadística, Sokal y Rohlf (1980) la
definen como el conjunto de
observaciones seleccionadas por un
procedimiento específico, una
observación individual está basada en
un individuo; esto es un pez o un
cangrejo; aunque solo se hubiera
medido el peso de un individuo a
través de un determinado periodo, la
muestra estaría constituida por los
pesos registrados en momentos
sucesivos.
Características esenciales de una muestra.

Representativa: Una muestra es representativa cuando


todos los elementos de la población tienen la misma
probabilidad de constituir la muestra. Para lograrlo se
emplean diferentes métodos de muestreo probabilístico. Si la
inferencia estadística realiza generalizaciones sobre el
comportamiento de una población estudiando solo una parte
limitada de ella entonces la muestra (o las muestras) no es
representativa por lo que la inferencia carecerá de valor
científico.

Adecuada: Una muestra estadística es adecuada si es lo


suficientemente grande para proveer la precisión requerida
por el estudio, minimizando el efecto del azar.
Tipos de muestra
1. Muestra con reemplazo
En esta muestra, cada elemento puede ser
tomado más de una vez. El resultado es como si
la población fuese infinitamente grande. El
procedimiento es simple: Se extrae un elemento
de la población para conformar la muestra y
luego éste retorna a la población.

2. Muestra sin reemplazo


En esta muestra, cada elemento es tomado sólo
una vez, cuando un elemento es seleccionado,
éste es separado de la población.
Definición de Definición de
parámetro estimador
Parámetro: Es la Estimador: Es el valor
característica de una calculado para el parámetro
en base a una muestra la
población, se simboliza
que es representativa y
con letras griegas. adecuada.

Símbolo de Parámetro Símbolo del estimador _


Media: μ Media: Y
Varianza: σ2 Varianza: S2
Desviación estándar: σ Desviación estándar S
Error estándar: σY Error estándar: SY
Estadígrafos de tendencia central

MEDIDAS DE POSICION
Son aquellas medidas que nos ayudan a saber donde
están los datos pero sin indicar como se distribuyen.
Medidas de posición central:
Media: Media aritmética
_
μ = ΣYi/N Y = ΣYi/n (Para datos no agrupados)

_
Y = Σ(fi*Yi)/Σfi (Para datos agrupados)
Propiedades:

1º Si una variable estadística Y varía en origen


y escala Y = a + b X, la media aritmética de
dicha variable varía en la misma
proporción:
Y= a + b X _= a + b X
Y _

2º La suma de los valores de una variable Y,


respecto de la media aritmética es cero.
n _
∑ (Y1 – Y) = 0
i=1
Ventajas e inconvenientes:
- La media aritmética viene expresada en las
mismas unidades que la variable.
- En su cálculo intervienen todos los valores de la
distribución.
- Es el centro de gravedad de toda la distribución,
representando a todos los valores observados.
- Es única.
- Su principal inconveniente es que se ve afectada
por los valores extremadamente grandes o
pequeños de la distribución.
Mediana:

Es el valor alrededor del cual queda el 50% de


datos. Para determinar la mediana se ordenan
los datos en orden de magnitud.

Para datos sin agrupar:

1) 10, 11, 12, 13, 13, 13, 15, 15


para n = 8

Me = (13+13)/2 = 13
1
2) 5, 7, 8, 9, 10, 10, 11
para n = 7

Me = 9
2

Esta foto de Autor desconocido está bajo licencia CC BY-SA


Para datos agrupados:
Intervalo de clase fi Fi
Longitud (cm)
9,5 – 10,5 2 2
10.5- 11.5 10 12
11.5- 12.5 15 27
12.5- 13.5 10 37
13.5- 14.5 2 39

Si n=39, entonces N/2=19,5 es el 50%


Me = Li + (a.i./fi) [(N/2)-Fi]
Donde:
Li : Límite inferior del intervalo de clase
a.i.: amplitud del intervalo
N : ∑fi
Fi: frecuencia simple del intervalo donde se ubica la
Me
Fi: frecuencia acumulada del intervalo anterior al
intervalo donde se ubica la Me.
Me = 11,5 +(1/15)[(39/2)-12]

Me = 11,5 +(1/15)[19,5-12]

Me = 11,5 + 0,5 = 12 cm
Gráficamente: Grafique en un eje de coordenadas
Fi versus la marca de clase del intervalo. Calcule
(∑fi/2) = N/2. Trace una línea paralela al eje de las
abscisas desde el punto N/2 (que se ubica en la
ordenada) hasta la ojiva. Del punto de intersección
de la ojiva y la paralela trace una perpendicular al
eje de las abscisas. El valor de la Longitud
(abscisa) es el valor de la Me.
Ventajas e inconvenientes :
- Es la medida más representativa en el caso de
variables que solo admitan la escala ordinal.
- Es fácil de calcular.
- En la mediana solo influyen los valores
centrales y es insensible a los valores extremos
o “outliers ”.
- En su determinación no intervienen todos los
valores de la variable.
Moda:
Es el valor más frecuente

Para datos sin agrupar:

10, 11, 12, 13, 13, 13, 15, 15 para n = 8

Mo=13 cm
Para datos agrupados:
Mo = Li + [(a.i. * D1)/(D1+D2)]
Donde:
D1: Es la diferencia entre F de la clase modal
(Fi)y F de la clase precedente (Fi-1)
D2: Es la diferencia entre F de la clase modal
(Fi)y F de la clase siguiente (Fi+1)
Mo = 11,5 + [1*(27-12)/(27-12)+(37-27)]

Mo = 11,5 + 0,6 = 12, 1 cm


Ventajas e inconvenientes:
- Su cálculo es sencillo.
- Es de fácil interpretación
- Es la única medida de posición central que puede
obtenerse en las variables de tipo cualitativo.
- En su determinación no intervienen todos lo
valores de la distribución.
Estadígrafos de dispersión
Las medidas de dispersión miden el grado de dispersión que tiene una variable
estadística en torno a una medida de posición o tendencia central,
indicándonos lo representativa que es la medida de posición. A mayor
dispersión menor representatividad de la medida de posición y viceversa.
Medidas de dispersión absoluta
a) Rango
Se define como la diferencia entre el máximo y el mínimo valor de la variable:

Ej: Sea X, las longitudes de Mugil cephalus obtenidas para dos puntos de
desembarque A y B

R ( A) = 370 – 100= 270


R ( B) = 245 – 225= 20 :Distribución menos dispersa
b) Varianza
La varianza mide la mayor o menor dispersión de los valores de la
variable respecto a la media aritmética. Cuanto mayor sea la
varianza mayor dispersión existirá y por tanto menor
representatividad tendrá la media aritmética.
La varianza se expresa en las mismas unidades que la variable
analizada, pero elevadas al cuadrado.

σ 2 = [(Y1 - μ)2 + …(YN - μ)2]/N


_______________________
S2 = [(Y1- Y)2 + ... + (Yn-Y)2]/(n-1)
_________
σ 2 = Σ(Yi- μ)2/N S2 = Σ(Yi-Y)2/(n-1)
d) Desviación típica o estándar
Se define como la raíz cuadrada de la varianza.

e) Error de estimación
Medidas de dispersión relativa
Nos permiten comparar la dispersión
de distintas distribuciones.
a) Coeficiente de variación de Pearson
( CV): Indica la relación existente
entre la desviación típica de una
muestra y la media.
Al dividir la desviación típica por la media se
convierte en un valor exento de unidad de medida.
Si comparamos la dispersión en varios conjuntos de
observaciones tendrá menor dispersión aquella que
tenga menor coeficiente de variación.
El principal inconveniente, es que al ser un
coeficiente inversamente proporcional a la media
aritmética, cuando ésta tome valores cercanos a
cero, el coeficiente tenderá a infinito.
b) Desviación estándar de medias (error
estándar)
MEDIDAS DE FORMA
Las medidas de forma de una distribución se pueden
clasificar en dos grandes grupos o bloques: medidas de
asimetría y medidas de curtosis.
Medidas de asimetría o sesgo : Coeficiente de asimetría de
Fisher.
Cuando al trazar una vertical, en el diagrama de barras o
histograma, de una variable, según sea esta discreta o
continua, por el valor de la media, esta vertical, se
transforma en eje de simetría, decimos que la distribución
es simétrica. En caso contrario, dicha distribución será
asimétrica o diremos que presenta asimetría. El coeficiente
de asimetría más preciso es el de Fisher, que se define por:
Según sea el valor de g1, diremos que la distribución
es asimétrica a la derecha o positiva (desplazada a
la derecha), a la izquierda o negativa (desplazada a
la izquierda), o simétrica:

Si g1 > 0 : la distribución es asimétrica positiva

Si g1 < 0 : la distribución es asimétrica negativa

Si g1 = 0 : la distribución es simétrica
Medidas de apuntamiento o curtosis: coeficiente
de curtosis de Fisher
Con estas medidas nos estamos refiriendo al
grado de apuntamiento que tiene una
distribución; para determinarlo, emplearemos el
coeficiente de curtosis de Fisher. (g2)
Si g2 > 3 la distribución será leptocúrtica o
puntiaguda

Si g2 = 3 la distribución será mesocúrtica o normal

Si g2 < 3 la distribución será platicúrtica o menos


puntiaguda que la normal.
Diferencia entre exactitud, sesgo y precisión

Exactitud: Es la cercanía del estadígrafo al


parámetro
Sesgo: Es la distancia del estadígrafo al
parámetro
Precisión: Es la cercanía de las observaciones
individuales.
Inexactitudes en la estimación de un parámetro
Se pueden producir:

En la toma de datos: Por eso al tomar los datos


hay que realizar una cuidadosa revisión para
detectar si hay algún dato extraño.

En el registro de los datos: Cuando se registra en


el campo en fichas o libretas o cuando se
registra en otras fichas más especializadas en el
laboratorio o cuando se trasladan los datos al
computador. Es otro paso que debe verificarse.
En los cálculos: Para evitar errores hay que
escribir con claridad y orden, teniendo cuidado
con las puntuaciones y utilizando las
puntuaciones vigentes (por ejemplo , (coma)
para decimales, etc.). Hay que verificar que los
cálculos se realicen correctamente. Deben
revisarse los resultados para detectar si hay algo
extraño.

Equipos: Si los equipos no se encuentran en


buenas condiciones (bien calibrados y
funcionando sin problemas) pueden ocasionar
que se registre información errónea.
Detección y corrección de la baja precisión de
un estimador
Como detectar y corregir la baja precisión
El investigador tiene dos opciones:
Si se trata de los equipos verificará que los equipos tengan la
precisión apropiada para las variables a ser medidas. Por ejemplo
no se puede utilizar una balanza que mida al 0,1 g para obtener
los pesos de larvas de camarón, aquí se debe utilizar una balanza
con mayor precisión, por ejemplo que mida al 0,001 g
Si se analiza la varianza y el coeficiente de variación y son valores
muy altos, ello puede ser corregido:
Aumentando el número de elementos en la muestra o
estratificando la población
Detección y corrección del alto sesgo de un
estimador
El sesgo sólo puede detectarse realizando un control
de calidad de todo el trabajo, desde la elección del
método de muestreo, la toma de muestra, la
medición de los valores, el registro, el análisis, los
resultados, etc.
Ello incluye lógicamente la supervisión de los equipos
utilizados y la supervisión del personal que trabaja
como operador en la recolección de datos.
REDONDEO

Si el cálculo es manual o con calculadora simple o caso que así


se requiera se deben redondear los estimadores.
Reglas:
Si la cantidad eliminada excede la mitad de la unidad del último
dígito retenido, se aumenta a éste en una unidad:
236,856 : 240, 237, 236,9, 236,86

Si la cantidad eliminada no excede la mitad de la unidad del


último dígito retenido, no se aumenta a éste en ninguna unidad:
894,342 : 890, 894, 894,3, 894,34

Estimador Límites
193 192,5 – 193,5
GRACIAS

Esta foto de Autor desconocido está bajo licencia CC BY-NC

También podría gustarte