Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Biotecnología, 2019-A
Gráficos
El gráfico de dispersión muestra cada valor de los datos.
Mediana
Es el valor de en medio cuando los datos se ordenan de menor a mayor.
Moda
Es el valor del dato que se presenta con mayor frecuencia (si lo hubiera).
Media Geométrica
Estima el centro de los datos. Se usa frecuentemente para datos que tienen
un sesgo positivo, ya que estará más cerca del pico de la distribución que
la media aritmética.
Media Winsorizada
Es una medida robusta que se obtiene calculando la media muestral después
de haber reemplazado con copias los valores de los datos que se eliminaron
en una media recortada.
Obs.: La media recortada y la media Winsorizada son menos afectadas por
valores extremos que la media aritmética.
Varianza
Es una medida de la desviación cuadrada promedio alrededor de la media
muestral.
Desviación Estándar
Es la raíz cuadrada de la varianza muestral.
DAM
Es la desviación absoluta mediana.
Percentiles
Cuartil inferior: el 25 percentil.
Cuartil Superior: el 75 percentil.
Rango Intercuartílico: RIC=cuartil superior - cuartil inferior.
Sesgo
Es una medida de asimetría.
Un valor cercano a 0 correspondería a una muestra de datos casi simétri-
ca. Un sesgo positivo indica una cola superior más larga que la inferior,
mientras que un sesgo negativo indica una cola inferior más larga.
Sesgo Estandarizado
Convierte la estadística de sesgo calculada anteriormente a un valor que
tiene aproximadamente una distribución normal estándar en muestras gran-
des.
Al nivel de significancia del 5 %, se podría declarar un sesgo significativo
si su valor cae fuera del intervalo (-2, +2).
Curtosis
Es una medida de lo relativamente picudo o plano comparado con una
curva con forma de campana.
Un valor cercano a 0 corresponde a una distribución normal con forma
casi de campana. Una curtosis positiva indica una distribución que es más
picuda en el centro y tiene colas más largas que la normal. Una curtosis
negativa indica una distribución que es más aplanada que la normal con
colas más cortas.
Construcción
Se dibuja una caja que se extienda desde el cuartil inferior de la mues-
tra hasta el cuartil superior. Este es el intervalo cubierto por el 50 %
central de los valores de los datos cuando se ordenan de menor a
mayor.
Se dibuja una línea vertical en la mediana (el valor de en medio).
Si se solicita, un signo de más se coloca en el lugar de la media
muestral.
Los bigotes se dibujan desde los extremos de la caja hasta los valores
mínimo y máximo de los datos, a menos que haya valores inusualmente
muy alejados de la caja (puntos extremos).
Intervalos de confianza
Un intervalo de confianza indica un rango en el que puede estar el valor
de un parámetro poblacional con cierto nivel de seguridad o confianza.
Intervalos de confianza
Un intervalo de confianza indica un rango en el que puede estar el valor
de un parámetro poblacional con cierto nivel de seguridad o confianza.
Una correcta interpretación es como sigue: si se obtuvieran 100 muestras
independientes de la misma población y para cada muestra se calculará el
intervalo de confianza para el mismo parámetro, entonces se espera que
95 de los 100 intervalos contengan el verdadero valor de dicho parámetro.
Intervalos de confianza
Un intervalo de confianza indica un rango en el que puede estar el valor
de un parámetro poblacional con cierto nivel de seguridad o confianza.
Una correcta interpretación es como sigue: si se obtuvieran 100 muestras
independientes de la misma población y para cada muestra se calculará el
intervalo de confianza para el mismo parámetro, entonces se espera que
95 de los 100 intervalos contengan el verdadero valor de dicho parámetro.
Prueba de hipótesis
Una hipótesis de investigación es una proposición realizada por el inves-
tigador cuando éste especula acerca del resultado final de una investigación
o experimento.
Se usan para determinar si la muestra proviene de una distribución con una
media o desviación estándar particulares.
Ejemplo
En un proceso de inyección de plástico, una característica de calidad del
producto es su grosor. Para evaluar esta característica de calidad, durante
una semana se hace un muestreo en una línea de calidad, y se obtienen 20
muestras de tamaño 7. De la muestra total se obtiene la media muestral,
X̄ =1.37 mm y la varianza S 2 =0.094.
a) ¿Cuál es la estimación puntual del grosor?
b) Encontrar un intervalo de confianza del 90 % para la media verdadera
del grosor.
c) Encontrar un intervalo de confianza del 98 % para la desviación verda-
dera del grosor.
d) Antes del estudio se suponía que µ =1.30. Dada la evidencia de los
datos, ¿tal supuesto es correcto?
Ejemplo
Se quiere estimar la proporción p de artículos defectuosos en un lote de
3,000. Para ello, se toma una muestra aleatoria de 250 artículos y se en-
cuentra que de éstos, 35 son defectuosos.
a) Encontrar un estimador puntual de p.
b) Encontrar una estimación por intervalo de p con 99 % de confianza.
Ejemplo
Un fabricante de dulces compra costales de azúcar. Según los vendedores,
los costales tienen un peso medio de 50.1 kg, con una varianza de σ 2 =0.5.
El comprador sospecha que el peso medio es menor, para ello se selecciona
de manera aleatoria tres bultos de cada uno de los siguientes 5 pedidos;
pesa los 15 bultos y obtiene que X = 49.4 kg. y S 2 = 1.2. A nivel de
significancia de 10 %, ¿podemos confirmar la sospecha del comprador?