Está en la página 1de 23

Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.

ESTADÍSTICA DESCRIPTIVA
OBJETIVOS ESPECIFICOS
 Identificar una población o muestra
 Definir la o las variables que caracterizan a una distribución
 Calcular medidas de posición y de dispersión adecuadas para describir cada distribución.
 Comprender la utilidad e importancia del Teorema Central del Límite en estadística.

CONTENIDOS TEMÁTICOS
Población y muestra. Variables cuantitativas continuas y discretas. Variable atributo. Principios y tipos de
muestreo. Distribución de frecuencias discretas y continuas. Gráficos. Medidas de posición y dispersión: me-
dia aritmética, mediana, modo, amplitud, varianza, desvío estándar, coeficiente de variación y distancia inter-
cuartílica. Propiedades de media aritmética y varianza. Esperanza, varianza y caso especial de la distribución
de X .

* GLOSARIO
Estadística. Variable: cuantitativa, cualitativa o atributo. Población. Muestra. Muestreo. Gráficos: barras,
bastones, escalones, histogramas; polígonos de frecuencias, ojiva; Boxplot. Media aritmética, Mediana,
Modo, Varianza, Desvío estándar, Coeficiente de variación, Rango o Amplitud. Variación relativa y abso-
luta.

El orden que seguimos es:


 Definir la población de la que seleccionaremos la muestra a evaluar
 Definir la variable de interés, donde debe constar la unidad de observación
 Ordenar los datos en una tabla de frecuencias.
 Graficar frecuencias a partir de la tabla.
 Calcular medidas que nos resuman las características de la distribución de la variable en la muestra.

Conceptos de Muestreo

El muestreo es la selección de una parte de la población denominada muestra. A las características de


cada muestra se las denomina estadísticos o estadísticas. A las características de la distribución de la
variable en la población se las denomina parámetros. La varianza poblacional y la esperanza son ejem-
plos de parámetros.

Las técnicas de muestreo estadístico comprenden dos aspectos principales:


 el criterio de selección da las reglas mediante las cuales algunos miembros de la población son
incluidos en la muestra.
 la selección y cálculo de estimadores muestrales de los parámetros de la población en fun-
ción de sus propiedades y distribución. (SÉ VERA EN LA PROXIMA UNIDAD)

I.-Tipos de muestreo. Criterio de selección de las muestras

ALEATORIO: en el que se utilizan los conceptos aportados por la teoría de probabilidad para seleccionar las
unidades de muestreo. Esta aleatorización se usa para tener una distribución muestral y obtener estimacio-
nes válidas del error de esa estimación para poder concluir acerca de la población.
a) No restringido o simple
En este método todos los sujetos tienen la misma posibilidad de ser seleccionados para la muestra, indepen-
dientemente uno de otro. Para garantizar esto, cada sujeto debería ser devuelto a la población luego de ser
medido y registrado. Sea N el tamaño de la población:
1
a) Si se trabaja con reposición la probabilidad de que cada elemento sea seleccionado es .
N
1
b) Si se trabaja sin reposición la probabilidad para el primer elemento a elegir es , para el segundo es
N

33
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

1 1
, para el tercero , y así sucesivamente.
N 1 N 2
Puede suceder que:
 El tamaño de la muestra sea menor al 5% de la población y por lo tanto trabajar sin reposición es casi lo
mismo que trabajar con reposición, vale decir que el error cometido es despreciable numéricamente.
 Sea imposible devolverlos a la población porque, por ejemplo, pueden ser destruidos para la investiga-
ción, y no pueden ser repuestos luego de la medición.
b) Restringido
i) Estratificado: la población está dividida en base a una variable estratificadora en grupos homogé-
neos o clases llamados “estratos”. Se toma una muestra aleatoria simple de cada grupo y se obtiene una
muestra estratificada. La muestra puede ser “proporcionada” si el número de elementos seleccionado en
cada grupo es proporcional al tamaño del grupo; o “desproporcionada” si se toma igual número de elementos
en cada estrato sin importar su tamaño.
Por ejemplo, si estratificamos por género y el 60% de una determinada población corresponde al género
masculino, si tomamos del estrato masculino el 60% de la muestra, esta sería proporcionada; en cambio, si
tomamos igual número de hombres y mujeres sería desproporcionada.
ii) Agrupado o en conglomerados: la población está dividida o se la divide en grupos que presentan
características similares a toda la población y se extrae una muestra de esos grupos heterogéneos llamados
“conglomerados”. Cada grupo es una “unidad primaria de muestreo”; se puede incluir el grupo entero de las
unidades elementales que lo forman en la muestra o tomar una muestra de las unidades primarias más pe-
queñas.
El muestreo para llegar a la muestra final puede ser “monoetápico” (en una sola etapa), “bietápico” o con
“submuestreo” (en dos etapas), o “multietápico” (más de dos etapas).
Por ejemplo, un multietápico seria: en una primera etapa podemos seleccionar las universidades (UNI-
DAD PRIMARIA), luego seleccionar las facultades en una segunda etapa, y, por último, los estudiantes en
una tercera etapa.
Cuando no se puede llegar a las unidades de muestreo directamente se divide a la población en grupos.
Se seleccionan algunos al azar y se muestrean solamente los seleccionados en una o varias etapas. Por
ejemplo: barrios, manzanas, viviendas, personas.
Este muestreo por etapas se puede combinar con un muestreo estratificado.
iii) Sistemático: supongamos que las unidades de la población se enumeran en un cierto orden,
se toma una unidad al azar entre las k primeras y luego se toman las subsecuentes en intervalos de k.
No se necesita conocer el tamaño total de la población en estudio ni tener definido el marco de referen-
cia. Para elegir el valor de k se elige una cifra entera, razonable, generalmente el cociente entre el tama-
ño de la población (cuando se conoce) y el tamaño de la muestra, que se establece sobre la base de in-
formaciones previas.
Este tipo de muestreo suele usarse en control de calidad, y para el caso de sucesiones de elementos,
como, por ejemplo, historias clínicas de pacientes, certificados de nacimiento, etc.
Supongamos que se necesita un animal de cada 100, y el primero es seleccionado aleatoriamente de
entre los primeros 100. Si es el animal número 63, entonces la muestra estaría formada por los animales
número 63, 163, 263, y así sucesivamente.
Este tipo de muestreo es un procedimiento fácil, pero insatisfactorio si en la población hay tendencias,
ciclos no reconocidos o periodicidades ocultas. Como ejemplo, tenemos el siguiente caso: Si un ganadero
solamente envía a sus animales al matadero los días martes, y las muestras, en el matadero, se selec-
cionan sistemáticamente los días miércoles, los animales de este ganadero no estarán representados en
la muestra.
NO ALEATORIO: la elección de la muestra queda en manos del investigador, basado en su juicio exper-
to, conveniencia u otros criterios. En este caso un riesgo a tener en cuenta es que la estimación obtenida
muy posiblemente sea sesgada.
Por ejemplo, si quiere estimarse la proporción de vacas lecheras rengas (con claudicaciones) en un esta-
blecimiento, y se selecciona como muestra a las 10 primeras vacas que entran a la sala del ordeñe, de un
total de 100 vacas, posiblemente estemos subestimando esta proporción, ya que esas 10 primeras vacas
tendrían menor chance de tener claudicaciones.
34
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

PROBLEMAS RESUELTOS
EJERCICIO 1) En un estudio sobre la detección de pseudotuberculosis, la Dirección de Bromatología
seleccionó al azar 28 establecimientos, dedicados a la cría y engorde de ovinos, registrando la cantidad
de animales afectados, por establecimiento, al realizar la faena en el frigorífico:

70 110 135 110 77 82 118 110 82 77 77 82 110 110


75 82 75 82 70 75 118 75 120 77 77 82 82 70

a) Identificar la variable, clasificarla y definir la población en estudio.


b) Construir la tabla de frecuencias.
c) Calcular las medidas de posición y dispersión.
d) A partir del boxplot analizar la distribución de la variable.
e) Realizar el grafico de frecuencias acumuladas correspondiente.
f) Si suponemos que en los establecimientos se realizó un tratamiento que disminuye en 10% la canti-
dad de animales afectados, ¿cómo se modifican las medidas calculadas en el punto d)?

SOLUCIÓN
a) La variable es aquella característica que nos interesa medir en cada unidad experimental, en este ca-
so:
X: “cantidad de ovinos atacados de pseudotuberculosis en un establecimiento dedicado a la cría y engor-
de de ovinos al realizar la faena en el frigorífico”.
Se trata de una V. Cuantitativa Discreta.

En este problema la población en estudio corresponde a los establecimientos dedicados a la cría y engorde
de ovinos; como no se especifica la región en donde están ubicados, solamente con esta descripción nos
alcanza. Entonces, la muestra tomada es de:
n (tamaño de la muestra): 28 establecimientos dedicados a la cría y engorde de ovinos.

b) Tabla de frecuencias: la primera columna contiene los valores de la variable que se registraron en la
muestra, y se simboliza con xi; en la segunda columna se registra cuántas veces se observa cada uno de
los valores de la variable (xi), y corresponde a la frecuencia absoluta simple (fi). En la tercera columna se
registra cuántas veces se observan los valores de la variable menores o iguales a xi, o sea, las frecuen-
cias absolutas acumuladas (Fi). La cuarta columna corresponde al cociente entre fi y n, o sea la frecuen-
cia relativa simple (hi). En la última columna, correspondiente a las frecuencias relativas acumuladas (Hi),
sumamos las frecuencias relativas simples de la misma manera que en la tercera columna, hasta acumu-
lar el total de la muestra. Por las características de las frecuencias relativas siempre obtendremos como
valor 1, o 100%, o cercanos a ellos, según se expresen en decimales o como porcentajes.

xi fi Fi hi Hi
70 3 3 0,11 0,11
75 4 7 0,14 0,25
77 5 12 0,18 0,43
82 7 19 0,25 0,68
110 5 24 0,18 0,86
118 2 26 0,07 0,93
120 1 27 0,04 0,96
135 1 28 0,04 1,00
TOTAL 28 1,00

La utilidad de la tabla es que el ordenamiento de los datos permite interpretar la información de la mues-
tra. Por ejemplo, tomemos la información de la cuarta fila de datos, en donde x4 = 82:
 f4 = 7, indica que en 7 establecimientos dedicados a la cría y engorde de ovinos se encontraron 82
ovinos atacados de pseudotuberculosis.
 F4 = 19, se interpreta como que en 19 establecimientos dedicados a la cría y engorde de ovinos se
encontraron a lo sumo 82 ovinos atacados de pseudotuberculosis (o hasta 82 ovinos atacados de pseu-
dotuberculosis inclusive).

35
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

4
NOTA: F4  f
1
i  f1  f 2  f3  f 4  3  4  5  7  19

 h4 = 0,25, expresa que en el 25% de los establecimientos dedicados a la cría y engorde de ovinos se
encontraron 82 ovinos atacados de pseudotuberculosis.
 H4 = 0,68, indica que en el 68% de los establecimientos dedicados a la cría y engorde de ovinos se
encontraron a lo sumo 82 ovinos atacados de pseudotuberculosis (o hasta 82 ovinos atacados de pseu-
dotuberculosis inclusive).
4
NOTA: H 4   h  h h
1
i 1 2  h3  h4  0,11  0,14  0,18  0, 25  0,68
c) Medidas de posición

MEDIA ARITMÉTICA
xi fi xi fi
Para calcular la media aritmética debemos sacar el promedio de
todos los valores de la variable que hemos obtenido en la muestra. En la 70 3 210
fórmula observamos que aparece la expresión xifi, o sea, la sumatoria de 75 4 300
los productos entre cada valor de la variable y su correspondiente frecuen- 77 5 385
cia absoluta simple. Para facilitar los cálculos podemos agregar una colum- 82 7 574
na a la tabla de frecuencias en donde realizaremos estos productos, de la 110 5 550
siguiente forma: 118 2 236
xi fi 2510 120 1 120
x   89,64
n 28 135 1 135
Interpretación: aproximadamente hay 90 ovinos afectados con pseudotu- 28 2510
berculosis, en promedio.

MEDIANA
Para calcular la mediana, primero debemos ordenar los datos de menor a xi Fi
mayor o de mayor a menor. En este ejercicio ya ordenamos los datos al construir
la tabla de frecuencias. Como sabemos, esta medida divide a la muestra en dos 70 3
partes iguales, por lo que en el primer paso debemos encontrar la posición de la 75 7
misma, o sea, encontrar cuál es el valor central de la muestra (en caso de que n 77 12
sea un número impar), o cuáles son los valores centrales (en caso de que n sea 82 19
un número par). 110 24
n+1 118 26
Pos Me = = 14,5
2 120 27
135 28

Entonces los valores centrales ocupan los lugares 14 y 15. Luego los ubicamos en la tabla de Frecuen-
cias acumuladas y observamos:

Como los valores centrales son x(14)=82 y x(15)=82, debemos realizar el promedio entre ellos:

x14 + x15 82+82


Mex = = = 82
2 2
La mediana es 82 ovinos afectados con pseudotuberculosis.

36
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

MODO

xi fi Para calcular el modo tenemos que recurrir nuevamente a la tabla de frecuencias,


70 3 porque en ella vamos a ubicar rápidamente cuál es el valor de la variable que se
repite con mayor frecuencia. Debemos observar cualquiera de las columnas de
75 4 frecuencias simples, en este caso tomamos la columna de f i. La mayor frecuencia
77 5 es f4, por lo tanto:
82 7
110 5 f 4 = 7  Mo = 82 ovinos afectados con pseudotuberculosis
118 2
120 1
135 1
TOTAL 28
Observar que también estas medidas verifican la condición de asimetría positiva:
Me = Mo = 82 < X = 89,64 ovinos afectados con pseudotuberculosis

CUARTILES
Otra medida de posición para datos ordenados son los CUARTILES. Para calcularlos dividimos la
muestra en cuatro partes iguales, por lo que calculamos 3 cuartiles, C1, C2 (=Me) y C3.
Realizamos el mismo mecanismo que para calcular la Mediana, en cada una de las dos mitades, y
obtenemos:

n+1 n+1 3(n+1)


PosC1 = = 7,25 PosC2 = PosMe = = 14,5 PosC3 = = 21,75
4 2 4
C1 = 76 ovinos afectados con pseudotuberculosis y C3 = 110 ovinos afectados con pseudotuberculosis

Medidas de dispersión:
RANGO o AMPLITUD
Esta medida de dispersión es la más sencilla y consiste en conocer cuántas unidades comprende
la totalidad de los valores observados en la muestra. Para calcularlo sólo basta con realizar la resta entre
el xmáx (mayor valor de la variable) y xmín (menor valor de la variable).

Amplitud= xMáx - xmín =135-70 = 65 ovinos afectados con pseudotuberculosis

DISTANCIA INTERCUARTÍLICA
Es la medida de dispersión asociada a los cuartiles, se simboliza d C, y en ella observamos la disper-
sión de los valores centrales, la forma de calcularla es: d C = C3 – C1, e indica el rango o amplitud donde
se encuentra el 50% “central” de las observaciones.

En este caso es: dC= C3-C1 = 110-76 = 34 ovinos afectados con pseudotuberculosis
2
VARIANZA xi fi xi fi xi f i
Es una medida de dispersión absoluta, que 70 3 210 14700
mide el grado de concentración de las observacio- 75 4 300 22500
nes con respecto a su promedio ( X ) 77 5 385 29645
En la fórmula observamos que aparece la 82 7 574 47068
expresión ∑xifi, que ya habíamos usado al calcular la 110 5 550 60500
media aritmética, y aparece una expresión, xi fi, la
2
118 2 236 27848
sumatoria de los productos entre el cuadrado de 120 1 120 14400
cada valor de la variable y su correspondiente fre- 135 1 135 18225
cuencia absoluta simple. Para facilitar los cálculos TOTAL 28 2510 234886
podemos agregar una columna a la tabla de fre-
cuencias en donde realizaremos estos productos, de la siguiente forma:

37
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

1  2 Σxi fi   1   25102  = 1 234886 - 225003,57 = 366,02


2

s2x = Σxi fi - = 234886 -   


n -1  n  27  28  27
2 2
sx = 366,02 (ovinos afectados con pseudotuberculosis)

Debemos recordar que se expresa en la unidad de la variable, pero elevada al cuadrado.

DESVÍO ESTÁNDAR
El desvío estándar es la raíz cuadrada de la varianza. Por lo que lo calculamos de la siguiente forma:
S = S2 = 366,02 =19,13 ovinos afectados con pseudotuberculosis

COEFICIENTE DE VARIACIÓN
Es una medida de dispersión relativa en donde se relaciona una medida de dispersión (Sx) con
una medida de posición ( X ), y su resultado se expresa en porcentaje. No tiene unidades de medida.

S 20,6
C.V. = .100 = .100 = 23,8%
X 86,5

e) Si cada observación se disminuye en 10%, la variable inicial X se modifica de la siguiente forma:


Yi = Xi - 0,10Xi = Xi (1- 0,10) = 0,90Xi
La media aritmética y la varianza también se modifican, en este caso según la propiedad del producto
entre la variable y una constante:

Y = 0,90.X = 0,90.89,64 = 80,676  81ovinos afectados con pseudotuberculosis


Nota: Lo mismo sucedería con la mediana (MeY = 0,90 · Mex = 0,90 · 0,82 = 73,8 74 ovinos infectados)

SY = 0,90 .Sx = 0,81.366,02 = 296,47  297 (ovinos afectados con pseudotuberculosis)


2 2 2 2

Como consecuencia de esta modificación, el valor del desvío estándar será:

2
SY = SY = 296,47 = 17,22 ovinos afectados con pseudotuberculosis

sY 0,90.sX sX
El CV no se modifica, ya que: CVY     CVX
Y 0,90.x x

c) Boxplot.

Para analizar el boxplot debemos prestar atención a la caja.


En este caso vemos que la Me (representada por la línea
horizontal dentro de la caja) está próxima al C 1, de manera
que el 25% de los datos centrales inferiores a ella están
muy cercanos entre sí, mientras que el 25% de los datos
centrales superiores a la Me están más alejados entre sí, si
comparamos la distancia entre la Me y C 3. Además, toda la
caja está desplazada hacia la parte inferior del gráfico: el
bigote inferior es menor que el superior. Esto nos indica que
la distribución es ASIMÉTRICA POSITIVA.

38
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

e) El gráfico siguiente se denomina de ESCALONES, y sirve para representar frecuencias acumuladas, de


variables aleatorias discretas, ya sean las absolutas o las relativas, pero en este ejercicio sólo necesitamos
graficar estas últimas.

Podemos observar los escalones y relacionarlos con el gráfico de la función de distribución acumulada
F(xi), que ya hemos visto en la unidad anterior (correspondiente a Distribuciones de Probabilidad).

EJERCICIO 2) Los siguientes valores corresponden a la altura, en mm, del complejo QRS de 20 electro-
cardiogramas de galgos de ambos sexos, luego de una competencia:
25,0 29,3 20,0 24,1 22,5 20,5 25,0 24,0 21,0 23,7
17,0 20,5 30,0 20,6 23,2 30,8 27,5 30,3 25,5 33,8
a) ¿Cuál es la variable en estudio y de qué tipo es?
b) Realizar los gráficos correspondientes a los datos ordenados en una tabla de frecuencias.
c) Calcular las medidas de posición y de dispersión, indicando las unidades que corresponden a ca-
da caso.

SOLUCIÓN
a) X: “altura del complejo QRS en un electrocardiograma de galgo, luego de una competencia, medida en
mm.”
n = 20 (tamaño de muestra)

La población en estudio puede definirse como:


 el conjunto de todos los galgos, luego de una competencia  Población Biológica
 el conjunto de todos los valores de altura del complejo QRS en electrocardiogramas de galgos, des-
pués de una competencia  Población Estadística.
La unidad de observación es un electrocardiograma de un galgo.
La clasificación de la variable de interés es cuantitativa continua.
La unidad de medida utilizada en esta variable es mm.

39
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

b) Tabla de frecuencias:
[ ; ) x'i fi Fi hi Hi
17,0 - 20,4 18,7 2 2 0,10 0,10
20,4 - 23,8 22,1 7 9 0,35 0,45
23,8 - 27,2 25,5 5 14 0,25 0,70
27,2 - 30,6 28,9 4 18 0,20 0,90
30,6 - 34,0 32,3 2 20 0,10 1,00
TOTAL 20 1,00

donde: x'i = marca de clase (punto medio del intervalo) fi = frecuencia absoluta simple
Fi = frecuencia absoluta acumulada hi = frecuencia relativa simple
Hi = frecuencia relativa acumulada [ ; ) = intervalo de clase

Ejercitemos la interpretación de los datos que aparecen en la tabla. Tomemos por ejemplo la infor-
mación del intervalo de clase que aparece en la cuarta fila: [27,2 – 30,6). ¿Cómo interpretamos “[27,2 –
30,6)”? El intervalo es cerrado en 27,2 y abierto en 30,6, por lo que la altura de complejo QRS de los electro-
cardiogramas realizados luego de la competencia de los galgos de la muestra, está comprendida entre 27,2
mm (inclusive) y 30,6 mm (sin incluir).
Como F4 = 18, podemos decir que 18 electrocardiogramas de galgos, luego de una competencia,
tienen una altura de complejo QRS menor a 30,6 mm.
Como h4 = 0,20, decimos que el 20% de los electrocardiogramas de los galgos muestreados, lue-
go de una competencia, tiene una altura de complejo QRS comprendida entre 27,2 mm (inclusive) y 30,6
mm (sin incluir).
f4 = 4, indica que se encontraron 4 galgos, cuyos electrocardiogramas realizados luego de una
competencia muestran una altura del complejo QRS comprendida entre 27,2 mm (inclusive) y 30,6 mm
(sin incluir).
H4 = 0,90, indica que el 90% de los galgos muestreados, luego de la competencia, muestran una
altura en el complejo QRS de hasta 30,6 mm.

Los dos gráficos representan las frecuencias simples (absolutas y relativas), se denominan HISTO-
GRAMAS y también tienen representado un polígono, llamado POLÍGONO DE FRECUENCIAS, que pasa
por los puntos cuyas abscisas son los puntos medios de los intervalos de clase, o las marcas de clase, y cu-
40
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

yas ordenadas son las frecuencias correspondientes a dicho intervalo. Se cierra el polígono uniendo con las
marcas de clase de dos intervalos ficticios, uno anterior al 1er. intervalo, y otro posterior al último intervalo.
Ambos gráficos representan la densidad de los valores observados de la variable en esta muestra, ya que la
superficie encerrada dentro del histograma es equivalente a la superficie delimitada por el polígono de fre-
cuencias.
La distribución de la variable en esta muestra, presenta una leve asimetría positiva (cola a derecha).

En este caso, se representan las frecuencias acumuladas, absolutas y relativas. Se denomina HIS-
TOGRAMA DE FRECUENCIAS ACUMULADAS, y se puede graficar una poligonal, llamada OJIVA, que
marca la acumulación a lo largo del intervalo, uniendo la frecuencia acumulada obtenida en el límite inferior
de cada intervalo con la obtenida en el límite superior del mismo.

c) Medidas de centralidad:

NOTA: Observar que se trata de variables continuas, agrupadas en intervalos, por lo tanto, la media y la varianza se cal-
culan utilizando las marcas de clase.

MEDIA ARITMETICA
 xi f i 499,8
x= = = 24,99 mm
n 20
MEDIANA
n 1 21
Pos Me    10,5  Int Me [23,8 ; 27,2)
2 2
 (n+1) 
 - F i-1 
Mex = L i + c  2

 fi 
 
Donde: c: amplitud del intervalo
41
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Li: límite inferior del intervalo mediana


fi: frecuencia absoluta simple del intervalo mediana
Fi-1: frecuencia absoluta acumulada del intervalo anterior
 10,5-9   1,5 
Mex = 23,8+3,4   = 23,8 + 3,4   = 23,8 + 3,4.0,3 = 23,8 + 1,02 = 24,82 mm
 5   5 
Es importante diferenciar POSICIÓN DE MEDIANA y valor de la MEDIANA en sí. La primera sólo nos
aporta la ubicación del Intervalo Mediana, pero, ¿cuál de los infinitos valores contenidos en ese intervalo
es la Mediana? Para encontrarla, tenemos que realizar el cálculo correspondiente.
En este ejercicio, el Intervalo Mediana corresponde al comprendido entre 23,8mm y 27,2mm; y el valor de
la Mediana es 24,82mm.

MODO
Int. Mo ----> [ 20,4 ; 23,8)
 1 
Mo = Li + c  
 1 + 2 
Donde
1  f (Max)  f (ant)
2  f (Max)  f (post)
Li: Límite inferior del intervalo Modal.
c: Amplitud del intervalo Modal.
f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal.
f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.
f(Max): Frecuencia absoluta del intervalo Modal.

 5  5
Mo = 20,4+3,4   = 20,4+3,4. = 20,4+2, 429 = 22,829 mm
 5+ 2  7

Volvamos a analizar la distribución de la variable en esta muestra utilizando las medidas de posición:
Me= 24,82 mm, Mo = 22,829 mm, x = 24,99 mm. Al ser Mo < Me < x , podemos decir que la distribución
tiene ASIMETRÍA POSITIVA.

Medidas de dispersión:

VARIANZA
1  Σx'ifi  2
 1   499,8  
2
1
2
s =
x Σx'i2 fi - = 12796,92 - = ×306,918 =16,15mm2
n -1 
 n 
 19 
 20 
 19

DESVÍO ESTÁNDAR
2
SX = SX = 16,15mm = 4,018mm

COEFICIENTE DE VARIACIÓN

42
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

BOX PLOT
El boxplot o diagrama de caja lo utilizamos para analizar la distribución de la variable en esta muestra.

En la caja, la Mediana (la línea horizontal que subdi-


vide la caja) se ubica casi en el centro, y el tamaño
de los bigotes es distinto, siendo mayor el bigote
superior.

En este caso podemos decir que la distribución es


levemente ASIMÉTRICA POSITIVA.

Además, el valor de la media aritmética (señalado en


el gráfico con el puntito) es levemente superior al
valor de la mediana; lo que confirma la asimetría
positiva.
X > Me > Mo

En este cuadro presentamos las medidas resumen obtenidas, a partir de los datos de la muestra, apli-
cando el programa estadístico InfoStat®.

Estadística descriptiva
Variable n Media D.E. Var(n-1) CV Mín Máx Mediana
Altura 20 24,99 4,02 16,15 16,08 17,00 33,80 24,82

EJERCICIO 3) Para realizar un determinado experimento se ha medido la anchura interorbital, en mm, de


una muestra de 40 palomas, obteniéndose los siguientes datos:
a) Dada la distribución, completar la tabla con todas las frecuencias. ¿Qué [ ; ) fi
frecuencia usaría si necesita valores relativos al tamaño de muestra? 10,0 – 10,5 3
b) Grafique el histograma y el polígono de frecuencias. 10,5 – 11,0 4
c) Calcule la mediana, el modo, y el coeficiente de variación. 11,0 – 11,5 14
11,5 – 12,0 10
d) ¿Qué puede decir con respecto a la simetría de esta muestra? 12,0 – 12,5 5
e) ¿Cuál es la probabilidad de seleccionar una paloma al azar, de este 12,5 – 13,0 3
conjunto de palomas, y que su anchura interorbital mida entre 10 y 10,5 13,0 – 13,5 1
mm?
f) Sabiendo que hemos seleccionado de este conjunto una paloma al azar cuya anchura interorbital
es menor a 11,5, ¿cuál es la probabilidad de que se encuentre entre 10 y 10,5 mm?
g) Sabiendo que hemos seleccionado de este conjunto una paloma al azar cuya anchura interorbital
es menor a 11,5 ¿cuál es la probabilidad de que se encuentre entre 13 y 13,5 mm?
SOLUCIÓN
a)
2
[ ; ) x’i fi Fi hi Hi x’i* fi x’i * fi
10,0 – 10,5 10,25 3 3 3/40 3/40 30,75 315,1875
10,5 – 11,0 10,75 4 7 4/40 7/40 43 462,25
11,0 – 11,5 11,25 14 21 14/40 21/40 157,5 1771,875
11,5 – 12,0 11,75 10 31 10/40 31/40 117,5 1380,625
12,0 – 12,5 12,25 5 36 5/40 36/40 61,25 750,3125
12,5 – 13,0 12,75 3 39 3/40 39/40 38,25 487,6875
13,0 – 13,5 13,25 1 40 1/40 40/40 13,25 175,5625
40 40/40 461,50 5343,5
43
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Si necesitáramos valores relativos al tamaño de muestra, podríamos trabajar tanto con hi como con Hi

b)

n+1 41
c) MEDIANA: Pos Me = = = 20,5  Int. Mediana: 11,0 ; 11,5
2 2
 Pos Me -Fi-1   20,5 - 7 
Me = Li +c·  =11,0 +0,5·  =11,4821mm
 fi   14 
MODO: La mayor frecuencia absoluta simple es f4 = 14, por lo que el intervalo modal es [11,0; 11,5), por
lo que:
 1   10 
Mo = Li + c·    11,0  0,5·   11,0  0,357  11,357 mm
 1 + 2   10  4 

COEFICIENTE DE VARIACIÓN: CV% =


SX 0,6969
·100 = ·100  6,044%
X 11,53

d) Como: Mediana = 11,4821 mm; Modo = 11,357


mm; Media = 11,53 mm, si ordenamos numérica-
mente los resultados, tenemos que: Media > Me-
diana > Modo, lo que nos indicaría que es levemen-
te asimétrica positiva. Pero, como los valores son
muy cercanos entre sí, veamos que sucede con el
boxplot:

En el gráfico observamos que:


 La mediana se encuentra cerca del centro
de la caja
 El bigote superior es un poco más largo que
el bigote inferior
Entonces, podemos decir que la distribución
es levemente asimétrica positiva

3
e) p(10  x  10,5)   0,075
40

44
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

3
f) p(10  x  10,5) / x  11,5)   0,1428
21
i) p(13  x  13,5) / x  11,5) = 0 / 21 = 0

EJERCICIO 4) Se quiere estudiar la eficacia de un nuevo insecticida para plantas de interior. Se selec-
cionan 50 plantas y se cuenta el número de hojas que han sido atacadas por la plaga, después de haber
tratado la planta con el nuevo producto. Los resultados son:

N° de hojas atacadas fi
0 6
1 10
2 12
3 8
4 5
5 4
6 3
8 1
10 1

a) Definir la variable en estudio y clasificarla.


b) ¿Cuál es la población en estudio? ¿Y la muestra observada?
c) Encontrar todas las medidas de tendencia central que correspondan.
d) Encontrar todas las medidas de variabilidad que correspondan.
e) ¿Qué porcentaje de plantas observadas fueron atacadas? ¿Qué porcentaje de plantas observadas
tienen a lo sumo 1 sola hoja atacada? ¿qué porcentaje de plantas observadas tienen más de 5 hojas
atacadas?
f) Complete la tabla encontrando las frecuencias relativas y las frecuencias acumuladas (absolutas y
relativas).
g) Calcule el percentil 15 e interprete en función del problema. ¿Cuál es la cantidad de hojas atacadas
que supera el 33% de las plantas?
h) Interprete, respecto al problema planteado, los valores de: f3 ; F6 ; h1 ; H4
i) La empresa que comercializa el nuevo insecticida dice que, el número de hojas atacadas por planta
cuando se aplica este insecticida, sigue la siguiente distribución de probabilidad:
N° de hojas atacadas p(x)
0 0,12
1 0,20
2 0,25
3 0,15
4 0,10
5 0,08
6 0,06
8 0,03
10 0,01
i.i) Encontrar la esperanza, varianza y desvío estándar de la variable definida.
i.ii) ¿Cuál es la probabilidad de que una planta que ha sido tratada con el nuevo fertilizante tenga por
lo menos 3 hojas atacadas, según la información de la empresa que comercializa el nuevo fertilizante?

SOLUCIÓN
a) Definir la variable en estudio y clasificarla.
X: “número de hojas atacadas por la plaga en una planta tratada con el nuevo insecticida”
Variable cuantitativa discreta
b) ¿Cuál es la población en estudio? ¿Y la muestra observada?

45
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Población: plantas de interior


Muestra: las 50 plantas de interior seleccionadas
c) Encontrar todas las medidas de tendencia central que correspondan.
d) Encontrar todas las medidas de variabilidad que correspondan.
Moda 2 hojas atacadas
Mediana 2 hojas atacadas
Media 2,68 hojas atacadas
Rango 10
Desviación estándar 2,133 hojas atacadas
Varianza de la muestra 4,549 (hojas atacadas)2
Mínimo 0
Máximo 10
Coeficiente de variación 0,796 o 79,6%
e) ¿Qué porcentaje de plantas observadas fueron atacadas? ¿Qué porcentaje de plantas observadas
tienen a lo sumo 1 sola hoja atacada? ¿qué porcentaje de plantas observadas tienen más de 5 hojas
atacadas?
A partir de la tabla de frecuencia obtenemos los porcentajes pedidos:
 De las 50 plantas observadas, 6 no han sido atacadas, por lo tanto han sido atacadas 50-6=44
plantas. Entonces el porcentaje de plantas de la muestra que han sido atacadas es:
44
100  0,88 100  88%
50
 De las 50 plantas observadas, la cantidad de plantas que tienen a lo sumo una hoja atacada es
6+10=16. Entonces el porcentaje de plantas de la muestra que tienen a lo sumo una hoja atacada es:
16
100  0,32 100  32%
50
 De las 50 plantas observadas, la cantidad de plantas que tienen más de 5 hojas atacadas es
3+1+1=5. Entonces el porcentaje de plantas de la muestra que tienen más de 5 hojas atacadas es:
5
100  0,1100  10%
50
Nota: Relacione estos resultados con los que obtendrá a continuación, luego de responder el ítem f)

f) Complete la tabla encontrando las frecuencias relativas y las frecuencias acumuladas (absolutas y
relativas).
N° de hojas atacadas fi hi Fi Hi
0 6 0,12 6 0,12
1 10 0,2 16 0,32
2 12 0,24 28 0,56
3 8 0,16 36 0,72
4 5 0,1 41 0,82
5 4 0,08 45 0,9
6 3 0,06 48 0,96
8 1 0,02 49 0,98
10 1 0,02 50 1

g) Calcule el percentil 15 e interprete en función del problema. ¿Cuál es la cantidad de hojas atacadas
que supera el 33% de las plantas?
Para calcular el percentil 15 primero hay que encontrar su posición:
Pos P15 = (n+1)·0,15 = 51·0,15=7,65
A continuación, se busca la frecuencia acumulada que contiene a este valor, en nuestro caso F2=16, por
lo tanto, el percentil 15 es igual a 1 hoja atacada, esto significa que el 15% de la las plantas de interiores
tratadas con el nuevo producto tienen a lo sumo una hoja atacada.

46
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

Para saber la cantidad de hojas atacadas superadas por el 33% de las plantas, hay que calcular el per-
centil 67:
Pos P67= 51· 0,67 = 34.17 → P67 = 3 hojas atacadas.
Podríamos decir entonces, que el 33% de las plantas de interior tratadas con el nuevo producto, tiene
más de 3 hojas atacadas por la plaga

h) Interprete, respecto al problema planteado, los valores de: f3 ; F6 ; h1 ; H4


f3=12  12 plantas de interiores tratadas con el nuevo insecticida tienen 2 hojas atacadas.
F6=45  45 plantas de interiores tratadas con el nuevo insecticida tienen a lo sumo 5 hojas ataca-
das.
h1=0,12  de las 50 plantas observadas tratadas con el nuevo insecticida, la proporción de plantas
que no tienen ninguna hoja atacada por la plaga es 0,12. O también se puede decir que el 12% de las
plantas observadas de la muestra no tienen ninguna hoja atacada por la plaga.
H4=0,72  de las 50 plantas observadas tratadas con el nuevo insecticida, la proporción de plantas
que tienen a lo sumo 3 hojas atacadas es 0,72. También podemos decir que, el 72% de las plantas
observadas de la muestra fueron atacadas a lo sumo en 3 hojas.

i) La empresa que comercializa el nuevo insecticida dice que, el número de hojas atacadas por planta
cuando se aplica este insecticida, sigue la siguiente distribución de probabilidad:

N° de hojas atacadas 0 1 2 3 4 5 6 8 10
p(x) 0,12 0,2 0,25 0,15 0,1 0,08 0,06 0,03 0,01
i.i) Encontrar la esperanza, varianza y desvío estándar de la variable definida.

E(X)= 0·0,12 + 1·0,2 + 2·0,25 + 3·0,15 + 4·0,1 + 5·0,08 + 6·0,06 + 8·0,03 + 10·0,01=
= 0 + 0,2 + 0,5 + 0,45 + 0,4 + 0,4 + 0,36 + 0,24 + 0,1 = 2,65 hojas atacadas
2 2
Var(X) = E(X ) –[E(X)]
2 2 2 2 2 2 2 2 2 2
E(X )= 0 ·0,12 + 1 ·0,2 + 2 ·0,25 + 3 ·0,15 + 4 ·0,1 + 5 ·0,08 + 6 ·0,06 + 8 ·0,03 + 10 ·0,01=
= 0 + 0,2 + 1 + 1,35 + 1,6 + 2 + 2,16 + 1,92 + 1 = 11,23
2 2 2 2
Var(X) = E(X ) –[E(X)] = 11,23 – 2,65 = 11,23 – 7,02225 = 4,20 (hojas atacadas)

Desvío(X)= Var(X) = 4,2075 = 2,0512 hojas atacadas


i.ii) ¿Cuál es la probabilidad de que una planta que ha sido tratada con el nuevo fertilizante tenga por
lo menos 3 hojas atacadas, según la información de la empresa que comercializa el nuevo fertilizan-
te?
P( X ≥ 3) = 1- P(X<3) = 1- H3 = 1- 0,57 = 0.43

EJERCICIO 5) Asuma que el aumento de peso los cobayos alimentados con un determinado balanceado,
se distribuye normal con media igual a 105 g y desvío estándar igual a 10,5 g.
a) ¿Con qué probabilidad un cobayo tomado al azar tendrá un aumento de peso de al menos 104 g?
b) ¿Qué valor de aumento de peso no será superado por el 95% de los cobayos?
Si se extrae de esta población de cobayos una muestra aleatoria de tamaño 16:
c) ¿Cuál es la probabilidad de que los cobayos de esta muestra tengan un aumento de peso promedio
inferior a 106 g?

d) ¿Qué valor del aumento medio de peso no será superado por el 95% de los cobayos en muestras de
este tamaño?

En este tipo de ejercicios, generalmente nos dan información de una variable (aumento de peso, en g, de
un cobayo, X ) y nos piden resolver cálculos de probabilidad para esa variable, o para la variable
promedio (aumento de peso medio o promedio (en g) de 16 cobayos, X16 ). Las distribuciones de estas
dos variables aleatorias son: X ~N 105;110,25 X16 ~N 105;6,89062

47
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

En los gráficos siguientes se representa sendas muestras aleatorias de tamaño 10.000 cada una, a la
izquierda la distribución del aumento de peso en un cobayo, y a la derecha la de aumento de peso medio
o promedio de 16 cobayos.

PESO PESO MEDIO

La distribución de la media muestral tiene una varianza menor que la de la variable original, lo que se ve
reflejado claramente en los gráficos anteriores, aunque coinciden en la media. Entonces, es importante
elegir correctamente la distribución sobre la cual se realizarán los cálculos de probabilidades. Si la pre-
gunta se refiere a un individuo, el cálculo de probabilidad se realizará con la distribución de la variable
; en cambio, si la misma se refiere al promedio, entonces se empleará la distribución
del promedio de la muestra, en este caso X16 ~N 105;6,890625 donde el 6,890625 proviene de

SOLUCIÓN
a) En este caso estamos calculando la probabilidad de que un cobayo pese 104 g o más (al menos 104
g), nos interesa la distribución de X . Entonces se procede:

Entonces, buscamos en la tabla de la distribución normal estándar aproximando –0,095 a –0,1 y obtenemos:

Un cobayo de la muestra tendrá un aumento de peso de al menos 104 g con una probabilidad de 0,54.

b) En este caso nos preguntan sobre el aumento de peso medio (o promedio) de los cobayos de una
muestra de tamaño 16, entonces se debe usar la distribución de X16 .
 106  105 
P  X16  106  P  Z   P  Z  0,38  0, 6480
 10,5  

  
 
  16  

La probabilidad de que el promedio de los individuos de una muestra de tamaño 16 sea menor que 106 g es
igual a 0,65.

c) Se quiere saber qué valor no será superado, con una probabilidad 0,95, por un cobayo tomado al azar. En
este caso interesa la distribución X , entonces, por un lado sabemos que:
 x  105 
P  X  xi   0, 95  P  Z  i  0, 95
 10, 5 

48
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

 
Por el otro, en la distribución normal estándar P Z  z0,95  0,95 , sabemos que z0,95 = 1,64; entonces
xi 105
igualando z0,95 con , y despejando xi de dicha igualdad, 1,64  xi 105 , se obtiene el valor de xi .
10,5 10,5
xi  105 1,64 10,5  122,22 g.
El valor del aumento de peso que no será superado por el 95% de los cobayos, es 122,2 g.

d) Esta pregunta, aunque similar a la anterior, se refiere al valor de aumento de peso medio de una
muestra de tamaño 16, entonces, empleamos la distribución de X16 .
 x  105 
P  X 16  xi   0,95  P  Z  i  0,95
10,5 
 
 16 
xi 105
Al igual que antes, igualando z0,95 con , y despejando xi se obtiene la solución:
10,5 16
xi  105 1,64  2,625  109,305 g.

El valor del aumento medio de peso que no será superado por el 95% de los cobayos en muestras de
tamaño 16 es 109,3 g.

Nota: la solución en d) está más cerca de la media de su distribución que la solución en b) de la suya, aunque ambas
soluciones representen desde el punto de vista probabilístico lo mismo.

49
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

PROBLEMAS PROPUESTOS
EJERCICIO 1) Clasificar las siguientes variables en CUALITATIVAS (NOMINALES u ORDINALES) o
CUANTITATIVAS (DISCRETAS o CONTINUAS) y nombrar de cada una la unidad de observación
a) Peso, en g, de pelo esquilado a un conejo de Angora.
b) Cantidad de lámparas de 40 W fabricadas en un día de trabajo.
c) Valor calórico de la grasa de la leche de una vaca.
d) Tiempo de incubación del sarampión en una persona, en días.
e) Color de ojos de un niño de 10 años nacido en la Provincia de Córdoba.
f) Color de pelaje en un equino.
g) Número de insectos de Trifolium repens, encontrados por parcela.
h) Cantidad de caninos de raza Bóxer con linfosarcoma multicéntrico por distrito, en la Provincia de
Buenos Aires.
i) Efecto de una droga en un canino.
j) Número de cachorros nacidos por camada.
k) Número de llamados telefónicos que recibe una central telefónica por mes.
l) Alzada de un caballo del haras "La Biznaga".
m) Color de una rosa.
n) Circunferencia torácica de un lechón recién parido, expresado en cm.
o) Cantidad de tornillos producidos en ocho horas de trabajo.
p) Volumen de nafta despachada por una compañía petrolera en una semana.
q) Nivel educacional alcanzado por un individuo.
r) Número de errores cometidos por un estudiante en un examen de elección múltiple.
s) Distancia recorrida por un neumático de un vehículo, hasta el primer pinchazo.
t) Nacionalidad de un individuo.
u) Rendimiento de maíz en un campo determinado en la Provincia de Buenos Aires.
v) Número de niños nacidos en un hospital el primer día del año.

EJERCICIO 2) En veintiséis tambos se registró, en el año 1988, la cantidad de partos distócicos en la


raza Holando Argentino, obteniéndose los siguientes datos:
4 3 5 7 4 2 1 0 6 3 5 6 3
0 3 1 2 1 3 6 0 4 3 2 1 2

a) Ordenar los datos en una tabla de frecuencias.


I. ¿Cuál es la unidad de observación?
II. Interpretar el par (x5 ; f5)
III. Interpretar el par (x3 ; H3)
b)
i) Construir los gráficos para frecuencias absolutas simples y
acumuladas. ¿Es simétrica la distribución de la variable en
esta muestra?
ii) Analizar el gráfico de caja (Box Plot)
c) Calcular media aritmética, mediana y modo. Compare los re-
sultados obtenidos con la asimetría propuesta en b)
d) Calcular el percentil 24 e interpretar en términos del problema.
e) Calcular varianza, desviación estándar y coeficiente de variación.

EJERCICIO 3) Los siguientes datos corresponden a la medición en sangre de GPT (glutámico pirúvico
transaminasa, enzima que demuestra toxicidad hepática) en felinos sometidos a una dosis tóxica mínima
de un nuevo antiparasitario externo:

[ ; ) 16,3-21,5 21,5-26,7 26,7-31,9 31,9-37,1 37,1-42,3


fi 1 5 5 9 5

Utilizando la información dada en la tabla:


a) Interpretar H2, F4, y h3.
b) ¿Cuál es la unidad de observación?

50
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

c) Representar gráficamente. ¿Cómo clasifica la distribución de la variable?


d) Calcular media aritmética, modo y mediana.
e) Calcular varianza, desvío estándar y C.V.

EJERCICIO 4) En un estudio de precios de un grupo de alimentos se obtiene la media aritmética y des-


viación estándar para cada uno de ellos, expresados en unidad monetaria por kilogramo de producto.

Alimento Media A. Desvío


Manteca 80 7
Arroz 110 15
Lechuga 50 6
Zanahoria 30 6
Chaucha 350 50

a) Entre todos los alimentos considerados, ¿a cuál le corresponde la mayor variación relativa? ¿Y la
menor variación absoluta?
b) Entre los vegetales considerados, ¿cuál presenta la menor variación relativa? ¿y la mayor varia-
ción absoluta?

EJERCICIO 5) A continuación se presenta la media aritmé- Materias Media A. C. V.%


tica y el coeficiente de variación de las calificaciones obte-
nidas por 50 alumnos: Salud Pública 6,5 31
Estadística 5,8 29
a) ¿Qué materia presenta la mayor variación relativa?
¿Cuál la menor? Anatomía 4,2 74
b) ¿Qué materia presenta la mayor variación absoluta?
Histología 5,3 68

EJERCICIO 6) Luego de aplicar a un grupo de ani-


males un tratamiento con insulina se midió la gluce-
mia (en mg %) a cada uno obteniéndose:

a) Indicar cuál es la variable.


b) ¿Cuál es la unidad de observación?
c) ¿Cuál es el tamaño de la muestra?
d) Calcular la media aritmética, la desviación están-
dar
e) Opinar sobre la distribución de la muestra en tér-
minos del problema.

EJERCICIO 7) Los siguientes datos corresponden a los diámetros car-


Intervalos frecuencias
díacos, en mm, medidos en radiografías de tórax de 100 adultos nor-
80,5 - 90,5 8
males:
a) Definir la variable y clasificarla. 90,5 - 100,5 15
b) La población en estudio es .................................................. 100,5 - 110,5 21
c) La unidad de observación es ............................................... 110,5 - 120,5 23
d) Completar la tabla de distribución de frecuencias y realizar los gráfi- 120,5 - 130,5 16
cos correspondientes a las fi y Hi. 130,5 - 140,5 9
e) Interpretar f2, F5, h4 y H6 140,5 - 150,5 8
f) Calcular la media y la varianza.
g) Determinar los intervalos mediana y modal, y calcular las medidas correspondientes a cada uno.
h) Comparando los valores de las medidas de posición, ¿podemos concluir que la distribución es simétri-
ca?

51
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

EJERCICIO 8) Se evaluaron 4 dosis de Nitrógeno, N, (0, 30, 60 y 90 kg/ha) en parcelas de trigo, en las
que se midió el rendimiento obtenido expresado en kg/ha. A continuación, se presentan los diagramas de
caja correspondientes a cada tratamiento.

a) Para el tratamiento testigo (0 kg N) indique aproximadamente los valores de rendimiento medio y


percentiles 25% y 75%.
b) ¿En qué tratamiento resultó mayor la variabilidad? Justifique.
c) ¿Puede decir qué dosis de N fue la que arrojó el mayor rendimiento promedio? Justifique.
d) A partir de la comparación de los valores de media y mediana ¿cuál/es de los tratamientos pre-
sentan asimetría positiva?

EJERCICIO 9) Para estudiar las palabras usuales, usted necesita una muestra de las páginas tomadas
de un libro dado. Diseñe brevemente un procedimiento de muestreo que pudiera usar. ¿Qué haría usted
con las páginas que tienen grabados sobre ellas o con aquellas que están llenas sólo parcialmente?

EJERCICIO 10) En un estudio sobre parasitismo un grupo de investigadores registra la cantidad de hue-
vos por nido parasitados en 1700 nidos. Los datos se registran en la siguiente tabla:

N° de huevos N° nidos con x n°


parasitados por nido de huevos parasitados
11 52
12 820
13 572
14 215
15 41

a) Definir la variable en estudio y clasificarla.


b) Calcular media, varianza, modo y cuartiles.
c) Interpretar f4 y H4
d) Realice los gráficos correspondientes
e) ¿Cuál es el número de huevos parasitados por nidos alcanzado por el 66 % de la muestra?
f) ¿Cuál es la probabilidad de seleccionar un nido al azar y que este tenga al menos 13 huevos pa-
rasitados?
g) ¿Cuál es la probabilidad de seleccionar dos nidos al azar y que el primero tenga 13 huevos para-
sitados y el segundo 15?
h) Sabiendo que seleccionamos un nido que se encuentra dentro de los dos primeros cuartiles,
¿cuál es la probabilidad de que tenga 11 huevos parasitados?

52
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

EJERCICIO 11) Se conocen los pesos al destete (X) de 15 lechones (en Kg) de cada una de dos granjas
diferentes (granja A y granja B).

Peso al destete de la granja A(Xa) 7,5 6,4 7,1 2,9 4,6 9,4 7,5 6,8 3,9 4,1 4,6 5,2 6,8 5,2 6,4
Peso al destete de la granja B(Xb) 5,1 3,9 4,3 7,03 4,6 5,7 6,4 4,9 3,8 5,9 6,2 3,8 5,7 4,7 5,3

a) Definir las variables en estudio y clasificarlas.


b) ¿Cuál es/son la/s poblaciones en estudio? ¿Y la/las muestras observadas?

Con InfoStat® armamos los siguientes histogramas:

Y obtuvimos los siguientes resultados resumen


Estadística descriptiva
Variable n Media D.E. Var(n-1) CV Mín Máx Mediana Q1 Q3
Xa 15 5,89 1,72 2,97 29,22 2,9 9,4 6,4 4,6 7,1
Xb 15 5,16 1 1 19,37 3,8 7,03 5,1 4,3 5,9
c) Indicar, con sus correspondientes unidades, todas las medidas de tendencia central que correspon-
dan para ambas muestras.
d) Indicar, con sus correspondientes unidades, todas las medidas de variabilidad que correspondan para
ambas muestras.
e) Comparar las dos muestras usando los resultados de c) y d).
f) ¿Qué porcentaje de lechones en la muestra de la granja A tiene un peso al destete superior a 6 Kg?
¿Y de la Granja B? ¿Y si juntamos ambas muestras, qué porcentaje de lechones tienen un peso al
destete superior a 6 Kg?
g) Si se tiene el dato de que el peso al destete de un lechón de la granja A sigue una distribución normal
2
con media 5,5 Kg y varianza 2,25 Kg . ¿Cuál es la probabilidad de que un lechón de la granja A tenga
al destete un peso superior a los 6 Kg?
h) Se tiene el dato de que la probabilidad de que un lechón de la granja B tenga un peso mayor a 5,5 Kg
es 0,4. Si se toman 8 lechones al azar de la granja B, ¿cuál es la probabilidad de que todos tengan
un peso mayor a 5,5 Kg? ¿Y la probabilidad de que más de la mitad tenga un peso mayor a 5,5 Kg?
EJERCICIO 12) Se realizó un experimento con lechones híbridos, criados en sistema extensivo (al aire
libre en piso de tierra) en la provincia de Buenos Aires, para analizar la ganancia diaria de peso, en gra-
mos. El objetivo final de este experimento es poder comparar esta variable con la correspondiente a le-
chones criados en sistema intensivo (en piso de concreto). De los primeros se obtuvieron los siguientes
resultados:
xi [0;50) [50;100) [100;150) [150;200) [200;250]
Fi 1 4 9 15 16

a) Definir y clasificar la variable de interés.


b) Interpretar h3 y F4

53
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

c) Calcular el modo, la mediana y la media. ¿Se puede decir que la distribución es simétrica?
d) ¿Cuál es el aumento de peso no alcanzado por el 25% de los lechones?
e) Si se espera que dicha ganancia de peso aumente en un 15%, ¿cómo se vería afectada la me-
diana? ¿Y la varianza? Justifique utilizando propiedades.
f) Si se supone que la variable se distribuye normalmente, con media 180 g y desvío estándar 15 g,
¿cuál es la probabilidad que la ganancia de peso medio de los lechones supere los 182 g en una
muestra de 40?

EJERCICIO 13) La distribución del tiempo de respuesta obtenido en la aplicación de prostaglandinas a hem-
bras caninas preñadas entre 35 y 55 días es normal con media 60 horas y con desvío de 15 horas.
a) Definir la variable en estudio
b) Detallar su distribución
c) 1) ¿Cuál es la probabilidad de obtener la reacción luego de 50 horas?
2) ¿Cuál es la probabilidad de obtener la reacción antes de 30 horas?
3) ¿Cuál es la probabilidad de obtener la reacción entre 30 y 60 horas?
4) ¿Cuál es la probabilidad de obtener la reacción luego de 90 horas?
5) ¿A partir de qué tiempo la probabilidad de obtener reacción es del 30%?
d) Si se toma una muestra de 16 hembras preñadas, ¿cuál es la probabilidad de que, en promedio,
tengan la reacción:
1) luego de 50 horas?
2) antes de 30 horas?
3) entre 30 y 60 horas?
4) luego de 90 horas?
5) ¿A partir de qué tiempo medio, la probabilidad de obtener reacción es del 30%?

EJERCICIO 14) La altura de las plantas de una población de Trébol Rojo a las 5 semanas de ser planta-
das se distribuye normalmente con media 3,2 cm y desvío estándar 1,8 cm.
a) ¿Cuál es la probabilidad de que una de dichas plantas a las 5 semanas mida más de 3,5cm?
b) ¿Qué altura es alcanzada por el 20% de las plantas?
c) Si se toma una muestra de 3 plantas, ¿cuál es la probabilidad de que las tres tengan altura superior
a 3,5cm?
d) Si se toma una muestra de 20 plantas:
i. ¿Cuál es la probabilidad de que la media sea superior a 3,3cm?
ii. El resultado de la probabilidad calculada en el punto anterior, ¿es exacto o aproximado?
e) Si se toman muestras de 50, ¿qué altura media es superada por el 15% de las muestras?

54
Elementos de Estadística 2020- 1er Cuatrimestre Fac. Cs. Veterinarias (U. B. A.)

CUESTIONARIO
1) Corrija, en caso de ser necesario, las negritas de las siguientes afirmaciones de modo tal que siempre
resulten verdaderos:
i.- La media aritmética se obtiene ordenando los datos y no es influenciada por valores extremos.
ii.- La varianza es una medida de variación relativa porque permite comparar la dispersión de muestras
de distintas variables.
iii.- La media aritmética de una variable puede ser negativa.
iv.- El polígono de frecuencias se utiliza para graficar frecuencias absolutas y relativas simples cuando
la variable es continua.
v.- Las unidades de la varianza coinciden con las de la variable en estudio.
vi.- Las unidades del coeficiente de variación son las mismas para cualquier variable.

2) ¿Puede ser que en una muestra coincidan numéricamente la media aritmética y la varianza? Justifi-
que y/o ejemplifique.
3) ¿Está de acuerdo con la siguiente afirmación? “Si todos los valores de una variable con desviación
estándar 30 se aumentan un 30%, entonces la varianza de la nueva variable es 1521”. Justifique su res-
puesta.
4) En una distribución asimétrica positiva la mediana es numéricamente ............................ que la media.
5) ¿Cómo se representa F(x) para una variable discreta? ¿Por qué?
6) Haga un círculo en V (“Verdadero”) o F (“Falso”) según corresponda:
a) V F Los histogramas de todas las distribuciones muestrales siempre tienen forma simétrica.
b) V F Las frecuencias relativas están expresadas en las mismas unidades que la de la unidad
de observación.
c) V F La media aritmética es una medida influenciada por valores extremos.
d) V F El coeficiente de variación es útil para comparar valores promedios.
7) ¿Cuántos valores son necesarios para construir un boxplot? ¿Cuáles?
8) ¿Puede ser una distribución simétrica y que presente varios outliers grandes? Justifique.
9) ¿Es posible estudiar la simetría de la distribución de una variable a partir del grafico de histograma de
la misma? Justifique.
10) Si la distribución de una variable es asimétrica negativa, entonces cuando uno se mueve de menos
infinito a más infinito se encuentra con ....................... , ................................., y modo.
11) Dé dos razones válidas para justificar un muestreo en lugar de un censo para obtener información de
una población.
12) Se sabe que una máquina produce piezas defectuosas periódicamente y para testear su
funcionamiento se selecciona cada 15 minutos la última pieza producida. ¿Qué tipo de muestreo se
aplicó? ¿Le parece adecuado en este caso? ¿Por qué? Indique las posibles conclusiones de este
muestro.
13) Para elegir en una región 1000 personas expuestas a un factor de contaminación ambiental (agua,
químicos, desechos tóxicos, etc.) es más fácil seleccionar al azar localidades, y dentro de ellas a las
personas. ¿Cuál sería el muestreo más adecuado para este caso?
14) Se quiere analizar la producción, medida en Tm/Ha, de maíz en una región productora de dicho ce-
real. Se sabe que algunas zonas tienen riego artificial y otras no, y que en algunas se emplean fertilizan-
tes y en otras no. Indique:
a) qué muestreo le parece más adecuado para una estimación correcta:
i. Muestreo aleatorio simple
ii. Muestreo estratificado
iii. Muestreo por conglomerados
iv. Muestreo sistemático
b) ¿Cómo seleccionaría una muestra en el muestreo que haya elegido?

55

También podría gustarte