Está en la página 1de 121

CARLOS HERNÁN SARAZA NARANJO

ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA

UNISARC

SANTA ROSA DE CABAL


2018
2 CARLOS HERNAN SARAZA NARANJO

TABLA DE CONTENIDO

Pág.

INTRODUCCIÓN 6
UNIDAD I. DEFINICIONES GENERALES 8
INTRODUCCIÓN 8
1.1 Definición de estadística 9
1.2 Población 9
1.3 Muestra 9
1.4 Variable 10
1.5 Notación con subíndices 12

UNIDAD II. DISTRIBUCIÓN DE FRECUENCIAS 13

INTRODUCCIÓN 13

2.1 Distribución de frecuencias. Definición 13

2.2 Distribución de frecuencias para variable discreta 14

2.2.1 Frecuencia absoluta 14

2.2.2 Frecuencia absoluta acumulada 15


2.2.3 Frecuencia relativa 15
2.2.4 Frecuencia relativa acumulada 15
2.3 Distribución de frecuencias para variable continua 17
2.3.1 Marcas de clase 21
2.3.2 Frecuencia absoluta 22
2.3.3 Frecuencia absoluta acumulada 22
2.3.4 Frecuencia relativa 23
2.3.5 Frecuencia relativa acumulada 23
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 3

2.4 Distribución de frecuencias para un estudio de variable cualitativa 26

UNIDAD III. REPRESENTACIÓN GRÁFICA 30

INTRODUCCIÓN 30

3.1 Condiciones generales de los gráficos 31


3.2 Histograma 32
3.3 Polígono de frecuencias 32
3.4 Gráfico circular 33
3.5 Ojivas 34
3.5.1 Ojiva mayor que 34
3.5.2 Ojiva menor que 35

UNIDAD IV. MEDIDAS DE CENTRALIZACIÓN 37

INTRODUCCIÓN 37

4.1 Notación sumatoria 38


4.2 Medidas de centralización 38
4.2.1 Media aritmética 38
4.2.1.1 Media para datos con frecuencias 39
4.2.1.2 Media para datos agrupados en intervalos 41
4.2.1.3 Propiedades de la media 42
4.2.2 Media geométrica 47
4.2.2.1 Cálculo de la media geométrica para datos sin frecuencias 47
4.2.2.2 Cálculo de la media geométrica para datos con frecuencias 48
4.2.2.3 Cálculo de la media geométrica utilizando logaritmos 48
4.2.3 Media armónica 50
4.2.3.1 Cálculo de la media armónica para datos sin frecuencias 50
4 CARLOS HERNAN SARAZA NARANJO

4.2.3.2 Cálculo de la media armónica para datos con frecuencias 51

4.2.4. Mediana 52
4.2.4.1 Cálculo de la mediana para datos que no están en intervalos 52
4.2.4.2 Mediana para datos agrupados en intervalos 54

4.2.5 Cuartiles 56
4.2.5.1 Cálculo de los cuartiles 56
4.2.6 Deciles 56
4.2.6.1 Cálculo de los deciles 57
4.2.7 Percentiles 57
4.2.7.1 Cálculo de los percentiles 58
4.2.8 Moda 59
4.2.8.1 Moda para datos agrupados en intervalos 60
4.2.9 Uso de las medidas de centralización 61
UNIDAD V. MEDIDAS DE DISPERSIÓN 64

INTRODUCCIÓN 64

5.1 Definición: medidas de dispersión 64


5.2 Rango 64
5.3 Desviación media 65
5.4 Varianza 67
5.4.1 Propiedades de la varianza 70
5.5 Desviación estándar 72
5.5.1 Interpretación de la desviación estándar 75
5.5.1.1 Campana de Gauss 75
5.5.1.2 Teorema de Tchebysheff 78
5.6 Coeficiente de variación 81
5.6.1 Cálculo del coeficiente de variación 81
5.7 Análisis de dispersión 84
5.7.1 Momentos con respecto a la media 84
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 5

5.7.2 Sesgo 85
5.7.2.1 Coeficiente de sesgo 86
5.7.3 Curtosis 87
5.7.3.1 Coeficiente de curtosis 88
UNIDAD VI. TÉCNICAS DE CONTEO 90
INTRODUCCIÓN 90
6.1 Regla de la potencia 90
6.2 Regla de la multiplicación 91
6.3 Número factorial 92
6.4 Permutación 92
6.5 Combinación 93
6.6 Cálculos sistematizados 94
6.6.1 Cálculo de medidas estadísticas utilizando calculadora
CASIO FX-82 95
6.6.2 Calculo de medidas estadísticas utilizando EXCEL 96
GLOSARIO 99
BIBLIOGRAFÍA 101
TALLER UNIDAD I 102
TALLER UNIDAD II 104
TALLER UNIDAD III 109
TALLER UNIDAD IV 111
TALLER UNIDAD V 114
TALLER UNIDAD VI 119
6 CARLOS HERNAN SARAZA NARANJO

INTRODUCCIÓN

El manejo de información resulta importante para todo profesional en la búsqueda


de ampliar las posibilidades de aplicar los conocimientos al desarrollo de la ciencia
propia de su desempeño. Los avances de la ciencia se facilitan cuando los
resultados se sustentan en argumentos comprobables a través de nuevos ensayos
y de conclusiones que permitan determinar, en contexto, cuándo, dónde y en qué
condiciones es posible llevarlos a campo.

Los argumentos que requieren los resultados de las investigaciones están


relacionados con un buen trabajo de campo, pero también con la confiabilidad de
las conclusiones obtenidas a través de este. La estadística constituye el medio
expedito para dar sustento a las conclusiones derivadas de los trabajos de
investigación. Por medio de esta área de estudio es posible obtener muestras
representativas de una población para iniciar el análisis de las variables que han
sido definidas de importancia para los objetivos trazados.

Una buena muestra se constituye en elemento fundamental de la confiabilidad de


los resultados, entendiendo que resulta impracticable la posibilidad de trabajar con
todos los elementos de la población. A través de los resultados obtenidos en la
muestra es posible obtener conclusiones del comportamiento que tendrá la
población. Para ello la estadística se vale de técnicas tales como el manejo de las
probabilidades, la estimación de parámetros, la formulación y comprobación de
hipótesis, la regresión y la correlación.

De esta manera la estadística hace presencia en todos los campos del saber, su
aporte avanza desde sencillas aplicaciones relacionadas con la interpretación de la
información y la elaboración de gráficos hasta la obtención de conclusiones
relacionadas con estudios de mercado, proyección de compras y ventas, análisis de
comportamientos futuros, análisis de diferencias significativas entre tratamientos
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 7

(manejo de diferentes materias primas, insumos, comportamiento e incidencia de la


temperatura, optimización de procesos, entre otros).

La era moderna ha sido bien llamada la de la información al punto de afirmarse sin


mayor riesgo de equívoco que quien tiene la información tiene una riqueza
inconmensurable. En el manejo de la información la estadística ocupa primerísimos
lugares como excelente complemento para argumentar con cifras las observaciones
derivadas de trabajos de campo.

Bienvenidos, entonces, al fascinante mundo de la estadística que está por descubrir


para quienes apenas llegan a su morada, o para servir como estimulante
complemento a los que ya han incursionado por ella. Los ejemplos se han
estructurado con casos simulados relacionados con la zootecnia y con las variables
que la rodean de tal manera que sea más agradable, para quienes están
interesados en el área, acceder a los conocimientos que a lo largo del libro se
desarrollan.

El libro condensa contenidos relacionados con la estadística descriptiva, elemento


fundamental en la tarea de facilitar el proceso de análisis de conjuntos de datos y
de resultados obtenidos de estos.
8 CARLOS HERNAN SARAZA NARANJO

UNIDAD I

DEFINICIONES GENERALES

INTRODUCCIÓN

La estadística se constituye, cada día más, en herramienta indispensable para todos


los profesionales de cualquiera de las diferentes ramas del conocimiento. Se utiliza
la estadística en derecho, en medicina, en contaduría, en sociología, en psicología,
en ingeniería, en administración, en las labores productivas, en fin, en todas las
carreras profesionales.

Los datos estadísticos son herramientas que permiten tomar decisiones a presente
y a futuro en las pequeñas, en las medianas y en las grandes empresas. Unas y
otras, con mayor o menor profundidad, se apoyan en datos históricos o presentes
para decidir los momentos actuales y los que vendrán luego de cierto período de
tiempo.

En este capítulo se definen algunos términos que resultan indispensables para


comprender el proceso estadístico y para obtener de él resultados veraces y
confiables. Los conceptos generales hacen referencia a marcar los límites a los que
se quiere llegar con el trabajo estadístico.
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 9

1.1 Definición de estadística

Rama de la matemática que se ocupa de la selección, ordenación, clasificación y


análisis de un conjunto de datos con el fin de sacar conclusiones sobre él o de
obtener conclusiones de un grupo mayor de datos.

Cuando la estadística se ocupa de obtener conclusiones sobre el conjunto de datos


analizado, se denomina estadística descriptiva, cuando por el contrario la
estadística se ocupa de obtener conclusiones sobre un conjunto mayor de datos, se
denomina estadística inferencial.

Por ejemplo, si durante una inspección a un lote de 500 bovinos se analizan 45


animales con el objetivo de observar el peso y con los datos se obtienen
conclusiones acerca de lo que ocurre con los 45 bovinos, estamos ubicados en el
campo de la estadística descriptiva; si con el dato que se obtiene de la
observación de los 45 animales se concluye cuál es el peso que alcanzan los 500
animales, hemos pasado al campo de la estadística inferencial.

1.2 Población

Es todo conjunto de datos del cual se quiere realizar un estudio. Por ejemplo: se
quiere realizar un estudio referente al diámetro de huevos producidos en la finca
Naturalia. Entonces la población son todos los huevos que se producen en la finca
Naturalia. El tamaño de la población se nota N.

Por ejemplo, si en la finca Naturalia se producen 1800 huevos, entonces N=1800

1.3 Muestra
10 CARLOS HERNAN SARAZA NARANJO

Es todo subconjunto tomado de una población de tal manera que pueda ser
representativo de esta. Por ejemplo: una muestra de huevos de la finca Naturalia.
El tamaño de la muestra se nota n.

Por ejemplo, si en la finca Naturalia se decide hacer el estudio de los diámetros de


huevos midiendo el diámetro de 40 huevos, entonces n=40.

Aunque un estudio sería más confiable tomando todos los datos de la población, en
la mayoría de los casos esto resulta imposible por la dificultad del estudio, así como
por los costos. Entonces el estadístico generalmente trabaja con muestras.

Si regresamos a la clasificación de la estadística con al ánimo de precisar


diferencias se tiene que la estadística descriptiva analiza los resultados de una
muestra y toma decisiones acerca de estos resultados. La estadística inferencial
se apoya en los resultados aportados por la muestra para obtener conclusiones
acerca de lo que puede estar ocurriendo en la población de la cual fue extraída la
muestra.

1.4 Variable
Es toda cantidad que puede tomar diferentes valores en un estudio. Por ejemplo: el
número de huevos recolectados por día en las fincas del eje cafetero; el valor de los
jornales asignados a los trabajadores de las fincas; las variedades de pastos que
se cultivan en una región; la temperatura diaria que se registra en una hacienda
ganadera.

Una cantidad que no es variable se


llama constante

Las variables se pueden clasificar en dos tipos: cualitativas o cuantitativas.


ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 11

Una variable cualitativa es aquella que estudia cualidades presentes en los


elementos de una muestra, por ejemplo: tipos de huevo (C, B, A, AA); razas de los
animales presentes en una región; color preferido para las paredes de establos.

Las variables cualitativas pueden ser nominales u ordinales. Una variable


cualitativa nominal es aquella que observa cualidades de los elementos de la
muestra que no pueden ser ordenados de manera alguna, por ejemplo: el color de
las aves, las razas de conejos que se producen en Colombia.

Una variable cualitativa ordinal es aquella que observa cualidades de los


elementos de la muestra que responden a un orden establecido, por ejemplo:
estrato social de las familias de un municipio, los tipos de huevos que se recolectan
en la finca Miracampos.

Una variable cuantitativa es aquella que estudia cantidades referentes a los


elementos en una muestra, por ejemplo: cantidad de cerdos nacidos por mes, peso
de los conejos en una finca.

Las variables cuantitativas pueden ser de dos tipos: discretas y continuas. Una
variable cuantitativa es discreta cuando resulta de hacer conteos, de esta manera
solo puede tomar valores enteros, por ejemplo: el número de quesos fabricados por
semana, el número de empleados en la empresa Agroprocesados.

Una variable cuantitativa es continua cuando resulta de hacer mediciones, este tipo
de variable puede tomar cualquier valor, entero o decimal, por ejemplo, el peso de
las vacas lecheras de la finca Cantabria, el valor de los insumos requeridos para la
dotación de bebederos.

En resumen, las variables se clasifican como se muestra en la figura No. 1

VARIABLES

CUALITATIVA CUANTITATIVA

Nominal Ordinal Discreta Continua

No clasifica Clasifica Cuenta Mide

Estrato social; tamaño


Color, raza, sexo (pequeño, mediano, Cantidad de Peso de conejos
grande) trabajadores
Figura No. 1. Clasificación de las variables contratados por finca
12 CARLOS HERNAN SARAZA NARANJO

1.5 Notación con subíndices

El símbolo Xi se lee equis sub i, representa el valor i-ésimo que toma una variable
en una muestra. Así, por ejemplo, el símbolo X3 representa el tercer dato de la
variable en la muestra. Es necesario aclarar que los subíndices no representan
mayor o menor valor, solo indican ubicación.

Ejemplo, se pregunta a cinco trabajadores de la empresa Alimentos del Café acerca


del número de hijos que tienen:

El primer trabajador encuestado es Rafael quien afirma que tiene 5 hijos; Alberto
responde que tiene 6 hijos; Teresa dice que tiene 4 hijos; Oscar responde que tiene
7 hijos y Mariela afirma que tiene 3 hijos.

Entonces se escribe que X1=5 X2=6 X3=4 X4=7 X5=3


ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 13

UNIDAD II
DISTRIBUCIÓN DE FRECUENCIAS

INTRODUCCIÓN

El trabajo estadístico requiere orden y estética. Esta condición exige que la persona
encargada de manejar datos estadísticos tenga habilidad para ordenar conjuntos de
datos y para clasificarlos en tablas que permitan resumir la información.

La habilidad para construir tablas se adquiere por medio de ejemplos basados en


una teoría que los guía y que les da la forma que cada aplicación requiere. Sin
embargo, más allá de la construcción de una tabla está la capacidad para interpretar
la información que se encuentra en ella de tal manera que sea posible obtener
conclusiones acerca de la muestra analizada.

En la presente unidad se trabajan los conceptos de tablas de distribución de


frecuencias para variable discreta y para variable continua. Igualmente se introduce
un ejemplo de una distribución para variable cualitativa.

Cada concepto tratado se ilustra con ejemplos aplicados a diferentes situaciones


relacionadas con la zootecnia.

2.1. Distribución de frecuencias

Definición

Una distribución de frecuencias es un cuadro que permite resumir, ordenar y


clasificar los datos de una muestra con el fin de facilitar su estudio. Por tener algunos
elementos diferentes, se hace referencia primero a la distribución de frecuencias
para variable discreta y después a la distribución para variable continua. Con el fin
14 CARLOS HERNAN SARAZA NARANJO

de facilitar la comprensión de los procedimientos que se siguen para la construcción


de las distribuciones, los conceptos se ilustran con un ejemplo.

2.2 Distribución de frecuencias para variable discreta

Los siguientes datos corresponden a una muestra del número de huevos


recolectados, durante un día, en 24 galpones de la finca La Morelia.

142 145 140 142 143 144 142 145 140 148 138 146
144 143 138 140 142 147 144 140 142 145 138 140

Se pide construir la distribución de frecuencias correspondiente.

El primer paso de la construcción consiste en ordenar los datos de la muestra; la


ordenación queda así:

138 138 138 140 140 140 140 140 142 142 142 142
142 143 143 144 144 144 145 145 145 146 147 148

Los datos, que constituyen la variable de estudio, se notan Xi, con ellos se construye
la distribución de frecuencias para lo cual se definen a continuación cuatro tipos de
frecuencias: frecuencia absoluta, frecuencia absoluta acumulada, frecuencia
relativa y frecuencia relativa acumulada

2.2.1 Frecuencia absoluta

Se simboliza fi. Se define como el número de veces que se repite cada valor de la
variable. La suma de las frecuencias absolutas es igual a n. (Tabla No. 1)
2.2.2 Frecuencia absoluta acumulada
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 15

Se simboliza Fi. Se define como el número acumulado de elementos de la muestra


que son menores o iguales que el dato correspondiente. Se obtiene sumando
sucesivamente la columna de frecuencias absolutas. La última frecuencia absoluta
acumulada es igual a n. (Tabla No. 1)

2.2.3 Frecuencia relativa

Se simboliza hi. Es el peso relativo, es decir, la importancia, que cada frecuencia


absoluta tiene con relación al tamaño de la muestra. Se expresa en decimales o en
porcentajes.

Se obtiene dividiendo cada frecuencia absoluta entre n; si el valor se desea en


porcentaje, el cociente obtenido se multiplica por cien. La suma de frecuencias
relativas es igual a 1 o a 100%. (Tabla No. 1)

fi
hi  .100
n

2.2.4 Frecuencia relativa acumulada

Se simboliza Hi. Es el peso relativo que cada frecuencia absoluta acumulada tiene
con relación al tamaño de la muestra. Se obtiene dividiendo cada frecuencia
absoluta acumulada entre n. En forma práctica se obtiene sumando sucesivamente
la columna de frecuencias relativas. La última frecuencia relativa acumulada es igual
a 1 o a 100%. (Tabla No. 1).

Con base en las definiciones dadas para cada tipo de frecuencias, se obtiene la
distribución de frecuencias que se observa en la tabla No 1.
16 CARLOS HERNAN SARAZA NARANJO

Tabla No. 1.

NÚMERO DE HUEVOS RECOLECTADOS EN UN


DÍA – GALPONES FINCA LA MORELIA
Xi fi Fi h i% Hi%
138 3 3 12,50 12,50
140 5 8 20,83 33,33
142 5 13 20,83 54,16
143 2 15 8,33 62,49
144 3 18 12,50 74,99
145 3 21 12,50 87,49
146 1 22 4,17 91,66
147 1 23 4,17 95,83
148 1 24 4,17 100,00
n=24

INTERPRETACIÓN DE LA TABLA
A continuación se formulan algunas preguntas referentes a la tabla, cada una con
su respuesta correspondiente, trate de resolver los enunciados antes de consultar
las respuestas:

1. ¿En cuántos galpones se recolectaron 145 huevos?.

2. ¿Cuál es el porcentaje de galpones en los que se recolectaron por lo menos 144


huevos?.

3. Halle el valor e interprete f6; F3; h4; H5.

4. ¿Cuál fue el menor número de huevos reportado?.

5. ¿Cuál fue el número de huevos más se presentó en la muestra?.

RESPUESTAS

1. Se pregunta por la frecuencia absoluta correspondiente a x6=145. La respuesta


es 3 galpones.
2. Se pregunta por el porcentaje correspondiente a las xi mayores o iguales que
144. En la tabla corresponde a la suma de las frecuencias relativas desde la h5
hasta la última frecuencia relativa. La respuesta es 37,51%.
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 17

3. f6 = 3 En 3 galpones se recolectaron 145 huevos.


F3 = 13 En 13 galpones se recolectaron entre 138 y 142 huevos.
h4 = 8,33% En el 8,33% de los galpones se recolectaron 143 huevos.
H5 = 74,99% En el 74,99% de los galpones se recolectaron entre 138 y 144
huevos.
4. El menor número de huevos encontrado fue 138.
5. El número de huevos que más se presentó en la muestra fue 140 y 142 huevos.
Apareció en 5 galpones (mayores frecuencias absolutas).

2.3 Distribución de frecuencias para variable continua

Cuando la variable es continua, con el objetivo de facilitar el análisis, se acostumbra


ordenar los datos de la muestra en intervalos. Un intervalo es un conjunto de
números comprendidos entre un límite inferior (Li) y un límite superior (Ls). El
procedimiento de construcción de los intervalos y su respectiva distribución de
frecuencias se expone a continuación.

El procedimiento de construcción de
intervalos también se utiliza para
variable discreta cuando la variable
toma muchos valores diferentes

Es necesario aclarar que los métodos para construir intervalos son variados. Aquí
se expone uno de tantos métodos, lo que se hará utilizando un ejemplo.

Se desea estudiar la longitud, en centímetros, de lombrices, pasados 30 días de


haber sido instaladas en una cama. Se mide la longitud de 80 lombrices. Los
resultados obtenidos son los siguientes:
5,4 5,1 5,0 5,2 5,0 5,1 5,4 5,0 5,2 5,5 5,8 7,6 5,7 5,4 5,3 5,3
5,7 5,4 5,4 5,7 5,9 5,5 5,8 5,5 5,5 5,8 5,9 5,1 5,3 5,4 5,4 5,4
6,2 5,2 5,7 5,5 5,2 5,3 5,5 5,6 5,8 5,5 6,2 5,7 5,5 5,0 5,5 5,7
5,7 7,4 5,0 6,6 5,0 5,5 5,3 5,1 5,8 5,0 5,1 5,3 6,0 5,8 5,7 6,5
18 CARLOS HERNAN SARAZA NARANJO

5,9 6,0 6,0 6,1 6,1 6,3 5,4 5,4 6,7 5,8 7,0 6,5 5,4 6,0 5,4 5,4

El primer paso para iniciar el estudio consiste en ordenar los datos en forma
ascendente, procedimiento que aparece a continuación
5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,1 5,1 5,1 5,2 5,2 5,2 5,2 5,3 5,3
5,3 5,3 5,3 5,3 5,4 5,4 5,4 5,4 5,4 5,4 5,4 5,4 5,4 5,4 5,4 5,4
5,4 5,5 5,5 5,5 5,5 5,5 5,5 5,5 5,5 5,5 5,5 5,6 5,7 5,7 5,7 5,7
5,7 5,7 5,7 5,7 5,8 5,8 5,8 5,8 5,8 5,8 5,8 5,9 5,9 5,9 6,0 6,0
6,0 6,0 6,1 6,1 6,1 6,1 6,2 6,2 6,3 6,5 6,5 6,6 6,7 7,0 7,4 7,6

Una vez ordenados los datos se procede a construir los intervalos de clase. Aunque
para la construcción de los intervalos existen diversos métodos una regla general
utilizada por los autores consiste en asegurar que todos los intervalos tengan igual
tamaño. En el presente libro se desarrolla uno de tantos métodos para la
construcción de intervalos así:

 Se determina el rango de la muestra; el rango se nota R y se define como la


diferencia que existe entre el dato mayor y el dato menor de la muestra:

R = DM – Dm

Para el ejemplo que estamos siguiendo tenemos


R = 7,6-5,0 R = 2,6 centímetros
 Se decide el número de intervalos que se van a construir. El número de
intervalos se nota m. El número recomendado oscila entre 5 y 15 intervalos.
El número se escoge a voluntad teniendo en cuenta si los datos presentan
un rango grande o pequeño, a mayor tamaño del rango se recomienda
mayor número de intervalos.
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 19

También existe una regla empírica para determinar el número de intervalos,


conocida como regla de Sturges, aunque no es necesario utilizarla, se deja
para conocimiento de los lectores:
m= 1+ 3,3 log n
Para el ejemplo m= 1+3,3 log 80; m= 7,28; entonces m= 7 intervalos

De igual manera otros autores definen el número de intervalos como m  n

Para el ejemplo m  80 ; por lo tanto m=8,94; m=9 intervalos

Para el ejemplo se optará por escoger de manera libre y se construirán


6 intervalos.

 Se determina el tamaño de cada intervalo. El tamaño se nota C y está dado


por:

C = R/m

Se recomienda que el tamaño del intervalo tenga el mismo número de cifras


decimales que los datos de la muestra, para el ejemplo se requiere que el
tamaño aparezca con décimas, es decir, con una sola cifra decimal. Para
realizar el ajuste se procede siempre por exceso, es decir, en este ejemplo,
a la décima siguiente.

Para el ejemplo

C = 2,6/6 C = 0,43333

De tal manera que, aproximando, resulta que C = 0,5


20 CARLOS HERNAN SARAZA NARANJO

 Se determina el nuevo rango, dado por el producto m.C = 6 (0,5) = 3,0

 Se calcula la diferencia entre los rangos 3,0 – 2,6 = 0,4

 Se procede a construir los intervalos siguiendo las instrucciones siguientes:

El límite inferior del primer intervalo resulta de restar la diferencia entre los rangos
al dato menor de la muestra que es 5,0.

Primer límite inferior = 5,0 – 0,4 = 4,6

El límite superior del primer intervalo se obtiene sumando al límite inferior, el


tamaño del intervalo.

Primer límite superior= 4,6 + 0,5 =5,1

Para obtener el siguiente límite inferior se pasa al valor siguiente al límite superior
ya construido, dependiendo de los decimales que se están utilizando, es decir, si se
trabaja con unidades se pasa a la unidad siguiente, si se trabaja con décimas a la
décima siguiente, si con centésimas, a la centésima siguiente. A este límite inferior
se suma el tamaño del intervalo.

El procedimiento se continúa hasta obtener el número de intervalos buscado.

La construcción de los 6 intervalos para el ejemplo que nos ocupa es la siguiente:


El dato menor de la muestra es 5,0. Se le resta la diferencia entre rangos (0,4), se
obtiene 5,0 – 0,4 = 4,6. El primer límite inferior es 4,6, se le suma C=0,5 y se obtiene
el primer límite superior: 4,6 + 0,5 = 5,1. Se pasa al decimal siguiente, 5,2 y se suma
0,5.
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 21

Longitudes
(centímetros)
4,6 – 5,1
5,2 – 5,7
5,8 – 6,3
6,4 – 6,9
7,0 – 7,5
7,6 – 8,1

Al terminar la construcción de los intervalos es necesario comprobar que todos los


datos de la muestra queden incluidos en ellos. Es decir, que los intervalos inicien en
un valor menor o igual que el dato menor de la muestra y que terminen en un valor
mayor o igual que el dato mayor de la muestra. En algunos casos el último intervalo
sobrepasa al dato mayor, entonces se omite este intervalo y se trabaja con los
intervalos restantes.

2.3.1 Marcas de clase

En el trabajo con intervalos resulta importante determinar un número que represente


al intervalo, puesto que, como se observa, cada intervalo está conformado por
muchos números, por ejemplo, el intervalo 4,6-5,1 está conformado por todos los
números comprendidos entre 4,6 y 5,1 (4,6; 4,71; 4,72; …5,02; 5,03; ….5,1). Las
marcas de clase son los puntos medios de cada intervalo. Se notan Xi. Para
cálculos estadísticos las marcas de clase representan a cada uno de los intervalos.
Las marcas de clase se obtienen sumando los límites de cada intervalo y dividiendo
el resultado entre 2.

li  ls
Xi 
2
También se pueden obtener dividiendo el tamaño del intervalo entre dos, este
cociente se le suma a los límites inferiores o se le resta a los límites superiores.
Para la muestra de longitudes de lombrices se calcula la primera marca de clase y
se obtiene
22 CARLOS HERNAN SARAZA NARANJO

4,6  5,1
X1   4,85
2

Todas las marcas de clase se observan en la tabla No. 2.

Construcción de la distribución de frecuencias

A continuación se redefine cada una de las frecuencias definidas para variable


discreta y se calcula, para cada caso, una de las frecuencias; al final aparece la
tabla resumen de la distribución de frecuencias. (Tabla No. 2)

2.3.2 Frecuencia absoluta

Es el número de datos de la muestra que son mayores o iguales que cada límite
inferior pero menores o iguales que cada límite superior, es decir, corresponde al
número de datos de la muestra que están comprendidos en cada intervalo. La suma
de frecuencias absolutas es igual a n.

Ejemplo: f1 contiene los datos de la muestra mayores o


iguales que 4,6 y menores o iguales que 5,1 de esta
manera f1 es igual a 10

2.3.3 Frecuencia absoluta acumulada

Es el número de datos de la muestra que son mayores o iguales que el dato menor
de la muestra y a su vez menores o iguales que el límite superior del intervalo al
cual corresponde la frecuencia que se está calculando, es decir, son los datos
comprendidos entre el dato menor de la muestra y el límite superior de cada
intervalo. La última frecuencia absoluta acumulada es igual a n. Las frecuencias
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 23

absolutas acumuladas pueden obtenerse sumando sucesivamente la columna de


frecuencias absolutas.

Ejemplo: F3 contiene los datos mayores o iguales que


4,6 y menores o iguales que 6,3, de esta forma F3 es
igual a 73. (Ver tabla No. 2)

2.3.4 Frecuencia relativa

Es el peso relativo que cada frecuencia absoluta tiene sobre el tamaño de la


muestra. Se expresa en porcentaje o en decimales. Se obtiene dividiendo cada
frecuencia absoluta entre n. Si se desea el valor en porcentaje, el cociente obtenido
se multiplica por cien. La suma de frecuencias relativas es igual a 1 si los valores
son decimales o a 100% si los valores se dan en porcentaje.

Ejemplo: h4  f 4 .100  4 .100  5%


n 80

2.3.5 Frecuencia relativa acumulada

Es el peso relativo que cada frecuencia absoluta acumulada tiene sobre el tamaño
de la muestra. Se obtiene dividiendo cada frecuencia absoluta acumulada entre n y
multiplicando por cien. También puede obtenerse sumando sucesivamente la
columna de frecuencias relativas. La última frecuencia relativa acumulada es igual
a 1 o 100%.

Ejemplo:
F4 77
H 4  .100  .100  96,25%
n 80
24 CARLOS HERNAN SARAZA NARANJO

Tabla de frecuencias: aplicando las definiciones vistas resulta la distribución de


frecuencias que se presenta en la tabla No. 2.
Tabla No. 2. Distribución de frecuencias
LONGITUD DE LOMBRICES 30 DÍAS DESPUÉS DE SER INSTALADAS EN LA
CAMA

Longitudes Xi fi Fi hi% Hi% Longitudes


Centímetros Centímetros

4,6 - 5,1 4,85 10 10 12,50 12,50 4,55 – 5,15


5,2 – 5,7 5,45 42 52 52,50 65,00 5,15 – 5,75
5,8 – 6,3 6,05 21 73 26,25 91,25 5,75 – 6,35
6,4 – 6,9 6,65 4 77 5,00 96,25 6,35 – 6,95
7,0 – 7,5 7,25 2 79 2,5 98,75 6,95 – 7,55
7,6 – 8,1 7,85 1 80 1,25 100,00 7,55 – 8,15

Además de la distribución de frecuencias se han construido unos intervalos nuevos


denominados intervalos reales (última columna en la tabla 2). Son intervalos que
permiten conseguir que la distribución sea continua, es decir, que entre un límite
superior y el límite inferior siguiente, no exista espacio. Estos intervalos son
necesarios para realizar cálculos estadísticos y para obtener algunos de los gráficos
correspondientes a la muestra.

Para construir los intervalos reales se resta un límite inferior y el límite superior
inmediatamente anterior, la diferencia se divide entre dos, este cociente se resta a
los límites inferiores y se suma a los límites superiores. Por ejemplo: 5,2-5,1=0,1;
0,1/2=0,05. Este valor se le resta a 4,6; 5,2; 5,8;…7,6. Este mismo valor se le suma
a 5,1; 5,7; 6,3…8,1)

INTERPRETACIÓN DE LA TABLA
A continuación se formulan algunas preguntas referentes a la tabla, cada una con
su respuesta correspondiente, trate de resolver los enunciados antes de consultar
las respuestas:

1. ¿Cuántas lombrices fueron medidas?


ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 25

2. ¿Cuál fue la mayor longitud encontrada?


3. ¿Cuál fue la longitud que más se presentó?
4. ¿Cuál fue la menor longitud encontrada?
5. ¿Cuál fue la longitud que menos se presentó?
6. Determine el valor e interprete f2, F5, h3, H4
7. ¿Cuántas lombrices midieron por lo menos 7,0 centímetros?
8. ¿Cuántas lombrices midieron entre 6,4 y 7,5 centímetros?
9. ¿Cuál es el porcentaje de lombrices que midieron más de 5,7 centímetros?
10. ¿Cuál es el porcentaje de lombrices que midieron a lo sumo 6,9 centímetros?
11. ¿Cuántas lombrices midieron por lo menos 7,0 centímetros o a lo sumo 6,3
centímetros?
12. ¿Cuántas lombrices midieron por lo menos 6,4 centímetros y a lo sumo 7,5
centímetros?
13. ¿Cuál es el porcentaje de lombrices que midieron más de 6,9 centímetros y
menos de 5,2 centímetros?

RESPUESTAS

1. Se pregunta por el tamaño de la muestra. Fueron medidas 80 lombrices.


2. De acuerdo con la tabla, la mayor longitud encontrada fue 8,1 centímetros.
3. La longitud que más se presentó es aquella que tiene mayor frecuencia absoluta.
Corresponde a la longitud entre 5,2 y 5,7 centímetros.
4. De acuerdo con la tabla, la menor longitud encontrada fue 4,6 centímetros.
5. La longitud que menos se presentó es aquella que tiene menor frecuencia
absoluta. Corresponde a la longitud entre 7,6 y 8,1 centímetros.
6. f2 es la segunda frecuencia absoluta. Su valor es 42. Significa que 42 lombrices
midieron entre 5,2 y 5,7 centímetros.

F5 es la quinta frecuencia absoluta acumulada. Su valor 79. Significa que 79


lombrices midieron entre 4,6 y 7,5 centímetros.
26 CARLOS HERNAN SARAZA NARANJO

h3 es la tercera frecuencia relativa. Su valor 26,25%. Significa que el 26,25%


de las lombrices midieron entre 5,8 y 6,3 centímetros.

H4 es la cuarta frecuencia relativa acumulada. Su valor 96,25%. Significa que el


96,25% de las lombrices midieron entre 4,6 y 6,9 centímetros.

7. Se pregunta por el número de lombrices cuyas longitudes fueron iguales o


superiores a 7,0 centímetros: 3 lombrices.

8. Se pregunta por el número de lombrices del cuarto y quinto intervalos: 6


lombrices.
9. Se pregunta por el porcentaje de lombrices con longitud mayor que 5,7
centímetros: 35%
10. Se Pregunta por el porcentaje de lombrices con longitud menor o igual a 6,9
centímetros: 96,25%

11. Es necesario tener en cuenta que la conjunción o, significa


unión. Se pregunta por todas las lombrices que cumplan con
una cualquiera de las condiciones dadas, es decir, se pregunta
por lombrices con longitud mayor o igual que 7,0 o menor o
igual que 6,3 centímetros: 76 lombrices.

12. Es necesario tener en cuenta que la conjunción y, significa


intersección. Se pregunta por todas las lombrices que
cumplan con las dos condiciones dadas, es decir, se pregunta
por lombrices con longitud mayor o igual que 6,4 centímetros y
que al mismo tiempo tengan longitud menor o igual que 7,5
centímetros, es decir, lombrices con longitud entre 6,4 y 7,5
centímetros: 6 lombrices.

13. Se pregunta por lombrices con longitud mayor que 6,9 centímetros y, a su vez,
menor que 5,2 centímetros: no existen lombrices con esas condiciones, 0%.

2.4 Distribución de frecuencias para un estudio de variable


cualitativa
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 27

Las variables cualitativas se expresan en palabras (color, especie, comida


preferida, etc.). Sin embargo, ellas dan origen a números a través de los cuales es
posible estudiar su comportamiento en determinada situación.

Es importante mostrar, por medio de un ejemplo, cómo se analizan las variables


cualitativas. El ejemplo es el siguiente:

Un estudio realizado entre jóvenes que estudian en universidades del Eje Cafetero
planteó, como una de las variables, indicar cuáles son los tipos de carne que
prefieren comer. En el estudio participaron 80 jóvenes a quienes se les indicó que
podían marcar más de una opción. Los resultados se resumen en la siguiente tabla:
Tipo de carne No. de respuestas
Res 49
Cerdo 56
Pescado 74
Pollo 58
Camarones 67
Conejo 34

Con estos datos es posible construir una tabla sencilla en los siguientes términos

Tipo de carne fi hi%/80


Res 49 61,25
Cerdo 56 70
Pescado 74 92,5
Pollo 58 72,5
Camarones 67 83,75
Conejo 34 42,5

Es importante tener en cuenta varios aspectos que ocurren en la tabla anterior:


28 CARLOS HERNAN SARAZA NARANJO

 No se construyen frecuencias acumuladas porque no se trata de una variable


que tenga una sola respuesta, ni de una variable que esté expresada en
números.
 Lo único que se hace es contar, a manera de una frecuencia absoluta, cuántos
jóvenes eligieron cada uno de los tipos de carne.
 La frecuencia relativa, a diferencia de lo que ocurre en la variable cuantitativa,
no suma 100% porque se trata de un estudio en el que un mismo joven puede
dar varias respuestas a la vez, de tal manera que el interés es saber qué
porcentaje de los 80 jóvenes elige cada uno de los tipos de carne. Las
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 29

frecuencias relativas, en consecuencia, se han calculado sobre n=80 jóvenes,


valor que no coincide con la suma de frecuencias absolutas.

Interpretación de la tabla

De igual manera como la tabla es muy sencilla, su interpretación presenta esta


misma característica, sin embargo, es posible dar respuesta a preguntas como las
siguientes:

1. ¿Cuántos jóvenes prefieren carne de res?


2. ¿Cuál es el porcentaje de jóvenes que prefieren el pescado?
3. ¿Cuál es el porcentaje de jóvenes que prefieren los camarones?
4. ¿Cuál es el tipo de carne menos mencionado por los jóvenes?
5. ¿Cuáles son los tres tipos de carne más comunes entre los jóvenes?
6. ¿Cuántos tipos de carne logran ser preferidos por lo menos por el 50% de
los jóvenes?

RESPUESTAS

1. 49 jóvenes prefieren carne de res


2. El 92,5% de los jóvenes prefieren el pescado
3. El 83,75% de los jóvenes prefieren los camarones
4. El tipo de carne menos mencionado por los jóvenes es la carne de conejo
5. Los tres tipos de carne más comunes entre los jóvenes son el pescado, los
camarones y el pollo
6. 5 tipos de carne (res, cerdo, pescado, pollo, camarones) logran ser escogidos
por lo menos por el 50% de los jóvenes.

Los datos de la encuesta se resumen en la figura No. 2 (Para tener claridad sobre
el gráfico que se ha construido, consulte la unidad 3.
30 CARLOS HERNAN SARAZA NARANJO

TIPO DE CARNE PREFERIDO POR LOS JÓVENES QUE


ESTUDIAN EN UNIVERSIDADES DEL EJE CAFETERO

80
70

NÚMERO DE JÓVENES
60
50
40 74 67
30 49 56 58
20 34
10
0

TIPO DE CARNE

Figura No. 2. Histograma. Tipo de carne


preferido por jóvenes matriculados en
universidades del Eje Cafetero
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 31

UNIDAD III

REPRESENTACIÓN GRÁFICA
INTRODUCCIÓN

Una distribución de frecuencias puede ser graficada de diversas maneras. En el


presente libro se abordan los siguientes gráficos: histograma, polígono de
frecuencias, gráfico circular y ojivas.

Cada gráfico tiene su propia interpretación y permite relacionar diferentes elementos


de una tabla de frecuencias.

Los gráficos tienen varias ventajas sobre los datos que contiene la tabla: en primer
lugar, su estética los hace llamativos y motivan a la lectura; en segundo lugar
permiten visualizar fácilmente los valores que sobresalen en una muestra así como
aquellos que se presentan con menor frecuencia.

Muchas publicaciones de libros, revistas, periódicos y similares, utilizan los gráficos


para hacer más agradable y entendible la lectura, de tal manera que más lectores
quieran y puedan acceder a estos medios de comunicación.

De igual manera, cada vez es más común que en los seminarios y conferencias
alrededor del mundo, los conferenciantes utilicen gráficos para presentar
argumentos de sus hipótesis y para dejar planteados sus presupuestos sobre
diferentes temas. Condensar en cifras y en gráficos una información constituye un
elemento de confianza para los oyentes de los conferenciantes.
32 CARLOS HERNAN SARAZA NARANJO

3.1 Condiciones generales de los gráficos

Los gráficos estadísticos tienen el doble objetivo de recrear la información y de


facilitar el análisis de la misma. Cualquiera sea el gráfico que se elija para
representar una muestra, este debe cumplir con ciertas condiciones:

 El gráfico más efectivo es aquél que resulte más simple y por lo tanto sólo debe
contemplar la información necesaria.
 Todo gráfico requiere un título que identifique el objeto de estudio.

 Si el gráfico utiliza ejes, cada uno de los ejes debe estar identificado con la
variable que maneja.

 Cada vez que sea necesario, se debe aclarar el contenido del gráfico por medio
de convenciones.

 Un gráfico debe ser tan claro que pueda ser interpretado en ausencia de los
datos que lo originaron.

 Los gráficos que hacen parte del mismo documento deben ser numerados.
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 33

3.2 Histograma

También llamado gráfico de barras. Se dibuja sobre el plano cartesiano. Está


compuesto por rectángulos cuyas bases, de igual longitud, se colocan sobre el eje
X y sus alturas, coincidentes con las frecuencias absolutas, se ubican sobre el eje
Y. Para el histograma se pueden utilizar los intervalos reales (barras unidas) o los
intervalos de clase (barras separadas). La Figura No. 3 muestra el histograma
correspondiente a la muestra de las longitudes de lombrices 30 días después de
haber sido instaladas en la cama, utilizada en la unidad II. Los Datos
correspondientes al gráfico se consignan en la tabla a la izquierda del mismo.

Longitudes fi LONGITUD DE LOMBRICES 30


Centímetros DIAS DESPUÉS DE HABER
4,6 - 5,1 10 SIDO INSTALADAS
60
5,2 – 5,7
Cantidad de lombrices

42 4,6 - 5,1
42
5,8 – 6,3 21 40 5,2 – 5,7
6,4 – 6,9 4 21 5,8 – 6,3
7,0 – 7,5 2 20 10 6,4 – 6,9
4
7,6 – 8,1 1 2 1 7,0 – 7,5
0
7,6 – 8,1
Longitudes (cm)

Figura No.3. Histograma

La figura muestra que la longitud que más se presenta (barra más alta), es la
longitud comprendida entre 5,2 y 5,7 centímetros; la longitud que menos se presenta
(barra más baja), es la longitud comprendida entre 7,6 y 8,1 centímetros; la menor
longitud encontrada fue 4,6 centímetros mientras que la mayor fue 8,1 centímetros.
De igual manera se pueden obtener muchas otras conclusiones.

3.3 Polígono de frecuencias


34 CARLOS HERNAN SARAZA NARANJO

Es un gráfico que relaciona las marcas de clase, ubicadas sobre el eje X de un plano
cartesiano, con las frecuencias absolutas, ubicadas sobre el eje Y. La Figura No. 4
muestra el polígono de frecuencias correspondiente a la muestra de las longitudes
de lombrices 30 días después de haber sido instaladas en la cama. Los datos
correspondientes al gráfico se consignan en la tabla a la izquierda del mismo.

Longitudes fi LONGITUD DE LOMBRICES 30


Centímetros
4,85 10 DÍAS DESPUÉS DE INSTALADAS
5,45 42 50 42
Cantidad de lombrices

6,05 21 40
6,65 4 30 21
7,25 2 20 10
7,85 1 10 4 2 1
0
4.85 5.45 6.05 6.65 7.25 7.85
Longitudes (cm)

Figura No.4. Polígono de frecuencias

El gráfico muestra, por ejemplo, que hubo 42 lombrices con una longitud media de
5,45 centímetros; hay 4 lombrices con longitud media de 6,65 centímetros (nota: el
concepto de media puede ser consultado en la unidad referente a medidas de
centralización, en este caso, la marca de clase es la media de cada intervalo)

3.4 Gráfico circular

Es un gráfico que relaciona los intervalos con las frecuencias relativas. Analiza
porcentualmente la distribución partiendo de la relación que existe entre la
circunferencia (360º) y el 100% de las frecuencias relativas. Para cada frecuencia
relativa se establece, por medio de una regla de tres simple directa, el valor de
grados que le corresponden. El gráfico se completa con convenciones que aclaren
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 35

su contenido. La Figura No. 5 muestra el gráfico circular correspondiente a la


muestra de la longitud de lombrices después de 30 días de haber sido instaladas en
la cama. Los datos correspondientes al gráfico se consignan la tabla a la izquierda
del mismo.

Longitudes hi LONGITUD DE LOMBRICES (cm),


Centímetros
30 DÍAS DESPÚES DE HABER SIDO
4,6 - 5,1 12,50
INSTALADAS
5,2 – 5,7 52,50
2.50% 1.25%
5,8 – 6,3 26,25 5.00% 12.50% 4,6 - 5,1
6,4 – 6,9 5,00 5,2 – 5,7
26.25%
7,0 – 7,5 2,5 5,8 – 6,3
7,6 – 8,1 1,25 6,4 – 6,9
52.50% 7,0 – 7,5

Figura No. 5. Gráfico circular

El gráfico muestra, por ejemplo, que hay 52,5% de lombrices con longitud entre 5,2
y 5,7 centímetros; hay 5% de lombrices con longitud entre 6,4 y 6,9 centímetros;
hay 26,25% de lombrices con longitud entre 5,8 y 6,3 centímetros.

3.5 Ojivas

Son gráficos que muestran el crecimiento o decrecimiento acumulado de la


distribución. Las ojivas pueden graficarse de dos formas diferentes: ojiva mayor que
y ojiva menor que.

3.5.1 Ojiva mayor que

Se construye respondiendo a la pregunta ¿Cuántos datos son mayores que cada


límite real?. Con la pregunta se construye una columna de frecuencias acumuladas,
en forma descendente, así:
MANUAL DE ESTADÍSTICA
36

4,55 80
5,15 70
5,75 28
6,35 7
6,95 3
7,55 1
8,15 0

En la tabla No. 2 se puede observar de dónde resultan las frecuencias. Cuando se


pregunta cuántos datos de la muestra son mayores que 4,55, resultan ser todos
(80); cuando se pregunta cuántos datos son mayores que 5,15 resultan ser todos
menos los que corresponden al primer intervalo (80-10=70); cuando se pregunta
cuántos datos son mayores que 5,75 resultan ser todos menos los que
corresponden al primer y segundo intervalos (80-52=28); así sucesivamente.

3.5.2 Ojiva menor que

Se construye respondiendo a la pregunta ¿Cuántos datos son menores que cada


límite real?. Con la pregunta se construye una columna de frecuencias acumuladas,
en forma ascendente, así:
4,55 0
5,15 10
5,75 52
6,35 73
6,95 77
7,55 79
8,15 80

En la tabla No. 2 se puede observar de dónde resultan las frecuencias. Cuando se


pregunta cuántos datos de la muestra son menores que 4,55, resulta ninguno (0);
cuando se pregunta cuántos datos son menores que 5,15 resultan ser los que
corresponden al primer intervalo (10); cuando se pregunta cuántos datos son
menores que 5,75 resultan ser los que corresponden al primer y segundo intervalos
(52); así sucesivamente. Nótese que si se unen las dos tablas (ojiva mayor que y
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 37

ojiva menor que, las frecuencias correspondientes a cada fila suman 80 (0+80=80;
10+70=80; 52+28=80). La Figura No. 6 muestra las ojivas correspondientes a la
muestra de la longitud de lombrices 30 días después de ser instaladas en la cama,
utilizado en la unidad II. Los datos se han descrito en los renglones anteriores.

LONGITUD DE LOMBRICES 30 DÍAS


DESPUÉS DE HABER SIDO INSTALADAS
90 80 77 79 80
80 70 73
Cantidad de lombrices

70
60 52
50
40 28 Ojiva >
30
Ojiva <
20 10 7
10 0 3 1 0
0
4.55 5.15 5.75 6.35 6.95 7.55 8.15
Longitudes (cm)

Figura No.6. Ojivas

El gráfico muestra, por ejemplo, que hay 80 lombrices con longitud mayor que 4,55
centímetros, mientras que no hay lombrices con longitud menor que 4,55
centímetros; hay 10 lombrices con longitud menor que 5,15 centímetros en tanto
que 70 lombrices tienen longitud mayor que 5,15 centímetros.
38 CARLOS HERNAN SARAZA NARANJO

UNIDAD IV

MEDIDAS DE CENTRALIZACIÓN

INTRODUCCIÓN

La estadística descriptiva tiene, como objetivo general, el análisis de conjuntos de


datos para aportar a la estadística inferencial en la búsqueda de conclusiones
acerca de conjuntos mayores de los cuales se han extraído los datos analizados.

El análisis que la estadística hace de los datos no puede quedarse sólo en contar
cuántos elementos del conjunto cumplen con cierta característica, es necesario ir
más allá, se requiere realizar mediciones que permitan establecer relaciones entre
los elementos del conjunto y que ayuden a determinar puntos desde los cuales se
miren los valores para dar solidez a los resultados obtenidos.

En la presente unidad se entregan los elementos conceptuales necesarios para


hacer mediciones a lo largo de la ordenación del conjunto de datos, que traten de
informar el punto donde se ubica el centro del conjunto, para obtener diversas
conclusiones según la medida que se esté utilizando.

De igual manera se hacen mediciones que permiten ubicar diferentes valores en la


muestra que están relacionados con porcentajes de interés dentro de la misma.

Para facilitar la comprensión de las fórmulas que se requieren para los diferentes
cálculos, la unidad se inicia con una explicación acerca de la notación sumatoria.
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 39

4.1 Notación sumatoria

n
El símbolo  Xi
i 1
se lee sumatoria desde i=1 hasta n de los Xi y representa la suma
4
de los valores de Xi desde i=1 hasta i=n, por ejemplo,  Xi
i 1
representa la suma X1

+ X2 + X3 + X4.

Ejemplo: Sean X1 =3 X2=4 X3=2 X4=5 X5=-2

Halle el valor de las sumatorias dadas:


5
a. X
i 2
i = X2+X3+X4+X5 = 4+2+5+(-2) = 9

X
2
b. i = X12+X22+X32+X42 = 9+16+4+25 = 54
i 1

NOTA: Cuando se requiere simbolizar la suma de n valores, desde i=1 hasta i=n,
para simplificar el símbolo se escribe  Xi
Es decir,  Xi  X 1  X 2  X 3  .......  X n

4.2. Medidas de centralización

Son medidas de centralización aquellas que tienden a ubicar el centro de una


distribución. Las medidas de centralización son variadas, en el presente libro se
definen la media aritmética, la media geométrica, la media armónica, la mediana y
la moda. Además se definen los cuartiles, los deciles y los percentiles que reciben,
junto con la mediana, el nombre de medidas de posición por cuanto permiten ubicar
diferentes puntos dentro de la distribución.

4.2.1 Media aritmética

También se le denomina media. Se nota X cuando se calcula para una muestra y


se nota μ cuando se calcula para una población. La media de un conjunto de n
40 CARLOS HERNAN SARAZA NARANJO

valores se define como la sumatoria de los valores dividida entre el número de


valores, es decir,

X X i

Ejemplo: Sean X1 =30 X2=40 X3=20 X4=50 X5=12

La media está dada por:

X  X i

30  40  20  50  12 152
  30,4
n 5 5

La media de los valores es igual a 30,4

Ejemplo: en la finca El Tesoro, dedicada a la cría de animales, se tomó el peso de


8 conejos del lote identificado con el código L4. Los pesos obtenidos, en kilogramos,
fueron los siguientes:

X1 = 2,5 X2 = 3,2 X3 = 1,9 X4 = 4,1


X5 = 3,4 X6 = 2,8 X7 = 4,5 x8 = 3,9

El peso medio de los conejos está dado por:

X  X i

2,5  3,2  1,9  4,1  3,4  2,8  4,5  3,9 26,3
  3,2875 kilogramos
n 8 8

El peso medio de los conejos es 3,2875 kilogramos, es decir, aproximadamente 3,3


kilogramos.

4.2.1.1 Media para datos con frecuencias

Cuando al querer calcular una media ocurre que uno o más datos se repiten
(frecuencias absolutas), la fórmula a utilizar para el cálculo es:

X 
 f .x
i i

n
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 41

Donde n=  f i

Nótese que la fórmula indica que se debe multiplicar cada valor de fi por el valor
correspondiente de la variable. Los productos obtenidos se suman y el resultado de
la sumatoria se divide entre n.

Ejemplo:

Se realiza un estudio para determinar el peso medio de una muestra de cachamas.


Los datos obtenidos, en gramos, se resumen en la siguiente tabla

Pesos No. de cachamas


(gramos) fi
Xi
145 54
154 28
155 72
162 53
165 12
168 5
n=224

Para determinar el peso medio de las cachamas se aplica la fórmula obteniendo:

X
 fi . X i  54(145)  28(154)  72(155)  53(162)  12(165)  5(168)  34708  154,94 gramos
n 224 224
La muestra de cachamas presentó un peso medio de 154,94 gramos.

El cálculo anterior se facilita si se utiliza una tabla con una tercera columna como
se muestra a continuación
42 CARLOS HERNAN SARAZA NARANJO

Peso No. de fi.xi


(gramos) cachamas
Xi fi
145 54 7830
154 28 4312
155 72 11160
162 53 8586
165 12 1980
168 5 840
n=224 34708

Obtenida la tabla, el cálculo se reduce a:


34708
X   154,94 gramos
224
4.2.1.2 Media para datos agrupados en intervalos

Cuando los datos se han agrupado en intervalos, la fórmula para el cálculo de la


media es:
Nótese que esta fórmula es
similar a la que se ha venido
utilizando, lo importante es
X  f .X
i i recordar que cuando se trata
n de intervalos las Xi
corresponden a las marcas
de clase
Ejemplo:

Se realizó un estudio para determinar el tiempo medio requerido por operarios para
despicar un lote de pollos. Se trabajó con una muestra de 36 operarios. En la tabla
siguiente aparece el registro de los tiempos tomados en minutos.

Tiempos (minutos) fi xi fi . xi
40,2-40,8 8 40,5 324,0
40,9-41,5 5 41,2 206,0
41,6-42,2 3 41,9 125,7
42,3-42,9 11 42,6 468,6
43,0-43,6 9 43,3 389,7
n =36 1514
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 43

1524
X  42,05 minutos
36
El tiempo medio requerido por los operarios para despicar el lote de pollos es 42,05
minutos.
4.2.1.3 Propiedades de la media

La media tiene diversas propiedades que se enuncian en los siguientes renglones

1. La suma algebraica de las desviaciones de un conjunto de datos con


respecto a su media es igual a cero.

Se entiende por desviaciones con respecto a la media, la diferencia que existe entre
cada dato de la muestra y la media.

Ejemplo: Sean X1 =28 X2=30 X3=36 X4=42 X5=47

183
X   36,6
5
El cálculo de las desviaciones es el siguiente:

d1 = 28 - 36,6 = - 8,6 d2=30 - 36,6 = - 6,6 d3=36 - 36,6 = - 0,6


d4= 42 - 36,6 = 5,4 d5=47 - 36,6 = 10,4

di= 0

2. La media de una constante es igual a la constante

Ejemplo: Sean X1 =28 X2=28 X3=28 X4=28 X5=28

28  28  28  28  28 140
X   28
5 5

3. La media de una variable más una constante es igual a la media de la variable


más la constante.

Ejemplo: Sean X1 =52 X2=58 X3=81 X4=28 X5=38

52  58  81  28  38 257
X1    51,4
5 5
44 CARLOS HERNAN SARAZA NARANJO

A cada valor de la muestra se le suma una constante arbitraria K, para el ejemplo


se suma K = 12 (el valor de la constante ha sido elegido libremente)

Los datos originales quedan convertidos en:

X1 =64 X2=70 X3=93 X4=40 X5=50

64  70  93  40  50 317
X2    63,4
5 5

Se muestra, con el ejemplo, que: X 2  X1  k X 2  51,4  12 X 2  63,4

Ejemplo aplicado:

En la empresa Alegrías se realiza un pesaje de conejos. Se obtiene un peso medio


de 3450,2 gramos. Terminado el pesaje se registra que la pesa utilizada está mal
calibrada y que cada peso ha sido reducido en 2,01 gramos. ¿Cuál es, en
consecuencia, el nuevo peso medio de los conejos?.

Los datos del ejercicio son: X1  3450,2 gramos K  2,01 gramos

El nuevo valor medio es: X 2  3450,2  2,01  3452,21 gramos

4. La media de una variable por una constante es igual a la media de la variable


por la constante.

Ejemplo: Sean X1 =52 X2=58 X3=81 X4=28 X5=38

52  58  81  28  38 257
X1    51,4
5 5

Cada valor de la muestra se multiplica por una constante aleatoria K, para el ejemplo
K=5

Los datos originales quedan convertidos en:

X1 =260 X2=290 X3=405 X4=140 X5 =190

260  290  405  140  190 1285


X2    257
5 5
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 45

Se muestra, con el ejemplo, que: X 2  X1.k X 2  51,4(5) X 2  257

Ejemplo aplicado:

En la finca Resplandor se llevan registros que determinan que el peso medio de los
conejos al nacer es 29,5 gramos. Se ha establecido que una dieta especial sobre
las madres gestantes puede incrementar en un 8% el peso de los gazapos al nacer.
Si una muestra de conejas recibe la dieta, ¿Cuál es el peso medio que se puede
esperar en los gazapos?
Es necesario tener en cuenta
Los datos del ejercicio son: X 1  29,5 gramos K  1,08 que para incrementar el 8%
basta con multiplicar por 1,08.
0,08 corresponde a 8/100.
El nuevo valor medio es: X 2  29,5(1,08)  31,86 gramos

El peso medio de los gazapos que resultan de conejas que reciben la dieta es 31,86
gramos.

5. Si n1 datos tienen media X1 ; n2 datos tienen media X 2 ; n3 datos tienen media


X 3 ; ...; nK datos tienen media X k , entonces la media de todos los datos está
dada por:

ni . Xi n1. X1  n2 . X 2  n3. X 3  .....  nk . X k


X 
n n

Ejemplo: Sean X1 =12 X2=18 X3=11 X4=14 X5=16

X1 =4 X2=9 X3=2

X1 =2 X2=7 X3=3 X4=4

La media de todos los valores, incluidas las tres variables, está dada por:

12  18  11  14  16  4  9  2  2  7  3  4 102
X2    8,5
12 12

La media anotada puede conseguirse calculando la media de cada serie y aplicando


la fórmula indicada en la propiedad así:

71 15 16
X
1 5
 14,2 X
2 
3
5 X3 
4
4

n1=5 n2=3 n3=4 n=12


46 CARLOS HERNAN SARAZA NARANJO

14,2(5)  5(3)  4(4) 102


X    8,5
12 12

Ejemplos aplicados:

1. Esteban es propietario de explotaciones porcícolas en diferentes fincas en


municipios del Eje Cafetero. Ha solicitado que se le entregue un registro de los
pesos de los animales en 3 de las explotaciones. Los registros que recibe indican
que en La Estrella se pesaron 80 animales que entregan un peso medio de 84,7
kilogramos; en El Paso se pesaron 105 animales con un peso medio de 79,2
kilogramos; mientras que en La Palmilla el peso medio de 92 cerdos fue 64,8
kilogramos. ¿Cuál es el peso medio de los cerdos en las 3 explotaciones?.

Los datos del ejercicio son:

X1  84,7 kilogramos X 2  79,2 kilogramos X 3  64,8 kilogramos

n1 =80 n2 =105 n3=92 n=277

84,7(80)  79,2(105)  64,8(92) 21053,6


X    76 kilogramos
277 277
El peso medio de los cerdos en las 3 explotaciones es 76 kilogramos

2. Los 50 trabajadores de la finca Senderos se distribuyen entre hombres y mujeres.


Los 38 hombres ganan en promedio $34.500 diarios en tanto que las mujeres ganan
en promedio $33.900 diarios. ¿Cuál es el salario medio diario de los trabajadores
de la finca?

Los datos del ejercicio son:

X H  34.500 X M  33.900 X  ¿?

n Hombres =38 n Mujeres=12 n=50

34.500(38)  33.900(12) 1.717.800


X   34.356
50 50

El salario medio diario de los trabajadores de la finca Senderos es $34.356


ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 47

3. Para realizar un estudio acerca del tiempo que requieren las peces para alcanzar
el peso de uso en procesos agroindustriales se utilizan dos muestras, una en una
región con temperatura media de 22 °C y otra en una región con temperatura media
de 25°C. Se analizan en total 100 animales. Se obtiene un tiempo medio de 142,44
días. Los peces de la región con temperatura de 22 °C arrojaron un tiempo medio
de 144 días mientras que los peces de la región con temperatura de 25 °C arrojaron
un tiempo medio de 138 días. ¿Cuántos peces se manejaron en cada región?

Los datos del ejercicio son:

X 22  144 días X 25  138 días X  142,44 días

n22 =¿ ? n25=¿ ? n=100

Para resolver el ejercicio se parte de la base que n=n22+ n25

Por lo tanto 100=n22+ n25

Se tiene que n22 =100 – n25

Remplazando en la fórmula se tiene

(100 - n 25 )(144)  n 25 (138)


142,44 
100

14.244  14.400  144. n 25  138.n 25


14.244  14.400  144. n 25  138.n 25

 156  6.n 25

 156
 n 25 26  n 25
6

En la región con temperatura de 25 °C se manejaron 26 peces

Para hallar el número de peces manejados en la región con temperatura de 22 °C

n22 = 100 – n25

n22 = 100 – 26

n22 = 74
Se manejaron 74 peces en la región con temperatura de 22 °C.
48 CARLOS HERNAN SARAZA NARANJO

4.2.2 Media geométrica

El uso de la media geométrica no es muy común. Esta medida se utiliza cuando se


desea dar importancia a valores pequeños de la variable o cuando los datos se
presentan en forma similar a una progresión geométrica (se llama progresión
geométrica a un conjunto de números para los cuales un número se consigue
multiplicando el anterior por una constate, por ejemplo: 2, 6, 18, 54, 162…..).

La media geométrica es muy útil cuando se desea promediar el crecimiento o


decrecimiento de una variable.

La media geométrica se nota G.

4.2.2.1 Cálculo de la media geométrica para datos sin frecuencias

La media geométrica se calcula por medio de la raíz n-ésima del producto de los n
datos de la muestra, es decir:

n
G  n xi
i 1
n
Donde el símbolo  representa la productoria (multiplicación) de los valores de xi
i 1
desde i=1 hasta i=n

Ejemplo: los siguientes datos corresponden al precio del dólar, en pesos, durante 8
días.

2768 2772 2820 2824 2800 2850 2920 2972

Se pide hallar la media geométrica del precio del dólar

n
G  n xi  8 (2768)(2772)(2820)(2824)(2800)(2850)(2920)(2972)
i 1

G
8 4,231629736x1027

G  2839,968

La media geométrica del precio del dólar durante los 8 días fue $2839,968
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 49

4.2.2.2 Cálculo de la media geométrica para datos con frecuencias

La media geométrica se calcula por medio de la raíz n-ésima del producto de los n
datos de la muestra, elevado, cada uno de ellos, a la frecuencia correspondiente,
es decir

n
Gn x
fi
i
i 1

Ejemplo

Los siguientes datos corresponden a la variación del interés bancario durante 30


días de un mes:

Variación No. de días


0,2 7
0,4 9
0,5 6
0,6 5
0,7 3

Se pide hallar la media geométrica de la variación del interés bancario

n
G  n xi i  30 (0,2) 7 (0,4) 9 (0,5) 6 (0,6) 5 (0,7) 3
f

i 1

G  30 1,39836x10 -12

G  0,40258168
2

La media geométrica de la variación del interés bancario es 0,4

4.2.2.3 Cálculo de la media geométrica utilizando logaritmos

Dado que el cálculo de la media geométrica se realiza utilizando el producto de los


valores de la muestra, en ocasiones este producto se hace muy grande y resulta
ser un cálculo difícil e imposible, aun para las calculadoras. Por esta razón se
recomienda utilizar las propiedades de los logaritmos para hacer el cálculo
50 CARLOS HERNAN SARAZA NARANJO

correspondiente. El procedimiento de uso de logaritmos se muestra para el ejemplo


que se acaba de resolver, deduciendo primero la fórmula a utilizar así:

x
fi
Gn i Expresando la raíz como potencia se tiene:
i 1

1
 n n
 fi 
G    xi  Aplicando logaritmos en ambos lados de la igualdad se obtiene
 i1 
 
1
 n n
 f 
log G  log   xi i 
 i 1 
 

Aplicando propiedad de la potencia en un logaritmo se obtiene

 n 
1  fi 
log G  log   xi 
n  i1 
 
Como el logaritmo de un producto se puede separar como la suma de los logaritmos
entonces tenemos que

1 n
log G  
f
log xi i Aplicando de nuevo regla de la potencia para logaritmos se
n i1
obtiene
1 n
log G   fi log xi
n i1
Para volver al valor de G, obtenemos
1 n
G  anti log  fi log xi
n i1
Aplicando esta fórmula al ejemplo anterior se obtiene la siguiente tabla:

Variación % No. de días log xi f i .log xi


0,2 7 -0,69897 -4,89279003
0,4 9 -0,39794001 -3,58146008
0,5 6 -0,30103 -1,80617997
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 51

0,6 5 -0,22184875 -1,10924375


0,7 3 -0,15490196 -0,46470588
-11,8543797

 1 
G  anti log  (-11,8543797)
 30 
G  anti log - 0,39514599
G  0,402581682
La media geométrica de la variación del interés bancario es 0,4%

4.2.3 Media armónica

El uso de la media armónica, al igual que el de la media geométrica, no es muy


común. Por esta razón estas dos medidas se definen y se calculan sólo a manera
de información para los estudiantes. Esta medida se utiliza cuando se desean
promediar cantidades que tienen comportamientos inversamente proporcionales o
cantidades que están expresadas como tasas (de crecimiento, decrecimiento,
población, etc.).

La media armónica se nota H.

4.2.3.1 Cálculo de la media armónica para datos sin frecuencias

La media armónica se define como el inverso de la media de los inversos de los


datos de la muestra, es decir:

n
H n
1
x
i 1 i

Ejemplo

Los siguientes datos corresponden al precio del dólar durante 8 días, dado en
pesos:

2812 2900 2850 2878 3010 2698 2920 2674

Se pide hallar la media armónica del precio del dólar


52 CARLOS HERNAN SARAZA NARANJO

8
H
1 1 1 1 1 1 1 1
      
2812 2900 2850 2878 3010 2698 2920 2674

8
H
0,002818095

H  2838,79

La media armónica del precio del dólar fue $2838,79

4.2.3.2 Cálculo de la media armónica para datos con frecuencias

La media armónica se calcula utilizando la siguiente relación

n
H n
fi
x
i 1 i

Ejemplo

Los siguientes datos corresponden a la variación del interés bancario durante 30


días de un mes:

Variación % No. de días


0,2 7
0,4 9
0,5 6
0,6 5
0,7 3

Se pide hallar la media armónica de la variación del interés bancario

Vamos a aplicar la fórmula para lo cual construimos una tabla de valores

Variación No. de días f i / xi


0,2 7 35,00
0,4 9 22,50
0,5 6 12,00
0,6 5 8,33
0,7 3 4,28
82,11
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 53

30
H
82,11

H  0,36

La media armónica de la variación del interés bancario es 0,36 %.

4.2.4 Mediana

Se nota me. La mediana es una medida de centralización y de posición. La mediana


es una medida que divide un conjunto de datos en dos partes iguales de tal manera
que ubica el 50% de los datos a su izquierda (menores que la mediana) y el 50% de
los datos a su derecha (mayores que la mediana).

La mediana de un conjunto ORDENADO de valores se define como el dato medio


o como el promedio de los dos datos medios del conjunto. Esta definición está
dejando claro que para calcular la mediana se requiere ORDENAR previamente los
datos.

4.2.4.1 Cálculo de la mediana para datos que no están en intervalos

a. Si el número de datos es impar, la mediana es el dato medio del conjunto


ordenado de valores y se puede ubicar utilizando la relación:

M e  X n 1

Ejemplo:

Se toma el dato de la temperatura de 7 caballos. Los datos obtenidos son los


siguientes:
54 CARLOS HERNAN SARAZA NARANJO

X1 =38,2 X2 =37,2 X3 =36,9 X4 =37,4 X5 =37,8 X6 =39,3 X7 =38,8

Ordenando los datos se obtiene 36,9; 37,2; 37,4; 37,8; 38,2; 38,8; 39,3

La mediana es el dato medio, es decir, me=37,8 ° C

El 50% de los caballos mostraron temperatura mayor de 37,8°C y el otro 50%


mostraron temperatura menor de 37,8°C.

Aplicando la fórmula anotada para ubicar la mediana, se obtiene:

M e  X n 1  X 7 1  X 4
2 2

Lo anterior indica que la mediana es el dato que ocupa el cuarto lugar en el conjunto
ordenado de valores, en consecuencia, me =37,8 °C

b. Si el número de datos es par, la mediana es la media de los dos datos que


ocupan el centro del conjunto ordenado de valores y se puede ubicar
utilizando la relación:

X n X n 2
Me  2 2
2

Ejemplo:
Se toma el dato de la temperatura de 10 caballos. Los datos obtenidos son los
siguientes:

X1 =38,2 X2 =37,2 X3 =36,9 X4 =37,4 X5 =37,8 X6 =39,3 X7 =38,8

X8 =40,0 X9 =37,6 X10 =38,1

Ordenando los datos 36,9; 37,2; 37,4; 37,6; 37,8; 38,1; 38,2; 38,8; 39,3; 40,0

La mediana es la media de los dos datos que ocupan el centro, es decir,

37,8  38,1
Me   37,95 C
2
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 55

El 50% de los caballos mostraron temperatura mayor de 37,95°C y el otro 50%


mostraron temperatura menor de 37,95°C.

Aplicando la fórmula anotada para ubicar la mediana, se obtiene:

X n  X n2 X 10  X 10 2
X5  X6
Me  2 2
 2 2

2 2 2

Lo anterior indica que la mediana es la media de los datos que ocupan el quinto y
el sexto lugares en el conjunto ordenado de valores, en consecuencia,

37,8  38,1
Me   37,95 C
2

4.2.4.2 Mediana para datos agrupados en intervalos

Cuando los datos han sido agrupados en intervalos, la mediana se obtiene


utilizando la siguiente relación:

n 
  Fi 1 
M e  li   2 Cr
 fi 
 
 

Donde li = Límite real inferior del intervalo de clase mediana


n
=Tamaño de la muestra dividido entre dos
2
Fi-1 = Frecuencia absoluta acumulada del intervalo de clase anterior al intervalo de
clase mediana
fi = Frecuencia absoluta del intervalo de clase mediana.
Cr = Tamaño del intervalo real donde se encuentra la mediana (límite real superior
menos límite real inferior
56 CARLOS HERNAN SARAZA NARANJO

Para calcular la mediana es necesario determinar el intervalo en el cual se ubicará


(intervalo de clase mediana). El intervalo de clase mediana es aquel cuya frecuencia
n
absoluta acumulada contiene el valor del cociente .
2
Ejemplo: Los siguientes datos corresponden a una muestra del peso de bovinos en
la Finca Campoamor:

Peso (Kg) fi Fi Peso (Kg)


200 – 242 84 84 199,5-242,5
243- 285 56 140 242,5-285,5
286 – 328 35 175 285,5-328,5
329 – 371 22 197 328,5-371,5
372- 414 11 208 371,5-414,5
415 - 457 5 213 414,5-457,5
n=213

n 213
Se calcula =  106,5
2 2

Este valor se ubica en la columna de frecuencias absolutas acumuladas F i. La


frecuencia que contiene a 106,5 es F2, de acuerdo con ello la mediana se ubica en
el segundo intervalo. Al terminar el cálculo se debe verificar que el valor encontrado
se ubique entre 242,5 y 285,5 Kg.

Remplazando valores en la fórmula se obtiene:

n 
  Fi 1   106,5  84 
M e  li   2 Cr M e  242,5   43 M e  259,77 kilogramos
 fi   56 
 

El 50% de los bovinos en la finca Campoamor tienen peso superior a 259,77


kilogramos y el 50% tienen peso inferior a ese valor.
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 57

4.2.5 Cuartiles

Son medidas que dividen una distribución en cuatro partes iguales de tal manera
que cada cuartil corresponde a 25%. Se notan Q1, Q2 y Q3.

0% Q1 = 25% Q2= 50% Q3 = 75% 100%

El 25% de los datos de la muestra son menores que el cuartil 1 mientras que el
75% de los datos son mayores que el cuartil 1.

El 50% de los datos de la muestra son menores que el cuartil 2 mientras que el
50% de los datos son mayores que el cuartil 2, es decir, el cuartil 2 coincide con
la mediana.

4.2.5.1 Cálculo de los cuartiles

Para calcular uno cualquiera de los cuartiles se procede de igual manera que en el
caso de la mediana utilizando la siguiente fórmula:

 r.n 
  Fi 1 
Qr  li   4 Cr
 f 
 i

 

r representa el cuartil que se quiere calcular. La ubicación del intervalo en el cual se


r.n
encuentra el cuartil se hace por medio del cociente
4

4.2.6 Deciles

Son medidas que dividen una distribución en diez partes iguales de tal manera
que cada decil corresponde a 10%. Se notan D1, D2, D3,..., D9

0% D1 =10% D3=30% D5=50% D9=90% 100%


58 CARLOS HERNAN SARAZA NARANJO

El 10% de los datos de la muestra son menores que el decil 1 mientras que el
90% de los datos son mayores que el decil 1.

El 20% de los datos de la muestra son menores que el decil 2 mientras que el 80%
de los datos son mayores que el decil 2; el decil 5 coincide con la mediana

4.2.6.1 Cálculo de los deciles

Para calcular uno cualquiera de los deciles se procede de igual manera que en el
caso de la mediana utilizando la siguiente fórmula:

 r.n 
  Fi 1 
Dr  li   10 Cr
 fi 
 
 

r representa el decil que se quiere calcular. La ubicación del intervalo en el cual se


r.n
encuentra el decil se hace por medio del cociente
10

4.2.7 Percentiles

Son medidas que dividen una distribución en cien partes iguales de tal manera
que cada percentil corresponde a 1%. Se notan P1, P2, P3,...,P99

0% P5 P10 P99
5% 10% 99%

El 1% de los datos de la muestra son menores que el percentil 1 mientras que el


99% de los datos son mayores que el percentil 1

El 5% de los datos de la muestra son menores que el percentil 5 mientras que el


95% de los datos son mayores que el percentil 5; el percentil 50 coincide con la
mediana
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 59

4.2.7.1 Cálculo de los percentiles

Para calcular uno cualquiera de los percentiles se procede de igual manera que en
el caso de la mediana utilizando la siguiente fórmula:

 r.n 
  Fi 1 
Pr  li   100 Cr
 fi 
 
 

r representa el percentil que se quiere calcular. La ubicación del intervalo en el


r.n
cual se encuentra el percentil se hace por medio del cociente
100

Ejemplo: Se tomó el peso de un lote de pollos que han sido alimentados con una
dieta alternativa. Los pesos encontrados se registran en la siguiente tabla. Se
requiere determinar el peso del 18% de los pollos más livianos; el peso del 25%
de los pollos más pesados y el peso del 40% de los pollos más pesados.
Pesos (Libras) fi Fi Pesos (Libras)
2,0 - 2,6 42 42 1,95 - 2,65
2,7 - 3,3 24 66 2,65 – 3,35
3,4 - 4,0 78 144 3,35 - 4,05 P18
4,1- 4,7 124 268 4,05 - 4,75
4,8 - 5,4 221 489 4,75 - 5,45 Q3;D6
5,5 - 6,1 125 614 5,45 – 6,15
n=614

Se están pidiendo el P18, el Q3 y el D6. Los cálculos aparecen a continuación:


18(614)
P18 se encuentra en el intervalo que corresponde a  110,52
100
Por lo tanto el P18 se encuentra en el tercer intervalo y su cálculo es el siguiente:

 110,52  66 
P18  3,35   .0,7 P18  3,35  0,3995 P18  3,74 Libras
 78 
60 CARLOS HERNAN SARAZA NARANJO

El 18% de los pollos más livianos pesan 3,74 libras o menos.


3(614)
Q3 se encuentra en el intervalo que corresponde a  460,5
4
Por lo tanto el Q3 se encuentra en el quinto intervalo y su cálculo es el siguiente:

 460,5  268 
Q3  4,75   .0,7 Q3  4,75  0,6097 Q3  5,35 libras El
 221 
25% de los pollos más pesados pesan más de 5,35 libras.
6(614)
D6 se encuentra en el intervalo que corresponde a  368,4
10
Por lo tanto el D6 se encuentra en el quinto intervalo y su cálculo es el siguiente:

 368,4  268 
D6  4,75   .0,7 D6  4,75  0,318 D6  5,06 libras
 221 
El 40% de los pollos más pesados pesan más de 5,06 libras.

4.2.8 Moda

Se nota mo. Se define como el dato que más se repite en la muestra, es decir, el
dato de mayor frecuencia absoluta. En una muestra puede ocurrir que haya una
moda, en este caso se dice que la muestra es unimodal; puede ocurrir que haya
más de una moda, en este caso la muestra se denomina multimodal; también
puede ocurrir que no haya moda, en este caso la muestra se denomina amodal.

Estas tres situaciones se ilustran a continuación:

Xi fi Xi fi Xi fi
12 12 12 12 12 12
15 15 15 12 15 15
18 24 18 12 18 25
20 11 20 12 20 11
22 10 22 12 22 25

La tabla de la izquierda corresponde a una muestra unimodal, tiene una


moda m0  18 ; la tabla del centro corresponde a una muestra amodal, NO
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 61

tiene moda porque todos los valores de la variable se repiten igual número de
veces; la tabla de la derecha corresponde a una muestra multimodal
(bimodal), tiene 2 modas: m0  18 , m0  22
1 2

4.2.8.1 Moda para datos agrupados en intervalos


Cuando los datos han sido agrupados en intervalos, la moda está dada por:

 f i  f i 1 
M o  li   Cr
 ( f i  f i 1 )  ( f i  f i 1 ) 

li Límite real inferior del intervalo de clase modal.

f i  f i 1 Diferencia entre la frecuencia absoluta del intervalo de clase modal y


la frecuencia absoluta del intervalo inmediatamente anterior.

f i  f i 1 Diferencia entre la frecuencia absoluta del intervalo de clase modal y


la frecuencia absoluta del intervalo inmediatamente posterior.

Cr Tamaño del intervalo real modal.

El intervalo modal es aquel que presenta mayor frecuencia absoluta.

Ejemplo:

Los siguientes datos corresponden a una muestra del peso, en gramos, de los
huevos recolectados durante un día en la avícola Suprema.

Peso (Gramos) fi Peso (Gramos)


53,2-54,0 124 53,15-54,05
54,1-54,9 203 54,05-54,95
55,0-55,8 333 54,95-55,85
55,9-56,7 245 55,85-56,75
56,8-57,6 132 56,75-57,65
57,7-58,5 422 57,65-58,55
58,6-59,4 414 58,55-59,45

El intervalo de clase modal es el sexto porque allí se encuentra la mayor frecuencia


absoluta; el cálculo de la moda es como sigue:
62 CARLOS HERNAN SARAZA NARANJO

 422  132 
M o  57,65   .0,9
 ( 422  132)  ( 422  414) 

 290 
M o  57,65   .0,9
 290  8) 

M o  58,52 gramos

El peso que más se presenta en los huevos recolectados en un día en la Avícola


Suprema es 58,52 gramos.

Si al construir la distribución de frecuencias resultan


dos o más intervalos con la mayor frecuencia
absoluta, se trata de una muestra con dos o más
modas y debe calcularse cada una de ellas.

4.2.9 Uso de las medidas de centralización

En un estudio estadístico se pueden utilizar, según el caso, la media, la mediana o


la moda. La decisión acerca del uso de una u otra medida debe tomarse atendiendo
algunas observaciones.

 Cuando la distribución presente mucha asimetría (la mayoría de los datos estén
a un extremo de la muestra) debe utilizarse la mediana o la moda.

Xi fi
12 2 X  20,92

15 5 M e  22 M o  22
18 4
20 11
22 19
25 12
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 63

Note la diferencia entre las medidas. Resultan más adecuadas la Me y la Mo

 Cuando la distribución tiene una o varias frecuencias absolutas muy diferentes


de las demás, debe utilizarse la moda.

Xi fi
12 2
15 5 X  20,42

18 15 M e  20
20 11 M o  22
22 19 Resulta más adecuada la Mo
25 3

 En una distribución en la que los valores extremos no estén definidos debe


calcularse la mediana o la moda.
Xi fi Como X1 y X6 no están definidas,
<12 2 no es posible calcular la media
15 5 M e  20
18 15 M o  20
20 11
22 19
>25 3

 La media se deja afectar fácilmente por valores extremos, en presencia de estos


es preferible utilizar la mediana. Si, de todas maneras, resulta necesario calcular
la media, es preferible retirar de la muestra aquellos datos que se encuentren
muy alejados.
64 CARLOS HERNAN SARAZA NARANJO

Ejemplo: un investigador de mercados pregunta a 8 empleados de una finca, cuál


es su salario mensual. Los datos obtenidos, en miles de pesos, se resumen en la
siguiente tabla:
720 832 834 835 1730 720 715 718

El investigador calculó el salario medio por mes de las ocho personas así:

720  832  834  835  1730  720  715  718


X  888
8

De acuerdo con este resultado se debe concluir que las ocho personas reciben un
salario medio mensual de $888.000.

El investigador analiza el resultado y observa que supera a todos los salarios


excepto a uno de ellos que corresponde al agregado de la finca. Entonces decide
excluir este dato de la muestra y volver a calcular el salario medio obteniendo:

720  832  834  835  720  715  718


X  767,714
7

De acuerdo con este resultado se debe concluir que las personas de la finca
reciben un salario medio mensual de $767.714

Si se comparan los dos resultados se podrá concluir que este último es más
adecuado para interpretar el salario medio (está más cercano a todos los datos).

 Cuando el tamaño de los intervalos en la distribución no es constante, no debe


utilizarse la moda
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 65

UNIDAD V
MEDIDAS DE DISPERSIÓN

INTRODUCCIÓN

El cálculo de medidas de centralización resulta importante para el análisis de una


muestra, sin embargo no es suficiente. Existen variados ejemplos de muestras,
claramente diferentes entre sí, que conducen al mismo resultado referente a las
medidas de centralización. Se hace, en consecuencia, imprescindible determinar en
qué grado los datos de la muestra se alejan de dichas medidas.

Medir la dispersión permite, de un lado, determinar cómo se ajusta una medida de


centralización al conjunto del cual fue obtenida y del otro establecer grados de
alejamiento entre los datos de la muestra.

En el presente capítulo se aborda el cálculo de medidas de dispersión absoluta y de


medidas de dispersión relativa permitiendo con ello un mayor acercamiento al
análisis de muestras.

5.1 Definición de medidas de dispersión

Son medidas que permiten determinar el grado de alejamiento que un conjunto de


datos tiene con respecto a una medida de centralización. Algunas medidas de
dispersión son: el rango, la desviación media, la varianza, la desviación estándar y
el coeficiente de variación.

5.2 Rango

El rango R, es la diferencia que existe entre el dato mayor y el dato menor de un


conjunto de valores.

R = DM - Dm
66 CARLOS HERNAN SARAZA NARANJO

Ejemplo:

Los siguientes datos corresponden al peso en kilogramos de una muestra de


camuros

X1= 46,62; X2=47,75; X3=47,48; X4=47,58; X5=48,52; X6=50,54; X7= 40,5; X8=43,8

El rango de los pesos está dado por:

R = 50,54 – 40,5 R = 10,04 kilogramos.

Como puede observarse, el rango es una medida muy fácil de calcular pero a su
vez presenta el inconveniente de que no proporciona buena información acerca del
comportamiento de la muestra; esto ocurre porque el rango sólo considera dos
datos de la muestra olvidándose de los demás.

5.3 Desviación media

La desviación media, M.D., de un conjunto de datos se define como la media de los


valores absolutos de las desviaciones del conjunto de datos con relación a la media.

En consecuencia, la desviación media viene dada por las siguientes relaciones

 xi  x
M .D.  Cuando los datos de la muestra se presentan sin frecuencias
n
f i xi  x
M .D.  Cuando los datos de la muestra se presentan con frecuencias
n

Nota importante: las fórmulas incluyen el concepto de valor absoluto. El valor


absoluto de un número es el valor del número considerándolo siempre positivo, es
decir:
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 67

7  7 y 7  7

Ejemplo 1:

Se realiza un estudio sobre el crecimiento de 8 semillas de pasto estrella manejadas


in vitro. Los datos obtenidos en centímetros son los siguientes:

X1=14,5 X2=15,5 X3=18,4 X4=10,2 X5=10,8 X6=17,3 X7=16,7 X8=19,4

Se requiere hallar la desviación media del crecimiento de las plantas.

Para hacer el cálculo es necesario calcular, en primera instancia, la media del


crecimiento de las semillas.
xi 122,8
x   15,35 centímetro s
n 8
Con esta media se calculan las desviaciones correspondientes

14,5  15,35  ,15,5  15,35  18,4  15,35  10,2  15,35  10,8  15,35  17,3  15,35  16,7  15,35  19,4  15,35
M .D. 
8

0,85  0,15  3,05  5,15  4,55  1,95  1,35  4,05 21,1


M .D.  M .D.   2,6375 centímetro s
8 8

El crecimiento de las plantas de pasto estrella manejadas in vitro tiene una longitud
media de 15,35 centímetros con una desviación media de 2,63 centímetros.

Ejemplo 2:
68 CARLOS HERNAN SARAZA NARANJO

Se realiza un estudio sobre el peso de una muestra de camuros que han recibido
una dieta de forraje + concentrado comercial. Se toma el peso de 120 camuros. Los
datos obtenidos en kilogramos se registran en la siguiente tabla:

Pesos (Kg) fi xi f i .xi xi  x f i . xi  x


40-42 22 41 902 5,775 127,050
43-45 21 44 924 2,775 58,275
46-48 36 47 1692 0,225 8,100
49-51 26 50 1300 3,225 83,850
52-54 15 53 795 6,225 93,375
n=120 5613 370,65

Calculando la media resulta f i .xi  5613  46,775 kilogramos


n 120
370,65
M .D.   3,08 kilogramos
120

El peso medio de los camuros alimentados con forraje + concentrado comercial es


46,78 kilogramos. Los pesos tienen una desviación media de 3,08 kilogramos.

5.4 Varianza

La varianza de un conjunto de datos se simboliza S2 cuando se calcula para una


muestra y se simboliza σ2 cuando se calcula para una población.

La varianza de un conjunto de datos se define como la media de los cuadrados de


las desviaciones del conjunto de datos, con relación a la media.

En consecuencia, la varianza viene dada por las siguientes relaciones


ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 69

( xi  x )2 Cuando los datos se presentan sin frecuencias


S2 
n

f i .( xi  x )2 Cuando los datos se presentan con frecuencias


S2 
n

Cuando el tamaño de la muestra es menor que 30 datos se recomienda calcular la


varianza corregida. La corrección se consigue utilizando en el denominador de las
fórmulas el valor n-1.

Entonces las fórmulas para el cálculo de la varianza corregida son las siguientes:

( xi  x ) 2 Cuando los datos se presentan sin frecuencias


S n1 
2

n 1

f i .( xi  x ) 2 Cuando los datos se presentan con frecuencias


S n1 
2

n 1

La varianza se expresa en
unidades cuadradas

Ejemplo 1:

Se realiza un estudio de la cantidad de leche que se obtiene por vaca al día en la


finca Lucerna. La producción en litros de 10 vacas se resume en la siguiente tabla:

4,5 4,8 3,9 4,2 4,4 3,8 3,7 5,1 6,0 4,6

Para calcular la varianza se empieza por hallar la media de las producciones


xi 45
x   4,5 litros
n 10
Luego se hallan las desviaciones y estas se elevan al cuadrado
70 CARLOS HERNAN SARAZA NARANJO

xi xi  x ( xi  x ) 2
4,5 0,0 0,00
4,8 0,3 0,09
3,9 -0,6 0,36
4,2 -0,3 0,09
4,4 -0,1 0,01
3,8 -0,7 0,49
3,7 -0,8 0,64
5,1 0,6 0,36
6,0 1,5 2,25
4,6 0,1 0,01
4,3

4,3
S2   0,47 litros 2

La producción diaria de leche por vaca tiene una varianza de 0,47 litros2.

Nótese que se
calculó la varianza
corregida porque
n<30
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 71

Ejemplo 2

Se realiza un estudio para determinar el peso en pie de cerdos entregados para el


sacrificio en la Porcícola “Colitas”. Los datos obtenidos, en kilogramos, se resumen
en la siguiente tabla:
Pesos (Kg) fi xi f i .x i xi  x ( xi  x ) 2 f i .( xi  x ) 2
75,8-76,9 4 76,35 305,4 -5,39 29,0521 116,2084
77,0-78,1 3 77,55 232,65 -4,19 17,5561 52,6683
78,2-79,3 7 78,75 551,25 -2,99 8,9401 62,5807
79,4-80,5 15 79,95 1199,25 -1,79 3,2041 48,0615
80,6-81,7 26 81,15 2109,9 -0,59 0,3481 9,0506
81,8-82,9 32 82,35 2635,2 0,61 0,3721 11,9072
83,0-84,1 43 83,55 3592,65 1,81 3,2761 140,8723
n=130 10626,3 441,349

fi .xi 10626,3


x   81,74 kilogramos
n 130

441,349
S2   3,39 kilogramos 2

130

El peso medio de los cerdos al sacrifico en la Finca Colitas es 81,74 kilogramos. Los
pesos tienen una varianza de 3,39 kilogramos2.

5.4.1 Propiedades de la varianza

1. La varianza de una constante es igual a cero

Ejemplo: Sean x1 =3 x2=3 x3=3 x4=3 x5=3 x6=3

De acuerdo con las propiedades de la media, la media de una constante es igual a

la constante, en consecuencia, x 3
72 CARLOS HERNAN SARAZA NARANJO

Si se calculan las desviaciones de cada uno de los datos con respecto a la media,
estas son iguales a cero, por lo tanto resulta que:

0
S2  0
5

2. La varianza de una variable más una constante es igual a la varianza de la


variable

Ejemplo:

Sean x1 =3 x2=4 x3=6 x4=2 x5=5 x6=1

xi 21
Calculando la media se obtiene: x1    3,5
n 6

Calculando la varianza se obtiene:

(3  3,5) 2  (4  3,5) 2  (6  3,5) 2  (2  3,5) 2  (5  3,5) 2  (1  3,5) 2


S1   3,5
2

Sumando una constante K=5 a cada uno de los datos se obtiene la serie

x1 =8 x2=9 x3=11 x4=7 x5=10 x6=6

Calculando la nueva media se obtiene: x  3,5  5 x2  8,5 (aplicando


propiedades de la media)

Calculando la nueva varianza se obtiene


(8  8,5) 2  (9  8,5) 2  (11  8,5) 2  (7  8,5) 2  (10  8,5) 2  (6  8,5) 2
S2   3,5
2

5
ESTADÍSTICA CON APLICACIONES EN ZOOTECNIA 73

Por medio del ejemplo se comprueba que S1  S 2  3,5


2 2

3. La varianza de una variable por una constante es igual al producto del cuadrado
de la constante por la varianza de la variable.

Ejemplo:

Sean x1 =3 x2=4 x3=6 x4=2 x5=5 x6=1

Calculando la varianza se obtiene que S21 = 3,5

Multiplicando cada valor por una constante arbitraria, por ejemplo K=3, se obtiene
la serie

x1 =9 x2=12 x3=18 x4=6 x5=15 x6=3

Hallando la nueva varianza se obtiene S22 = 31,5

S22 = K2. S21 = (3) 2(3,5) = 9(3,5) = 31,5

5.5 Desviación estándar

Para evitar la presentación de los resultados en unidades cuadradas, unidades que


hacen ilógicos los análisis de los mismos, se utiliza una nueva medida que se
denomina desviación estándar o desviación típica. (Es necesario anotar que la
varianza es muy importante en cálculos estadísticos y en la comparación de
parámetros de diferentes poblaciones).
74 CARLOS HERNAN SARAZA NARANJO

La desviación estándar se nota S cuando el cálculo se hace para una muestra y se


nota σ cuando el cálculo se hace para una población, la desviación estándar se
define como la raíz cuadrada positiva de la varianza, de esta manera se obtiene:
s  s 2 en términos de las fórmulas se tiene que

( xi  x ) 2 Cuando los datos se presentan sin frecuencias


s
n

f i .( xi  x ) 2 Cuando los datos se presentan con frecuencias


s
n

Para calcular la desviación estándar de una muestra se pueden utilizar las fórmulas
anteriores, sin embargo, cuando el tamaño de la muestra es menor que 30 datos,
se recomienda calcular la desviación estándar corregida. La corrección se consigue
utilizando en el denominador de las fórmulas el valor de n-1.

Entonces las fórmulas para el cálculo de la desviación estándar corregida son las
siguientes:

( xi  x ) 2 Cuando los datos se presentan sin frecuencias


sn1 
n 1

f i .( xi  x ) 2 Cuando los datos se presentan con frecuencias


sn1 
n 1

NOTA: debe quedar claro que para obtener la desviación estándar basta con
calcular la raíz cuadrada positiva de la varianza.

Ejemplo 1:

Se pregunta a 8 familias campesinas el número de personas que conforman la unidad


familiar. Los datos obtenidos se resumen en la siguiente tabla:
1 2 4 8 4 2 8 16
Para calcular la desviación estándar se calcula primero la varianza y al resultado
obtenido se le extrae la raíz cuadrada positiva:
xi xi  x ( xi  x ) 2
1 -4,625 21,390625
2 -3,625 13,140625
4 -1,625 2,640625
8 2,375 5,640625
4 -1,625 2,640625
2 -3,625 13,140625
8 2,375 5,640625
16 10,375 107,640625
Ʃ45 171,875

xi 45 171,875
x   5,625 personas s2   24,5535 personas 2
n 8 7

s  24,55352  4,95 personas

El número medio de personas que conforman la unidad familiar es 5,6 personas con
desviación estándar de 4,9 personas.

Ejemplo 2:

Se realiza un estudio para determinar el valor diario de las ventas realizadas por 80
empresas agroindustriales ubicadas en ciudades capitales del país. Los datos, en
millones de pesos, se resumen en la siguiente tabla:

Ventas fi xi f i .x i xi  x ( xi  x ) 2 f i .( xi  x ) 2
(millones de $)
2,14-2,42 5 2,28 11,40 -0,982375 0,965060 4,825300
2,43-2,71 4 2,57 10,28 -0,692375 0,479383 1,917532
2,72-3,00 11 2,86 31,46 -0,402375 0,161905 1,780955
3,01-3,29 25 3,15 78,75 -0,112375 0,012628 0,315700
3,30-3,58 14 3,44 48,16 0,177625 0,031550 0,441700
3,59-3,87 12 3,73 44,76 0,467625 0,218673 2,624076
3,88-4,16 9 4,02 36,18 0,757625 0,573995 5,165955
n=80 260,99 17,071218

fi .xi 260,99 x  $3.262.375


x   3,262375 millones de pesos
n 80
76 CARLOS HERNAN SARAZA NARANJO

17,071218
s2   0,213390225 millones de pesos 2

80

s  0,213390225  0,46194 millones de pesos

Las empresas agroindustriales realizan una venta media diaria de $3.262.375 con
varianza de 0,21339 millones de $2 y desviación estándar 0,46194 millones de $.

5.5.1 Interpretación de la desviación estándar

La producción media diaria de carne de conejo en las fincas del corregimiento La


Unión es 1,2 arrobas con desviación estándar de 0,12 arrobas.

Resulta importante saber qué significa este valor de la desviación estándar. Para
hacerlo existen dos posibilidades.

5.5.1.1 Campana de Gauss

Si la distribución de los datos es simétrica, es decir, si las frecuencias absolutas


ascienden hacia el centro y luego descienden guardando la misma proporción, se
pueden hacer las siguientes afirmaciones derivadas de los valores de áreas bajo la
curva normal (Campana de Gauss). (El tema hace parte de los contenidos de un
curso de Estadística Inferencial).

 El 68,27% de los datos de la muestra quedan incluidos en el intervalo X  S


 El 95,45% de los datos de la muestra quedan incluidos en el intervalo X  2.S
 El 99,73% de los datos de la muestra quedan incluidos en el intervalo X  3.S

Aplicado al supuesto de producción media de carne de conejo tenemos


 El 68,27% de los datos de la muestra quedan incluidos en el intervalo 1,2 0,12;
es decir, el 68,27% de los datos de la muestra quedan incluidos en el intervalo
(1,08,3;1,32)

Este intervalo muestra que analizado el 68,27% de las fincas, es posible encontrar
fincas con producción de 1,08 arrobas mientras que otras lograron producción
superior a 1,08 arrobas pudiendo llegar hasta 1,32 arrobas.

 El 95,45% de los datos de la muestra quedan incluidos en el intervalo 1,2 0,24;


es decir, el 95,45% de los datos de la muestra quedan incluidos en el intervalo
(0,96;1,44)

Este intervalo muestra que analizado el 95,45% de las fincas, es posible encontrar
fincas con producción de 0,96 arrobas mientras que otras lograron producción
superior a 0,96 arrobas pudiendo llegar hasta 1,44 arrobas.

 El 99,73% de los datos de la muestra quedan incluidos en el intervalo 1,2  0,36;


es decir, el 99,73% de los datos de la muestra quedan incluidos en el intervalo
(0,84;1,56)

Este intervalo muestra que analizado el 99,73% de las fincas, es posible encontrar
fincas con producción de 0,84 arrobas mientras que otras lograron producción
superior a 0,84 arrobas pudiendo llegar hasta 1,56 arrobas.

Es importante notar que para analizar el 99,73% de una muestra simétrica es


posible restar y sumar a la media tres veces la desviación estándar de los datos.

Ejemplo:

Los siguientes datos corresponden al peso, en gramos, de huevos de codornices


en la empresa Maracay
78 CARLOS HERNAN SARAZA NARANJO

Peso (g)

( xi  x ) 2 f i .( xi  x ) 2
fi xi f i .x i xi  x

14,0 - 14,2 54 14,1 761,4 -0,9 0,81 43,74


14,3 - 14,5 72 14,4 1.036,8 -0,6 0,36 25,92
14,6 - 14,8 84 14,7 1.234,8 -0,3 0,09 7,56
14,9 - 15,1 96 15,0 1440,0 0 0 0,00
15,2 - 15,4 84 15,3 1.285,2 0,3 0,09 7,56
15,5 - 15,7 72 15,6 1.123,2 0,6 0,36 25,92
15,8 - 16,0 54 15,9 858,6 0,9 0,81 43,74
n=516 7.740 154,44

Al calcular la media y la desviación estándar de los datos se obtiene

f i .xi 7740
x   15 gramos
n 516

154,44
S2   0,2993 g 2
516

S  0,2993 g 2  0,54 g

Los huevos de codorniz producidos en la finca Maracay tienen un peso medio de 15


gramos, con varianza de 0,29 gramos2 y desviación estándar de 0,54 gramos.

Para la muestra se cumple que:

 El 68,27% de los datos quedan incluidos en el intervalo x  S , es decir, el 68,27%


de los datos quedan en el intervalo 150,54  (14,46;15,54) gramos. En términos
de la muestra afirmamos que el 68,27% de los huevos de codorniz que se
producen en la finca Maracay tienen peso entre 14,46 y 15,54 gramos.
 El 95,45% de los datos quedan incluidos en el intervalo x  2S , es decir, el 95,45%
de los datos quedan en el intervalo 151,08  (13,92;16,08) gramos. En términos
de la muestra afirmamos que el 95,45% de huevos de codorniz producidos en la
finca Maracay tienen peso entre 13,92 y 16,08 gramos.
 El 99,73% de los datos quedan incluidos en el intervalo x  3S , es decir, el 99,73%
de los datos quedan en el intervalo 151,62  (13,38;16,62) gramos. En términos
de la muestra afirmamos que el 99,73% de los huevos de codorniz producidos en
la finca Maracay tienen peso entre 13,38 y 16,62 gramos.

5.5.1.2 Teorema de Tchebysheff

Para aproximar una interpretación de la desviación estándar, cuando la distribución


de la muestra no es simétrica, el matemático ruso Tchebysheff enunció el siguiente
teorema:

“Dado un número K mayor que 1 y un conjunto de


n observaciones X1,X2,X3,...,Xn, por lo menos
 1 
1  2 % de las observaciones se encuentran en
 k 
el intervalo X  K .S ”

El teorema permite escoger cualquier número mayor que 1 y con este número
calcular el porcentaje de la muestra que se va a describir y el intervalo en el que se
ubica ese porcentaje de datos de la muestra:

Ejemplo:
80 CARLOS HERNAN SARAZA NARANJO

Los siguientes datos corresponden al porcentaje de grasa encontrada en diferentes


muestras de leche entera.

Porcentaje de
grasa
fi xi f i .x i xi  x ( xi  x ) 2 f i .( xi  x ) 2

2,70 - 2,82 38 2,76 104,88 -0,30 0,0900 3,4200


2,83 - 2,95 85 2,89 245,65 -0,17 0,0289 2,4565
2,96 - 3,08 70 3,02 211,4 -0,04 0,0016 0,1120
3,09 - 3,21 62 3,15 195,3 0,09 0,0081 0,5022
3,22 - 3,34 21 3,28 68,88 0,22 0,0484 1,0164
3,35 - 3,47 42 3,41 143,22 0,35 0,1225 5,1450
3,48 - 3,60 10 3,54 35,4 0,48 0,2304 2,3040
n=328 1.004,73 14,9561

Al calcular la media y la desviación estándar de los datos se obtiene

f i .xi 1.004,73
x   3,06%
n 328

14,9561
S2   0,0455 % 2
328

S  0,0455 % 2  0,21 %

Los muestras de leche tienen un contenido medio de grasa de 3,06%, con varianza
de 0,0455 %2 y desviación estándar de 0,21%.

Aplicando el teorema de Tchebysheff y escogiendo K=3 y K= 3,5 encontramos:


a. Para K=3

 1   1 8
1  2 %  1 -  %   %  88,88%
 3   9  9

Entonces se puede concluir que por lo menos el 88,88% de las muestras de leche
tienen un contenido de grasa en el intervalo X  3.S , es decir, por lo menos el 88,88%
de las muestras de leche tienen contenido de grasa en el intervalo 3,06  3(0,21)

Realizando la multiplicación y procediendo primero a restar y después a sumar se


obtiene el intervalo (2,43 ; 3,69)%

Por lo menos el 88,88% de las muestras de leche tienen una cantidad de grasa que
oscila entre 2,43% y 3,69 %.

NOTA: Tenga en cuenta que tanto la campana de Gauss como el teorema de


Tchebysheff calculan tan sólo una aproximación al comportamiento de la desviación
estándar, por lo tanto no le debe extrañar si al hacer los cálculos algunos de los
resultados quedan por fuera de la tabla de datos.

b. Para K=3,5

 1   1 
1  %  1 -  %  91,83%
 3,52   12,25 

Entonces se puede concluir que por lo menos el 91,83% de las muestras de leche
tienen un contenido de grasa en el intervalo X  3,5S , es decir, por lo menos el
91,83% de las muestras de leche tienen un contenido de grasa en el intervalo
3,06  3,5(0,21)
82 CARLOS HERNAN SARAZA NARANJO

Realizando la multiplicación y procediendo primero a restar y después a sumar se


obtiene el intervalo (2,325 ; 3,795)%

Por lo menos el 91,83% de las muestras de leche tienen un contenido de grasa


entre 2,32% y 3,79%.

5.6 Coeficiente de variación

Se simboliza C.V., es una medida de dispersión relativa que relaciona la desviación


estándar y la media de una muestra. Tiene la propiedad de ser una medida sin
unidades razón por lo cual resulta muy útil para comparar la dispersión de dos o
más muestras aunque estas manejen diferentes unidades. El coeficiente de
variación se expresa en porcentaje.

El coeficiente de variación permite mostrar la homogeneidad de un conjunto de


datos. En tanto el valor del coeficiente sea más cercano a cero, los datos son más
homogéneos, mientras que su alejamiento de cero indica alta heterogeneidad en
los datos.

Aunque no existe un valor exacto para indicar cuándo el coeficiente de variación es


bueno o malo, se puede afirmar que valores del coeficiente menores o iguales que
10% indican un buen grado de homogeneidad en los datos mientras que valores por
encima del 10% corresponden a datos heterogéneos.

5.6.1 Cálculo del coeficiente de variación


S
C.V .  X 100
X

Ejemplo 1:
El propietario de la finca “Ruiseñor” toma el dato del peso y el diámetro de los
huevos de avestruz producidos en la finca. Los datos obtenidos, en gramos y en
centímetros respectivamente, se resumen en las siguientes tablas. Se requiere
determinar cuál de las dos variables: peso o diámetro resulta más heterogénea.

Peso de una muestra de huevos de avestruz finca “Ruiseñor”


Peso (Kg) Xi fi f i .X i (X i  X )2 f i .( X i  X ) 2

0,85-1,05 0,95 24 22,8 0,236196 5,668704


1,06-1,26 1,16 52 60,32 0,076176 3,961152
1,27-1,47 1,37 75 102,75 0,004356 0,3267
1,48-1,68 1,58 78 123,24 0,020736 1,617408
1,69-1,89 1,79 43 76,97 0,125316 5,388588
1,90-2,10 2,00 8 16 0,318096 2,544768
n=280 402,08 19,50732

f i .xi 402,08,
x   1,436 kilogramos
n 280

19,50732
S  0,2639 kilogramos
280
0,2639
C.V .  X 100  18,37%
1,436

Los huevos tienen un peso medio de 1,436 kilogramos, con desviación estándar de
0,2639 kilogramos, para un coeficiente de variación de 18,37%.
84 CARLOS HERNAN SARAZA NARANJO

Diámetro de una muestra de huevos de avestruz en la finca “Ruiseñor”


Diámetro (cm) Xi fi f i .X i (X i  X )2 f i .( X i  X ) 2

12,0-12,3 12,15 14 170,1 1,69 23,66


12,4-12,7 12,55 22 276,1 0,81 17,82
12,8-13,1 12,95 40 518 0,25 10
13,2-13,5 13,35 78 1041,3 0,01 0,78
13,6-13,9 13,75 53 728,75 0,09 4,77
14,0-14,3 14,15 73 1032,95 0,49 35,77
n=280 3767,2 92,8

f i .xi 3767,2
x   13,45 centímetro s
n 280

92,8
S  0,57 centímetro s
280
0,57
C.V .  X 100  4,23%
13,45

Los huevos tienen un diámetro medio de 13,45 centímetros, con desviación


estándar de 0,57 centímetros, para un coeficiente de variación de 4,23%.

Con los datos obtenidos de las dos tablas se puede concluir que el diámetro de los
huevos tiene menor dispersión que el peso de estos. Es decir, el peso es más
heterogéneo que el diámetro.

Ejemplo 2

Un informe estadístico indica que el precio medio de venta de la libra de carne de


cerdo es $8650,2 con desviación estándar de $106,25, en tanto que el precio medio
de carne de res es $12450 con desviación estándar de $72. Se busca determinar
cuál de los dos precios resulta más homogéneo.
PRECIO DE VENTA LIBRA DE CARNE DE CERDO

106,25
C.V .  X 100  1,22%
8650,2

PRECIO DE VENTA LIBRA DE CARNE DE RES


72
C.V .  X 100  0,578%
12450

Resulta más homogéneo el precio de venta de la libra de carne de res.

5.7 Análisis de dispersión

La dispersión de una muestra se puede analizar teniendo en cuenta dos criterios


diferentes: i) la distribución de los datos alrededor de la media; ii) la forma como los
datos se alzan en un gráfico de frecuencias formando picos más o menos
pronunciados. Para el primer caso se utiliza el denominado coeficiente de sesgo,
mientras que para el segundo caso se calcula el coeficiente de curtosis.

Tanto el coeficiente de sesgo como el de curtosis son adimensionales, es decir, no


tienen unidades y se calculan utilizando el concepto de momentos con respecto a
la media, los que se definen a continuación:

5.7.1 Momentos con respecto a la media

Si una variable x que toma valores xi tiene una media X , se define el momento de
orden r con respecto a la media, por medio de la siguiente relación:

mr 
 f * (x  x)
i i
r

n
86 CARLOS HERNAN SARAZA NARANJO

Entonces se tiene que m1   f i * ( xi  x ) de acuerdo con las propiedades de la


n

media se tiene que el momento de orden 1 es igual a cero; m1  0 .

m2 
f i * ( xi  x ) 2
de acuerdo con las fórmulas ya estudiadas en este libro se tiene
n

que el momento de orden 2 es la varianza m2  S 2 .

m3 
f i * ( xi  x ) 3
momento de orden tres.
n

Así sucesivamente se puede calcular cualquier momento con respecto a la media


de la muestra.

Los momentos 3 y 4 son útiles para analizar el comportamiento de una muestra; el


momento 3 permite determinar el sesgo de una muestra mientras que el momento
4 permite determinar la curtosis.

5.7.2 Sesgo

El sesgo es un concepto que analiza la simetría o asimetría de una muestra con


relación a un punto central. Si la muestra es simétrica se dice que los datos son
normales y por lo tanto se comportan de igual manera a derecha e izquierda del
punto de simetría (ver figura No. 8); si la muestra tiene una cola más alargada que
la otra se trata de una muestra sesgada a la izquierda (figura No. 9) o sesgada a la
derecha (figura No. 10)
Curva normal Sesgo a la izquierda Sesgo a la derecha
Figura No. 8 Figura No. 9 Figura No. 10

En presencia del gráfico resulta fácil determinar si una muestra tiene sesgo o si es
simétrica, pero no es posible determinar de qué magnitud es el sesgo que presenta,
para conocer este elemento se debe calcular el denominado coeficiente de sesgo

5.7.2.1 Coeficiente de sesgo

Es un valor que permite medir el sesgo de una muestra, se simboliza a 3 y está


definido así:
m3
a3  donde m3 es el tercer momento con relación a la media; s3 es la desviación
s3
estándar elevada al cubo.

El coeficiente de sesgo puede ser negativo, positivo o cero, el valor del coeficiente
se interpreta de la siguiente manera:

Si a3<0 entonces la muestra se encuentra sesgada a la izquierda


Si a3=0 entonces la muestra es simétrica
Si a3>0 entonces la muestra se encuentra sesgada a la derecha

Ejemplo: se realiza un estudio para determinar el número de bolsas de leche


vendidas por tienda, en una semana, en el municipio de Pereira. Se toma el dato
del número de bolsas de leche vendidas en 110 tiendas y se obtienen los siguientes
datos:
88 CARLOS HERNAN SARAZA NARANJO

Cantidad de bolsas de leche vendidas por semana en tiendas de Pereira

No. xi  x xi  x 2 fi.xi  x  xi  x 3 fi.xi  x 


2 3
fi f i .xi
Bolsas
18 12 216 -6,55 42,9025 514,8300 -281,0113 -3372,1356
19 15 285 -5,55 30,8025 462,0375 -170,9538 -2564,3070
21 18 378 -3,55 12,6025 226,8450 -44,7388 -805,2984
23 20 460 -1,55 2,4025 48,0500 -3,7238 -74,4760
28 18 504 3,45 11,9025 214,2450 41,0636 739,1448
30 15 450 5,45 29,7025 445,5375 161,8786 2428,1790
34 12 408 9,45 89,3025 1071,6300 843,9086 10126,9032
n=110 2701 2983,1750 6478,0100

2701
x  24,55 bolsas de leche
110
2983,175
s2   27,11 bolsas de leche 2
110

s  27,11  5,2 bolsas de leche

58,891 58,891
6478,01 a3    0,41
m3   58,891 bolsas de leche 3 5,23 140,608
110

El coeficiente indica que la muestra tiene sesgo a la derecha, como el valor es


cercano a cero, se concluye que la muestra es poco sesgada.

5.7.3 Curtosis

La curtosis es un concepto que analiza la manera como los datos se elevan con
respecto a un punto medio de la muestra. Es decir, determina el grado de
concentración que presentan los valores en la región central de la distribución. De
acuerdo con la curtosis que presente una muestra se puede decir que esta es
leptocúrtica si existe una gran concentración de valores; mesocúrtica si hay una
concentración normal o Platicúrtica si hay una baja concentración. (Figura No. 11)
Figura No. 11
En presencia del gráfico resulta fácil determinar si una muestra es leptocúrtica,
mesocúrtica o platicúrtica, pero no es posible determinar de qué magnitud es la
curtosis, para conocer este elemento se debe calcular el denominado coeficiente de
curtosis

5.7.3.1 Coeficiente de curtosis

Es un valor que permite medir la curtosis de una muestra, se simboliza a 4 y está


definido así:
m4
a4  donde m4 es el cuarto momento con relación a la media; s4 es la desviación
s4
estándar elevada a la cuarta potencia.

El coeficiente de curtosis, calculado de esta manera, no puede ser negativo


(potencias pares siempre son positivas o cero), el valor del coeficiente se interpreta
de la siguiente manera:

Si a4<3 entonces la muestra es platicúrtica


Si a4=3 entonces la muestra es mesocúrtica
Si a4>3 entonces la muestra es leptocúrtica

Ejemplo: se realiza un estudio para determinar el número de bolsas de leche


vendidas por tienda, en una semana, en el municipio de Pereira. Se toma el dato
del número de bolsas de leche vendidas en 110 tiendas y se obtienen los siguientes
datos:
90 CARLOS HERNAN SARAZA NARANJO

Cantidad de bolsas de leche vendidas por semana en tiendas de Pereira

No. xi  x xi  x 2 fi.xi  x  xi  x 4 fi.xi  x 


2 4
fi f i .xi
Bolsas
18 12 216 -6,55 42,9025 514,8300 1840,6245 22087,4940
19 15 285 -5,55 30,8025 462,0375 948,7940 14231,9100
21 18 378 -3,55 12,6025 226,8450 158,8230 2858,8140
23 20 460 -1,55 2,4025 48,0500 5,7720 115,4400
28 18 504 3,45 11,9025 214,2450 141,6695 2550,0510
30 15 450 5,45 29,7025 445,5375 882,2385 13233,5775
34 12 408 9,45 89,3025 1071,6300 7974,9365 95699,2380
n=110 2701 2983,1750 150776,5245

2701
x  24,55 bolsas de leche
110
2983,175
s2   27,11 bolsas de leche 2
110

s  27,11  5,2 bolsas de leche

150776,5245
m4  1370,6956bolsas de leche4
110

1370,6956 1370,6956
a4   1,87
5,24 731,1616

El coeficiente indica que la muestra tiene curtosis menor que 3 y por lo tanto se trata
de una muestra platicúrtica.
UNIDAD VI
TÉCNICAS DE CONTEO

INTRODUCCIÓN

En muchos trabajos de investigación resulta importante y necesario determinar el


número de resultados que puede tener un suceso o un conjunto de sucesos. Por
ejemplo, determinar de cuántas maneras pueden rotarse 4 ingredientes en 4 recetas
diferentes; determinar de cuántas formas se puede presentar el resultado de una
premiación; determinar de cuántas formas pueden seleccionarse los conejos para
presentar en una exposición.

Las técnicas de conteo permiten hacer este tipo de cálculos estableciendo


diferencias significativas relacionadas con las condiciones que conducen a
encontrar el resultado buscado.

6.1 Regla de la potencia

Sea S un suceso que tiene un número constante de resultados (K) y sea n el número
de veces que se repite el suceso.

El número total de resultados posibles en las n veces que se repite el suceso está
dado por:

número de resultados  K n

Ejemplo: en una evaluación de 6 conejos cuántos resultados se pueden presentar


referidos a la presencia de síntomas de sarna en los animales.

Como cada animal puede mostrar o no síntomas de sarna, entonces el suceso de


presencia de síntomas de sarna tiene 2 resultados, K=2. Se van a evaluar 6 conejos,
por lo tanto n=6

número de resultados  26  64 resultados

Ejemplo: En una prueba de habilidad para la preparación de kumis los participantes


pueden ser evaluados en las categorías A, B, C o D según la calidad del producto
elaborado. Si en la prueba participan 5 personas, cuántos resultados posibles hay
para la calidad del producto.

K= 4 (Siempre hay 4 categorías de evaluación)


n= 5 personas
92 CARLOS HERNAN SARAZA NARANJO

número de resultados  45  1024 resultados

6.2 Regla de la multiplicación

Sea S1 un suceso que tiene n1 resultados; S2 un suceso que tiene n2 resultados; S3


un suceso que tiene n3 resultados…..; Sk un suceso que tiene nk resultados.

El número total de resultados posibles de que ocurra S1; y que ocurra S2; y que
ocurra S3; ……y que ocurra Sk está dado por:

número de resultados  n1 * n2 * n3 * .... nk

Ejemplo: una dieta para un animal que ha sido tratado de cierta enfermedad sugiere
el uso de un tipo de cereal, un tipo de harina, un tipo de carne, un tipo de azúcar y
un tipo de líquido. Para atender la dieta del animal una persona dispone de 3 tipos
de cereal, 5 tipos de harina, 3 tipos de carne, 4 tipos de azúcar y 2 tipos de líquido.
¿De cuántas formas se puede variar la dieta?.

Organizando los datos se encuentra que

S1: tipos de cereal n1= 3


S2: tipos de harina n2= 5
S3: tipos de carne n3= 3
S4: tipos de azúcar n4= 4
S5: tipos de líquido n5= 2

número de formas  3 * 5 * 3 * 4 * 2 número de formas  360 formas de variar la dieta

La persona puede variar la dieta de 360 formas diferentes.

Ejemplo: las jaulas de conejos en una finca deben ser codificadas de tal manera
que cada jaula tenga un código que la distinga de las demás. Cada código está
conformado por una letra elegida entre la M (Macho) y H (Hembra); y dos números
elegidos entre el 0 y el 9. Teniendo en cuenta que el primer número no puede ser
cero y que los números se pueden repetir, ¿Cuántos códigos diferentes se pueden
diseñar?.

S1: letra del código n1= 2


S2: primer número del código n2= 9
S3: segundo número del código n3= 10

Número de resultados  2 * 9 * 10 Número de resultados  180 códigos


Se pueden diseñar 180 códigos

6.3 Número factorial

El número n! se denomina número factorial, se define como el factorial de n y


representa las diferentes formas en que un grupo de n elementos se puede
organizar en n espacios disponibles. Por ejemplo, determinar de cuántas maneras
pueden ubicarse 4 conejos en 4 jaulas disponibles. Nótese que el número de
conejos es igual al número de jaulas, entonces, las diferentes formas para rotar los
conejos están dadas por 4!.

Definición: n factorial= n! = n(n-1)(n-2)(n-3)….(1)

Ejemplos:

5!= 5*4*3*2*1= 120


9!= 9*8*7*6*4*3*2*1= 362.880

Por definición se tiene que 0!=1

Volviendo al ejemplo de la rotación de conejos

Número de rotaciones= 4! = 24

Ejemplo: De cuántas formas pueden asignarse 15 establos a 15 novillos.

n=15

Número de formas= 15! = 1,30767*1012 formas de asignar los establos.

6.4 Permutación

El concepto de número factorial se aplica para grupos de n elementos tomados


todos a la vez. Sin embargo, en muchos sucesos se requiere tomar solamente una
parte de los elementos.

Una permutación de n elementos organizados en grupos de x elementos (donde


x  n ) es una selección de x de los n elementos teniendo en cuenta la ubicación
de cada elemento en el grupo. Es decir, la permutación 3,4,5 es diferente de la
permutación 5,3,4.

El número de permutaciones de n elementos organizados en grupos de x elementos


está dado por:
94 CARLOS HERNAN SARAZA NARANJO

n!
nPx 
( n  x )!

Ejemplo: Cuántas permutaciones de 2 elementos cada una pueden obtenerse con


los números 1,2,3,4

n=4 x=2

4! 24
P2    12 permutaciones
( 4  2)! 2
4

Las permutaciones que se obtienen son:


1,2 1,3 1,4
2,1 2,3 2,4
3,1 3,2 3,4
4,1 4,2 4,3

Ejemplo: de cuántas maneras se pueden seleccionar el gerente, el administrador y


el contador de una empresa avícola si la elección se hace sobre 12 hojas de vida
disponibles de personas capacitadas para cualquiera de los tres cargos.

Para entender el concepto de permutación es necesario analizar si el orden es


importante. Para una persona es relevante ser elegida pero también es importante
el cargo para el cual se le elige. Supongamos que al final la elección es Pedro,
Alberto, Gonzalo; una elección diferente sería Alberto, Gonzalo, Pedro.

La diferencia radica en que en la primera elección Pedro es el Gerente mientras que


en la segunda es el contador; en la primera Alberto es el administrador pero en la
segunda es el gerente.

Para desarrollar el ejercicio se procede así:

n=12 x=3

12! 12!
P    1320
(12  3)! 9!
12 3

Las tres personas pueden ser seleccionadas de 1320 maneras diferentes.

6.5 Combinación

Una combinación de n elementos organizados en grupos de x elementos (donde


x  n ) es una selección de x de los n elementos sin tener en cuenta la ubicación
de cada elemento en el grupo. Es decir, la combinación 3,4,5 es igual a la
combinación 5,3,4.

El número de combinaciones de n elementos organizados en grupos de x elementos


está dado por:
n!
nCx 
( n  x )!* x!

Ejemplo: Cuántas combinaciones de 2 elementos cada una pueden obtenerse con


los números 1,2,3,4

n=4 x=2
4! 24
C2    6 combinaciones
( 4  2)!*2! 2 * 2
4

Las combinaciones que se obtienen son:

1,2 1,3 1,4


2,3 2,4 3,4

Ejemplo: de cuántas maneras se pueden seleccionar tres personas de una empresa


porcícola para que reciban un curso de actualización teniendo en cuenta que en la
empresa hay 8 hojas de vida disponibles de personas capacitadas para asistir al
curso.

Para entender el concepto de combinación es necesario analizar si el orden es


importante. Para una persona es relevante ser elegida para asistir a la capacitación
pero no es importante si se le elige de primera, de segunda o de tercera.

n=8 x=3

8! 40320
C3    56
(8  3)!*3! 120 * 6
8

Las tres personas pueden ser seleccionadas de 56 maneras diferentes.

6.6 Cálculos sistematizados

Algunos de los cálculos estadísticos que se han manejado en el presente libro


pueden hacerse de manera directa utilizando los programas que incluyen las
calculadoras científicas o las hojas de cálculo. También existen programas como
Statgraphics, Minitab o SPSS.
96 CARLOS HERNAN SARAZA NARANJO

El manejo de este tipo de herramientas facilita los cálculos, ahorra tiempo y permite
dar mayor precisión a los resultados, sin embargo, su uso requiere de buen
conocimiento y buen manejo. Recuerde que las calculadoras y los computadores
hacen lo que se les ordene y que de la información que reciban y la forma como la
reciban, depende la confiabilidad de los resultados que puedan entregar.

Además, resulta más importante la interpretación que se da a un resultado que el


resultado mismo.

En esta última parte del libro se explica brevemente el funcionamiento de la


calculadora CASIO FX-82 (los diversos modelos de calculadora tienen diferentes
formas de funcionamiento para los programas estadísticos), y de la hoja de cálculo
de Excel.

6.6.1 Cálculo de medidas estadísticas utilizando calculadora CASIO FX-82


Para iniciar el trabajo con su calculadora colóquela en el modo SD (figura No. 12),
en pantalla aparecerá SD. Verifique si la calculadora tiene datos en la memoria, esta
operación es necesaria porque las calculadoras mantienen la información
estadística aun cuando son apagadas.

Verificar si la calculadora tiene datos, consiste en leer el valor de n el cual debe ser
igual a cero. En caso que esto no sea cierto, siga la secuencia SHIFT, CLR, 1,=
(Figura No. 12).

Una vez se asegure que la calculadora no tiene datos en la memoria, proceda a


introducir los datos de la muestra. Si los datos se presentan sin frecuencias
introduzca cada dato escribiéndolo en pantalla para luego presionar la tecla DT (que
aparece donde se encuentra M+); si usted necesita incluir datos con frecuencias
entonces escriba el primer dato en pantalla, escriba el signo ;, escriba el valor de la
frecuencia y presione DT.

En cualquiera de los dos casos, cuando termine de introducir los datos verifique el
valor de n el cual debe coincidir con el tamaño de la muestra.

Para leer los resultados utilice la opción SHIFT y las teclas 1 y 2 (marcadas con s-
sum), escriba el número que corresponde a la opción buscada (media, n, desviación
estándar o desviación estándar corregida) y presione el signo =. Para hallar la
varianza eleve al cuadrado los valores de la desviación estándar.
Figura No. 12. Calculadora CASIO FX-82

Modo SD

Para borrar
información
SHIFT;
CLR; 1 =

Cálculo de n,
sumatoria de los DT
valores de x y
sumatoria de los
cuadrados de los
valores de x ;

Cálculo de la media, la
desviación estándar y la
desviación estándar
corregida

De igual manera la calculadora le informa valores de n!, de combinaciones y de


permutaciones.
98 CARLOS HERNAN SARAZA NARANJO

6.6.2 Calculo de medidas estadísticas utilizando EXCEL

Si en un libro de Excel se copian los datos correspondientes a una muestra es


posible obtener, de manera directa, las diferentes medidas que se han explicado a
lo largo del libro, a continuación se explica uno de los procedimientos para obtener
los cálculos indicados:

En una celda en la que no hay información se puede escribir la medida que se desee
calcular, en seguida se da la orden de cálculo escribiendo la palabra clave con la
que Excel accede a calcular cada valor requerido, esta orden debe ir precedida del
signo igual o del signo más. En la siguiente tabla se reproducen 5 columnas de una
hoja de cálculo en Excel. La primera columna corresponde al número de la fila; la
segunda columna corresponde a los datos de la muestra; la tercera columna indica
el cálculo que se quiere realizar; la cuarta columna muestra la orden que se da para
que Excel entregue los cálculos requeridos. (Note que para el caso del percentil el
número se da en decimal correspondiente al porcentaje del percentil a calcular, por
ejemplo, percentil 23 =0,23; percentil 9=0,09. La quinta columna contiene los
resultados obtenidos en cada uno de los cálculos realizados.

A B C D
No. de fila Datos Medida Procedimiento Resultado
1 12
2 13
3 14
4 15
5 20
6 24
7 25
8 25
9 25
10 29
11 MEDIA =PROMEDIO(A1:A10) 20,1
12 MEDIANA =MEDIANA(A1:A10) 22
13 MODA =MODA(A1:A10) 25
14 PERCENTIL 23 =PERCENTIL(A1:A10;0,23) 14,07
15 DESV. ESTÁNDAR =DESVESTP(A1:A10) 5,73
16 VARIANZA =VARP(A1:A10) 32,89
17 DESV. ESTANDAR =DESVEST(A1:A10) 6,04
CORREGIDA
18 VARIANZA CORRE. =VAR(A1:A10) 36,54

Los valores referidos también se pueden obtener utilizando la opción de


fórmulas estadísticas de la hoja de cálculo, que se encuentra presionando la
techa fx la cual da paso a la opción insertar función. Para el uso de las
fórmulas se elige la categoría estadísticas. Luego se busca la fórmula
correspondiente. Por ejemplo, para calcular la media se busca la opción
promedio y luego se marca el rango de datos que componen la muestra. De
igual manera se procede con las demás funciones que se encuentran con los
mismos nombres que han sido descritos en la tabla anterior.
100 CARLOS HERNAN SARAZA NARANJO

GLOSARIO

Aleatoria: Dependiente de algún suceso fortuito. Perteneciente o relativa al azar.


Se dice que un valor es aleatorio cuando se elige libremente, es decir, sin seguir
regla alguna.
A lo sumo: menor o igual que, expresión que se utiliza para designar a todos los
datos que son menores o iguales que un valor dado.
Convención: nota que permite aclarar el contenido de un esquema o de un gráfico.
Curtosis: concepto que analiza la manera como los datos se elevan con respecto
a un punto medio de la muestra.
Diagnóstico: que sirve para reconocer las condiciones de una persona o de una
acción.
Estadístico: cualquier dato o resultado que se toma de una muestra
Financiero: relativo a la hacienda pública, a la banca o a los grandes negocios
mercantiles.
Inferencia: conclusión que se toma a futuro o sobre un grupo mayor, como
resultado de un estudio.
Insumos: cconjunto de bienes empleados en la producción de otros bienes.
Notación: representación por medio de signos convencionales.
Parámetro: cualquier dato o resultado que se toma de una población
Por lo menos: mayor o igual que, expresión que se utiliza para designar a todos los
datos que son mayores o iguales que un valor dado.
Remesa: envío que se hace de una cosa de una parte a otra.
Sesgo: concepto que analiza la simetría o asimetría de una muestra con relación a
un punto central.
BIBLIOGRAFÍA

BERENSON, Mark L. Et all. Estadística básica en Administración. Prentice Hall.


Englewood. 1992. 946 p.C

CHAO, Lincoln L. Estadística para las Ciencias Administrativas. Mc Graw Hill.


México. 1982. 472 p.

GRISALES G., Arbey F. y ZULUAGA R., Antonio. Estadística Práctica. REAL.


Armenia, 1990. 163 p.

HILLS, Richard L. et all. Estadística para economía y administración. Mc Graw Hill.


México. 1981. 597 p.

HOEL, Paul G. Estadística Básica para negocios y Economía. Continental. México.


1978. 452 p.

LEVIN, Richard I. Estadística para Administradores. PRENTICE HALL. Englewood.


1981. 572 P.

MARTÍNEZ B., Ciro. Estadística, 614 problemas resueltos.ECOE. Bogotá.1978. 713


p.

MENDENHALL, William. Estadística para Administradores. Editorial


IBEROAMÉRICA. México. 1990. 817 p.

MURRAY SPIEGEL. Estadística. Serie Schaum. Mc. Graw Hill. México. 1983. 357
p.

PORTUS GOVIDEN, Lincoyán. Curso Práctico de Estadística. MacGraw – Hill.


México, 1990. 192 p.

SARAZA N., Carlos H. Manual de Estadística. UNISARC. 1999. 101p.

SPIEGEL, Murray R. Estadística. MacGraw – Hill. México, 1983. 357 p.

WONNACOTT, Tomás H. et all. Fundamentos de Estadística para Administración y


Economía. LIMUSA. México, 1981
102 CARLOS HERNAN SARAZA NARANJO

TALLER UNIDAD I

1. Teniendo en cuenta la clasificación de las variables proponga un ejemplo


de cada uno de los cuatro tipos definidos de variable.
2. Se realiza un estudio para identificar las personas que trabajan en una granja,
a cada una de ellas se le pide que llene un formato que tiene preguntas
relacionadas con la ciudad de nacimiento, la edad, el sexo, el valor del
ingreso mensual, la preferencia de comida, el grado de escolaridad y el
tiempo de trabajo que llevan en la empresa. Identifique las variables que
intervienen en el estudio y llene un cuadro como el que se muestra a
continuación. (Se presenta la primera de las variables).
Variable TIPO SUBTIPO
Ciudad de nacimiento Cualitativa Nominal

3. Un estudio de mercado pretende conocer si a los jóvenes les agrada o no


tener mascotas, qué tipo de animal prefieren como mascota, cuál es el sexo
que prefieren para la mascota, de qué color le gusta la mascota, cuánto
estarían dispuestos a pagar por una mascota y cuál sería el número de
mascotas que estarían dispuestos a tener. El estudio se realiza con jóvenes,
hombres y mujeres, en edades entre 16 y 20 años, que viven en el barrio El
Estadio del municipio de Miraflores. La oficina de planeación del
departamento informa que en el barrio hay una población total de 1150
personas en este rango de edades. Se diseña una encuesta que se aplica
al 35% de los jóvenes. Para el estudio realizado determine: descripción y
tamaño de la población; descripción y tamaño de la muestra; variables
utilizadas; clasificación de las variables utilizadas.
4. Clasifique las variables que se describen a continuación:
4.1 Barrio donde viven los empleados de una empresa.
4.2 Tipo de zapatos de calle que utilizan los zootecnistas.
4.3 Cargo que ocupan los egresados de UNISARC que laboran en
empresas del Eje Cafetero.
4.4 Valor de los aportes que las granjas pecuarias hacen por concepto de
seguridad social de sus empleados.
4.5 Cantidad de personas que trabajan en granjas pecuarias y que acreditan
estudios de postgrado.
4.6 Cantidad de huevos recolectados por día en una granja.
4.7 Costo de los microscopios disponibles en el mercado
4.8 Tipo de embutido preferido por mujeres que tienen edades entre 25 y
30 años.
4.9 Registro de las preferencias políticas de jóvenes de zonas rurales
4.10 Valor cobrado por empresas pecuarias, por concepto de retención en
la fuente.

5. Un grupo de investigadores decide realizar un estudio para determinar si los


jóvenes matriculados en grado once en los colegios de Risaralda están
pensando ingresar a la universidad. Se registran 11765 estudiantes
matriculados en grado once. Para el estudio se entrevistan 52 estudiantes y
se obtienen los resultados que se registran, en orden horizontal en la
siguiente tabla:

SI NO SI NO NO SI NO SI NO SI NO SI NO
SI NO SI NO SI NO SI NO NO SI NO NO NO
NO SI NO SI NO SI NO SI NO NO SI SI NO
SI SI NO NO NO NO NO SI SI NO SI SI SI

Teniendo en cuenta la información suministrada: a. Describa la población y


determine el valor de N; b. Describa la muestra y determine el valor de n; c.
describa y clasifique la variable; d. Encuentre el resultado de X24; X2 y X50; e.
Interprete el resultado de X27.

6. Se realiza una encuesta socioeconómica entre las familias del municipio La


Peña. La encuesta tiene el objetivo de determinar los siguientes aspectos:
distribución de los habitantes del municipio por sexos y por estratos; ingreso
promedio familiar por mes; edades de las personas económicamente activas;
tipo de comida que prefieren las familias; actividades que han sido relegadas
a causa de la condición económica de la familia; alternativas que ha
diseñado la familia para mejorar las condiciones económicas; respuesta
acerca de estar de acuerdo o no con las políticas económicas del país;
evaluación de la gestión del gobierno en términos de excelente, aceptable,
buena o mala.

Para el estudio que se describe identifique las variables que intervienen y


clasifique cada una de ellas.
104 CARLOS HERNAN SARAZA NARANJO

7. Determine cuáles de las siguientes afirmaciones son verdaderas o falsas.


Para las afirmaciones falsas justifique la respuesta

7.1 La variable tipo de mascotas disponibles en el mercado es cualitativa porque


las mascotas se clasifican según su color.
7.2 La variable grado de escolaridad de los empleados de empresas avícolas es
cualitativa nominal porque se refiere a cualidades y no establece orden
7.3 El valor X3=25 de una variable significa que la encuesta número 3 arrojó un
resultado de 25
7.4 Cuando en una encuesta se encuentra que X32=245 se tiene seguridad que
X33≥245
7.5 Si el tamaño de una población es N=450 es posible obtener una muestra
de tamaño n=50
7.6 Para una muestra se sabe que X3=25 y que X5=32 entonces se puede
concluir que X8=57
7.7 La variable valor del gasto mensual en pago de servicios públicos en
empresas transformadoras de lácteos es cuantitativa continua porque hace
referencia a una medición del gasto
7.8 En un mismo estudio estadístico es posible combinar diferentes clases de
variables

TALLER UNIDAD II

1.
Número de hijos en las familias de los empleados de la empresa Apícola del
Centro
Xi fi Fi hi% Hi%
1 12 12 13,33 13,33
2 45 57 50,00 63,33
3 23 80 25,55 88,88
4 9 89 10,00 98,88
5 1 90 1,11 99,99

Con base en los datos de la tabla responda los siguientes enunciados:

1.1 Describa la población y determine el valor de N


1.2 Describa la muestra y determine el valor de n
1.3 Interprete f3, F2, h1 y H4
1.4 Cuántas familias tienen a lo sumo 2 hijos
1.5 Cuál es el porcentaje de familias que tienen menos de 2 hijos
1.6 Cuál es el mayor número de hijos por familia
1.7 Cuál es el número de hijos que más se presentó
1.8 Cuántas familias tienen más de dos hijos o menos de 5 hijos
1.9 Cuál es el porcentaje de familias que tienen menos de 2 hijos y más de 4
hijos
1.10 Cuántas familias tienen por lo menos 2 hijos.

2. Se realiza un estudio para determinar la cantidad de quesos vendidos en un día


domingo en locales comerciales ubicados a lo largo de la carretera entre Pereira
y Cali. Para el estudio se visitan 25 locales y se pregunta por el número de
quesos vendidos el domingo anterior. Los datos obtenidos son los siguientes:
75 44 32 84 45 44 45 75 38 75 44 45 40
45 75 84 80 84 84 84 84 75 40 38 40

Organice los datos en una tabla de distribución de frecuencias y responda los


siguientes enunciados:

2.1 Obtenga tres conclusiones sobre los datos de la tabla.


2.2 Cuál es el valor y qué significan f3 y H5.
2.3 En cuántos locales el número de quesos vendidos supera 45.
2.4 Cuál es el porcentaje de locales que venden a lo sumo 80 quesos.
2.5. Cuál fue el número de quesos vendidos que menos se presentó.

3. Se realiza un estudio para determinar el tiempo que tardan los operarios para poner
en funcionamiento un molino eléctrico. Se registra el tiempo, en minutos, de 80
operarios en diferentes empresas. Los datos encontrados son los siguientes:

0,92 0,95 0,95 0,96 0,94 0,85 0,82 1,01 0,90 0,90 0,80 0,80 0,84 0,83
0,90 0,94 0,92 0,93 0,90 0,95 0,92 1,00 0,72 0,74 0,78 0,78 0,94 0,93
0,75 0,78 0,77 1,02 0,94 0,80 0,50 0,63 0,60 0,92 0,93 0,62 0,71 0,78
0,45 0,48 0,57 0,62 0,64 0,80 0,56 0,83 0,80 0,92 0,71 0,72 0,81 0,88
1,05 1,08 0,49 0,87 0,64 0,59 0,64 0,53 0,48 0,52 0,53 0,49 0,61 0,56
0,99 0,98 0,84 0,72 0,72 0,78 0,65 0,71 0,60 0,52

Organice los datos en 7 intervalos de clase, construya la tabla de distribución de


frecuencias correspondiente y responda los siguientes enunciados:

3.1 Cuál fue el menor tiempo encontrado


3.2 Cuál fue el tiempo que menos se presentó
3.3 Cuál es el valor y qué significan h6 y F3
3.4 Obtenga tres conclusiones sobre los datos de la tabla
3.5 Cuál es el tiempo que más se presentó.
106 CARLOS HERNAN SARAZA NARANJO

4. Longitud de lombrices en la cama A-11, finca El Empedrado

Longitudes (cm) Xi fi Fi hi Hi Longitudes (cm)


4,2 - 4,6 13
4,7 - 5,1 11
5,2 - 5,6 10
5,7 - 6,1 9
6,2 - 6,6 7
6,7 - 7,1 25
7,2 - 7,6 18

Complete la tabla y responda los enunciados:

4.1 Determine el valor de n


4.2 Cuántas lombrices tienen longitud superior a 6,6 centímetros
4.3 Cuántas lombrices tienen longitud de a lo sumo 6,1 centímetros
4.4 Cuál es el porcentaje de lombrices con longitud superior a 5,6 centímetros e
inferior a 6,7 centímetros
4.5 Cuál es el porcentaje de lombrices con longitud de por lo menos 5,7 centímetros
y a lo sumo 5,1 centímetros
4.6 Cuál es el porcentaje de lombrices con longitud superior a 6,6 centímetros o
inferior a 5,2 centímetros.
4.7 Cuál es la longitud que más se presenta en las lombrices.
4.8 Cuál fue la mayor longitud encontrada en las lombrices
4.9 Qué valor tienen y que significan F5 y h4
4.10 Cuántas lombrices tienen longitud que no supera 6,1 centímetros.

5. Para un estudio en el que se han considerado 120 datos, se construyen 8


intervalos de clase. Determine cuáles de las siguientes afirmaciones son falsas.
Justifique cada una de las respuestas elegidas.

5.1 f8 = 120
5.2 F4 = f3 + f4
5.3 H4= H3 + h4
5.4 H8=120
5.5 f1+f2+f3=F3
5.6 h3 < h4
5.7 H5 > H4
5.8 F3 = H3

6. Se realiza un estudio para determinar el estrato social de las mujeres que laboran
en empresas que manejan bovinos. Los datos obtenidos se resumen en la
siguiente tabla:

3 1 2 3 4 2 4 3 1 6 2 4 3 2 1 6 4 3 2 4 1 2 4 3 2
2 2 3 6 2 3 4 2 6 4 3 2 1 6 4 3 2 1 4 3 2 4 4 3 2
Organice los datos en una tabla de frecuencias y determine:

6.1 Variable que interviene en el estudio y clasificación de la misma


6.2 Descripción y tamaño de la muestra
6.3 Porcentaje de mujeres que están clasificadas en estrato 2
6.4 Cantidad de mujeres que están clasificadas en estratos 4 o 6
6.5 Porcentaje de mujeres que están clasificadas en estrato 2 y en estrato 3
6.6 Cantidad de mujeres clasificadas en estrato 5
6.7 Porcentaje de mujeres que no están clasificadas en estrato 3
6.8 Porcentaje de mujeres que están clasificadas en estrato 2 o en estrato 3
7. Se realizó un estudio estadístico de variable continua en el cual se construyeron
8 intervalos. La muestra utilizada fue de 80 datos. Con base en esta información
determine si las siguientes afirmaciones son verdaderas o falsas. Si la afirmación
es falsa indique cuál sería la forma de corregirla.
7.1 ______ F5>f5

7.2 ______ F6= f4+f5

7.3 ______ H8=80

7.4 ______ f3>F3

7.5 ______ H4=H3+h4

8. Se preguntó en 20 fincas del Eje Cafetero el número de huevos vendidos durante


un día. Los datos obtenidos son los siguientes:
45 48 48 48 50 50 50 50 50 64
64 70 70 70 70 70 70 85 85 85

Construya la tabla de distribución de frecuencias y determine:

8.1 Cuántas fincas reportan ventas superiores a 50 huevos


8.2 Cuál es el porcentaje de fincas con ventas de por lo menos 70 o a lo sumo 64
huevos
8.3 Cuál es el porcentaje de fincas con ventas mayores que 64 y menores que 85
huevos
8.4 Cuál fue la venta que menos se presentó
8.5 Cuál fue la menor venta reportada
8.6 Cuál es el número de fincas cuyas ventas no exceden 64 huevos
8.7 Cuál es el porcentaje de fincas cuyas ventas exceden 64 huevos pero no
exceden 50 huevos
8.8. Interprete f3, H4 y F5
108 CARLOS HERNAN SARAZA NARANJO

9. Se realiza un estudio de mercado para determinar el valor mensual que las


familias de zona rural destinan para comprar embutidos. Los datos, en miles de
pesos, se registran en la siguiente tabla:

8,5 8,5 8,5 8,8 8,8 8,8 8,8 8,8 9.0 9,0 9,0 9,3 9,5 9,5
10,0 10,0 10,0 10,0 10,0 10,0 10,0 10,0 10,5 10,8 11,5 11,7 12,0 12,5
12,5 12,8 13,7 13,9 14,0 14,4 14,7 14,7 14,7 14,7 14,7 14,7 15,2 15,8
16,4 16,9 17,8 18,2 20,1 20,4 20,9 25,7 27,4 27,9 28,1 29,3 29,5 29,8

9.1 Construya la tabla de distribución de frecuencias con m=7


9.2 Con los datos de la tabla obtenga 5 conclusiones
9.3 Con los datos de la tabla de respuesta a los siguientes enunciados:
9.3.1 Cuántas familias destinan más de $20.800 para comprar embutidos
9.3.2 Cuántas familias destinan menos de $24.100 para comprar embutidos
9.3.3 Cuántas familias destinan por lo menos $17.700 y a lo sumo $27,200 para
comprar embutidos
9.3.4 Cuántas familias destinan menos de $20.900 o más de 27.200 para comprar
embutidos
9.3.5 Porcentaje de familias que destinan más de $20.800 o menos de $14.500
para comprar embutidos
9.3.6 Porcentaje de familias que destinan más de $14.400 y menos de $20.900
para comprar embutidos
9.3.7 Porcentaje de familias que destinan más de $17.600 o menos de $24.100
para comprar embutidos
9.3.8 Valor destinado para comprar embutidos que más se presentó
9.3.9 Mayor valor destinado para comprar embutidos
9.3.10Interprete F4 y H3

10. Se realiza un estudio para determinar el valor anual pagado por familias
colombianas por concepto de alimento para animales. Los datos obtenidos se
resumen en la siguiente tabla:
Gasto (millones de $) fi
0,45-0,62 11
0,63-0,80 14
0,81-0,98 13
0,99-1,16 9
1,17-1,34 5
1,35-1,52 3

Complete la tabla y determine:

10.1 Tamaño de la muestra


10.2 Cuántas familias tienen pagos en alimento inferiores a $810.000
10.3 Cuál es el porcentaje de familias que pagan en alimento a lo sumo $980.000
10.4 Cuál es el mayor valor que se paga en alimento
10.5 Cuál es el valor pagado en alimento que más se presenta en el estudio
10.6 Cuál es el porcentaje de familias que gastan a lo sumo $800.000 o por lo menos
$1.170.000 en alimento.
10.7 Cuántas familias pagan por lo menos $990.000 y a lo sumo $1.340.000 en
alimento
10.8 Cuál es el porcentaje de familias que pagan más de $1.160.000 y menos de
$810.000 en alimento.

11. Proponga un ejemplo de aplicación de distribución de variable discreta y


construya la tabla correspondiente.

12. Proponga un ejemplo de aplicación de distribución de variable continua y


construya la tabla correspondiente.

TALLER UNIDAD III

1. Refiérase al ejercicio 1 del taller de la unidad II, construya el gráfico de barras y


el gráfico circular correspondientes.

2. Refiérase al ejercicio 2 del taller de la unidad II, construya el gráfico circular.

3. Refiérase al ejercicio 3 del taller de la unidad II, construya el polígono de


frecuencias y las ojivas.

4. Refiérase al ejercicio 4 del taller de la unidad II, construya la ojiva mayor que y
el histograma.

5. Establezca diferencias y semejanzas entre el histograma y el polígono de


frecuencias de una muestra.

6.
Altura de terneros
100
82
80 74 1,2-1,3
No. de terneros

62
56 1,4-1,5
60 45
1,6-1,7
40
14 1,8-1,9
20
2,0-2,1
0
2,2-2,3
Alturas(m)
110 CARLOS HERNAN SARAZA NARANJO

Tomando como referencia el gráfico responda los siguientes enunciados:


6.1 Describa el estudio y determine el tamaño de la muestra
6.2 Cuántos terneros tienen altura de por lo menos 1,8 metros
6.3 Porcentaje de terneros que tienen altura entre 1,4 y 1,9 metros
6.4 Cuántos terneros tienen altura entre 1,8 y 2,1 metros
6.5 Porcentaje de terneros que tienen altura a lo sumo de 1,9 metros
6.6 Mayor altura encontrada en los terneros
6.7 Altura que menos se presenta
6.8 Cantidad de terneros que no logran superar 1,7 metros de altura

7.
Peso de un lote de pollos
80
70
1,4-1,7
60
1,8-2,1
No. de pollos

50
2,2-2,5
40 75
2,6-2,9
30 56 52
20 46 3,0-3,3
32
10 24 25 3,4-3,7

0 3,8-4,1
Pesos (libras)

Tomando como referencia el gráfico responda los siguientes enunciados:


7.1 Mayor peso encontrado
7.2 Porcentaje de pollos que tienen peso entre 1,8 y 2,9 libras.
7.3 Porcentaje de pollos que tienen peso de por lo menos 3,4 libras
7.4 Porcentaje de pollos que tienen peso de a lo sumo 3,3 libras
7.5 Porcentaje de pollos que no alcanzan peso de 2,6 libras
7.6 Menor peso encontrado
8. Para diferentes estudios y especialmente para la presentación de resultados en
revistas y periódicos se utiliza un gráfico denominado pictograma. Consulte qué
es un pictograma y construya el pictograma correspondiente al ejercicio 4 de la
unidad número 2.

TALLER UNIDAD IV
1. Tomando como referencia la siguiente tabla, Encuentre el valor de cada una
de las sumatorias dadas:

1 2 3 4 5 6 7 8
Xi 2 3 5 8 -1 4 3 6
Yi 4 2 10 3 8 -3 -4 7
Zi 0 11 12 -5 11 9 8 8

5 7 2

1.1 X
2
i 1.6 X
4
i

4 8
1.2   7Y
1
i 1.7  6Y  8Z
5
i i

7 4
9Xi
1.3  3( X
3
i  Zi ) 1.8 1 12
8 3 5
Zi Yi
1.4  (Yi  Zi )
5
1.9 8
4

4
4 8

 Xi  3(Z  2Yi )  4Z i
Yi
1.5 1.10 i
1 1

2. Encuentre el valor medio de los números pares mayores o iguales que 2 y


menores o iguales que 8

3. Encuentre la mediana de los números impares mayores que 3 y menores que


15.

4. Una empresa avícola ha registrado la cantidad de jeringas vendidas durante 10


días encontrando los datos que se registran en la siguiente tabla

340 342 298 298 340 345 298 354 302 311
Encuentre.
112 CARLOS HERNAN SARAZA NARANJO

4.1 Cantidad media de jeringas vendidas


4.2 Cantidad de jeringas vendidas en el 50% de los días con mayores ventas
4.3 Cantidad de jeringas vendidas que más se presenta

5. Los datos de la tabla siguiente corresponden a la cantidad de leche entregada


por día en fincas de las veredas de Pereira

CANTIDAD DE LECHE (l) No. DE VEREDAS


35 3
38 5
40 7
42 6
44 4
45 2
50 5

5.1 Determine la cantidad media de leche entregada por día


5.2 Determine la cantidad de leche entregada por el 50% de las veredas que
hacen las menores entregas al día
5.3 Encuentre la cantidad de leche entregada por día, que más se presenta

6. Un avicultor tiene 3 lotes de pollos en los cuales ha programado el sacrifico


correspondiente. En total tiene 200 pollos. El primer lote presenta un peso
medio de 3,2 libras; en el segundo lote hay una cantidad de pollos que es
excedida por la cantidad del primer lote en 13 unidades y que tiene un peso
medio de 3,7 libras; el tercer lote tiene una cantidad de pollos que excede a la
cantidad de pollos del segundo grupo en un animal. Si el peso medio de todos
los pollos es 3,5755 libras ¿Cuál es el peso medio de los pollos del tercer lote?

7. El propietario de la finca “La Esperanza” paga salarios mensuales cuya media


asciende a $812.300

7.1 Si el propietario decide incrementar cada salario en $32.800, ¿cuál es el nuevo


salario medio?

7.2 Si el propietario decide incrementar cada salario en el 6%, ¿cuál es el nuevo


salario medio?

8. Los siguientes datos corresponden a una muestra del gasto mensual en


medicamentos para aves en fincas de la vereda Los Micos

Costo (miles de $) fi
10 - 15 35
16 - 21 20
22 - 27 18
28 - 33 35
34 - 39 15
40 - 45 13

Determine: gasto medio, gasto en el 50% de las fincas que presenta mayores
gastos, gasto que más se presenta; gasto en el 15% de las fincas que presentan
mayores gastos; gasto en el 25% de las fincas que reportan los mayores gastos;
gasto en el 30% de las fincas que reportan los menores gastos.

9. Los siguientes datos corresponden a una muestra de la longitud de peces en el


estanque A23 de la piscícola El Mirador.

Longitudes (cm) fi
12,5-12,9 35
12,9-13,3 32
13,3-13,7 42
13,7-14,1 23
14,1-14,5 15
14,5-14,9 13

9.1 Calcule la longitud media de los peces


9.2 Calcule la longitud del 50% de los peces más largos
9.3 Calcule la longitud que más se presenta
9.4 Calcule la longitud del 35% de los peces más largos
9.5 Calcule la longitud del 20% de los peces más cortos

10. En la tabla siguiente se registra el valor del salario mínimo en Colombia durante
8 años consecutivos. Calcule el incremento porcentual anual del salario mínimo
para los años entre el 2011 y el 2018. Con los valores calculados obtenga la media
geométrica y la media armónica.
AÑO SALARIO
2011 535.600
2012 566.700
2013 589.500
2014 616.000
2015 644.350
2016 689.455
2017 737.717
2018 781.242
114 CARLOS HERNAN SARAZA NARANJO

11.
Edad de las personas económicamente
activas en las familias campesinas del
departamento de Risaralda
60 52
17-22

Número de personas
50 45 44
23-28
40 34 34
27 28 29-34
30
35-40
20
41-46
10
47-52
0
Edades 53-58

Con base en el histograma determine:


11.1 Cuántas personas componen la muestra
11.2 Edad media de las personas
11.3 Edad que más se presenta
11.4 Edad del 50% de las personas más jóvenes
11.5 Cuál es la edad del 35% de las personas de mayor edad
11.6 Cuál es el porcentaje de personas con edades entre 29 y 40 años

12. El departamento de control de calidad de un laboratorio ha determinado los


tiempos, en horas, requeridos para analizar muestras que llegan al laboratorio.
Los tiempos aparecen en la siguiente tabla:

TIEMPOS(horas) fi
0,38 – 0,52 14
0,53 - 0,67 18
0,68 - 0,82 22
0,83 - 0,97 45
0,98 - 1,12 32
1,13 - 1,27 25
1,28 - 1,42 20
12.1 Encuentre el tiempo medio requerido para analizar una muestra.
12.2 Encuentre el tiempo requerido para el 50% de los análisis más rápidos.
12.3 Encuentre el tiempo que más se presenta.
12.4 Encuentre el tiempo requerido para el 10% de los análisis más rápidos.
12.5 Encuentre el tiempo requerido para el 18% de los análisis más demorados.
12.6 Encuentre el tiempo requerido para el 75% de los análisis más rápidos

TALLER UNIDAD V
1. Los siguientes datos corresponden al valor de los gastos mensuales en pago
de servicio de agua en empresas pecuarias. El gasto está expresado en miles
de pesos.

Gasto fi
23 - 30 21
31 - 38 14
39 - 46 12
47 - 54 18
55 - 62 15

Determine:

1.1 Rango del costo de servicio de agua


1.2 Varianza y desviación estándar del costo
1.3 Dispersión relativa del costo
1.4 Si por efecto de errores en la facturación se cobró un excedente de $1400 a
cada finca, cuál es el verdadero valor de la media, la varianza, la desviación
estándar y el coeficiente de variación.

2. Dos fincas vecinas crían conejos. Se tomó el peso de 10 conejos de cada finca.
Determine cuál de las dos fincas presentó la producción más homogénea.
116 CARLOS HERNAN SARAZA NARANJO

Finca Ensueño Finca Calamar


Pesos (g) Pesos (g)
320 320
330 450
340 320
360 310
325 270
380 470
370 270
390 400
350 370
330 315

3. La empresa “Mascotas y Alimentos” paga impuestos mensuales por diferentes


conceptos cuyo valor medio asciende a $485.000 y su varianza es $21.200.000.

3.1 Si el gobierno decide incrementar cada impuesto en $17.000, ¿cuál es el nuevo


impuesto medio y cuál es la nueva varianza?

3.2 Si el gobierno decide incrementar cada impuesto en el 5,8%, ¿cuál es el nuevo


impuesto medio y cuál es la nueva varianza?

4. Los Siguientes datos corresponden a una muestra de la resistencia de bolsas


plásticas referencia B45 disponibles en el mercado. Las resistencias están dadas
en kilogramos.
PESOS(Kg) fi
10,5 - 14,5 5
14,5 - 18,5 6
18,5 - 22,5 8
22,5 - 26,5 15
26,5 - 30,5 40
30,5 - 34,5 32
34,5 - 38,5 18
Determine:

4.1 Varianza y desviación estándar de las resistencias


4.2 Desviación media de las resistencias
4.3 Coeficiente de variación de las resistencias
4.4 Utilizando el teorema de Tchebysheff con dos valores de K diferentes, analice
la muestra

5. En un estudio socioeconómico se pregunta a 8 porcicultores acerca del valor que


pagan anualmente por concepto de impuestos. Los datos obtenidos, tomados en
miles de pesos, se resumen en la siguiente tabla:

900 450 500 800 750 420 380 600

5.1 Determine el coeficiente de variación de los pagos en impuestos


5.2 Encuentre el coeficiente de sesgo
5.3 Determine el coeficiente de curtosis
6. Los registros financieros anuales de la empresa “Aves del Otún” muestran que
los ingresos mensuales tienen un valor medio de $23.565.000 con una varianza
de $2 50.625.000.000; de igual manera informan que el valor medio de los
egresos mensuales es $7.025.000 con varianza de $2 6.724.000.000. Cuál de las
dos variables resulta ser más heterogénea.

7. Se pregunta a empleados de la empresa “El Encanto” acerca del número de


personas que conforman sus familias. Los datos obtenidos se registran en la
siguiente tabla:

7 4 5 8 6 7 9 2
5 7 5 7 5 7 8 7

Calcule la varianza, la desviación estándar y el coeficiente de variación.

8. Se realiza un estudio en porcícolas del departamento del Quindío para determinar


la cantidad de cerdos vendidos en el mes de diciembre. Los resultados son los
siguientes:

Cantidad de cerdos 92 94 95 96 98 100 105 108


Número de
3 4 5 2 4 6 2 8
porcícolas

Calcule el coeficiente de variación, el coeficiente de sesgo y el coeficiente de curtosis


118 CARLOS HERNAN SARAZA NARANJO

9. En un estudio de la cantidad de huevos vendidos durante un día en tiendas de Pereira


se encuentran los datos que se resumen en la tabla siguiente:

No. de huevos vendidos No. de tiendas (fi)


(Xi)
52 4
58 9
64 12
65 5
78 9
82 5
94 10
Calcule la varianza, la desviación estándar y el coeficiente de variación

10. Se realiza un estudio para determinar el valor de las acciones que manejan los dueños
de caballos en empresas colombianas. Los resultados del estudio se muestran en la
siguiente tabla:
Valor acciones No. de empresas (fi)
(millones de $)
1,5-2,4 2
2,5-3,4 4
3,5-4,4 16
4,5-5,4 5
5,5-6,4 11
6,5-7,4 22
7,5-8,4 34

Calcule la varianza, la desviación estándar y el coeficiente de variación

11. Se realiza un estudio para determinar el valor de los gastos mensuales de publicidad de
empresas pecuarias. Los datos obtenidos se resumen en la siguiente tabla:

Valor gastos No. de empresas (fi)


(millones de $)
0,62-0,84 10
0,85-1,07 18
1,08-1,30 24
1,31-1,53 35
1,54-1,76 24
1,77-1,99 18
2,00-2,22 10

11.1 Determine el valor de la varianza, la desviación estándar y el coeficiente de variación.


11.2 Interprete la muestra utilizando Tchebysheff con constantes 4,5 y 5,2.
11.3 Determine e interprete los coeficientes de sesgo y de curtosis D
12. En un estudio que pretende determinar el valor de las remesas procedentes del
extranjero que reciben mensualmente 52 familias campesinas del departamento de
Risaralda se obtienen los siguientes datos:

 X i  34.970.000  X  X   10.559.250.000
2
i

Con los datos dados determine:

12.1 Valor medio de las remesas


12.2 Desviación estándar de las remesas
12.3 Coeficiente de variación de las remesas

13. Determine cuáles de las afirmaciones siguientes son verdaderas o falsas. Para las
afirmaciones falsas corrija la afirmación o explique por qué es falsa

13.1 Si la varianza de una muestra es 25 entonces la desviación estándar de la muestra es


625

13.2 Si la suma de los datos de una muestra es 1024 y la media de la muestra es 64


entonces el tamaño de la muestra es 16

13.3 Si la desviación estándar de una muestra es -24,8 entonces la varianza de la muestra


es (-24,8)2.

13.4 Para que una distribución sea simétrica se requiere que el momento de orden 3 sea
igual a cero

13.5 Cuando el rango de una muestra es 25000 se puede afirmar que la muestra es
heterogénea

13.6 Cuando el coeficiente de variación de una muestra es 23,45% y la varianza de la


muestra es 20,25, se puede afirmar que la media de la muestra es 1,0525.
120 CARLOS HERNAN SARAZA NARANJO

TALLER UNIDAD VI

1. Un investigador recibe 8 muestras de sangre para las que dispone de igual


número de cajas petri. ¿De cuántas formas puede asignar las cajas a las
muestras?

2. En una prueba psicotécnica aplicada a Zootecnistas que aspiran a trabajar en


una empresa exportadora de carne de conejo se exponen 5 dibujos de animales
en un salón y se pide a cada entrevistado que elija, a su gusto, uno de los cinco
dibujos y se pare al lado de él. A la prueba se presentan 6 candidatos. ¿De
cuántas formas puede ocurrir la elección de los dibujos?

3. ¿Cuántos resultados pueden presentarse en el premio mayor de una lotería en


el que se deben acertar 4 números y una serie compuesta por dos números?

4. En la empresa “Alimentos del Bosque” laboran 7 hombres y 8 mujeres. Para el


mes de diciembre el propietario decide bonificar, con bonificaciones de igual
valor, a tres hombres y cuatro mujeres.

a. ¿De cuántas maneras se puede presentar la bonificación?


b. ¿De cuántas maneras se puede presentar la bonificación si se decide que uno
de los hombres no debe ser bonificado?
c. ¿De cuántas maneras se puede presentar la bonificación si se decide que una
de las mujeres y dos de los hombres deben ser bonificados?
d. ¿De cuántas maneras se puede presentar la bonificación si se decide que dos
de las mujeres deben ser bonificadas mientras que dos de los hombres no deben
ser bonificados?

5. Una empresa transformadora de lácteos produce 4 tipos de yogur, 3 tipos de


avena y 6 tipos de leche saborizada. La empresa envía a sus clientes un
muestrario constituido por un tipo de producto de cada clase. ¿Cuántos
muestrarios diferentes puede enviar la empresa?

6. En un laboratorio se toma la decisión de marcar cada caja petri con un código


compuesto por dos letras y dos números. La primera letra es una C o una K
para distinguir si la caja es clara u opaca; la segunda letra puede ser cualquiera
del alfabeto sin repetir la primera letra; los números se pueden repetir. El
laboratorio tiene 5400 cajas petri disponibles. ¿Es posible, con este tipo de
código, marcar todas las cajas disponibles?.

7. Los estudiantes de Zootecnia de UNISARC deben presentar una evaluación que


consta de 13 preguntas y que debe cumplir unas condiciones especificadas por
el profesor. Cuántas maneras de escoger las preguntas a resolver hay con cada
una de las siguientes condiciones:
a. El estudiante debe resolver solamente 8 preguntas a libre elección
b. El estudiante debe responder 8 preguntas, las 3 primeras preguntas son de
carácter obligatorio y de las restantes no interesa cuáles escoja
c. El estudiante debe responder 8 preguntas de tal manera que 4 sean
preguntas pares y 4 sean preguntas impares

8. Un piscicultor dispone de 3 vías para ir desde el estanque C1 al estanque C2 y


de 4 vías para viajar desde el estanque C2 hasta el estanque C1. ¿De cuántas
formas se puede organizar el viaje de ida y vuelta de C1 a C2?.

9. En un centro de investigaciones se destinan tres premios para entregar a los


mejores trabajos de investigación del año. Si el centro recibe 25 trabajos de
investigación, ¿de cuántas maneras puede entregar los premios?

10. Se lanzan a rodar 5 lápices que tienen marcados en sus lados los números del
1 al 4. ¿Cuántos resultados posibles hay?

13. El grupo de estudiantes del programa de Zootecnia está conformado por 17


personas. Se requiere escoger 5 personas para que asistan a un seminario. De
cuántas formas se puede hacer la selección en los casos siguientes:

a. Cualquier estudiante puede ser escogido


b. Cinco estudiantes determinados no pueden ser escogidos
c. Dos estudiantes determinados deben ser escogidos

13. En un zoocriadero se dispone de 7 espacios para ubicar 7 iguanas. De


cuántas formas se pueden rotar las iguanas en los diferentes espacios.

También podría gustarte