Está en la página 1de 28

UNIVERSIDAD NACIONAL DE CAJAMARCA

FACULTAD DE INGENIERÍA EN CIENCIAS PECUARIAS


E.A.P. INGENIERÍA ZOOTECNISTA

MÉTODOS ESTADÍSTICOS
PARA LA INVESTIGACIÓN
PECUARIA
DOCENTES:
ING. MC. JULIO CÉSAR GAMARRA MONTENEGRO
ING. M.CS. JAVIER ALEJANDRO PERINANGO GAITÁN
Cajamarca, septiembre 2023
MEDIDAS DE TENDENCIA CENTRAL.

Una medida de tendencia central es un único valor con el que


se pretende describir un conjunto de datos, a través de la
identificación de la posición central del mismo; sea de la
muestra o población. Como tal, las medidas de tendencia
central a veces se denominan medidas de ubicación central,
también se catalogan como un resumen estadístico.

Las medidas de tendencia central ayudan a entender cómo


se comportan los datos, siempre y cuando su distribución sea
relativamente normal, es decir, que los datos que más se
repiten estén más al centro
¿CUÁLES SON LOS OBJETIVOS?
GENERAL: Calcular e interpretar medidas de tendencia central para un conjunto de datos
estadísticos.

ESPECÍFICOS:

1. Mencionar las características particulares donde se aplica cada medida de tendencia


central.

2. Calcular diversas medidas de tendencia central para un conjunto de datos agrupados o no


agrupados.

3. Interpretar las diversas medidas calculadas.


El propósito de las medidas de tendencia central
señala:

1. Mostrar en qué lugar se ubica el elemento promedio o típica del grupo.

2. Sirve como un método para comparar o interpretar cualquier valor en relación con el
puntaje central o típico.

3. Sirve como un método para comparar el valor adquirido por una misma variable en
dos diferentes ocasiones.

4. Sirve como un método para comparar los resultados medios obtenidos por dos o
más grupos.
¿CUÁLES SON LAS MEDIDAS DE TENDENCIA
CENTRAL MÁS USADAS?

Media. Se suman todos los datos y se


dividen entre el número de datos.
Mediana. Se acomodan todos los datos en
orden ascendente y se encuentra el dato
central, que está en medio de ellos.
Moda. Es el dato que más se repite.
MEDIA.
Es el valor promedio de un conjunto de datos numéricos,
calculada como la suma del conjunto de valores dividida
entre el número total de valores. Hay diversas formas de
calcular la media.

También conocida como media aritmética, promedio


aritmético o simplemente promedio. No es indispensable
acomodar los datos en orden para calcularla, pero si se
hace, puede multiplicarse cada dato por su frecuencia,
para hacer más rápido la suma.

Los datos recabados como cero no modifican la suma,


pero sí cuentan para determinar el número entre el que
se divide, por lo que sí modifican el promedio.
Media aritmética.

La media puede servir En muchas ocasiones, es suficiente con esa información


para representar un conjunto de para tomar decisiones, por eso es tan importante saber
datos. Por ejemplo, si en un calcularla bien.
grupo las personas tienen una
estatura cuya media es 1.50 m,
entonces el 1.50 m representa
la estatura de todos, aunque
puede no ser la estatura de
ninguno en particular.
CÁLCULO DE LA MEDIA.

Cálculo de la media para datos no agrupados

Cálculo de la media para datos agrupados


Media ponderada.

La media ponderada (MP) es La media aritmética es un


una medida de centralización. caso particular de media
Consiste en otorgar a cada ponderada, en la que todos
observación del conjunto de los pesos son uno, ya que a
datos (X1,X2,…,XN) todos los elementos se les
unos pesos (p1,p2,…,pN) según otorga la misma importancia.
la importancia de cada
elemento.

Donde x es el valor de la observación i, P es el peso o importancia de cada observación y N el número


total de observaciones.
Propiedad de la Media: La suma de las desviaciones de los valores o datos de
una variable X, respecto a su media aritmética es cero.

Ventajas e inconvenientes:
- La media aritmética viene expresada en las mismas unidades que la variable.

- En su cálculo intervienen todos los valores de la distribución.

- Es el centro de gravedad de toda la distribución, representando a todos los valores


observados.

- Es única.

– Su principal inconveniente es que se ve afectada por los valores extremadamente


grandes o pequeños de la distribución.
MEDIANA.
La mediana es un estadístico de posición
central que parte la distribución en dos, es decir,
deja la misma cantidad de valores a un lado que
a otro. Las fórmulas propuestas no nos darán el
valor de la mediana, lo que nos darán será la
posición en la que está dentro del conjunto de
datos.

La mediana, en ocasiones se le llama media


posicional, porque queda exactamente en la
mitad de un grupo de datos, luego de que los
datos se han colocado de forma ordenada.
CÁLCULO DE LA MEDIANA

• Cuando el número de observaciones es par:


Mediana = (n+1) / 2 → Media de las posiciones observaciones
• Cuando el número de observaciones es impar:
Mediana = (n+1) / 2 → Valor de la observación

Para calcular la mediana es importante que los datos estén


ordenados de mayor a menor, o al contrario de menor a mayor. Esto
es, que tengan un orden.
Ventajas e inconvenientes de la mediana:

- Es la medida más representativa en el caso de variables


que solo admitan la escala ordinal.
- Es fácil de calcular.
- En la mediana solo influyen los valores centrales y es
insensible a los valores extremos u atípicos o “outliers”. -
En su determinación no intervienen todos los valores de
la variable.
MODA.
La Moda (Mo) es el dato que
más se repite o el dato que
ocurre con mayor frecuencia.
Un grupo de datos puede no
tener moda, tener una moda
(unimodal), dos modas
(bimodal) o más de dos
modas (multimodal).
Ventajas e inconvenientes:

- Su cálculo es sencillo.
- Es de fácil interpretación.
- Es la única medida de posición central que puede obtenerse
en las variables de tipo cualitativo.
- En su determinación no intervienen todos los valores de la
distribución.
CÁLCULO DE LA MODA

➢ Con valores no agrupados:


Unimodal, bimodal, multimodal

Se tiene una muestra con valores:


20, 23, 24, 25, 25, 26 y 30.

➢ Para estimar la moda, con datos


• Li: límite inferior del intervalo en el cual se encuentra la moda.
agrupados, se siguen los
siguientes pasos: • fi-1: frecuencia absoluta del intervalo anterior en el que se
encuentra la moda.
• Encontrar el intervalo en el cual se • fi: frecuencia absoluta del intervalo en el que se encuentra la
encuentra la moda, que es el moda.
intervalo con mayor frecuencia
absoluta. • fi+1: frecuencia absoluta del intervalo siguiente en el que se
encuentra la moda.
• Usar la siguiente fórmula para
estimar el valor de la moda: • Ai: amplitud del intervalo en el que se encuentra la moda.
CUANTILES.

Sabemos que la mediana divide a los datos en dos partes iguales, también tiene interés
estudiar otros parámetros, llamados cuantiles, que dividen los datos de la distribución en
función de otras cantidades. Los más importantes son los cuartiles, quintiles, deciles y
percentiles.
➢ Cuartiles: son tres valores que divides la serie de datos en cuatro partes iguales. Se
representan por Q1 (cuartil primero), Q2 (cuartil segundo) y Q3 (cuartil tercero)
➢ Quintiles: son cuatro valores que dividen la serie de datos en cinco partes iguales: K1, K2,
K3 y K4.
➢ Deciles: Son nueve valores que dividen la serie de datos en 10 partes iguales: D1, D2, ...,
D9.
➢ Percentiles: son 99 valores que dividen la serie de datos en 100 partes iguales: P1, P2, ...,
P99.
MEDIDAS DE DISPERSIÓN.
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar un
valor numérico que ofrezca información sobre el grado de variabilidad de una variable.

En otras palabras, las medidas de dispersión son números que indican si una variable se
mueve mucho, poco, más o menos que otra. La razón de ser de este tipo de medidas es
conocer de manera resumida una característica de la variable estudiada. En este sentido,
deben acompañar a las medidas de tendencia central. Juntas, ofrecen información de un
sólo vistazo que luego podremos utilizar para comparar y, si fuera preciso, tomar
decisiones.

Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica y el
coeficiente de variación (no confundir con coeficiente de determinación).
RANGO.
Es un valor numérico que indica la diferencia entre el valor máximo y el mínimo de una
población o muestra estadística. Su fórmula es:

R = Máxx – Mínx

Donde:

• R → Es el rango.
• Máx → Es el valor máximo de la muestra o población.
• Mín → Es el valor mínimo de la muestra o población estadística.
• x → Es la variable sobre la que se pretende calcular esta medida.
• El rango suele ser utilizado para obtener la dispersión total. Es decir, si tenemos una
muestra con dos observaciones: 10 y 100 soles, el rango será de 90 soles.
VARIANZA.

Es una medida de dispersión que representa la variabilidad de una serie de datos


respecto a su media. Formalmente se calcula como la suma de los residuos al
cuadrado divididos entre el total de observaciones.

También se puede calcular como la desviación típica al cuadrado. Dicho sea de


paso, entendemos como residuo a la diferencia entre el valor de una variable en un
momento y el valor medio de toda la variable.

La varianza, en estadística, es muy importante. Ya que, aunque se trata de una


medida sencilla, puede aportar mucha información sobre una variable en concreto.
CÁLCULO DE LA VARIANZA

• Donde:
• X → Variable sobre la que se pretenden calcular la varianza
• xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
• N → Número de observaciones.
• x̄ → Es la media de la variable X.
DESVIACIÓN TÍPICA.

La desviación típica es otra medida que ofrece información de la dispersión respecto a la


media. Su cálculo es exactamente el mismo que la varianza, pero realizando la raíz cuadrada de
su resultado. Es decir, la desviación típica es la raíz cuadrada de la varianza.

• X → Variable sobre la que se pretenden calcular la


varianza
• xi → Observación número i de la variable X. i puede
tomará valores entre 1 y n.
• N → Número de observacines.
• x̄ → Es la media de la Xvariabloe.
COEFICIENTE DE VARIACIÓN.

Su cálculo se obtiene de dividir la desviación típica entre el valor absoluto de la media del
conjunto y por lo general se expresa en porcentaje para su mejor comprensión

• X → Variable sobre la que se pretenden calcular la varianza


• σx → Desviación típica de la variable X.
• | x̄ | → Es la media de la variable X en valor absoluto con x̄ ≠ 0
LA DISTRIBUCIÓN t DE STUDENT Y LOS
LÍMITES DE CONFIANZA
La distribución t de Student o distribución t es un modelo teórico utilizado para
aproximar el momento de primer orden de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño y se desconoce la
desviación típica.

En otras palabras, la distribución t es una distribución de probabilidad que estima el


valor de la media de una muestra pequeña extraída de una población que sigue una
distribución normal y de la cual no conocemos su desviación típica.

¿Por qué es tan especial la distribución t?


Pues porqué a diferencia de la distribución normal que depende de la media y la varianza, la
distribución t solo depende de los grados de libertad, del inglés, degrees of freedom (df). En
otras palabras, controlando los grados de libertad, controlamos la distribución.
HIPÓTESIS ESTADÍSTICAS Y PRUEBAS DE
SIGNIFICACIÓN.
Las pruebas de significación estadística sirven para comparar variables entre distintas
muestras. ... Se obtiene mucha mayor información cuando se puede rechazar
la hipótesis nula, lo que quiere decir que los estadísticos de las muestras que se comparan
son diferentes entre sí con una probabilidad mayor del 95%.
Hipótesis estadísticas y pruebas de significación.

Si el análisis indica que las diferencias observadas rara vez podrían ocurrir en
muestras aleatorias extraídas de poblaciones con medias y varianzas iguales,
rechazamos la hipótesis nula y concluimos que al menos un tratamiento tiene efectos
reales. Se dice que al menos una de las medias es significativamente diferente a las
otras.
Si la probabilidad de que la variación observada entre medias, que pudiera ocurrir por
casualidad, es de un 5 % o menor, decimos que las medias son significativamente
diferentes. Si la probabilidad de que la variación observada entre medias la cual
pudiese esperarse que ocurriera por casualidad, es de 1 % o menor, decimos que las
diferencias son altamente significativas.
DISTRIBUCIÓN F

Una prueba F es una razón entre dos varianzas y se utiliza para


determinar si dos estimaciones de varianzas independientes pueden ser
admitidas como estimaciones de la misma varianza. Esta razón fue
denominada F por George W Snedecor, en honor del fallecido Ronald A.
Fisher, pionero de la utilización de las estadísticas matemáticas en la
agricultura. En el análisis de varianza, la prueba F se utiliza para
verificar la igualdad de medias, o sea, para responder a la pregunta: ¿es
razonablemente posible admitir que las medias del tratamiento
resultaron del muestreo de poblaciones con medias iguales? Esto puede
ilustrarse con una descripción de como una porción de la tabla de
valores de F podría ser determinada.
Muchas gracias

También podría gustarte