Está en la página 1de 18

Estadística

ESTADISTICA DESCRIPTIVA
Simbología utilizada en la estadística.

Los siguientes son los símbolos más usados en esta rama de las matemáticas:

Símbolo Descripción
,  Pertenece a, No pertenece a
 Si y solo si
 Implica; Si…entonces; Por lo tanto
 Sumatoria
>, <, ≥, ≤ Mayor que, Menor que, Mayor o igual que, Menor o
igual que
≠ Diferente
≈ Aproximadamente igual
|x| Valor absoluto de x
| Tal que

Ejemplos de uso:

xA que se lee “x pertenece a A”

a<b que se lee “a es menor que b”

x≠y que se lee “x diferente de y”

10
que se lee “Sumatoria total de todos los valores de x
x
i 1
i
desde el valor 1 al valor 10”

|-3| que se lee “Valor absoluto de -3”

3.995 ≈ 4 que se lee “3.995 aproximadamente igual a 4”

que se lee “B es el conjunto de los número x tal que x


B={x|x es par}
es par”

que se lee “y es igual a 2, si y solo si a y b pertenecen


𝑎
y = 2  a, b  B, a>b | y = a B, siendo a mayor que b tal que se de la división
𝑏
entera de a sobre b.

CEAPAC – Matemáticas 1 Domingo Abarca Ramírez


Estadística

Manejo de la información
La estadística es una rama de las matemáticas encargada del estudio del comportamiento de una
población mediante un estudio cuyo propósito es hacer inferencias a partir de un subconjunto de
datos, llamado muestra, tomados de ella. La estadística se encarga a su vez de reunir, organizar y
analizar datos numéricos, así como ayudar a diseñar experimentos, mismos que tienen como
intención primordial la generación de predicciones sobre un comportamiento de una determinada
población. El término estadística se deriva del latín status, que significa estado en el sentido político,
se empleó entonces para referirse a la recolección y descripción de tales datos del estado.

Población
Es el conjunto total de individuos, objetos o medidas que poseen algunas características comunes
observables en un lugar y en un momento determinado. El tamaño de la población se representa
por medio de la letra “N”.

La población puede ser según su tamaño de dos tipos:

Población finita: Cuando el número de elementos que la forman es finito, por ejemplo el número
de alumnos de un centro de enseñanza, o grupo clase.

Población infinita: Cuando el número de elementos que la forman es infinito, o tan grande que
pudiesen considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los productos
que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse
infinita.

Muestra
Es un subconjunto fielmente representativo de la población, para poder realizar estudios sobre ella
y poderlas inferir propiedades a la población. Los elementos de la muestra se representan con la
letra “n”.

Muestreo
Es la extracción, de una población, de los elementos de muestra. El muestreo es indispensable para
el investigador ya que es imposible entrevistar a todos los miembros de una población debido a
problemas de tiempo, recursos y esfuerzo. Al seleccionar una muestra lo que se hace es estudiar
una parte o un subconjunto de la población, pero que la misma sea lo suficientemente representativa
de ésta para que luego pueda generalizarse con seguridad de ellas a la población.

Técnicas de Muestreo
Existen dos técnicas para seleccionar la muestra de una población: El no aleatorio, también llamado
de juicio; y el probabilístico.

No aleatorio o de juicio: Se escogen los elementos de la muestra tomando en cuenta la experiencia


de alguien con la población. Algunas veces una muestra de juicio se usa como guía o muestra
tentativa para decidir cómo tomar una muestra aleatoria más adelante.

Aleatorio o Probabilístico: En este caso, todos los elementos de la población tienen alguna
oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente a cada sujeto de la
población es conocida de antemano, recibe el nombre de muestreo probabilístico.

CEAPAC – Matemáticas 2 Domingo Abarca Ramírez


Estadística

Variables estadísticas.
Una variable es un símbolo, tal como n, x, y, z o w, H1, etc., que puede tomar un valor cualquiera
de un conjunto determinado de ellos, llamado dominio de la variable. Si la variable puede tomar
solamente un valor, entonces se le llama constante. El manejo de muestras en la que los valores
pueden variar nos lleva a las llamadas variables aleatorias y son precisamente este tipo de variables
las que operan en la estadística. Las variables aleatorias se pueden clasificar en discretas y
continúas.

Variable aleatoria continúa


Una variable aleatoria continua es aquella que teóricamente puede tomar cualquier valor entre dos
valores cualesquiera (números reales). Las variables aleatorias continúas son consideradas así
por la posibilidad de poder tomar cualquier valor dentro de una infinidad de valores al azar dentro
de un intervalo. Por ejemplo: el tiempo, la cantidad de partículas que cae en un contenedor, la
cantidad de polvo galáctico, las estrellas que observamos en el cielo, etcétera. Las variables
utilizadas son variables continuas finitas o infinitas.

Variable aleatoria discreta


Las variables aleatorias discretas son aquellas cuya naturaleza toma un valor finito de valores
enteros (número enteros), tales como: los estudiantes de la escuela de medicina de una universidad,
los alumnos reprobados en la materia de matemáticas, el número de peces en un estanque, el
número de cursos que un estudiante debe cursar para graduarse, etcétera. El conjunto de valores
que podría de tomar una variable aleatoria discreta puede ser finita o infinita numerable.

Ejemplos:
- En una familia el número x de hijos puede tomar cualquiera de los valores 0, 1, 2, 3, …, pero no puede
ser 2.5 ó 3.842, es pues una variable discreta.

- La altura h de un individuo puede ser 1.73 mts, 1.75 mts. ó 1.80 mts, dependiendo de la exactitud de
medida; es una variable continua.

- El rango de temperaturas t en invierno en la ciudad de México es 1 °C  t  5 °C, es una variable


continua

Ejercicio 1. ¿Cuál de las siguientes variables son discretas y cuáles continúas?:

1.- Número de águilas en 6 lanzamientos de una moneda. R=

2.- Tiempo que usa un estudiante para resolver un examen. R=

3.- Altura del mercurio en un barómetro. R=

4.- Número de dientes de un niño. R=

5.- Máxima temperatura ambiental durante el día. R=

6.- Número de juegos ganados por un equipo de básquetbol. R=

7.- Número de hijos de una familia. R=

8.- Litros de gasolina vendidos el martes anterior en una gasolinera. R=

CEAPAC – Matemáticas 3 Domingo Abarca Ramírez


Estadística

Ejercicio 2: Determine sobre los siguientes ejemplos cuál es la población, cuáles son las
variables a estudiar así como su naturaleza.

1. En un estudio realizado para determinar la dosis respuesta de un fármaco para controlar la diabetes
mellitus, se ha realizado el estudio sobre un grupo de 50 personas, se espera determinar si el fármaco
es efectivo.

2. Se desea reconocer si la efectividad de un fármaco que ha sido probado como efectivo en otro país
sobre la población en otro, por lo que se han tomado dos grupos de 40 pacientes cada uno.

3. Se tiene dos grupos de estudiantes de 120 y 135 alumnos con edades 10 y 18 años, sobre los que
se hace un estudio paramétrico, a los que se les plantea una pregunta escolar para determinar la
eficiencia de dos modelos, a fin de comparar si es efectivo.

4. Una investigación sobre los sabores de los refrescos que más les agrada a los niños reporta que se
encuentra que la población infantil tienen preferencia por los sabores de los refrescos de cola.

Presentación de datos estadísticos


Los datos estadísticos pueden presentarse de dos formas: No agrupados y Agrupados.

Datos No agrupados
Los datos No agrupados son una lista simple de valores. Generalmente son en tan poca cantidad
que son fácilmente manejables y por lo mismo no requieren de alguna estructuración especial tal
como una tabla.

Ejemplo 1. Del estudio de la estatura de un cierto núcleo de población se han obtenido los siguientes datos:

1.62, 1.78, 1.75, 1.58, 1.83, 1.68 y 1.81 metros.

Son datos cuantitativos continuos, pues los individuos de una población pueden tener como estatura
cualquier número real en un cierto intervalo.

Ejemplo 2. Del alumbramiento de un conjunto de ratas se ha observado el número de crías, obteniéndose


los siguientes valores numéricos:

5, 3, 1, 5, 3, 6, 4, 2, 5, 6, 3, 6, 5, 2, 6, 7 y 3.

Datos Agrupados
Los datos Agrupados se estructuran en una tabla (comúnmente llamada tabla estadística o de
frecuencias) y la decisión de presentarlos de esta manera es porque la cantidad de los mismos ya
no es fácilmente manejable y observable. Los datos agrupados pueden estructurarse en tablas por
Tratamiento individual (recomendado cuando los datos están generalmente compactos) o en
Tratamiento por clases (recomendado para datos muy dispersos).

CEAPAC – Matemáticas 4 Domingo Abarca Ramírez


Estadística

Frecuencias
Los caracteres estadísticos de una población son las propiedades o cualidades de los individuos
que nos interesa estudiar. Un carácter estadístico divide a la población en grupos. A cada uno de
estos grupos se les denomina modalidad. Cuando el carácter es cuantitativo sus diversas
modalidades son medibles, es decir, se les puede asignar un número. Se llama variable estadística
a la aplicación que a cada modalidad le hace corresponder ese número, es decir, su medida.

Para referencia rápida llamaremos Ejemplo 1 al primer ejemplo de los Datos No agrupados y
Ejemplo 2 al segundo.

Ejemplo 3. En el Ejemplo 2 la variable estadística toma los valores: 1, 2, 3, 4, 5, 6 y 7.

Tamaño de la muestra
El tamaño de la muestra es la cantidad de datos que existen en ella y se representa por la letra N.

Ejemplo 4. En el Ejemplo 1 N es igual a 7 (7 personas) y en el Ejemplo 2 N es igual a 17 (17 ratas).

Frecuencia absoluta
Se llama frecuencia absoluta al número de individuos que toman un determinado valor de una
variable estadística (o una modalidad de un atributo)

Ejemplo 5. En el Ejemplo 2 la frecuencia absoluta del 1 es 1 (solo 1 rata tuvo 1 cría), la frecuencia absoluta
del 2 es 2 (2 ratas tuvieron 2 crías) y la frecuencia absoluta del 3 es 4 (4 ratas tuvieron 3 crías).

Frecuencia absoluta acumulada


Se llama frecuencia absoluta acumulada de un valor a la suma de las frecuencias absolutas de
todos los valores menores o iguales que él.

Ejemplo 6. En el Ejemplo 2 la frecuencia absoluta acumulada del 2 es 3 (1+2) y la del 3 es 7 (1+2+4).

Frecuencia relativa
Se llama frecuencia relativa a la razón entre la frecuencia absoluta y el número total de datos o
tamaño de la muestra (N).

Ejemplo 7. En el Ejemplo 2 N=17, entonces, la frecuencia relativa del 1 es 1/17=0.059, la frecuencia elativa
del 2 es 2/17=0.118 y la frecuencia relativa del 3 es 4/17=0.235.

Frecuencia relativa acumulada


Se llama frecuencia relativa acumulada de un valor de una variable estadística a la suma de las
frecuencias relativas de todos los valores menores o iguales que él.

Ejemplo 8. En el Ejemplo 2, la frecuencia relativa acumulada del valor 3 es 0.412 (0.059 + 0.118 + 0.235).

CEAPAC – Matemáticas 5 Domingo Abarca Ramírez


Estadística

Distribución de frecuencias
Las dos formas más comunes de representar los datos son las tablas y los gráficos.

Tablas estadísticas de frecuencias


Las tablas estadísticas son datos estructurados. Están diseñadas de tal modo que resultan muy
fáciles de leer y de interpretar. Para la construcción de tablas de datos cuantitativos pueden tratarse
éstos individualmente o agrupándolos en clases.

Tratamiento individual
Para variable discreta, o que siendo continua tengamos pocos datos. Si tenemos una muestra de
tamaño N, la tabla se estructura:

Variable Frecuencia Frecuencia absoluta Frecuencia Frecuencia relativa


Estadística: absoluta: acumulada: relativa: acumulada:
xi fi Fi hi Hi
x1 f1 F1=f1 h1=f1/N H1=h1
x2 f2 F2=f1 + f2 h2=f2/N H2=h1 + h2
x3 f3 F3=f1+f2+f3 h3=f3/N H3=h1+h2+h3
.
.
.
xn-1 fn-1 Fn-1=f1+f2+f3+…+fn- hn-1=fn-1/N Hn-1=h1+h2+h3+…+hn-1
1
xn fn Fn=f1+f2+f3+…+fn- hn=fn/N Hn=h1+h2+h3+…+hn-
1+fn 1+hn
n n
 fi  N  hi 1
i 1 i 1

Tabla 1.

El procedimiento a seguir para el correcto diseño de la tabla estadística para tratamiento individual
es el siguiente:
1. Se ordenan los datos recolectados de menor a mayor o viceversa.

2. N es el tamaño de la muestra.

3. Se diseña una tabla conformada por las siguientes columnas:


xi: Es la variable estadística (Puntuaciones, tallas, edades, etc.), y representa cada uno de
los valores que esta toma.
fi: Son las frecuencias absolutas y representan el número de veces que un dato se repite. La
suma de las f debe ser igual a N.
Fi: Son las frecuencias acumuladas absolutas.
hi: Son las frecuencias relativas. La suma de las h debe ser igual a uno.
Hi: Son la frecuencias acumuladas relativas.

CEAPAC – Matemáticas 6 Domingo Abarca Ramírez


Estadística

Ejercicios de Distribución de frecuencias (tabla estadística)


Tratamiento individual:
Ejercicio 3. Los siguientes son los pesos de 24 estudiantes hombres de una universidad,
con precisión de una libra:

119 119 125 130 130 130 130 130


135 135 135 138 138 138 140 140
140 142 142 142 142 142 144 144

Diseñe una tabla estadística para estos datos, así como también el histograma y el polígono
de frecuencias correspondientes.

Seguimos el procedimiento:
1 - Ordenación de datos

2 – Se determina N=

3 – Diseñamos la tabla de frecuencias siendo x la variable estadística:

Variable Frecuencia Frecuencia Frecuencia Frecuencia


Estadística: absoluta: absoluta relativa: relativa
xi fi acumulada: hi acumulada:
Fi Hi

4 - Representación gráfica

a – Diagrama de barras o histograma


b – Polígono de frecuencias
c – Diagrama circular

CEAPAC – Matemáticas 7 Domingo Abarca Ramírez


Estadística

7 7

6 6

5 5

4 4

3 3

2 2

1 1

119 125 130 135 138 140 142 144 119 125 130 135 138 140 142 144

(a) (b)

(c)

CEAPAC – Matemáticas 8 Domingo Abarca Ramírez


Estadística

Tratamiento por clases:


Ejercicio 4. Los siguientes datos corresponden a una muestra de tamaño 30 de los pesos de
obreros de una fábrica, obteniéndose los siguientes datos medidos en kg:

71.9 63.9 62.3 72.5 78.0 70.7 71.4 60.5 60.9 68.2
88.5 76.1 82.1 63.7 79.8 67.5 50.1 69.5 66.1 47.3
72.1 59.8 93.7 80.7 61.2 64.3 53.7 74.7 96.3 73.2

Construir una tabla de frecuencias agrupando los datos en clases de la misma amplitud.

Seguimos el procedimiento:
1 - Ordenación de datos

47.3 50.1 53.7 59.8 60.5 60.9 61.2 62.3 63.7 63.9
64.3 66.1 67.5 68.2 69.5 70.7 71.4 71.9 72.1 72.5
73.2 74.7 76.1 78.0 79.8 80.7 82.1 88.5 93.7 96.3

2 – Se determina N=

3 – Diseñamos la tabla de frecuencias para 6 clases:

Clases Marca de fi Fi hi Hi
clase:
mci

4 - Representación gráfica

a – Diagrama de barras o histograma


b – Polígono de frecuencias
c – Diagrama circular

CEAPAC – Matemáticas 9 Domingo Abarca Ramírez


Estadística

(a) (b)

(c)

CEAPAC – Matemáticas 10 Domingo Abarca Ramírez


Estadística

Mediciones - Medidas de tendencia central


También se les conoce como medidas de posición o promedios son los valores que se utilizan para
representar el conjunto de observaciones. Tienden a situarse en el centro del conjunto de los datos,
previamente ordenados. Las principales medidas centrales son:

1 - La media aritmética
2 - La mediana
3 - La moda.

Los cálculos de estas medidas son aplicados tanto a datos no agrupados (sin tabla estadística)
como a datos agrupados (con tabla estadística). Se estudiará cada medida para cada tipo de caso.

Media aritmética
La media aritmética de un conjunto de observaciones es una medida de tendencia central conocida
como promedio. Es la suma de todos los valores que toma la variable estadística dividida por el
número total de datos de la muestra (N).

Datos No agrupados: Para los datos no agrupados, es decir, sin tabla estadística, la media aritmética
se calcula a través de la siguiente expresión:
n
 xi ( x1  x 2  ...  x n )
i 1
x 
N N

Ejercicio 5. Los siguientes datos corresponden al registro de pesos de pollos (gr.) de seis semanas
de vida en un establecimiento.

150, 152, 154, 155, 155, 157, 157, 157, 157, 160

Encuentre el valor de la media para estos datos.

Ejercicio 6. Las calificaciones finales de un grupo de 12 alumnos de la materia de Física II de cierta


universidad son:

10, 3, 5, 9, 6, 8, 8, 7, 9, 6, 8, 7

Calcule el promedio general del grupo:

CEAPAC – Matemáticas 11 Domingo Abarca Ramírez


Estadística

Datos agrupados: Para el caso de los datos agrupados en tabla estadística, la expresión para
obtener la media aritmética es:

a) – Si es tratamiento individual:

n 
  xi * f i 
x
i 1   x1  f 1   x 2  f 2   ...  x n  f n 
N N

b) – Si es tratamiento por clases:

k 
  mi * f i 
x  i 1   m1  f 1   m 2  f 2   ...  m n  f n 
N N

Ejercicio 7. Encuentre la media aritmética para los valores de la tabla estadística del Ejercicio 3 del
tratamiento individual.

Mediana
Es la observación que se encuentra en el centro cuando los datos están ordenados, divide a los
datos en dos partes iguales. Este valor se obtiene dependiendo de la cantidad de valores N que
haya en la muestra:

- Si N es impar:
la mediana es la observación que está en el lugar (N+1)/2, esto es

x  x( n1) 2
~

- Si N es par:
la mediana es el promedio de las observaciones N/2 y N/2 + 1, esto es

xn 2  xn 21
x
~
2
Ejercicio 8. Encontrar la mediana para el siguiente conjunto de datos:

9, 12, 5, 16, 8, 3, 11

CEAPAC – Matemáticas 12 Domingo Abarca Ramírez


Estadística

Ejercicio 9. Encontrar la mediana para el siguiente conjunto de datos:

8.3, 5.7, 9.2, 3.9, 7.4, 11.8, 10.6, 4.3

Ejercicio 10. Encuentre el valor de la mediana para los valores de la tabla estadística del Ejercicio
3 del tratamiento individual.

Moda
Ejercicio 11. Si se observa cual es el dato que más se repite en las evaluaciones, se tiene:

3, 5, 6, 6, 7, 7, 8, 8, 8, 9, 9, 10

Ejercicio 12. Encuentra la moda de los siguientes datos:

4, 9, 5, 6, 7

Ejercicio 13. Encuentra la moda del siguiente conjunto de datos:

9, 3, 6, 7, 9, 8, 5, 9, 7, 3

Ejercicio 14. Calcula la moda para los datos que se presentan a continuación:

6, 7, 8, 6, 9, 7, 8, 5, 6, 8

Ejercicio 15. Calcula la moda para estos datos:

8, 6, 5, 5, 9, 6, 8, 6, 5, 9, 8, 9

Ejercicio 16. Encuentre los valores modales para los valores de la tabla estadística del Ejercicio 3
del tratamiento individual.

CEAPAC – Matemáticas 13 Domingo Abarca Ramírez


Estadística

Cuantiles
Los cuantiles son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la
distribución en partes, de tal manera que cada una de ellas contiene el mismo número de
frecuencias.

Los cuantiles más conocidos son:


 a) Cuartiles (Qi) Son valores de la variable que dividen a la distribución en 4 partes, cada una
de las cuales engloba el 25 % de las mismas. Se denotan de la siguiente forma: Q1 es el primer
cuartil que deja a su izquierda el 25 % de los datos; Q2 es el segundo cuartil que deja a su
izquierda el 50% de los datos, y Q3 es el tercer cuartil que deja a su izquierda el 75% de los
datos. (Q2 = 𝑥̃ )

 b) Deciles (Di) Son los valores de la variable que dividen a la distribución en las partes iguales,
cada una de las cuales engloba el 10 % de los datos. En total habrá 9 deciles. (Q2 = D5 = 𝑥̃ )

 c) Centiles o Percentiles (Pi) Son los valores que dividen a la distribución en 100 partes iguales,
cada una de las cuales engloba el 1 % de las observaciones. En total habrá 99 percentiles. (Q2
= D5 = Me = P50)

Cálculo de cuartiles para Datos No Agrupados


En el caso de datos no agrupados en tabla se calcula la posición de cada cuartil según el valor de
N, el valor obtenido “apuntará” al valor correspondiente al cuartil. Se localiza mediante las siguientes
fórmulas:
Cuando n es par: Cuando n es impar:
𝑘(𝑁) 𝑘(𝑁+1)
4 4

Donde k es el correspondiente número de cuartil.

Cálculo de cuartiles para Datos Agrupados por tratamiento individual


Cuando los datos están en tabla y por tratamiento individual se recurre al procedimiento de
localización de la posición de cada cuartil usado para los datos No Agrupados auxiliándose del valor
de la frecuencia acumulada. Posteriormente para calcular el valor de cada cuartil aplicamos las
expresiones anteriores.

Cálculo de cuartiles para Datos Agrupados en clases


Procedimiento similar al de tratamiento individual, pero los cuartiles se obtienen usando:

𝑁
𝑘 ( ) − 𝐹𝑘
𝑄𝑘 = 𝐿𝑘 + 4 ×𝑐
𝑓𝑘
Donde:
k= Número de cuartil (1, 2, 3)
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k

CEAPAC – Matemáticas 14 Domingo Abarca Ramírez


Estadística

Ejercicio 17. Calcule el cuartil 1, 2 y 3 para los siguientes dos grupos de datos:

1 - 150, 152, 154, 155, 155, 157, 157, 157, 157, 160, 160, 161, 161, 162, 163, 164

2 - 8, 6, 5, 5, 9, 6, 8, 6, 5, 9, 8, 9, 7

Ejercicio 18. Para el Ejercicio 4 del tratamiento por clases encuentre los siguientes valores:

1) - La media aritmética.

2) - Identifique la moda.

3) - ¿En qué marca de clase está la mediana?

4) - ¿Cuál es el valor del tercer cuartil?

5) - ¿En la marca de clase donde está la mediana también está incluido el __________________?

a) Primer decil b) Sexto cuartil c) Tercer quintil d) Segundo sextil

CEAPAC – Matemáticas 15 Domingo Abarca Ramírez


Estadística

Ejercicio 19. Los datos que se brindan a continuación corresponden a 110 mediciones de altura
(cm) de plantas de un cultivar de Soja en un determinado estado fenológico del ciclo:

56 57 57 58 58 58 59 59 60 60 61 62 62 62 63 63 63 64 64 64 65 65 65
65 66 66 66 66 66 66 66 67 67 67 67 67 67 68 68 68 68 68 68 68 68 69
69 69 69 69 69 69 69 69 69 69 70 70 70 70 70 70 70 70 70 71 71 71 72
72 72 72 72 72 73 73 73 73 73 73 73 73 73 74 74 74 74 74 75 75 75 75
75 76 77 77 78 78 78 78 78 79 79 80 80 81 82 82 83 84

Diseñe una tabla estadística para estos datos para diez clases. Trace la gráfica de barras, el
polígono de frecuencias y el diagrama circular.

m Intervalos Marca de Frecuencia Frecuencia Frecuencia relativa Frecuencia


clase: absoluta de absoluta de clase de clase: absoluta relativa de
mi clase: acumulada: hi clase acumulada:
fi Fi Hi

1) - Calcule la media aritmética de los datos.

2) - Identifique la moda.

3) - ¿En qué marca de clase está la mediana?

4) - ¿Cuál es el valor del noveno undecil?

5) - En la marca de clase donde está la mediana también está incluido el ____________________

a) Décimo quintil b) Sexto decil c) Quinto decil d) Tercer decil

CEAPAC – Matemáticas 16 Domingo Abarca Ramírez


Estadística

Medidas de dispersión
La dispersión de un conjunto de observaciones se refiere a la magnitud de la variabilidad que presentan las mismas.

Desviación estándar o típica


La desviación estándar es la medida de dispersión más usada en estadística, tanto en aspectos descriptivos como
analíticos.

Desviación estándar para datos no agrupados


En su forma conceptual, la desviación estándar para datos no agrupados de una muestra se define así:
n
 xi
2

i 1
S x
2

Desviación estándar para datos agrupados


Para datos agrupados en tablas, usando las notaciones establecidas en los temas anteriores, la desviación
estándar se puede escribir como:

a)- Si es tratamiento individual: b)- Si es tratamiento por clases:

n k
 xi f i  mi f i
2 2

i 1 i 1
S x S x
2 2

n n

Ejemplo 1. Calcular la desviación estándar de la tabla de frecuencias que se muestra a continuación:

xi fi Fi
1 2 2
2 2 3
3 4 5
4 1 8
5 1 10

Solución:

1 – Obtener N

2 – Calcular la media aritmética

3 – Calcular la sumatoria
𝑛

∑ 𝑥𝑖 2 ⋅ 𝑓𝑖
𝑖=1

3 – Calcular la desviación estándar:

CEAPAC – Matemáticas 17 Domingo Abarca Ramírez


Estadística

Varianza
La varianza se define como se define la media de las diferencias cuadráticas de n puntuaciones con respecto a su media
aritmética, es decir:

 x i  x 
n
2

i 1
V ( x)  S  2

Otra definición de varianza es la que dice que la varianza de un conjunto de datos es el cuadrado de la desviación
estándar. Por lo tanto, si ya se conociese el valor de la desviación estándar basta entonces con elevar al cuadrado dicho
valor para obtener la varianza o viceversa. Basado en esto, la varianza también se puede obtener a partir de las
expresiones de la desviación estándar, es decir:

a) – Para datos no agrupados

n
 xi
2

S  i 1
x
2 2

b) – Para datos agrupados con tratamiento individual

n
 xi f i
2

S2  i 1
x
2

c) – Para datos agrupados con tratamiento por clases

k
 mi f i
2

S2  i 1
x
2

Debido a que la desviación estándar tiene las mismas unidades que la media, la desviación estándar es más utilizada
que la varianza.

CEAPAC – Matemáticas 18 Domingo Abarca Ramírez

También podría gustarte