Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Conceptos Previos
Estadística: Disciplina que estudia los métodos para extraer información y obtener conclusiones
razonables, cuando hay incertidumbre. Para ello, se nutre de herramientas matemáticas, lógicas y
subjetivas. La estadística hace referencia a la información disponible y a la utilización que le
damos.
Población o Universo: Es el conjunto del cual se extraen las observaciones y sobre el cual
deseamos realizar afirmaciones, tanto pasadas o presentes (descriptivas) como futuras
(inferencias). Habitualmente el universo es demasiado grande como para realizar el análisis sobre
él, por lo que se toma una muestra representativa para ese propósito.
Subíndices (xi): Sirven para identificar y ordenar los distintos resultados de un experimento. Cada
resultado de ese experimento va a estar dentro de un espacio muestral, pero no necesariamente
es el mismo en cada repetición. De ahí que al resultado se lo llama variable (habitualmente se
representa con la “x”, y se utiliza el subíndice “i” para identificar a cuál de todos los resultados se
hace referencia.
Operadores con subíndice: Los operadores con subíndice resumen la reiteración de la operación
matemática que representan. La cantidad de reiteraciones está marcada por los subíndices.
Ejemplo: Sumatoria.
= + +. . . + +
4 = 4 + 4 + 4+. . . +4 + 4 = +1 .4 = − + 1 .4
+ = + + + +. . . + + + + = + = + +1 .
Análisis de la información:
Una vez que tomamos la decisión de realizar un análisis de la información disponible (ya sea a
través de una muestra o del total de la población) nos encontramos con que tenemos datos u
observaciones, que son los resultados de llevar a cabo el experimento de muestreo. Lo primero
que debemos hacer es identificar frente a qué tipos de datos nos estamos enfrentando, en caso de
estar frente a “Hechos Individualizados” podemos optar por trabajar con ellos como se presentan
o agruparlos para simplificar su exposición. Para agruparlos se utilizan las frecuencias, que se
detallarán en el glosario.
Tanto en el caso en que trabajemos con datos agrupados o que los agrupemos nosotros por
simplicidad, debemos calcular las medidas de tendencia central y de variabilidad. Dichas medidas
son de mucha importancia ya que nos van a permitir, con unos pocos valores, darnos una idea de
cómo está compuesta la población y además nos va a permitir compararla con otras poblaciones
para sacar conclusiones.
También podemos calcular las medidas de proporción para comprender un poco más a la
población y en caso de considerarlo necesario realizar una subselección de la muestra/población
para concentrar el análisis.
Por último, es importante tener en claro que la información se la debemos presentar a personas
que no necesariamente tengan conocimientos estadísticos, por lo que al realizar el informe final
debemos dejar de lado los términos técnicos y conceptuales y presentar la información de una
manera que sea fácil de leer y obtener conclusiones. Una herramienta muy útil para simplificar la
visualización de la información son los gráficos, pero su confección no es objeto del presente
resumen. Podemos resumir lo anterior en el siguiente diagrama:
Fase Previa
Frecuencia
Acumulada (Absoluta)
Media
Medidas de
Modo
Tendencia Central
Mediana
Medidas
Resumen de Información
Varianza
Medidas de
Desvío típico
Variablidad
Coeficiente de
Variabilidad
Percentiles
Medidas de
Decil Intervalo Interdecil
Proporción
Confección de
Cuartil Intervalo Intercuaril
informe
Presentación
Representación
gráfica de los datos
Glosario:
Hecho: Es cada dato u observación obtenido de la muestra. Habitualmente se ordenan de menor a
mayor para una mejor comprensión y manipulación de la información.
Clase: Son los grupos en los que se agrupa la información. En los casos en que las observaciones
pertenezcan al dominio discreto, los datos se agruparan por valor. En los casos en que las
observaciones pertenezcan al dominio discreto, los datos se agruparan por intervalos; los
intervalos deben ser contiguos y ocupar al menos toda la amplitud muestral, de manera que
contengan a todos los hechos.
En los casos en que los datos estén agrupados por valor es redundante, ya que la coincidiría con el
valor de la clase. Para el caso en que se agrupa por intervalos se utiliza el punto medio:
! +
=
2
Con:
! = #$ % $ &'%
= #$ ( % $ &'%
) =
Con:
=* ' ' + % $' % '$ #' ' %'+ ' %' '% % '% %'# + %' )
* = +*
Con:
= ' ' + % $' %' %'+ ' %' - % '% %'# + %' '' # %' '.
Media : Es el valor alrededor del cual oscilan los datos. Se la conoce como Media o Media
Aritmética, ya que se trata del valor promedio.
En el caso de que estemos trabajando con hechos individualizados, su cálculo no es más que el
promedio simple (como cualquier estudiante calcula su nota final):
Con:
En el caso en que estemos trabajando con Datos agrupados, su cálculo es a través de un promedio
ponderado:
.
=
Con:
= /'% %' %'+ − + #' /'% %' 1' ' ,%'+ % '+
= ' ' + % $'
2
1 = + . '
+ 2
Con:
= #$ ( % $ &'% # '%
Mediana 1 : Es el valor que deja la misma cantidad de datos por debajo que por encima
(ordenados de menor a mayor).
2
Para el caso en que sea impar, la mediana va a ocupar el lugar , por lo que para el caso de
3
hechos individualizados buscamos el valor que se encuentra en ese orden, y para el caso de datos
2
agrupados por valor buscamos el primer valor en que su * ≥ .
3
Para el caso en que sea par, la mediana va a ser el promedio de los dos valores centrales. Para el
caso de hechos individualizados van a ser los del lugar y + 1. Para el caso de hechos agrupados
3 3
por valor va a ser el promedio del primer valor que acumule 3 y el primer valor que acumule 3 + 1.
Por último, en el caso de Hechos Agrupados por Intervalos, sin importar si es par o impar, se
determina el intervalo que contiene a la mediana viendo cual es el primer intervalo en que * ≥ 3
y luego se realiza el siguiente calculo:
−*
1 = +2 .'
Con:
= #$ ( % $ &'%
Medidas de variabilidad: Al igual que las medidas de tendencia central, son “características” de la
población que se encuentran implícitas en los datos sobre los que trabajamos. Son medidas de
dispersión que nos sirven para darnos una idea de qué tan “juntos” o “separados” se encuentran
los datos.
Desvío Absoluto Medio (d.m), Varianza (5 3 ) y desvío Estándar (d.e): Parece intuitivo que para
encontrar una medida de dispersión lo mejor sería sumar en cuanto se desvía cada observación de
la media, pero lamentablemente lo que obtendríamos sería 0, ya que por la definición de media,
los datos que se encuentran por encima de la media (sumandos positivos) se compensan con los
datos que se encuentran por debajo (sumandos negativos). Para evitar este problema podemos
adicionar el módulo, con lo que obtendríamos el “Desvío Absoluto Medio”, y ganaríamos unos
cuantos problemas a la hora de operar matemáticamente, o elevar al cuadrado cada sumando con
lo que obtendríamos a la “Varianza”. Por simplicidad a la hora de operar la segunda es más
utilizada que la primer opción.
La Varianza así calculada nos sirve para comparar contra la varianza de otras muestras y
determinar cuál tiene mayor o menor dispersión, pero al elevar al cuadrado todos los sumandos lo
que tenemos es un resultado con la magnitud original elevada al cuadrado (Ejemplo: si trabajamos
con distancias en metros, lo que obtenemos en la varianza es metros al cuadrado, por lo que
estaríamos midiendo la dispersión en área de una variable en distancia, algo que no suena
coherente), por lo que la varianza por sí sola no nos permite suponer mucho sobre la muestra.
Entonces resulta “cómodo” realizarle la raíz cuadrada a la varianza para obtener lo que se conoce
como desvío estándar, que nos va a brindar un resultado en la misma magnitud en la que estamos
trabajando.
2
−
/ =
=1
Con:
Con:
= /'% %' %'+ − + #' /'% %' 1' ' ,%'+ % '+
Cabe mencionar que hay un teorema, conocido como el teorema fundamental de la varianza el
cual demuestra que la varianza puede ser calculada de la siguiente manera:
3. − 3
/ =
3. 3
/ = −
Con:
= /'% %' %'+ − + #' /'% %' 1' ' ,%'+ % '+
6/
,/ =
| |
Algunos autores hablan de población homogénea si el ,/ < 0,1 y medianamente homogénea si
,/ < 0,3
Percentil <= : Los percentiles son los que nos dicen qué parte de la muestra se encuentra por
debajo de un valor, al “tanto por uno”.
Para hechos individualizados el cálculo realizamos la cuenta auxiliar para encontrar la clase:
. =>
100
Para el caso de hechos agrupados por intervalos se debe buscar el intervalo con el criterio para
hechos agrupados por valor. Luego se utiliza la siguiente fórmula para saber el valor exacto:
A.B
EFGC
@? = + CDD H .'
F
Con:
= #$ ( % $ &'%
=I % $%
Decil (J : Es un caso particular de percentil, donde = . 10 para el primer decil, y sube a razón
de 10 según el orden del decil. Ejemplo: cuarto decil JK: = 4 . 10 = 40 ∶ K .
Intervalo Interdecil: Es el intervalo que va entre el primer decil y el último, es decir entre el y
el T . Al trabajar sobre el intervalo interdecil estamos dejando afuera del análisis el 10% de la
muestra de menor valor y el 10% de mayor valor, para concentrarnos en el 80% centrado.
/( ) = /( ) = /( ) =
=1 =1 =1
Desvío Típico:
“‚" ; "‰" Raíz cuadrada de Raíz cuadrada de V(x) Raíz cuadrada de V(x)
V(x)