Está en la página 1de 28

Fundamentos de la

Estadística Descriptiva
Ing. Alexander Pulido Rojano
Algo de Historia...
• Los orígenes históricos de la Estadística (descriptiva) datan de los procesos de
recogida de datos, censos y registros sistemáticos.
• En el siglo XVII, las universidades alemanas imparten enseñanzas de “Aritmética
Política”, termino con el que se designa la descripción numérica de hechos de
interés para la Administración Publica.
• Destacados autores de Aritmética Política fueron los ingleses Graunt (1620-1674)
y Petty (1623-1687).
Algo de Historia...
• Graunt llega a estimar tasas de mortalidad para la población
londinense y propone la creación de un departamento de estadística.
• Petty propone reunir información no solo de carácter demográfico,
sino también sobre recaudación de impuestos, educación y comercio.
Conceptos Básicos
• Los experimentos aleatorios son procesos en
los cuales interviene el azar.
• El espacio muestral de un experimento
aleatorio es el conjunto formado por todos los
posibles resultados.
• Los experimentos aleatorios pueden ser una
composición de experimentos aleatorios
simples. Por ejemplo: el experimento aleatorio
consistente en lanzar tres veces una moneda al
aire es composición de tres experimentos
aleatorios más simples, que corresponderían a
cada uno de los lanzamientos.
Variable y atributo
Observaciones resultantes de un experimento pueden ser de tipo cualitativo o
cuantitativo, en el primero de los casos se tiene un atributo y en el segundo una
variable. Para hacer referencia genéricamente a una variable o a un atributo se
utilizar el termino carácter.
EJ1. Clasifique los siguientes datos según sean variables o
atributos:
a) El color de ojos de un grupo de 20 personas.
b) La nacionalidad de un conjunto de individuos.
c) Los matices de color de un cuadro.
d) Las dianas que consigue un arquero sobre un total de 100
intentos.
Tipos de datos
Cualitativos (Atributo): Se refieren a cualidades o modalidades que no
pueden expresarse numéricamente. Pueden ser:
• Ordinales: siguen un orden o secuencia (ej. el abecedario, los meses del año).
• Categóricos: no siguen ningún orden (Ej. el estado civil de las personas:
solteros, casados, viudos, divorciados y separados).
Cuantitativos: se refieren a cantidades o valores numéricos. Pueden
ser:
• Discretos: si toman valores enteros (0, 1, 2, 3...) (Ej. el número de hijos).
• Continuos: si pueden tomar cualquier valor dentro de un intervalo (Ej. la
estatura o el peso de las personas).
Variables estadísticas
• Variables estadísticas unidimensionales, esto es, aquellas que
proporcionan un único dato para cada individuo.
• Variables estadísticas multidimensionales, con múltiples datos sobre
cada individuo.
En las unidimensionales, el objetivo es tratar de forma aislada a la
variable estadística, mientras que en las multidimensionales, es tratar
varias variables estadísticas unidimensionales.
Estadística Descriptiva

La estadística descriptiva es una parte de las matemáticas que estudia


fenómenos mediante la recogida de datos, la organización de estos en
tablas y su interpretación mediante gráficos o con el cálculo de valores
o parámetros numéricos que resumen la información obtenida de los
datos recolectados.
Estadística Descriptiva
Al realizar un estudio estadístico, la población constituye el conjunto
donde realizamos el estudio, a cada uno de los elementos de este
conjunto lo denominaremos individuo. Por otra parte, llamaremos
muestra al subconjunto de la población donde recopilamos los datos,
y caracteres estadísticos a los aspectos que consideramos de cada uno
de los individuos de la muestra.
Tablas Estadísticas de Datos Simples
• Las tablas estadísticas de datos simples recopilan
el número de veces que se repite cada uno de
los datos.
• Escribiremos en una primera columna los
distintos datos 𝒙𝒊 de la variable estadística, su
frecuencia absoluta 𝒇𝒊 , que corresponde al
número de veces que se repite dicho dato. Al
final de esta columna escribiremos la suma de
estas frecuencias absolutas (𝑵). La frecuencia
absoluta acumulada 𝑭𝒊 del dato 𝒙𝒊 es igual a la
suma de su frecuencia absoluta más la
frecuencia absoluta de todos los datos menores
que el. También incluir una nueva columna con
las frecuencias relativas 𝒉𝒊 (𝒉𝒊 = 𝒇𝒊 /𝑵).
Tablas Estadísticas de Datos Simples
Ej1. Número de No Conformidades (NC) Frecuencia
en un conjunto de 50 empresas que Número de No Frecuencia Absoluta
quieren certificarse con ISO 9001:2015. conformidades Absoluta Acumulada
Preguntas: (xi) (fi) (Fi)
• ¿Cuantas empresas presentaron 4 NC o 1 5 5
menos? 2 8 13
• ¿Qué porcentaje de empresas 3 17 30
presentó el máximo de NC? 4 7 37
• Si las NC son leves y pueden 5 6 43
certificarse aquellas cuyas NC son 3 o 6 4 47
menos, ¿ Cuantas empresas logran 7 3 50
certificarse y en que porcentajes? N = 50
Tablas Estadísticas de Datos Simples
• Trabajemos...
Tablas Estadísticas de Datos Agrupados en
Intervalos
• Cuando trabajamos con una variable estadística, ya sea continua o discreta, cuyos
datos tienen frecuencias absolutas muy pequeñas o datos muy dispersos, puede
resultar conveniente agrupar los datos en intervalos. Así, hablaríamos de
frecuencias absolutas de intervalos.
• Con ello, perderíamos precisión, ya que identificamos un dato con el intervalo
donde pertenece, pero sin embargo, ganaríamos una mejor comprensión de la
información que nos suministran los datos.
• Trabajaremos con intervalos cerrados por la izquierda y abiertos por la derecha
[a; b), que serían los números reales incluidos entre a y b, donde a pertenecería
al intervalo pero b no.
Tablas Estadísticas de Datos Agrupados en
Intervalos
• A los intervalos resultantes los podemos ahora identificar con un nuevo valor
numérico, lo que se conoce como la marca de clase 𝒙𝒊 , que no es más que el
punto medio de un intervalo [a; b), esto es (a + b)/2, aunque podemos obtenerlo
a simple vista.
También podemos crear una tabla que recopile la
Intervalos 𝒙𝒊 𝒇𝒊 𝑭𝒊
información sobre los intervalos, donde en la
1 [0 - 4) 2 3 3
primer columna incluiríamos estos, en la segunda
2 [4 - 8) 6 5 8
columna la marca de clase de cada uno de los
3 [8 - 12) 10 6 14
intervalos, en la tercera columna la frecuencias
4 [12 - 16) 14 4 18
absolutas de cada intervalo y de forma análoga,
5 [16 - 20) 18 3 21
columnas para las frecuencias absolutas
𝑁 = 21
acumuladas y las frecuencias relativas.
Tablas Estadísticas de Datos Agrupados en
Intervalos
• Paso 1: Ordenar los datos de menor a mayor
• Paso 2: Calcular el Rango (R); R = Valor máximo – Valor mínimo
• Paso 3: Número de intervalos de clase; K = Raíz(N) ó K = 1 + 3,322log (N)
• Paso 4: Amplitud (A) = R/K
• Paso 5: Definimos los intervalos sumándole al valor más pequeño, la Amplitud (A)
hasta que obtenga el número de intervalos de clase.
• Paso 6: Construir la tabla de frecuencias
Tablas Estadísticas de Datos Agrupados en
Intervalos
• Trabajemos...
Medidas de tendencia central
Son valores representativos de todos los datos, respecto de distintos puntos vista:
La moda (Mo), la mediana (Me), y la media (𝑥).
ҧ
No. Hallazgo (𝒙𝒊 ) 𝒇𝒊
1 5
La moda (Mo) es aquel o aquellos 2 6
datos con mayor frecuencia absoluta, y 3 7
por ello, corresponde con el dato o 4 8
datos más frecuentes de la muestra. 5 12 Mo = 5
6 4
7 3
8 5
9 4
10 2
Medidas de tendencia central
• La mediana (Me), si ordenamos todos los datos
de menor a mayor, incluyendo todas las No. Hallazgo (𝒙𝒊 ) 𝒇𝒊 𝑭𝒊
repeticiones, esta corresponderá al dato que 1 5 5
ocupa la posición central o en el caso de que 2 6 11
existan dos en el centro, el valor medio o 3 7 18
semisuma de estos. 4 8 26
5 12 38 Me = 5
❑Si dicho valor no se corresponde con ninguna
frecuencia absoluta acumulada, la mediana Me 6 4 42
coincide con el dato xi cuya frecuencia absoluta 7 3 45
acumulada supera por primera vez a N/2. 8 5 50
❑Si dicho valor corresponde con la frecuencia absoluta 9 4 54
acumulada Fi de un dato xi, la mediana Me será el 10 2 56
punto medio o semisuma de este dato xi y el 𝑁 = 56
siguiente dato xi+1, esto es, Me = (xi + xi+1)/2. 𝑁 = 56/2 = 28
Medidas de tendencia central
• La Media (𝑥)ҧ correspondería a lo que en física
se conoce como el centro de masas, y no es No. Hallazgo (𝒙𝒊 ) 𝒇𝒊 𝑭𝒊 𝒙𝒊 𝒇𝒊
m´as que: 1 5 5 5
2 6 11 12
3 7 18 21
4 8 26 32
Para su cálculo resulta muy útil la disposición de 5 12 38 60
los datos en una tabla que incluiría una columna 6 4 42 24
para los distintos datos xi, otra para las 7 3 45 21
frecuencias absolutas fi y una nueva columna 8 5 50 40
9 4 54 36
para xi*fi, que serían los productos de los valores
10 2 56 20
correspondientes a la misma fila de las columnas
Σ𝑥𝑖 𝑓𝑖 = 271
anteriores. La media corresponde a la suma de 271
los valores de esta ´ ultima columna xi*fi, partido 𝑥ҧ = = 4,84 𝑥ҧ = 4,84
56
de N.
Medidas de tendencia central
• Moda, Mediana y Media (ഥ
𝒙) para dados agrupados por intervalos

𝑓𝑖 − 𝑓𝑖−1 Intervalos 𝒙𝒊 𝒇𝒊 𝑭𝒊
𝑀𝑜 = 𝐿𝑖 + 𝐴 1 [0 - 4) 2 3 3
(𝑓𝑖 −𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) 2 [4 - 8) 6 5 8
3 [8 - 12) 10 6 14 Mo
6−5 4 [12 - 16) 14 4 18
𝑀𝑜 = 8 + 4
(6 − 5) + (6 − 4) 5 [16 - 20) 18 3 21
N = 21
𝑀𝑜 = 9,33
Medidas de tendencia central
• Moda, Mediana y Media (ഥ
𝒙) para dados agrupados por intervalos
𝑁 Intervalos 𝑥𝑖 𝑓𝑖 𝐹𝑖
− 𝐹𝑖−1
𝑀𝑒 = 𝐿𝑖 + 𝐴 2 1 [0 - 4) 2 3 3
𝑓𝑖 2 [4 - 8) 6 5 8
𝑁 3 [8 - 12) 10 6 14 Me
Posición = = 21/2 = 10,5
2 4 [12 - 16) 14 4 18
10,5 − 8 5 [16 - 20) 18 3 21
𝑀𝑒 = 8 + 4 𝑁 = 21
6
𝑀𝑒 = 9,67
Medidas de tendencia central
• Moda, Mediana y Media (ഥ
𝒙) para dados agrupados por intervalos

Intervalos 𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑥𝑖 𝑓𝑖
σ 𝑥𝑖 𝑓𝑖 1 [0 - 4) 2 3 3 6
𝑥ҧ = 2 [4 - 8) 6 5 8 30
𝑁 3 [8 - 12) 10 6 14 60
206 4 [12 - 16) 14 4 18 56
𝑥ҧ =
21 5 [16 - 20) 18 3 21 54
𝑥ҧ = 9,81 N = 21 σ 𝑥𝑖 𝑓𝑖 = 206
𝑥ҧ = 9,81
Medidas de dispersión
• Existen variables estadísticas con comportamientos distintos que
tienen la misma media, y lo mismo ocurre con las otras medidas de
centralización.
• Las medidas de dispersión son valores que miden cómo de separados
que están los datos. Así, introduciremos algunos parámetros de
dispersión, que nos informen sobre como de “dispersos” se
encuentran los datos con respecto de la media: La desviación media,
varianza, desviación típica y el coeficiente de variación.
Medidas de dispersión
• La desviación media: La desviación media es un promedio de las distancias de los
datos a la media, y por lo tanto, en cierto sentido, mide lo separados en promedio
que están los datos con respecto de la media.

• La varianza: También mide como de separados están con respecto de la media.


Medidas de dispersión
• La desviación típica: Es la raíz cuadrada de la varianza

• El coeficiente de variación: Es una medida adimensional que se obtiene de la


razón entre el la desviación tipifica y la media.
Medidas de dispersión
Para calcular todos estos parámetros, completamos con nuevas columnas la
tabla estadística.
Medidas de dispersión
𝑥𝑖 𝑓𝑖 𝐹𝑖 𝑥𝑖 𝑓𝑖 𝑥𝑖 − 𝑥ҧ 𝑥𝑖 − 𝑥ҧ 𝑓𝑖 𝑥𝑖2 𝑓𝑖
σ 𝑥𝑖 − 𝑥ҧ 𝑓𝑖 1 5 5 5 3,84 19,20 5
𝐷𝑀(𝑋) =
𝑁 2 6 11 12 2,84 17,04 24
111,64 3 7 18 21 1,84 12,88 63
𝐷𝑀 𝑋 = = 1,99
56 4 8 26 32 0,84 6,71 128
5 12 38 60 0,16 1,93 300
2 6 4 42 24 1,16 4,64 144
2
σ 𝑥𝑖 𝑓𝑖 7 3 45 21 2,16 6,48 147
𝑉𝐴𝑅 𝑋 = 𝜎 = − 𝑥ҧ 2
𝑁 8 5 50 40 3,16 15,80 320
1655 9 4 54 36 4,16 16,64 324
2
𝑉𝐴𝑅 𝑋 = 𝜎 = − 4,842
56 10 2 56 20 5,16 10,32 200
𝑉𝐴𝑅 𝑋 = 𝜎 2 = 6,13 𝑁 = 56 σ 𝑥𝑖 𝑓𝑖 = 271 σ 𝑥𝑖 − 𝑥ҧ 25,32 σ 𝑥𝑖 − 𝑥ҧ 𝑓𝑖 = 111,64 Σ𝑥𝑖2 *𝑓𝑖 = 1655
𝑥ҧ = 4,84 1,99 6,13
𝐷𝑀(𝑋) 𝑉𝐴𝑅 𝑋 = 𝜎 2
𝜎= 𝑉𝐴𝑅 𝑋 = 𝜎2 𝜎 2,48
𝐶𝑉 = = = 0,51 0,51 2,48
𝜎= 6,13 = 2,48 𝑥ҧ 4,84 𝐶𝑉 𝜎
Bibliografía
• Mª Purificación Galindo Villardón y Mª Purificación Vicente Galindo
(2013), “Estadística para investigadores”, Departamento de
Estadística, Universidad de Salamanca.
• David R. Anderson, Dennis J. Sweeney y Thomas A. Williams (2008),
“Estadística para administración y economía”, 10a. Edición, Cengage
Learning Editores, S.A., México, D.F.
• Instituto de Tecnologías Educativas. Ministerio de Educación
• Instituto Nacional de Estadística. Portugal
• Instituto Nacional de Estadística. España

También podría gustarte