Está en la página 1de 27

ESTADÍSTICA

2020

Clase
Estadística Descriptiva
1. Definición:
1.1 Estadística
Es una herramienta matemática que permite recopilar,
organizar, presentar y analizar datos obtenidos de un
estudio estadístico.

1.2 Población
Colección o conjunto de personas, objetos o eventos que
poseen características comunes, cuyas propiedades serán
analizadas.

1.3 Muestra
Subconjunto de la población que comparte una determinada
característica.
1.4 Variable estadística
Información a recopilar, en ella se describen las
características de la muestra. Existen dos tipos: Cualitativas
y Cuantitativas
• Cualitativas:
Las variables cualitativas tienen características no numéricas.
Por ejemplo: color de pelo, sexo, estado civil, etc.

• Cuantitativas:
Las variables cuantitativas tienen características numéricas.
Por ejemplo: edad, estatura, número de hijos, etc.
Cuantitativa discreta: Son aquellas a las que se les puede
asociar un número entero y es imposible fraccionar.
Por ejemplo: número de hijos, número de automóviles.

Cuantitativa continua: Son aquellas a las que se les puede


asociar cualquier número real. Por ejemplo: peso, estatura,
tiempo.
Estadística descriptiva
Tipos de Frecuencias

Distribución de frecuencias.
La distribución de frecuencias es una representación (muchas veces
en forma de tabla y/o gráficos) de la muestra estadística, donde se
asigna a cada dato su frecuencia correspondiente.

• Frecuencia absoluta fi • Frecuencia acumulada Fi


Número de veces que aparece Suma de las frecuencias absolutas
un determinado dato en un de todos los datos inferiores o
estudio estadístico. iguales al valor considerado.
Generalmente se le
denomina solo “frecuencia”.
• Frecuencia relativa fr
Cociente entre la frecuencia absoluta de
La suma de las frecuencias
absolutas es igual al
un determinado valor y el número
número total de datos. total de datos. También puede
expresarse como porcentaje.
1.3 Ejemplo

El gráfico de la figura muestra los porcentajes de obesidad de las mujeres con respecto al
total de mujeres y de los hombres con respecto al total de hombres, en algunos países de
América. ¿Cuál de las siguientes afirmaciones NO se deduce de este gráfico?

A) En Uruguay el mayor porcentaje de


obesidad está en las mujeres.
B) En Costa Rica el menor porcentaje de
obesidad está en los hombres.
C) Las mujeres de los países de América
son más obesas que los hombres.
D) Chile supera a Brasil en porcentaje de
obesidad tanto en hombres como en
mujeres.
E) Colombia tiene la mayor diferencia
porcentual de obesidad entre hombres y
mujeres.
ALTERNATIVA
CORRECTA

Fuente : DEMRE - U. DE CHILE, Modelo Proceso de admisión 2013.


C
2. Distribución de frecuencias
Ordenamiento de datos cuando en un estudio estadístico se
recopila una gran cantidad de ellos .

Existen dos tipos de distribución de frecuencias, con datos no


agrupados y con datos agrupados.

2.1 Distribución en datos NO agrupados


Se utiliza preferentemente cuando las opciones de la variable
son pocas .
Ejemplo:
Al lanzar un dado 10 veces, se obtuvo la siguiente información:

1–6–4–3–1–2–6–5–1–3

Frecuencia: Corresponde a la cantidad de veces


que se encuentra un dato en una muestra.
1–6–4–3–1–2–6–5–1–3

Al construir la tabla de frecuencias, se obtiene:

Número Frecuencia
1 3
2 1
3 2
4 1
5 1 Al sumar la columna frecuencia, se
6 2 obtiene el total de datos (n).

Total datos: 10.


2.2 Distribución en datos agrupados
Se utiliza cuando la variable ofrece una gran gama de
posibilidades, si es cuantitativa continua, debemos agrupar los
datos en intervalos semiabiertos, excepto el último, que es
cerrado.
Al agrupar los datos en intervalos, se debe calcular la
“marca de clase”.
Corresponde al promedio entre
los extremos del intervalo.
Ejemplo:

Peso (Kg.) Frecuencia Marca de


clase
[55,59[ 2 57
[59,63[ 5 61
[63,67[ 3 65
[67,71[ 7 69
[71,75] 4 73
3. Gráficos estadísticos
3.1 Gráfico de Barras
Se utiliza para variables cualitativas o variables discretas.

Cada variable se representa mediante una barra


proporcional a su frecuencia.
Ejemplo:
3.2 Histogramas
Se utilizan para datos agrupados.
Cada intervalo se representa mediante una barra proporcional
a su frecuencia.

Ejemplo:

La distribución del número de horas que duraron


encendidas 200 ampolletas está dada en el gráfico
siguiente. (Ensayo PSU, 2004)
3.3 Polígono de frecuencia
Es la línea que une los puntos correspondientes a las
frecuencias de cada dato.

Ejemplo:
3.4 Gráficos circulares
Estos gráficos permiten visualizar la distribución de los datos
en forma de porcentaje sobre un total.

Ejemplo:
4. Medidas de tendencia central
4.1 Moda
Es el dato que más se repite, es decir, el que tiene
mayor frecuencia.

Ejemplo:

Frecuencia
De acuerdo a la gráfica,
6 la Moda es 15.
5
4

1 Temperatura (º C)
8 10 12 15 18 21 25
4.2 Mediana
Corresponde al “valor central” de todos los datos
ordenados de una muestra.

La muestra debe ser ordenada en forma ascendente o


descendente.

Cuando la muestra tiene un número par de datos, la


mediana corresponderá al promedio de los dos datos
centrales.
Ejemplo 1:
Los puntajes de 8 alumnos en el 5° simulacro son los
siguientes:

650 – 556 – 722 – 478 – 570 – 660 – 814 – 670

Solución:
Al ordenarlos de menor a mayor:

478 – 556 –570 – 650 – 660 – 670 – 722 – 814

Mediana = 650 + 660 = 655


2
Ejemplo 2:
Determinar la mediana a partir del siguiente gráfico:

N° Alumnos

6
5
5
4
3 3
2 2 2 2
1 1
1 Nota
1 2 3 4 5 6 7

Solución:
Para determinar el total de datos, debemos sumar las
frecuencias. En este caso, el total de datos es 16.
Luego, los valores centrales están ubicados en las
posiciones 8ª y 9ª. Ambos corresponden a nota 4.
Por lo tanto, la mediana es 4.
4.3 Media aritmética o promedio (x)
Es el valor que se obtiene al dividir la suma de todos
los valores por el total de datos.

Ejemplo 1:
Los puntajes de 8 alumnos en el 5° simulacro son los
siguientes:
650 – 556 – 722 – 478 – 570 – 660 – 814 – 670

Luego, la media aritmética (promedio) es:

x = 650 + 556 + 722 + 478 + 570 + 660 + 814 + 670

8
x = 640

Por lo tanto, el promedio de los puntajes es 640.


Ejemplo 2:
Determinar la media aritmética a partir del siguiente
gráfico:
N° Alumnos

6
5
4
3
2
1 Nota
1 2 3 4 5 6 7

Solución:
Para determinar el total de datos, debemos sumar las
frecuencias. En este caso, el total de datos es 16.

Para determinar la media aritmética, debemos multiplicar


cada dato por su frecuencia, sumar estas cantidades y el
resultado dividirlo por el total de datos (n).
Por lo tanto:
N° Alumnos

6
5
5
4
3 3
2 2 2 2
1 1
1 Nota
1 2 3 4 5 6 7

x = 1·1 + 2·2 + 3·1 + 4·5 + 5·3 + 6·2 + 7·2


16

x = 1 + 4 + 3 + 20 + 15 + 12 + 14
16

x = 69
16

x ≈ 4,3
EN RESUMEN

Moda
La moda de una serie de datos es aquel valor que No se puede
se presenta con mayor frecuencia, es decir, es el asumir que el
valor que más se repite. La moda puede no existir dato que más
(si todos los datos tienen igual frecuencia) y si se repite se
existe, puede no ser única (muestra multimodal). encuentra en
el intervalo
En datos agrupados, el intervalo modal (o clase modal.
modal) corresponde al intervalo que tiene la mayor
frecuencia.
Promedio (o media aritmética)
Es la suma de todos los datos, dividida por el
número de datos. En datos tabulados, corresponde a El promedio
la suma del producto entre cada dato y su solo se puede
frecuencia, dividida por la suma de todas las obtener en
frecuencias. variables
cuantitativas.
En datos agrupados, el promedio se determina a
partir de la frecuencia y la marca de clase de cada
intervalo, pero solo es una aproximación al exacto.
Mediana

Corresponde al valor central de todos los datos de una muestra,


ordenados en forma ascendente o descendente (cuando el número total
de datos es impar). Cuando la muestra presenta una cantidad par de
datos, la mediana corresponderá al promedio de los dos datos centrales.

En datos agrupados, el intervalo donde se encuentra la mediana se


determina ubicando la posición central, de acuerdo a las frecuencias
acumuladas.

No necesariamente la
La mediana mediana corresponde a un
solo se puede dato de la muestra.
obtener en
variables En datos tabulados, es
cuantitativas. recomendable registrar la
frecuencia acumulada.
Medidas de tendencia central

Ejemplo
A un grupo de mujeres se le preguntó acerca de su masa corporal. Sus respuestas se resumen
en el histograma de la figura adjunta, donde los intervalos son de la forma [a, b[ y el último de la
forma [c, d]. Según la información del gráfico es verdadero que,

A) 7 mujeres fueron entrevistadas en total.


B) exactamente, un 50% de las mujeres
entrevistadas tiene una masa corporal que
está en el intervalo [64, 70[.
C) la mediana de las masas corporales está en
el intervalo [66, 68[.
D) las modas de las masas corporales son 65
kg y 71 kg.
E) solo una de las mujeres entrevistadas tiene
una masa corporal menor que 64 kg.

ALTERNATIVA
CORRECTA

Fuente : DEMRE - U. DE CHILE, Modelo Proceso de admisión 2017. C


5. Medidas de posición

5.1 Cuantiles

Se denomina cuantil al valor bajo el cual se encuentra un cierto


porcentaje de los datos, cuando estos están ordenados de menor a mayor
de acuerdo a la columna de frecuencia porcentual acumulada.

Percentiles. Deciles.
Dividen la muestra en 100 partes Dividen a la muestra en 10 partes
iguales, con 1% de los datos cada iguales, con 10% de los datos
una. Por ejemplo, El percentil 35 cada una. Por ejemplo, el decil 6
corresponde al valor bajo el cual corresponde al valor bajo el cual
se encuentra el 35% de los datos. se encuentra el 60% de los datos.

Quintiles. Cuartiles.
Dividen la muestra en 5 partes Dividen a la muestra en 4 partes
iguales, con 20% de los datos iguales, con 25% de los datos
cada una. Por ejemplo, El quintil 2 cada una. Por ejemplo, el cuartil 3
corresponde al valor bajo el cual corresponde al valor bajo el cual
se encuentra el 40% de los datos. se encuentra el 75% de los datos.
5. Medidas de posición

5.2 Diagrama de cajas

Un diagrama de cajas (o caja y bigotes) corresponde a una representación


gráfica de la distribución de datos de una muestra.
Rango intercuartil

Dato menor Dato mayor

Cuartil 1 Cuartil 3
Cuartil 2

Rango intercuartil = cuartil 3 – cuartil 1

El cuartil 2 corresponde a la mediana de la


muestra, al igual que el percentil 50 y el decil 5.
5. Medidas de posición

5.3 Ejemplo
¿Cuál de los siguientes gráficos representa a un conjunto de datos con
media iguala 5 y primer cuartil igual a 2?

ALTERNATIVA
CORRECTA

Fuente : DEMRE - U. DE CHILE, Modelo Proceso de admisión 2017.


6. Medidas de dispersión
Indican el alejamiento de los datos con respecto a la
media aritmética.

6.1 Desviación típica o estándar

A mayor desviación estándar, mayor dispersión en


los datos y a menor desviación estándar, mayor
homogeneidad en ellos.
Pregunta oficial PSU

Si la tabulación del peso de 50 niños recién nacidos se muestra en


la tabla adjunta, ¿cuál(es) de las siguientes afirmaciones es (son)
verdadera(s)?

I) La mediana se encuentra en el segundo intervalo.


II) Un 20% de los recién nacidos pesó 4 o más kilogramos.
III) El intervalo modal es 3,0 –3,4.

A) Solo III
B) Solo I y II
C) Solo I y III
D) Solo II y III
E) I, II y III
ALTERNATIVA
CORRECTA

E
Fuente : DEMRE - U. DE CHILE, Proceso de admisión 2016

También podría gustarte