Está en la página 1de 55

ESTADÍSTICA APLICADA

CM1-3. Estadística Descriptiva

1 de 115
ESTADÍSTICA APLICADA

Tabla de distribución para variables cuantitativas continuas.

Recordáis que particularidades tiene este tipo de variables?

Para este tipo de variables los valores no se pueden aislar


(como en los casos anteriores); entre dos valores siempre
cabrían otro.

Como se procede en estos casos?.

Definiremos 5 términos a tener en cuenta en estos casos

24 de 115
ESTADÍSTICA APLICADA

Definiremos 5 términos o pasos a tener en cuenta en estos casos:

1. Recorrido de la variable. !! = #"#$ − #"%& ,


#"#$ , valor máximo del intervalo
#"%& , valor mínimo del intervalo
MAX() y MIN() en Excel

2. Numero de clases (o numero de intervalos)


No hay un criterio único para esto. Puede obtenerse como
√&, o 1 + 3,322 ∗ -./'( & (12/-3 42 5671/28)

3. Ancho de la clase (o amplitud de la clase, o ancho del intervalo)


)!
3% = ,
*+"!,- .! /0#1!1

4. Marca de la clase (valor promedio del intervalo)

5. Sentido común.
25 de 115
ESTADÍSTICA APLICADA

1. Recorrido de la variable. ,' = 55 − 25 = 30,


2. Numero de clases (o numero de intervalos)
N = 10, 10 = 3,16; o 1 + 3,322 ∗ 678() 10 = 4,3, tomaremos 4 clases
3. Ancho de la clase (o amplitud de la clase, o ancho del intervalo)
*)
= 7,5 = 8
+
Los intervalos finalmente serían

• 24 (un valor menos que el mínimo ) + 8 = entre 24 y 32


• Entre 32 y “32 + 8” = entre 32 y 40
• Entre 40 y “40 + 8” = entre 40 y 48
• Entre 48 y “48 + 8” = entre 48 y 56 26 de 115
ESTADÍSTICA APLICADA

Tabla: Distribución de frecuencias para la variable, edad

Marca
Intervalos
de la
ni fi Ni Fi
clase,
ci
min max
24-32 24 32 28 1 0,1 1 0,1
32-40 32 40 36 3 0,3 4 0,4 Recomendaciones:
40-48 40 48 44 4 0,4 8 0,8 • No muchas clases
48-56 48 56 52 2 0,2 10 1,00 • Se prefiere igual ancho de la clase
10 1,00 • Aplicar el sentido común

Ver ejemplos p.7, Tema 1, UEMC


27 de 115
ESTADÍSTICA APLICADA

Intervalos Marca
de la
ni fi Ni Fi
clase,
ci
min max
24-32 24 32 28 1 0,1 1 0,1
32-40 32 40 36 3 0,3 4 0,4
40-48 40 48 44 4 0,4 8 0,8
48-56 48 56 52 2 0,2 10 1,00
10 1,00

“contar.si.conjunto”

29 de 115
ESTADÍSTICA APLICADA

Intervalos Marca
de la
ni fi Ni Fi
clase,
ci
min max
24-32 24 32 28 1 0,1 1 0,1
32-40 32 40 36 3 0,3 4 0,4
40-48 40 48 44 4 0,4 8 0,8
48-56 48 56 52 2 0,2 10 1,00
10 1,00

“frecuencia”

í=FRECUENCIA(DATOS;GRUPO)ý

F2 + (CTRL+MAYUS+ENTRAR) 31 de 115
ESTADÍSTICA APLICADA
Contenidos
1. Variable estadística unidimensional
1. Tipos de variables
2. Tabla de frecuencias
3. Parámetros numéricos. Variable estadística
4. Medidas de centralización
5. Medidas de dispersión
6. Medidas de posición
7. Momentos. Asimetría y apuntamiento
8. Representación gráfica

Para datos cuantitativos

32 de 115
ESTADÍSTICA APLICADA

Con variables cuantitativas, tendremos que calcular unos valores a los que llamamos medidas descriptivas o,
simplemente, estadísticos.
Son valores que describen con una medida una muestra.

Según tipo de información que nos proporcionen podremos estudiaremos 3 grupos:


• Estadísticos de posición, una idea general de donde se coloca la distribución de frecuencias sobre la recta de
los números reales;
• Estadísticos de dispersión o variabilidad, miden la separación existente entre los datos;
• Medidas de forma, la representación grafica de la distribución y,

Contenidos
1. Variable estadística unidimensional
1. Tipos de variables
2. Tabla de frecuencias
3. Parámetros numéricos. Variable estadística
4. Medidas de centralización
5. Medidas de dispersión
6. Medidas de posición
7. Momentos. Asimetría y apuntamiento
8. Representación gráfica
33 de 115
ESTADÍSTICA APLICADA

34 de 115
ESTADÍSTICA APLICADA

Estadísticos de Posición Central


p.8, Tema 1, UEMC
valores que actúan como resumen numérico del
conjunto de datos. El resto de los datos se agrupan
alrededor de ellos.
Media El más conocido y usado

de datos sin agrupar


variables cuantitativas agrupadas
∑&%2' ;%
;̅ = ∑&%2' ;% ∗ =%
& ;̅ =
&
Intervalos xi ni Ni

[24,32] 28 107 107

(32,40] 36 303 410

(40,48] 44 436 846 ;̅ = 41,1 3ñ.8


(48,56] 52 154 1000

1000
35 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición Central

Media, Ventajas

• Es el centro de gravedad de la distribución.


• Es muy utilizada en cálculos posteriores.
• Su cálculo es muy sencillo.
• Utiliza todos los valores.

Media, Desventajas

• los extremos tienen excesivo peso en la


media. (usar otros estadísticos como la
media recortada o la mediana)

36 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición Central
Media vs Mediana

Mayor inconveniente 37 de 115


ESTADÍSTICA APLICADA
Estadísticos de Posición Central
Mediana

en una variable cuantitativa se define como el valor que


divide en dos partes iguales la distribución cuando estos
están ordenados.
Pasos para encontrar la Me de un conjunto de datos:
1. Ordena los datos de menor a mayor.
2. Si el conjunto de datos contiene un numero impar de datos, el
Xi ni Ni
que está exactamente en el centro es la mediana.
3. Si el conjunto de datos contiene un numero par de datos, coge los 2 2 2

dos datos del centro y calcula la media para obtener la mediana 3 1 3

4 2 5
10 datos 11 datos
5 1 6

6 1 7
2, 2, 3, 4, 4, 5, 6, 8, 8, 8 2, 2, 3, 4, 4, 5, 6, 8, 8, 8, 9 7 0 7

8 3 10

4+5 10
= 4,5
2
38 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición Central
Mediana
&
Ej, para valores agrupados Se busca &% ≥
3
=
− &%4'
A! = B%4' + 2 C%
=%

5(
Intervalo ni Ni &% ≥ = 15 &% = 22 Inmediato superior
3
0-5 12 12

5-7 10 22 :&,( (extremo inferior del intervalo seleccionado) = 5


7-9 6 28
sustituyendo
9-10 2 30
15 − 12
30
A! = 5 + ×2
10
A! = 5,6

39 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición Central
Media vs Mediana??

40 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición Central
Moda
valor que más se repite, el que tiene una mayor
(ni) (pero cuidado!!!)

Tabla 4: Número de hijos de los


habitantes mayores de 30 años
Tabla: País de origen de los visitantes de un de un municipio
museo en enero de 2015 xi ni
xi ni 0 45
Alemania 167 1 36
Suiza 346 Mayor ni 2 89
Italia 198 3 56
Francia 453 Más de 3 43
Japón 107
cuantitativa discreta
cualitativa nominal

41 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición Central
Moda

cuantitativa continua con intervalos de igual amplitud


=%6'
A- = B%4' + ∗C
=%4' + =%6' %

cuantitativa continua con intervalos de desigual amplitud

4%6' =%
A- = B%4' + ∗ C% con 4% =
4%4' + 4%6' C%

Li-1 , Valor inferior del intervalo de mayor ni Vemos ejemplo


=%6' V =%4' , son las frecuencias absolutas antes y después del
intervalo seleccionado de mayor ni
4%6' V 4%4' , son las densidades antes y después del intervalo
seleccionado de mayor di
ci es el intervalo de clase, amplitud del intervalo, etc
42 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición Central
Li-1 , Valor inferior del intervalo de mayor ni
Ejemplo de Moda con amplitud constante <!"# = <!$#, son las frecuencias absolutas antes y después del
intervalo seleccionado de mayor ni
>!"# = >!$#, son las densidades antes y después del intervalo
seleccionado de mayor di
Tabla de frecuencias (o parte de ella) ci es el intervalo de clase, amplitud del intervalo, etc

Ci ni
0-2 3
2-4 6 Datos
4-6 8 anterior Li-1 6
6-8 9 ni+1 4
8-10 4 posterior ni-1 8
ci 2

=%6' 4
A- = B%4' + ∗C =6+ ×2 = 6,667
=%4' + =%6' % 8+4

43 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición

45 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición no Central
Percentil
dato concreto que representa el porcentaje de
valores de la muestra que están por debajo de
ese dato concreto.

Ej, si te dicen que tu puntuación está en el


percentil 90, significa que el 90% de las
personas que hicieron la misma prueba
obtuvieron una puntuación inferior a la tuya (y
el 10% de los que se examinaron obtuvieron
una puntuación mas alta que tu).

Los percentiles son los 99 puntos que dividen la


distribución en 100 partes iguales.

p.11, Tema 1, UEMC


46 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición no Central

Cálculo del Percentil para variables cuantitativas (pocos datos)

1. Ordena el conjunto de datos de menor a mayor.


2. Multiplica la cantidad de datos (n) por k (valor del percentil a obtener).
3. Si el resultado del paso 2 es un numero entero ve al paso 5. Si el resultado no es entero,
redondéalo al siguiente numero entero y ve al paso 4
4. Cuenta los números del conjunto de menor a mayor hasta llegar al valor indicado hasta
llegar al valor indicado en el paso 3. ese sería el valor del percentil k.
5. Cuenta los números del conjunto de menor a mayor hasta llegar al valor entero obtenido
en paso 3. El percentil k será la media entre ese valor y el valor inmediato superior.

47 de 115
ESTADÍSTICA APLICADA

25 notas de examen ordenadas de menor a mayor

43
54 Encontrar percentil 90 en estos datos (k = 0,9)
56
61
62 1. Ordena el conjunto de datos de menor a mayor.
66
68 2. ; ×= = 0,9 ×25 = 22,5 = 23
69 3. El resultado no es entero, redondéalo al siguiente numero entero
69 y ve al paso 4
70
71
4. Cuenta los números del conjunto de menor a mayor (23 en este
72 caso) hasta llegar al valor indicado sería 98. ese sería el valor del
77 percentil k.
78
79
85 R./ El 10% de los exámenes obtuvieron una calificación superior a 98 ptos
87
88
89
93
95
96
98
99
99

48 de 115
ESTADÍSTICA APLICADA

25 notas de examen ordenadas de menor a mayor

43
54 Encontrar percentil 20 en estos datos (k = 0,2)
56
61
62 1. Ordena el conjunto de datos de menor a mayor.
66
68 2. ; ×= = 0,2 ×25 = 5
69 3. El resultado es entero, por lo que paso 5.
69
70 5. Cuenta los números del conjunto de menor a mayor hasta llegar
71 al valor entero obtenido en paso 3. El percentil k será la media
72 ?@A??
77 entre ese valor y el valor inmediato superior, o sea = 64
@
78
79
85
87 R./ El 80% de los exámenes obtuvieron una calificación superior a 64 ptos
88
89
93
95
96
98
99
99

49 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición no Central
Cálculo del Percentil para variables
cuantitativas continuas
*∗8
1. Calcular , ubicando el primer intervalo
'((
de Ni que supere este valor Tabla 1
"∗$
4*'(%
%&&
2. Calculo de Pk. Y8 = B% + ∗ C% Intervalos ni Ni
&'
[24,32] 107 107
Ejemplo
(32,40] 303 410
Cálculo del P44 de la Tabla. Edad de personas
(40,48] 436 846

*∗8 '((( ∗99


1. = = 440. Intervalo que supere 440 (48,56] 154 1000
'(( '((
"∗$ 1000
%&&
4*'(%
Y8 = B% + ∗ C%
&'
1000 ∗ 44
− 410
Y99 = 40 + 100 ∗ 8 = 40,55 3ñ.8
436
50 de 115
ESTADÍSTICA APLICADA
Estadísticos de Posición no Central
Cuartiles
Son los tres valores que dividen a la distribución
en cuatro intervalos iguales, en cada una de ellos
se ubica la cuarta parte de los datos.
Los llamaremos Q1, Q2 y Q3 y corresponden a los
puntos situados en el 25, el 50 y el 75% de los
valores que hemos observado.
Por debajo de Q1, estarán el 25% de los valores y
por encima el 75% restante.
Para calcular los cuartiles utilizamos el mismo
procedimiento que para los percentiles, en
concreto

Q1= P25, Q2=P50 y Q3=P75.

51 de 115
ESTADÍSTICA APLICADA
Estadísticos de Dispersión o Variabilidad

medir el grado de separación de los datos sin


tener en cuenta las causas que originan dicha
variabilidad

Amplitud total, Recorrido o Rango

distancia entre el mayor y el menor valor que


toma la variable en la muestra

!! = ;"#$ − ;"%&

p. 9..10, Tema 1, UEMC


52 de 115
ESTADÍSTICA APLICADA
Estadísticos de Dispersión o Variabilidad

Rango intercuartilico
distancia existente entre los valores que toman
el primer y el tercer cuartil
!% = [5 − ['

Aporta información parecida a !! pero


eliminando los valores extremos

53 de 115
ESTADÍSTICA APLICADA
Estadísticos de Dispersión o Variabilidad

Varianza, Desviación Estándar, y Coeficiente


de Variación

Varianza, S2

Medida de dispersión que mide la separación de los datos


respecto a la media aritmética.
Valora la representatividad de la media con respecto a la
distribución.

∑ &
(; − ;)
̅ 3 Cuanto mas dispersas estén las observaciones respecto a
%2' %
53 = la media, mayor será su valor
&

Desviación Típica, S
5= 53 Ud, de S las mismas que x. Este estadístico se usa
para el análisis
54 de 115
ESTADÍSTICA APLICADA
Estadísticos de Dispersión o Variabilidad

Varianza de conjunto de datos sin agrupar

Varianza, S2
∑ &
(; − ;)
̅ 3 Datos, p.23: Notas de alumno
%2' %
53 =
&
Notas de Media aritmética 6,48
5 3 = 1,5256 un alumno s2 1,5256
6 s 1,2352
Desviación Típica, S 6,5
7,2
5= 1,5256 = 1,2352 4,5
8,2

55 de 115
ESTADÍSTICA APLICADA
Estadísticos de Dispersión o Variabilidad Tabla: Años de personas
Intervalos xi ni
Varianza para distribuciones de variables
[24,32] 28 107
cuantitativas
(32,40] 36 303
∑&%2'((;% − ;)̅ 3 ∗ =% ) (40,48] 44 436
53 =
& (48,56] 52 154

1000

L Min L Max ni xi xi*ni (xi-xprom)^2 *ni


24,00 32,00 107,00 28,00 2996 18351,05811
32,00 40,00 303,00 36,00 10908 7868,672448
40,00 48,00 436,00 44,00 19184 3676,882176
48,00 56,00 154,00 52,00 8008 18310,17126
1.000,00 x prom 41,096 48206,784

Varianza, 5 3 = 48,21 3ñ.8 3

Desviación Típica, S
5 = 6,94 3ñ.8
56 de 115
ESTADÍSTICA APLICADA
Estadísticos de Dispersión o Variabilidad

Coeficiente de Variación de Pearson


5
]^ =

Estadístico de dispersión muy utilizado.


Dispersión de las observaciones respecto a la media
Se suele expresar en %.
A menor CV mejor es la media
La cota inferior de CV es cero. El único caso problemático se presenta cuando
;̅ = 0 lo que haría que CV tendiera a ∞

57 de 115
ESTADÍSTICA APLICADA
Estadísticos de Forma p. 11..12, Tema 1, UEMC

ponen de relieve la forma que toma una


distribución cuando es representada en una
gráfica.
Asimetría o sesgo

Coeficiente de asimetría de Fisher

1 &
_ 5 ∑%2'(;% − ;)̅ 5 =%
/' = 5 = = 5
5 1 &
∑%2'(;% − ;)̅ 3 =%
=

Si /' = 0, -3 4`861`a7C`ó= 28 8`_é61`C3


Si /' > 0, -3 4`861`a7C`ó= 28 38`_é61`C3 e.8`6`f3 (. 3 -3 4212Cℎ3)
Si /' < 0, -3 4`861`a7C`ó= 28 38`_é61`C3 =2/36`f3 (. 3 -3 `ij7`2143)
58 de 115
ESTADÍSTICA APLICADA
Estadísticos de Forma

Coeficiente de asimetría de Fisher


Ejemplo
Variable, x
1 & min max ni
_5 ∑%2'(;% − ;)̅ 5 =%
/' = 5 = =
0 5 12
5 5 5 7 10
1 & 7 9 6
∑%2'(;% − ;)̅ 3 =%
= 9 10 2
30

Variable, x
min max ni xprom ni * Xprom xi - Xprom (xi - Xprom)^2 * ni (xi - Xprom)^3 * ni
0 5 12 2,5 30 -2,733 89,65333333 -245,0524444
5 7 10 6 60 0,767 5,877777778 4,506296296
7 9 6 8 48 2,767 45,92666667 127,0637778
9 10 2 9,5 19 4,267 36,40888889 155,3445926
30 157 177,8666667 41,86222222
Xprom 5,233

numerador 1,395407407 Asimetría


denominador 14,43643525 positiva, a
/' > 0 la derecha
g1 0,10
59 de 115
ESTADÍSTICA APLICADA
Estadísticos de Forma

Coeficiente de asimetría de Pearson

;̅ − A!
k: =
5

Ap = 0 simetría
Ap > 0 asimetría positiva o a la derecha
Ap < 0 asimetría negativa o a la izquierda

60 de 115
ESTADÍSTICA APLICADA
Estadísticos de Forma

Coeficiente de apuntamiento o curtosis

En una distribución de campana de Gauss, se refiere a la mayor o menor concentración


de valores alrededor de la zona central de la distribución.

Comparando el grado de
apuntamiento con respecto a la
normal, tenemos:
- Si es igual de alta que la tipo, será
Mesocúrtica
- Si es más estilizada Leptocúrtica
- Si es mas baja, Platicúrtica

61 de 115
ESTADÍSTICA APLICADA
Estadísticos de Forma

Curtosis

La medida normal para evaluar la curtosis es el coeficiente de Fisher.

1 &
_9 ∑%2' ;% − ;̅ 9 =%
/3 = 9 − 3 = = 3−3
5 1 &
∑%2' ;% − ;̅ 3 =%
=

Si /3 = 0, -3 4`861`a7C`ó= 28 _28.Cú16`C3
Si /3 > 0, -3 4`861`a7C`ó= 28 -2e6.Cú16`C3
Si /3 < 0, -3 4`861`a7C`ó= 28 e-36`Cú16`C3

62 de 115
ESTADÍSTICA APLICADA
Estadísticos de Forma

Curtosis
Ejemplo
Variable, x
1 &
_ 9 ∑%2' ;% − ;̅ 9 =% min max ni
/3 = 9 − 3 = = 3 −3 0 5 12
5 1 & 5 7 10
∑ ; − ;̅ 3 =% 7 9 6
= %2' % 9 10 2
30

Variable, x
min max ni xprom ni * Xprom xi - Xprom (xi - Xprom)^2 * ni (xi - Xprom)^4 * ni
0 5 12 2,5 30 -2,733 89,65333333 669,8100148
5 7 10 6 60 0,767 5,877777778 3,45482716
7 9 6 8 48 2,767 45,92666667 351,5431185
9 10 2 9,5 19 4,267 36,40888889 662,8035951
30 157 177,8666667 1687,611556
Xprom 5,233
160

numerador 56,25371852 140

denominador 1235,643662
120

100

80

Frecuencia
60

g2 -2,95 platicúrtica 40
45 48 51 54 57 60 63 66 69 72 75 78 81 84

Platicúrtica

63 de 115
ESTADÍSTICA APLICADA
Tarea: investigación sobre miles de kilómetros recorridos por
un modelo concreto de neumáticos hasta que se ha producido
un pinchazo o un reventón.

64 de 115
ESTADÍSTICA APLICADA
Contenidos
1. Variable estadística unidimensional
1. Tipos de variables
2. Tabla de frecuencias Los datos que aparecen en una distribución
3. Parámetros numéricos. Variable estadística de frecuencias vistos hasta ahora, pueden
4. Medidas de centralización
ser representados también por medio de
5. Medidas de dispersión
gráficos.
6. Medidas de posición
7. Momentos. Asimetría y apuntamiento
8. Representación gráfica La visión de conjunto será, en este caso,
más rápida e intuitiva.
Es recomendable además.

65 de 115
ESTADÍSTICA APLICADA

En función del tipo de variable podemos elegir entre unos diagramas u otros.

66 de 115
ESTADÍSTICA APLICADA
Diagramas para variables cualitativas.

• Diagrama de sectores, pastel o quesitos.

Consiste en dividir un círculo en tantos sectores como modalidades haya.


Cada una de ellas se representa por un sector circular cuya área es proporcional a su
frecuencia.
Es conveniente señalar con etiquetas el grafico.

Diagrama sectores de la variable sexo de la tabla


Representarlo según los datos
de la tabla.
H
40%

M
60%

p. 13..14, Tema 1, UEMC

67 de 115
ESTADÍSTICA APLICADA
Diagramas para variables cualitativas.

• Diagrama de rectángulos o de barras.


Sobre unos ejes cartesianos se indican en el eje de abscisas las distintas modalidades
y en el de ordenadas se anotan los valores que pueden tomar las frecuencias
absolutas o relativas.
Sobre la indicación de cada modalidad se levanta un rectángulo o una barra cuya
altura coincide con el valor de su frecuencia.
Se utiliza para las distribuciones con todos los tipos de variables “excepto para las
cuantitativas continuas”.
Diagrama rectángulos o barras de la variable Diagrama de rectángulos por nivel de estudio
sexo de la tabla segun tabla
7 4
6
6
3
5 3
4
4 2 2
ni

2
ni

3
2 1 1 1
1
1
0
0
H M
Prim. ESO. FP o GM Bach. Dip. Lic.
Sexo 68 de 115
Nivel de Estudios
ESTADÍSTICA APLICADA
Diagramas para variables cualitativas.

• Perfil poligonal.

Es un gráfico lineal en el que indicamos, en el eje de abscisas, las modalidades y en el


de ordenadas los valores que pueden tomar las frecuencias absolutas.
Señalamos con un punto cada par y unimos esos puntos.

Perfil poligonal por nivel de estudio


segun tabla 4
4

3 3

2 2 2
ni

1 1 1 1

0
Prim. ESO. FP o GM Bach. Dip. Lic.
Nivel de estudios

69 de 115
ESTADÍSTICA APLICADA
Diagramas para variables cuantitativas.

1. Cuantitativos discretos
• Diagrama de rectángulos o de barras.

Se realiza de la misma forma que para variables cualitativas con la salvedad de que
en el eje de abscisas aparecen ahora, en vez de las modalidades, los distintos valores
que puede tomar la variable.

Diagrama de rectángulos de Nº hijos y frecuencia


de la tabla
5

4
separados
3
ni

0
0 1 2 3
Nº de hijos
70 de 115
ESTADÍSTICA APLICADA
Diagramas para variables cuantitativas.

• Polígono de frecuencias.

Cuando unimos los extremos superiores de las barras de un diagrama de barras, o los
puntos medios de un diagrama de rectángulos.

Diagrama de rectángulos de Nº hijos y poligono En Excel son realmente dos series


de frecuencia de la tabla 5
iguales una representada como
5
4 barras y la otra como línea.
4 4
3
3 3
ni

2
2 2
1
1 1

0
0 1 2 3
Nº de hijos

71 de 115
ESTADÍSTICA APLICADA
Diagramas para variables cuantitativas.

2. Cuantitativos continuos
• Histograma.
Se utiliza para distribuciones de variable cuantitativa continua donde los datos se
agrupan en intervalos.
Se construye de forma que el área correspondiente al rectángulo que se dibuja
sobre el intervalo sea proporcional a su frecuencia.

Histograma de la variable edad de la Tabla


5
Los intervalos tienen la
4
misma amplitud.
3
ni

0
24-32 32-40 40-48 48-56
Edad
72 de 115
ESTADÍSTICA APLICADA
Diagramas para variables cuantitativas.

• Polígono de frecuencias.
Igual que en el caso de las variables discretas, pero con las barras unidas.

Histograma y poligono de frecuencia de la variable edad


de la Tabla 6
5

0
24-32 32-40 40-48 48-56

Series1 Series2
73 de 115
ESTADÍSTICA APLICADA

Diagrama de Cajas

Grafico unidimensional de datos cuantitativos basados en el resumen


pentanumético, que incluye el valor mínimo, el percentil 25 (Q1), la mediana (Q2), el
percentil 75 (Q3), y el valor máximo.

74 de 115
ESTADÍSTICA APLICADA

Diagrama de Cajas (ANÁLISIS)

75 de 115
ESTADÍSTICA APLICADA
PRUEBA DEL SUPUESTO DE NORMALIDAD (visto anteriormente)
La normalidad no significa necesariamente que los datos estén normalmente distribuidos, sino
si el conjunto de datos puede estar bien modelado por una distribución normal. La normalidad
puede explorarse por distintas vías (pruebas de normalidad):
1) Numéricamente.
2) Visualmente / gráficamente.
3) Estadísticamente. (prueba de Shapiro-Wilk, Kolmogorov-Smirnov, etc)

Vías:
1) Regla empírica, Meda-Mediana, Coef. de asimetría, Curtosis
Normal Q-Q Test
2) Visualmente / gráficamente.

3) Estadísticamente. (prueba de Shapiro-Wilk, Kolmogorov-Smirnov, Si los datos se distribuyen normalmente, todos


etc los puntos estarán cerca de la línea diagonal de
referencia. Si los puntos “caen” por encima o por
prueba t paramétrica debajo de la línea, hay un problema con la
curtosis. Si los puntos serpentean alrededor de la
76 de 63
línea, entonces el problema es la asimetría
76 de 115
ESTADÍSTICA APLICADA

77 de 115
ESTADÍSTICA APLICADA
El test de Shapiro-Wilks plantea la hipótesis nula que una muestra proviene de una
distribución normal. Elegimos un nivel de significancia, por ejemplo 0,05, y
tenemos una hipótesis alternativa que sostiene que la distribución no es normal.

Hipótesis nula (Ho). La muestra procede de una población que sigue


una distribución normal. Aceptaremos esta hipótesis tan deseada
cuando el p-valor (significatividad) es mayor a 0,050.

Hipótesis alternativa (H1 o Ha). La muestra no procede de una


población que se distribuye según un modelo de probabilidad
normal. Por el contrario, aceptaremos esta hipótesis cuando el p-
valor de la prueba sea menor que 0,050.

78 de 115
ESTADÍSTICA APLICADA

79 de 115
ESTADÍSTICA APLICADA

2. Variable estadística bidimensional. Recta de Regresión


1. Conceptos
2. Tabla bidimensional de frecuencias. (Tabla de
contingencia)
3. Distribuciones marginales
4. Representaciones gráficas. Diagrama de
dispersión
5. Covarianza, coeficiente de correlación
6. Recta de regresión
7. Coeficiente de determinación.

80 de 115

También podría gustarte