Está en la página 1de 50

ESTADÍSTICA I

Segundo Término Académico(Presencial)


2022 - 2023
Profesora: Eva María Mera Intriago Octubre 2022
2

1. Tratamiento estadístico de datos

• 1.1. Definición de población, muestra, parámetro y


estimador
• 1.2. Datos e información.
• 1.3. Tabulación de datos y gráficos descriptivos.
• 1.5. Cuantiles de una muestra y medidas de forma.
• 1.4. Medidas de tendencia central ,posición y dispersión.
• 1.4.1 Media y varianza de funciones de X
• 1.6. Estadística descriptiva multivariada
3

Objetivos de Aprendizaje

• Determinar medidas apropiadas para el resumen de los


datos.
• Interpretar la información obtenida a partir de los datos.

3
4

Medidas de Dispersión
Las medidas de dispersión nos indican cuanto varían los datos
5

Medidas de Dispersión

T T
x = (1 2 3); x = (-5 2 9);
1 2

T T
x = (-10 -3 0 2 3 20); x = (0 2 4)
3 4

Texto guía: Libro Probabilidad y Estadística, Fundamentos y Aplicaciones


Autor: Gaudencio Zurita Herrera
x=2
vg d(X i , x) = | X i − x |
Cuán lejos o dispersos se encuentran los datos respecto a la media

d(1, 2) = 1 d(2, 2) = 0 d(3, 2) = 1

d(–5, 2) = 7 d(2, 2) = 0 d(9, 2) = 7

d(0, 2) = 2
d(–10, 2) = 12
d(20, 2) = 18
d(3, 2) = 1
d(–3, 2) = 5 d(2, 2) = 0

d(0, 2) = 2 d(2, 2) = 0 d(4, 2) = 2 ¿Qué pasaría si todas las observaciones


toman el mismo valor?
Texto guía: Figura 1.12: Libro Probabilidad y Estadística, Fundamentos y Aplicaciones
Las sumas de las
Autor: Gaudencio Zurita Herrera distancias sería 0
7

Medidas de Dispersión para muestras

Rango Rango
Varianza Desviación Estándar
Muestral Intercuartil

• Cuanto varia una • Diferencia entre el • • Diferencia


Diferencia entre
entre el
Denominada valor máximo y el el Tercer
Tercer Cuartil
Cuartil y el y
variable X con respecto también Desviación
a su media . valor mínimo de la el Primero.
Primero.
Típica de una Muestra. • • Determina
Determina la la
• Nunca es negativa. Muestra, se la denota •
• No tiene las mismas Mide la dispersión longitud
longitud dede unun
por s y se la define con la longitud intervalo
intervalo que que
unidades que los igual a la raíz
valores observados, (mínima) de un incluye
incluye el el
cincuenta
cuadrada positiva de intervalo en el que se cincuenta
por por de
ciento central
está en unidades la Varianza.
cuadráticas. ubica el 100% de las ciento centralen
observaciones dela
Tiene las mismas observaciones que observaciones en
Muestra.
unidades que los constituyen la • la Muestra.
Mide la dispersión
valores observados. Muestra. respecto a la
• Variación general de mediana
Varianza muestral las observaciones
n
 (Xi − x )2
2
n
− x)

(X i
2
s = i =1
R = X(n) – X(1) RI = Q3 – Q1
n −1 s = +
i=1 n −1
x
8

Centrar una muestra

• Dada una Muestra XT = (X1 X2 … Xn), determinar la Media de (Xi – x ), para


i = 1, 2, … , n.
Desarrollo.
Para el caso dado,
Y
TT
YYTTY
===[[=[(X
(X
(X x-x))x) )(X
111---1x
[ (X (X(X
(X xx))x) …
222---2 x
- …
)……(X
(X
(X(X xx))x)]])]==]=(Y
nnn--n- x
- (Y
(Y
= (Y 1Y
1Y
111 Y 22Y 2…
2…
2… YYnnY
…Y Y
)n))nn))
nn
Por lo que,
yy== 
i=1
YYi i
nn
11 nn
==  
nn i=1
i=1
(Xi i-- x)
(X x)
i=1
= 1 [ (X1 - x ) + (X2 - x ) + … + (Xn - x ) ]
n
= 1 [ (X1 + X2 + … + Xn) - n x ]
n
X1 + X 2 + ... + X n
x=
n
Texto guía: Ejemplo 1.9: Libro
Probabilidad y Estadística,
 X1 + X 2 + ... + X n = nx
Fundamentos y Aplicaciones
Autor: Gaudencio Zurita Herrera = 1 [nx -nx]=0
n
9

…viene Centrar una muestra

Por lo tanto, si Yi = Xi - x , i = 1, 2, … , n, entonces: y = 0


Como ilustración numérica,
Si xT = (1 2 3 4), entonces x = 2.5
Si Yi = (Xi - x ), esto es yT = (-1.5 -0.5 0.5 1.5)
Por lo que y =0
n

Siempre es cierto que, i


=1
(X i − x)=(X1 − x) + (X 2 − x) + ... + (X n − x) = 0

Razón principal por la que la varianza n


Usa Sumas Cuadráticas del tipo  (X i − x) 2

i=1
10

Varianza

• Medida de la dispersión de una variable X con respecto a


su media aritmética.
• Promedio de las distancias al cuadrado que hay entre
cada observación y la media aritmética
• Varianza Poblacional N
(X -  ) 2
σ =
2 i

i =1 N
• Varianza Muestral
n 2
(X i - x)
s =
2

i =1 n -1
11

Otra expresión para calcular la varianza


muestral:

n n
[n  X - ( X i ) ]/n
2
i
2

2 i =1 i =1
s =
x
n -1

11
12

Propiedades de la Varianza

• Nunca es negativa
• Será cero si todas las observaciones toman el mismo
valor, esto es, son iguales y darían lugar a una constante.
• No tiene las mismas unidades que los valores observados,
es decir, que está en unidades cuadráticas, por ejemplo: si
el dato estuviera en cm3 la varianza seria cm3 al cuadrado
• Es por esto último que es común utilizar la raíz cuadrada
positiva de la Varianza, medida a la que se la llama
Desviación Estándar y está en las mismas unidades que la
variable aleatoria.
13

Desviación Estándar

• Desviación Estándar Poblacional:

N
(X i -  ) 2
σ =+ 
i =1 N

• Desviación Estándar Muestral o Desviación Típica de la


muestra:
n 2
(X i - x)
s =+ 
i =1 n -1
13
14

Ejercicio

• Supongamos que tenemos la variable X: Edad de un grupo


de personas, de una muestra de 10 personas.

xT = ( 20 25 21 26 21 26 22 26 22 18)

• Determinar media aritmética, varianza, desviación


estándar y rango muestral.
n

X
i=1
i

Ejercicio x=
n

xT = ( 20 25 21 26 21 26 22 26 22 18)

• Muestra de tamaño n=10


• Determinar Media Aritmética y varianza
• Media aritmética
10
(X1 + X 2 + ... +X10 ) Xi
x=
10
= 
i=1 10

(20 + 25 + 21 + 26 + 21 + 26 + 22 + 26 + 22 +18)
x=
10

x = 22.70
n 2
(X - x)
s2 =  i
…viene Ejercicio i =1 n -1

xT = ( 20 25 21 26 21 26 22 26 22 18)

• Varianza muestral
• n = 10
x = 22.70 10
(X − 22.70) 2
s 2x =  i
i =1 10 -1
[(20 − 22.70) 2
+ (25 − 22.70) 2
+ (21 − 22.70) 2
+ ... + (18 − 22.70) 2
]
s =
2

9
s 2 = 8.23
• Desviación estándar muestral

s = s = 8.23 = 2.87
2
17

…viene Ejercicio

• Otra expresión para calcular la varianza muestral:


(n = 10) 10 10
[10 X i2 - ( X i ) 2 ]/10
2 i =1 i =1
s =
x
10 -1
2
2 [10(5227) - (227) ]/10
sx =
9
2 [(52270) - (51529)]/10
sx =
9
2
s = 8.23
x
18

Rango Muestral

• Es también Medida de Dispersión el Rango Muestral, R, que


se define como:

• R = X(n) - X(1)

• Este valor mide la Dispersión de la Muestra en términos de


sus valores extremos, es decir con la longitud (mínima) de
un intervalo en el que se ubica el 100% de las observaciones
que constituyen la Muestra.
• El rango es cero cuando las observaciones toman todas el
mismo valor
19

Del ejercicio anterior, obtener el rango

• R = X(n) - X(1)
• n=10
• Ordenamos los datos:

18 20 21 21 22 22 25 26 26 26

• X(1)=18
• X(10)=26
• R=26-18=8 Muestra 2
5 18 20 21 21 22 22 25 26 26 26
• R=26-5=21
20

Otras medidas de dispersión

• Error Estándar de la media aritmética


• Coeficiente de Variación
21

Error Estándar de la media aritmética de la


muestra

sx
sx =
n
22

X: Edad de un grupo de personas

• A partir de los datos anteriores:


s 2x = 8.23
• Error Estándar de la Media Aritmética (n = 10)
sx
sX =
n
2.87
sX =
10

s X = 0.91

22
23

Coeficiente de Variación

(X1 + X 2 + ... +
• Mide la “dispersión relativa” de X con respecto a x =
n
• Dada una muestra(X1 + XXT=(X 1, +X
+ ... X2, n…
) , Xnn) Xque tiene media
2
aritmética x =y Desviación Estándar s, =se 
define a:
i
ns i =1 n
V = (100%)
x

• Sirve como medida comparativa entre dos características en


las mismas unidades ó si X y Y tienen escalas o unidades
distintas.

• Ejemplo: X estatura y Y ingreso en dólares de una persona.


24

Ejemplo

• En un examen final de Estadística, la calificación


promedio de un grupo de 150 estudiantes fue de 78 con
una desviación estándar de 8.0. Sin embargo, en Álgebra,
la calificación final promedio del grupo fue 73 y la
desviación estándar fue 7.6. ¿En qué materia hubo mayor
dispersión relativa?
25

…viene Ejemplo

• Para la materia Estadística, el coeficiente de variación es:


8
V = 100 = 10.26%
78

• Para la materia Álgebra, el coeficiente de variación es:

7.6
V= 100 = 10.41%
73
• Por lo que, la materia Álgebra es la que presenta mayor
dispersión relativa.
26

Ejercicio: Coeficiente de Variación

Calificaciones obtenidas para un curso

s = 3.83 ; x = 80.07 s 3.83


V= = = 0.05 = 5%
x 80.07

Inasistencia obtenida para un curso


s = 7.62 ; x = 10.00 s 7.62
V= = = 0.762 = 7.62%
x 10.00
27

Comparación de dos muestras


X: Edad de un grupo de personas en las dos
muestras

• Edad de un grupo de personas


• Muestra 1: n=10
• Muestra 2: n=50

x1T = ( 20 25 21 26 21 26 22 26 22 18)
x2T =
( 20 25 21 26 21 26 22 26 22 22
23 31 6 9 14 18 23 27 32 36
7 10 14 18 24 28 32 38 7 10
15 19 24 28 35 38 8 11 16 19
24 30 35 38 12 17 20 25 31 18)
28

Comparación de dos muestras


X: Edad de un grupo de personas en las dos
muestras
Muestra 1,n=10 Muestra 2,n=50
¿Soporte de la variable aleatoria? ¿Soporte de la variable aleatoria?
X toma valores de 18 a 26 X toma valores de 6 a 38
x = 22.70 4 4
x = 22.02 4
3,5 3,5 3,5
2 3
s = 77.53
3
s = 8.23 3 3 2
3
3 3 3 3 3

2,5 2,5 2,5

s = 2.87 2 2 2 2 2 2 222 2 2 2 222


2 2
s=8.81 2
1,5 1,5 1,5
1 1 1 2 1 1 1 11 11 111 1 1 1
sX = 0.91 1 1 s X =1.25 1

0,5 0,5 0,5

R=8 0 0 R=32 0
18 18
20 20
21 21
22 22
25 25
26 26 6 8 10 12 15 17 19 21 23 25 27 30 32 36
V=12.64% V=40%
• Intervalo en que se encuentra la • Intervalo en que se encuentra la
edad promediosí edad promedio

• 22.70±2.87(no): (19.83;25.57) • 22.02±8.81(no): (13.21;30.83; )
• 22.70±0.91(sí):(21.79;23.61) • 22.02±1.25(sí): (21.45;23.27)
Formas de Distribución: Apuntamiento

Coeficiente de Kurtosis o
apuntamiento >3

Coeficiente de Kurtosis =3

Coeficiente de Kurtosis <3


Cálculo de una tasa

• Es una medida que permite comparabilidad, pues


considera el tamaño poblacional.
• Es el cociente entre
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑑𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟é𝑠
• 𝑇𝑎𝑠𝑎 = 𝑥10000
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑡𝑜𝑡𝑎𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑎 𝑎 𝑚𝑖𝑡𝑎𝑑 𝑑𝑒 𝑎ñ𝑜

• Una mejor medida comparativa es aquella que considera


otras variables relacionadas con la población, por ejemplo
la estructura de edad o el nivel educativo de la población.

30
Ejercicio

En una ciudad que tiene alrededor de 200000 habitantes se registra


durante un año la cantidad de “robos agravados” que cada mes se
denuncian en la fiscalía, obteniéndose los siguientes datos:

Mes , t Enero Febrero Marzo Abril Mayo Junio Julio Agosto Sept. Octubre Nov. Dic.
Número de
robos
agravados,
17 23 19 38 16 26 24 21 19 24 23 27
X(t)

Determine la Tasa Anual de Criminalidad para este delito, por cada


cien mil habitantes si se sabe que a junio del año en que se efectúa la
medición, la población de la ciudad es de 198543 personas.

Texto Guía 31
Tasa Anual de Criminalidad

• Es el cociente entre
numero
´ total de delitos ocurridos en un año
Tasa = (100000)
total de la poblacion en ´ese año

32
Problema 1.15

• Tasa Anual de Criminalidad (para Robo Agravado)


17 + 23+19 +38+16 + 26 + 24 + 21+19 + 24 + 23+ 27
Tasa = (100000)
198543
277
= (100000)
198543
= 139.52
• Es decir, hay 139 Robos Agravados anuales por cada cien mil
habitantes.
• Tarea, investigue sobre las tasas estandarizadas(explique como
se calculan) e indique si ofrece ventajas sobre las tasas brutas.

33
34

Gráfico de Pástel: Cantidad de permiso


de armas en Quito
Figura 1.14
Gráfico de Pastel

4.38% 3.36% 0.98% 3.12% 3.97% 0.75% 0.15%


0.17% 1 0.25% 1
0.21%
0.36% 2 0.29% 2

38.87% 3 3
48.26%
4 4

5 5
6 6
7 7
51.67% 43.20%
8 8
Año 2006 Año 2007

3.63% 1.96% 1.23% 2.92% 0.97%


0.42% 1 3.17% 0.96% 1
0.17%
2 0.23% 2
0.06%
0.15%
3 3

56.13% 4 53.16% 4

5 5

6 6
36.41% 38.43%
7 7

8 8
Año 2008 Año 2009
35
Figura 1.25
Gráfico “de tallarín” para características investigadas utilizando proposiciones a un
grupo de estudiantes al ingresar a la ESPOL, Mayo de 2009

1.00

0.90

0.80

0.70

0.60

0.50

0.40

0.30

0.20

0.10

0.00
Completo Parcial Indiferencia Parcial Completo
Desacuerdo Desacuerdo Acuerdo Acuerdo

Fuente y elaboración: Centro de Estudios e Investigaciones Estadísticas ICM–ESPOL


36

Figura 1.26
Gráfico de Media y Error Estándar de un conjunto de proposiciones investigadas a un
grupo de estudiantes al ingresar a la ESPOL, Mayo de 2009

0.30 1. Confianza en conocimientos de álgebra para


resolver problemas de planteamiento de ecuaciones.

2. Confianza en conocimientos de trigonometría para


0.25 resolver problemas sobre triángulos rectángulos.
4
8 3. Confianza en conocimientos de trigonometría para
10 resolver problemas sobre triángulos oblicuángulos.
0.20 9
4. He utilizado frecuentemente una calculadora
Error Estándar

6
básica.
7 5. He utilizado frecuentemente una calculadora
0.15 científica.
5
3 6. He utilizado frecuentemente una calculadora
gráfica.
2
0.10 7. He utilizado frecuentemente una calculadora
1 programable.

8. He utilizado una calculadora para determinar el


0.05 promedio de un conjunto de datos.

9. He utilizado una calculadora para determinar la


desviación estándar de un conjunto de datos.
0.00 10. Tengo confianza en mis habilidades para graficar e
2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00 10.00 interpretar un histograma de frecuencias.

Media

Fuente y elaboración: Centro de Estudios e Investigaciones Estadísticas ICM–ESPOL


37

Media y Varianza de
Funciones de X y
Estandarización de una
muestra
Media y Varianza de Funciones de X

• Dada una muestra XT=(X1, X2, … , Xn) en la que se


investiga una característica X, que tiene media aritmética x
y Desviación Estándar sx, se define:

• Yi=aXi+b

• Donde a y b son constantes reales i=1,2,…,n

• Pretendemos encontrar la media aritmética y la varianza


de Y = aX + b
39

Media aritmética Y, Y = aX + b conociendo


Yi=aXi+b

• Por definición:
n
Y=
Yi
i=1 n

 aX i + b 
n
=  
i=1  n 

 n Xi  nβ
= α  +
 i =1 n  n

= αx + β
40

Varianza de Y, Y = aX + b conociendo
Yi=aXi+b

n
(Yi - y) 2
s =
2
Y = αx + β
• Por definición y
i =1 n -1
n
=  [(αX i + β) − (α x + β)] (n − 1)
2 2
Var( Y ) = sy
i =1
n
=  [(αX i − α x) + β - β)] (n − 1)
2

i =1

n

2
 (X i − x) 2
(n − 1)
i =1

= a 2 Var ( X )
= a 2 s 2x
41

Estandarizar una muestra

• “Estandarizar” una Muestra significa definir una nueva


variable Y, en términos de los valores observados X, de tal
manera que:
Xi - x
Yi =
sx
42

Dada una Muestra XT = (X1 X2 … Xn) “estandarizarla” y


calcular su Media y su Varianza.

• Desarrollo.
• Por definición: Yi = X i - x
sx
• La Muestra estandarizada es por tanto,
  X1 − x   X − x   Xn − x  
Y =   s   s  ...  s  
T 2

 x   x   x 

• La media de Y
• Siendo sx la Desviación Típica de X. n
• El numerador de la muestra estandarizada es:  (X i − x) = 0
i=1
• Por lo tanto la media de Y, Y = 0
Ejemplo 1.12 tomado de:
Texto guía Probabilidad y Estadística,
Fundamentos y Aplicaciones, G. Zurita
43

…viene Dada una Muestra XT = (X1 X2 … Xn)


“estandarizarla” y calcular su Media y su Varianza.

n
( )
2

=
X -x Yi -Y
• La varianza de Y Yi = i s 2y n -1
sx
i =1

 ( Xi - x )  ( Xi - x )  
2
( i )− 0
2
1 n
 

n
1 X - x
SY =
2

( ) i =1
 −  media de  =  
s x   ( n -1) i =1  s x
( )
n -1  sx  

( Xi - x ) s 2x
2
n
1
( n -1) 
=
s 2x
= 2 =1
i =1 sx
• Consecuentemente, toda Muestra Estandarizada, tiene
Media cero y Varianza uno.
44

Ejercicio: estandarizar muestra: xT = (1 2 3 4)


Ejemplo 1.12
x=2.5 s x = 1.291

• Si a la Muestra xT = (1 2 3 4) la “estandarizamos” se
transforma en
 1 − 2.5 2 − 2.5 3 − 2.5 4 − 2.5 
yT =  
 1.291 1.291 1.291 1.291 

• Puesto que,
n
( xi -x )
2

s 2x = 
i =1
n -1

 1 − 2.5 2 + 2 − 2.5 2 + 3 − 2.5 2 + 4 − 2.5 2 


( ) ( ) ( ) ( ) 
sx = 3 = 1.291.

45

Ejemplo 1.12
Tomado del texto guía Probabilidad y Estadística,
Fundamentos y Aplicaciones, G. Zurita

• Realizando los cálculos correspondientes, resulta que:


y T = ( −1.1619 −0.3873 0.3873 1.1619)

• De donde Y = 0 y,
1
( )
4 2
 Yi - Y
2
s =
y
3 i=1

=
(− 1.1619 − 0 ) + (− 0.3873 − 0 ) + (0.3873 − 0 ) + (1.1619 − 0 )
2 2 2 2

3
1.3500 + 0.1500 + 0.1500 + 1.3500 3
= = =1
3 3
• Luego Xi - x
Yi =  y = 0  sy = 1
sx
46

Ejercicio Propuesto

• Un estudiante toma cinco materias cada semestre durante


cuatro semestres y su promedio, sobre diez, es 7.5 en el
primer semestre; 8.4 en el segundo; 9.3 en el tercero; y,
8.9 en el cuarto. ¿Cuál es el promedio del estudiante en
los cuatro semestres?
Otro estudiante tiene los mismos promedios semestrales
que el descrito previamente pero este último tomó seis
materias en el primer semestre, tres en el segundo, siete
en el tercero y cinco en el cuarto. ¿Tienen el mismo
promedio general los dos estudiantes?

46
47

Ejercicio Propuesto

• Media Estudiante 1
Nº Promedio
Materia x Semestre por
Mw = w1x1 + w 2 x 2 + w 3 x3 + w 4 x 4
semestre Semestre
5 5 5 5
5 Primero 7.5 Mw = (7.5) + (8.4) + (9.3) + (8.9)
20 20 20 20
5 Segundo 8.4
5 Tercero 9.3 Mw = 1.875 + 2.100 + 2.325 + 2.225
5 Cuarto 8.9
20 Total
Mw = 8.525

47
48

Ejercicio Propuesto

• Media Estudiante 2
Promedio Mw = w1x1 + w 2 x 2 + w 3 x3 + w 4 x 4
por
Materia Semestre
Semestre 6 3 7 5
Mw = (7.5) + (8.4) + (9.3) + (8.9)
21 21 21 21
6 Primero 7.5
Mw = 2.145 + 1.201 + 3.097 + 2.118
3 Segundo 8.4
7 Tercero 9.3 Mw = 8.561
5 Cuarto 8.9
21 Total
48
49

Resultados de aprendizaje:

• Usted:
• Define, comprende y cuantifica medidas de tendencia
central, posición y dispersión, además de saber como
proceder cuando se encuentra con datos atípicos en una
muestra.
50

Referencia Bibliográfica

• ZURITA, G. (2010), “Probabilidad y Estadística,


Fundamentos y Aplicaciones”, Segunda Edición, Ediciones
de la Facultad de Ciencias Naturales y Matemáticas
ESPOL, Guayaquil, Ecuador.

También podría gustarte