Explora Libros electrónicos
Categorías
Explora Audiolibros
Categorías
Explora Revistas
Categorías
Explora Documentos
Categorías
ESTADISTICA
* Bibliografía básica
* ¿Qué es la Estadística?
* Población y muestra
Prof. Dora Apessetche 5
* Una muestra debidamente representativa debe
representar las mismas características de la
población
Ejemplos
Para saber la audiencia Para conocer el numero de viviendas de la
de un programa de tv se ciudad de Córdoba que tienen cloacas se
interroga al azar 1000 eligen 500 viviendas de Alta Córdoba
abonados telefónicos
* Muestra debidamente
representativa
* Parámetro y Estadístico
Prof. Dora Apessetche 7
* Variable: es una característica o atributo de interés sobre el
cual los elementos de una población difieren. Se denota con
X, Y, Z, etc.
* Categorías: son los valores que asume la variable.
* Dato: Es cada realización de las categorías de la variable
Ejemplos
Nominales Discretas
Ordinales Continuas
Variable Categoría
Cantidad de alumnos con 0,1,2,3…..
celular por curso
Genero de alumnos Femenino, masculino
Equipo de futbol favorito Boca, River, Belgrano…
Desempeño en el trabajo Malo, bueno, regular, muy
bueno, excelente.
Numero de accidentes 0,1,2,3
automovilísticos anuales en
un ciudad
Peso de los alumnos [35kg, 100kg]
* Actividad 1
Prof. Dora Apessetche 11
Población (N)
Muestra (n)
Posición Dispersión
* Parámetros y estadísticos
Población Muestra
μ x
N
xi
x
n
1
1 i
N x
n
* Medidas de Posición
Me=
Si n es
impar
Mediana
(Me)
Si n es
par
Me=
* Mediana
Prof. Dora Apessetche 14
* Se define como moda de una distribución al
valor que mas veces se repite.
* Moda
* Actividad 2
* Respuesta
* El engañoso promedio
* El engañoso promedio
* El engañoso promedio
Q1 Q2 Q3
Q1 Q2 Q3
𝑄
1= 𝑋
( 14 𝑁+ 14 )
𝑄
2=𝑋
( 12 𝑁 + 12 )
𝑄
3= 𝑋
( 34 𝑁+ 34 ) * Cuartiles
Prof. Dora Apessetche 21
* Cuando el numero de observaciones es mayor
que 15 se genera una serie de frecuencia.
* Frecuencia absoluta: Es el numero de veces
que la variable toma determinado valor. Se
representa como fi
* Distribución de frecuencia
Prof. Dora Apessetche 22
* Existen tres maneras de resumir la información en tablas y
gráficos, se le llaman tipos de distribución.
Distribuciones
* Distribución de datos
* Actividad 3
1 150
2 150
3 151
4 151
5 152
6 154
7 154
8 155
9 155
10 156
11 156
12 156
13 156
14 157
15 158
16 159
17 159
18 170
19 170
20 171
21 171
22 171
150 2 300
151 2 302
152 1 152
3482
154 2 308
x 158,27
155 2 310 22
156 4 624
157 1 157
Mediana
158 1 158
22 3482
xi fi fr % fa fd xi * f i
22 0.991 3482
Amplitud: 20-1=19
Media:
Mediana: Me= 10
* Medidas de dispersión
Prof. Dora Apessetche 29
Desvío medio: DM
Es el promedio de los valores absolutos de las desviaciones con
respecto a la media
* Desvío medio
Prof. Dora Apessetche 30
Varianza: es el promedio de los desvíos cuadráticos medios
∑ ( 𝑥 − 𝜇 )2 . 𝑓 𝑖
𝑉𝑎𝑟 ( 𝑥 ) = → 𝑃𝑜𝑏𝑙𝑎𝑐𝑖 ó 𝑛
𝑁
∑ ( 𝑥 − ´𝑥 )2 . 𝑓 𝑖
𝑉𝑎𝑟 ( 𝑥 ) = → 𝑀𝑢𝑒𝑠𝑡𝑟𝑎
𝑛 −1
Clase frecuencia Media
xi fi
150 2 158,27 -8,27 8,27 16,54 68,3929 136,7858
151 2 158,27 -7,27 7,27 14,54 52,8529 105,7058
152 1 -6,27 6,27 6,27 39,3129 39,3129
154 2 -4,27 4,27 8,54 18,2329 36,4658
155 2 -3,27 3,27 6,54 10,6929 21,3858
156 4 -2,27 2,27 9,08 5,1529 20,6116
157 1 -1,27 1,27 1,27 1,6129 1,6129
158 1 -0,27 0,27 0,7 0,0729 0,0729
159 2 0,73 0,73 1,46 0,5329 1.0658
170 2 11,73 11,73 23,46 137,5929 275,1858
171 3 12,73 12,73 38,19 162,0529 486,1587
22 126,59 1124,7831
𝜎 =√ 𝑉𝑎𝑟 ( 𝑥 ) =
𝑁 √
( 𝑥 − ´𝑥 ) . 𝑓 𝑖
Muestra
→ 𝑃𝑜𝑏𝑙𝑎𝑐𝑖 ó 𝑛
Expresado en porcentaje
Ejemplo
Se tiene dos distribuciones, una correspondiente a los pesos variables de los
paquetes de arroz de 500 grs de dos cerealeras:
La cerealera A con media de 495 grs y un desvío estándar de 10 grs
La cerealera B con media de 502 grs y un desvío estándar de 6 grs
* Coeficiente de Variación
Prof. Dora Apessetche 33
Cuando el numero de observaciones es mayor a 20 es conveniente
tomar intervalos de clases, teniendo en cuenta:
1) El numero de intervalos z debe cumplir 5< z <16, se adopta el
valor aproximado de
2) La amplitud del intervalo es
3) Todo intervalo está definido por su limite inferior y su limite
superior:
* Intervalo de clases
Prof. Dora Apessetche 34
Con los datos de la actividad 3 armar una distribución de
intervalos de clase
Nº Talla
1 150
2 150
3 151
4 151
5 152
6 154
7 154
8 155
9 155
10 156
11 156
12 156
13 156
14 157
15 158
16 159
* Actividad 4
17 159
18 170
19 170
20 171
21 171
22 171
𝑙𝑠+ 𝐿𝑖
𝑥 𝑚=
2
* Actividad 5
Mediana:
Moda:
* Medidas de posición
Prof. Dora Apessetche 38
Intervalo Frecuencia Marca de Frecuencia Frecuencia Frecuencia
clase relativa acumulada desacumulada
[100-110) 12 110 0,12 12 100-12=88
[110-120) 34 115 0,34 46 fa 100-46=54
fm
[120-130) 38 125 0,38 84 16
[130-140)
[130-140) 13
13 135
135 0,13
0,13 97
97 3
3
[140-150)
[140-150) 3
3 145
145 0,03
0,03 100
100 0
0
𝑥 =121,7
´
Mo=
Mo=121,38
Me=
Me=121,05
* Medidas de dispersión
Prof. Dora Apessetche 40
Histograma para los coeficientes intelectuales
38
34
13
12
* Gráficos estadísticos
Prof. Dora Apessetche 41
Histograma para los coeficientes intelectuales
38
34
13
12
* Gráficos estadísticos
Prof. Dora Apessetche 42
Polígono de Frecuencias para los coeficientes intelectuales
38
34
13
12
* Gráficos estadísticos
Prof. Dora Apessetche 43
Gráfico de torta
[140-150)
[100-110)
3%
12%
[130-140)
13%
[110-120)
[120-130) 34%
38%
* Gráficos estadísticos
Prof. Dora Apessetche 44
Serie Simple: 20; 26; 29; 29; 30; 32; 50 (Salarios de la Empresa B)
20 1
26 1
29 2
30 1
32 1
50 1
* Gráficos estadísticos
Prof. Dora Apessetche 45
Salarios Frec. Frec. Frec. Frec. Relativa Frec.
Relativa Acumulada Acumulada Desacumulada
20 1 0,14 1 0,14 7-1 = 6
26 1 0,14 2 0,28 7- 2 = 5
29 2 0,29 4 0,56 7-4 = 3
30 1 0,14 5 0,70 7-5 = 2
32 1 0,14 6 0,84 7-6 = 1
50 1 0,14 7 0,98 7-7 = 0
(14% ) (14% )
(14% )
(14% )
(14% )
(29% )
20 26 29 30 32 50
5
F re c u e n c ia s
0
19 23 28 32 37 41 46 50
Salarios
* Gráficos estadísticos
Prof. Dora Apessetche 48
frecuencias
frecuencias
Media=Moda=Mediana
* Distribución simétrica
Prof. Dora Apessetche 50
68%
Media
un un
desvío desvío
* Regla empírica
Prof. Dora Apessetche 51
95%
Media
dos desvíos dos desvíos
* Regla empírica
Prof. Dora Apessetche 52
100%
Media
tres desvíos tres desvíos
* Regla empírica
Prof. Dora Apessetche 53
Una empresa desea contratar personal para sus diversas áreas. Se
presentaron 125 aspirantes resultando una edad promedio de 36 años
con una desviación de 2 años. Si las edades se distribuyen en forma
simétrica y la empresa decidió, que solo empleará a personas menores
a 38 años, responde:
a) ¿Qué porcentaje de aspirantes estarán en condiciones de conseguir el
trabajo?
b) ¿Qué cantidad de personas fueron excluidas?
34 36 38 Años
34 36 38 Años
e.a
proceso
tiene es resultado
“Arrojar un dado”
e.a
resultados
Ejemplo:
e.a: arrojar un dado.
= { 1; 2; 3; 4; 5; 6 } y # =6
e.a A
= { 1; 2; 3; 4; 5; 6 } y # =6
1 3
2 4
5 pto.muestral
6
A’
A y B ocurren Ocurre al menos uno de No ocurre A
simultáneamente ellos
“y” “o”
si y solo si
Mutuamente excluyentes: =0
= P(A) . P(B)
P(2/salió par) =
De la prob. condicional:
Probabilidad Teorema de
Compuesta Bayes
B B
A1 A2 … An A1 A2 … An
Probabilidad Teorema de
Compuesta Bayes
P (B) P (A2/B)
B B
A1 A2 … An A1 A2 … An
Probabilidad
Compuesta
P
(
B
)
P
(B
/
A
1
)P
(
A
1
)
P(
B
/
A
2)
P
(
A
2
).
.
.
P(
B
/
A
n)
P
(
A
n
)
Teorema de Bayes
P(
B/A
2)
P(
A2
)
P
(
A2/
B)
P(
B/A
1
)P
(
A1
)
P(
B/A
2)
P(
A2
)
..
.P
(
B/)
A
nP
()
An
P(
B/A
)P
(A)
P
(
A2/
B) 2 2
P(
B)
45% 55% a.
D
“regla multiplicativa”
10% 8%
b. P
(
D
)
P
(
D/
M
)
1P
(
M
1)
P
(D
/
M)
P
(
2M
)
2
“prob. compuesta”
c.
“teo. Bayes”
Ω
R
Cara
Seca
Ω
Cara 1
Seca 0
Ω ={ (C10;C5); (C10;S5);(S10;C5);(S10;S5)} ; X = 2; 1; 0
Ω ={ (C10;C5); (C10;S5);(S10;C5);(S10;S5)}
X = 0; 1; 2 v.a discreta
La Función de Distribución de X es:
P(X=0)= ¼=0,25
P(X=1)=2/4 = 0,50
P(X=2)=1/4=0,25
0,70
0,57
Probabilidades
0,43
0,30
0,17
-1 0 1 2
X
Prof. Dora Apessetche 86
Valor Esperado de una Variable Aleatoria Discreta
La Esperanza Matemática
P(X=0)= ¼=0,25
P(X=1)=2/4 = 0,50
P(X=2)=1/4=0,25
E(X)=¿?
P(X=0)= ¼=0,25
P(X=1)=2/4 = 0,50
P(X=2)=1/4=0,25
P(X=0)=1/6 = 0,17
P(X=1)=4/6= 0,66
P(X=2)=1/6= 0,17
E(X) = 0. 0,17 + 1 . 0,66 + 2 . 0,17 = 1
Ω = {1; 2; 3; 4; 5; 6} ; X = $1;$2;$3;$4;$5;$6
Ω= {1; 2; 3; 4; 5; 6} ; X = $1;$2;$3;$4;$5;$6
E(X) = $3,50
V(X)= 2,905
Funciones de
Distribuciones
P(X)
n-ensayos identicos.
Ensayos independientes.
6-ensayos
Fórmula:
E(X) = np
V (X)= npq
P(x=5) = 0,001
Seminario 7-Ejercicio 2
Debido a las altas tasas de interés, una empresa reporta que el 30% de
sus cuentas por cobrar de otras empresas están vencidas. Si un
contador toma una muestra aleatoria de 5 de esas cuentas determine
la probabilidad de que:
a. Ninguna de la cuentas estén vencidas
Seminario 7-Ejercicio 2
n=5; E= cuenta esté vencida con probabilidad de 0,30.
X= 0;1;2;3;4;5
a. P(X=0)=
b. P(X=2)=
c. P(X=1)=
a. P(X=0)=0,16
b. P(X=2)=0,31
c. P(X=1)=0,36
X= 0;1;2;3;….
Fórmula:
E(X) = V(X) = λ
X= 0;1;2;3;4;5;…
a.
b.
X= 0;1;2;3;4;5;…
c.
n/N ≥ 0,04.
X~Hi(N;M;n)
N
M
Fórmula:
10
X~Hi(15; 5; 7) 5
n=7
P(x=3) = 0,33
B ( n , p ) ≈ Po(λ)
n.p
Grande > 20
Chico <0,05
X ~B(50;0,03) ≈ Po (1,5)
Hi( N , M ,n ) ≈ B( n, p)
≤ 0,05 N M/N
X ~ N (µ; σ2)
0,15
0,11
0,08
0,04
0,00
-8,23 -1,61 5,00 11,61 18,23
X
Características Generales
Forma acampanada.
Simétrica respecto a su media.
Queda determinada por su media y varianza (ó D.E).
Cada combinación de la media y varianza especifica una dist.
Normal única.
Los extremos de la campana se extiende por todo el eje de las
abscisas.
El área total bajo la curva es 1 o el 100%. P = área.
La probabilidad de que la v.a continua asuma un único valor es
0.
Área Bajo la Curva
0,20
0,15
0,10
0,05
p=1 ó 100%
0,00
-5,00 0,00 5,00 10,00 15,00
X
Área Bajo la Curva
0,20
0,15
0,10
0,05
P=0,5
0,00
-5,00 0,00 5,00 10,00 15,00
X
Área Bajo la Curva
0,20
0,15
0,10
0,05
p=0,68
0,00
-5,00 0,00 5,00 10,00 15,00
X
Área Bajo la Curva
0,15
0,11
0,08
0,04 p=0
0,00
-8,23 -1,61 5,00 11,61 18,23
X
Distribución Normal Estándar
Z ~ N ( 0; 1)
0,40
0,30
0,20
0,10
0,00
-5,00 -2,50 0,00 2,50 5,00
Z
Distribución Normal Estándar
0,30 0,30
0,20 0,20
0,10 0,10
0,00 0,00
-5,00 -2,50 0,00 2 2,50 5,00
-5,00 -2,50 0,00 1,5 2,50 5,00
Z Z
Distribución Normal Estándar
0,30 0,30
0,20 0,20
0,10 0,10
0,00 0,00
-5,00 -2,50 -1 0,00 1 2,50 5,00 -5,00 -2,50 -1 0,00 1,40 2,50 5,00
Z Z
Estandarización
X ~ N(5;4)
0,20
0,15
0,10
0,05
p=¿?
0,00
-5 0 5 6 10 15
X
Estandarización
X ~ N(5;4) Z ~ N(0;1)
0,20 0,40
0,15 0,30
0,10 0,20
0,05 0,10
p=¿?
0,00 0,00
6
-5 0 5 10 15 -5,00 -2,50 0,00 2,50 5,00
X Z
Estandarización
X ~ N(5;4) Z ~ N(0;1)
0,20 0,40
0,15 0,30
0,10 0,20
0,05 0,10
p=¿?
0,00 0,00
-5 0 5 6 10 15 -5,00 -2,50 0,00 2,50 5,00
X Z
Estandarización
X ~ N(5;4) Z ~ N(0;1)
0,20 0,40
0,15 0,30
0,10 0,20
0,05
p=¿? 0,10
0,00 0,00
-5 0 5 6 10 15 -5,00 -2,50 0,00 2,50 5,00
X Z
Estandarización
X ~ N(5;4) Z ~ N(0;1)
0,20 0,40
0,15 0,30
0,10 0,20
0,05 0,10
p=¿?
0,00 0,00
-5 0 5 6 10 15 -5 -3 0 0,5 3 5
X Z
Estandarización
X ~ N(5;4) Z ~ N(0;1)
0,20 0,40
0,15 0,30
0,10 0,20
0,05 0,10
p=¿? 0,69
0,00 0,00
-5 0 5 6 10 15 -5 -3 0 0,5 3 5
X Z
Estandarización
X ~ N(5;4) Z ~ N(0;1)
0,20 0,40
0,15 0,30
0,10 0,20
0,05 0,10
0,69 0,69
0,00 0,00
-5 0 5 6 10 15 -5 -3 0 0,5 3 5
X Z
Estandarización
X~N(5;16)
z = 0,5
z= -075
Estandarización
X ~ N(5;16) Z ~ N(0;1)
0,10 0,40
0,08 0,30
0,05 0,20
0,03 0,10
0,46
0,00 0,00
2 -5 -3 -0,75 0 0.5 3 5
-15 -5 5 7 15 25
Notas Notas estandarizadas
Estandarización
0,004 0,40
0,003 0,30
Densidad
0,002 0,20
0,001 0,10
95% 5% 95% 5%
0,000 0,00
0 250 500 750 1000 -5,00 -2,50 0,00 2,50 5,00
Puntuaciones Puntuaciones estandarizadas
Estandarización
0,004 0,40
0,003 0,30
Densidad
0,002 0,20
0,001 0,10
95% 5% 95% 5%
0,000 0,00
1,64
0 250 500 750 1000 -5,00 -2,50 0,00 2,50 5,00
Puntuaciones Puntuaciones estandarizadas
Estandarización
grande
np
npq
cerca de
0,5
Aproximación de la Binomial a la Normal
>5
Muestreo
Aleatorio
Se realiza un sorteo.
Características
Características
Características
18-54-90-126-162…
Parámetros y Estimadores
N es
infinito
de una población de media µ y desvío estándar σ, se extraen todas
Si
las muestras posibles del mismo numero de elementos n cada una de
ellas, y de cada muestra obtenemos su media, la distribución de
todas esas medias tendrá una distribución del tipo normal;
independientemente del tipo de distribuciones que posea la
población, con una media igual a la media poblacional µ y con un
desvío estándar σ menor al desvío estándar poblacional, denominado
error muestral estándar cuyo valor es igual a:
.
.
.
n
Distribución de Muestreo para la Media Muestral
Teorema Central del Límite
n
N es infinito
.
.
. n
Distribución de Muestreo para la Media Muestral
Teorema Central del Límite
n
N es infinito
n
Si n es grande
.
.
. n
Distribución de Muestreo para la Media Muestral
Teorema Central del Límite
n
N es finito y n/N>0,05
.
. factor de
n correcció
.
n
Aplicación
Ejemplo: El número de alumnos por año que ingresan a las escuelas tiene
media 600 con desvió 300. Si se toma una muestra aleatoria de 25 escuelas,
¿cuál es la probabilidad de que la media de la muestra sea inferior a 550?
0,007
0,005
0,003
0,002
0,000
300 450 550 600 750 900
Aplicación
Ejemplo: El número de alumnos por año que ingresan a las escuelas tiene
media 600 con desvió 300. Si se toma una muestra aleatoria de 25 escuelas,
¿cuál es la probabilidad de que la media de la muestra sea inferior a 550?
0,007
0,005
0,003
Estandarización de
0,002 550:
0,000
300 450 550 600 750 900
Aplicación
Ejemplo: El número de alumnos por año que ingresan a las escuelas tiene
media 600 con desvió 300. Si se toma una muestra aleatoria de 25 escuelas,
¿cuál es la probabilidad de que la media de la muestra sea inferior a 550?
Normal(0,1): p(evento)=0,2033
0,40
0,007
0,30
0,005
0,003 0,20
0,002 0,10
0,000 0,00
300 450 550 600 750 900 -5,00 -2,50 -0,83 0,00 2,50 5,00
Error Estándar
Error Estándar
Estandarizaciones
estim
a
L.I L.S
Estimación de Parámetros
0,40
0,30
0,20
0,10
0,95
0,00
-5,00 -z 0,00 z 5,00
Estimación de Parámetros
0,30
0,20
0,10
0,95
6,34 7 7,66
0,00
-5,00 -z 0,00 z 5,00
Interpretación de los Intervalos de Confianza
0 25 50 75 100
Intervalos
Error Máximo de Estimación
6,34 7 7,66
E = 0,66
Error Máximo de Estimación
6,34 7 7,66
E = 0,66
Determinación del Tamaño Muestral
Se necesita conocer:
Nivel de confianza.
Determinación del Tamaño Muestral
0,30
0,20
0,10
0,90
0,00
-5,00 -z 0,00 z 5,00
Determinación del Tamaño Muestral
0,30
0,20
0,10
0,90
n = 67,24≈67 0,00
-5,00 -z 0,00 z 5,00
Prof. Dora Apessetche 177