Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística 04
Estadística 04
VARIABLES
Cualitativas indican una cualidad o característica de la población de estudio
solamente se pueden contar (sacar porcentaje)
Hincha de qué equipo
Marca de auto que prefieres
Sexo
Cuantitativas indican cantidades de la población
Discretas solo admiten enteros
se pueden contar y ordenar
Número de hermanos
Alumnos en un curso
TABLAS Y GRÁFICOS
Cualitativas
Marca de auto
Frecuencia Frecuencia =Porcentaje
absoluta relativa
Detalle fi hi 80 75
Chevrolet 75 0.375 37.5 70
Nissan 32 0.16 16 60
Toyota 21 0.105 10.5 50
40 32
VW 15 0.075 7.5
30 21
Otros 57 0.285 28.5 20 15
Total 200 1 la suma siempre es 1 10
0
Chevrolet Nissan Toyota VW
Variables discretas
Número de hijos
Frec abs Frec relat
acumulada acumulada
Detalle fi hi FA HA
0 25 0.125 25 200 12.5%
1 56 0.28 81 175 40.5%
2 42 0.21 123 119 61.5%
3 29 0.145 152 77 76.0%
4 ó más 48 0.24 200 48 100.0%
Total 200 1
123 personas tienen 2 hijos o menos
119 tienen 2 hijos o más
DISPERSIÓN
60
56
50
40 42
30 29
25
20
10
0
0 0.5 1 1.5 2 2.5 3 3.5
Variables continuas
Peso
164 143 138 178 194 172
156 146 172 176 172 144
168 179 196 125 144 162
194 170 192 176 147 197
184 189 127 176 176 188
158 185 184 179 126 157
170 158 141 142 124 182
141 200 181 122 164 145
188 194 135 180 137 187
152 164 159 150 172 192
153 136 133 161 142 181
165 199 193 180 156 199
142 198 184 192 141 157
179 121 173 149 145 151
169 162 146 133 143 124
178 160 181 131 161 143
187 132 147 192 187 148
166 143 192 191 122 185
199 133 156 156 173 163
126 136 181 148 198 155
k= 6.34299164993
7 intervalos
Max - min
A=
k
Máx = 200
min = 120
80
A=
7
A= 11.4
11.5
Paso 3: Armar la tabla
= es el
punto
Marca de clase
medio de
los límites
Límite inferior Límite superior Xi fi hi FA
120 131.5 125.75 24 0.12 24
131.5 143 137.25 32 0.16 56
143 154.5 148.75 23 0.115 79
154.5 166 160.25 33 0.165 112
166 177.5 171.75 26 0.13 138
177.5 189 183.25 36 0.18 174
189 200.5 194.75 26 0.13 200
200 1
Marcar el rango
Aplastar F2
Aplastar Shift+Ctrl+Enter
Media aritmética
Letras latinas para muestra Estadísticos
Letras griegas para población Parámetros
Agrupados
𝑋 ̅=(∑▒ 〖 (𝑋𝑖.𝑓𝑖)
〗 )/𝑛
=MEDIANA(base de datos)
Para datos agrupados
Se obtiene la posición con la misma fórmula
𝑀𝑒𝑑=𝐿𝑖+(𝑛/2−
〖𝐹𝐴〗 _(𝑖−1))/𝑓𝑖.𝐴
𝑀𝑒𝑑=154.5+(200/2−79)/33.(11.5
Med =
=MODA(base de datos)
𝑀𝑜𝑑𝑎=𝐿𝑖+
(𝑓𝑖−𝑓_(𝑖−1))/
(𝑓𝑖−𝑓_(𝑖+1) ).𝐴
Moda = 189
Cuartiles Dividen a la cantidad de datos en 4 partes cada una representa el 25%
Q2 = Mediana 50%-50%
Con el máximo y el mínimo se tiene el resumen de 5 números y se puede hacer la gráfica de CAJA Y BIGOTES
Min x1
Q1 x2
Med x3
Q3 x4 min
Max x5
Q1 Med
Percentiles, deciles
Dividen a los datos en 100 partes
P45 percentil 45, el 45% de los datos está por debajo
P87 percentil 87, el 87% de los datos está por debajo
El decil es 10 percentiles
En la pestaña DATOS
Presionar Análisis de datos 113
Elegir Estadística descriptiva 140
Señalar la Base de datos 112
Marcar resumen de estadísticas 92
señalar rango de salida 103
Aceptar 133
141
Tienen que estar en columna 137
138
110
132
131
144
112
90
129
123
109
96
135
HISTOGRAMA
Es un diagrama de barras para variables continuas 40
35
Insertar el diagrama de columnas 30
seleccionas Agregar Serie
Seleccionar fi o hi de la tabla 25
en el eje horizontal va la marca de clase Xi 20
0
125.75 137.25 148.75 160.25 171.75
POLÍGONO
Es un diagrama de línea para variable continuas 40
35
Insertar el diagrama de línea o dispersión
seleccionas Agregar Serie 30
Seleccionar fi o hi de la tabla
25
en el eje horizontal va la marca de clase Xi
20
15
10
0
125.75 137.25 148.75 160.25 171.75
5
0
125.75 137.25 148.75 160.25 171.75
OJIVA
Es el diagrama lineal para las frecuencias acumuladas 250
100
50
0
120 130 140 150 160 1
Apellido fi hi %
Brown 7 0.14 14%
Davis 6 0.12 12%
Johnson 10 0.2 20%
Jones 7 0.14 14%
Smith 12 0.24 24%
Williams 8 0.16 16%
Total 50 1
0.3
0.25 0.24
0.2
0.2
0.16
0.15 0.14 0.14
0.12
0.1
0.05
0
Brown Davis Johnson Jones Smith Williams
Apellido
Brown; 0.14
Williams; 0.16
Davis; 0.12
Smith; 0.24
Johnson; 0.2
Jones; 0.14
Máximo 107 IBM
mínimo 11 Alcoa
10
9
8
7
6
5
4
3
2
7
6
5
4
3
2
1
0
16 26 36 46 56 66 76 86 96 106
Cuando la cola derecha tiende a ser más larga, entonces se tiene un sesgo positivo
Cuando la cola izqiuerda tiende a ser más larga, entonces se tiene un sesgo negativo
Max 2050
min 180
0.3
0.25
0.2
0.15
0.1
0.05
0
305 555 805 1055 1305 1555 1805 2055
Sesgo positivo
X
1200 𝑀𝐺=√(𝑛&𝑥1.𝑥2.𝑥3.𝑥4….𝑥𝑛
450 )
1780
800
1450 MG = =MEDIA.GEOM(valores)
850
890
180
1090
280
740
260
MG = 674.805425164
Media = 830.833333333
oblación de estudio
Barras Circular
75
57 28%
38% Chevrolet
Nissan
32
Toyota
21 VW
15 8%
Otros
11%
16%
Chevrolet Nissan Toyota VW Otros
100.0%
87.5%
59.5%
38.5%
24.0%
42
29
HA Xi.fi
0.12 3018
0.28 4392
0.395 3421.25
0.56 5288.25
0.69 4465.5
0.87 6597
1 5063.5
32245.5
Media = 161.23
PROMEDIO(base de datos)
+(𝑛/2−
(𝑖−1))/𝑓𝑖.𝐴
𝑀𝑒𝑑=154.5+(200/2−79)/33.(11.5)
161.8
𝐿𝑖+
𝑖−1))/
𝑖+1) ).𝐴
177.5+(36−26)/(36−26).
y se puede hacer la gráfica de CAJA Y BIGOTES
Max
Med Q3
Columna1
Media 121
Error típico 3.87502122
Mediana 126
Moda 112
Desviación estándar 17.3296217
Varianza de la muestra 300.315789
Curtosis -1.14741229
Coeficiente de asimetría -0.41921673
Rango 54
Mínimo 90
Máximo 144
Suma 2420
Cuenta 20
50
00
50
00
50
0
120 130 140 150 160 170 180 190 200
Last Name
Brown
Smith
Davis
Johnson
Williams
Williams
Johnson
Jones
Davis
Jones
Williams
Jones
Smith
Smith
Davis
Johnson
Smith
Jones
Jones
Johnson
Williams
Smith
Brown
Smith
Johnson
Jones
0.24 Smith
Smith
Williams
0.16 Brown
Williams
Johnson
Williams
Johnson
Williams
Smith
Smith Williams
Brown
Smith
Davis
Johnson
Brown
Smith
Johnson
Brown
Johnson
Brown
Jones
Davis
Smith
Davis
Company $/Share
3M 61
Alcoa 11
American Ex 25
AT&T 24
Bank of Ame 12
Boeing 52
Caterpillar 38
Chevron 69
Cisco Syste 20
Coca-Cola 49
DuPont 27
ExxonMobil 72
General Elec 14
Hewlett-Pac 37
Home Depot 24
IBM 107
Intel 16
J.P. Morgan 35
Johnson & J 56
Kraft Foods 27
McDonald's 59
Merck 26
Microsoft 22
Pfizer 14
Procter & G 53
Travelers 43
United Tech 56
Verizon 29
Wal-Mart St 51
Walt Disney 25
Media= 38.6666667
6 86 96 106
Spending
1200
450
1780
800
1450
850
890
180
1090
280
740
260
850
510
1120
590
610
Xi.fi 2050
2440 520
2775 200
4830 340
2110 350
1305 770
1555 220
1805 350
2055
18875
755
es bursátiles
Chevrolet
Nissan
Toyota
VW
Otros
MEDIDAS DE DISPERSIÓN
RANGO
R = Max - min
CORRELACIÓN
La fuerza de la relación entre dos variables
r= =COEF.DE.CORREL(valores X;valores Y)
X Y
280 26 r= 0.63351272
740 22
260 14 Toma valores entre -1 y 1
850 53
510 43 Si vale 0 no hay relación
Si vale 1 la relación es fuerte positiva (cuando una
Si vale -1 la relación es fuerte negativa (inversa) (cu
Y
VALORES Z
Campana de Gauss
Distribución Normal
P(Z)
Transformar a valores Z
Z
𝑍=(𝑋−𝑋 ̅)/𝑆
VARIANZA-DESVIACIÓN ESTÁNDAR
La varianza es adimensional.
La desviación estándar mide "el promedio" de las distancias de cada valor contra la media
Varianza = =VAR.P(valores)
varianza de la población 𝜎^2 𝜎^2=(∑▒(𝑋−𝜇)^2
)/𝑁
=VAR.S(valores)
varianza de la muestra (sample) 𝑆^2
𝑆^2=(∑▒(𝑋−𝑋 ̅ )^
2 )/(𝑛−1)
RIC = Q3 - Q1
COEFICIENTE DE VARIACIÓN
Es el porcentaje de la media que representa la desviacion estándar
𝐶𝑉=𝜎/𝜇.100
Media 528
Desvest = 265.650145869
CV = 50.31%
TEOREMA DE CHEBYSHEV
Por lo menos 1/z^2 de los valores están entre z desviaciones estándar de la media
z es mayor que 1
Ingresos
Media = 528
Desvest = 265.65014587
X= 1000
Z= 1.7767729751
1−1/
𝑧^2
0.6832357799
Al menos el 68.3% de los valores están dentro de ±1.78 desviaciones estándar de la media
REGLA EMPÍRICA
95% de
los datos
-2S +2S
VALORES ATÍPICOS
Son valores que están demasiado alejados del minimo o del máximo y que alteran el análisis. En general si se detectan, hay qu
Hacia abajo X
Lim inferior= Q1 - 1.5 RIC 280
Lim superior= Q3 + 1.5 RIC 400
260
Q1 = 275 1800 valor atípico
Q3 = 832.5 500
RIC = 557.5 510
COVARIANZA
población
muestra
MEDIA PONDERADA
Es una media aritmática en la que se asignan "pesos" a las variables para obtener un valor más exacto
Compra de arroz
Precio (xi) Cantidad (wi) wi.xi
Mes 1 0.5 100 50 𝑋 ̅=(∑▒ 〖𝑤𝑖 .𝑋𝑖
Mes 2 0.6 80 48
Mes 3 0.4 120 48 〗 )/(∑▒𝑤𝑖)
Mes 4 0.5 120 60
Mes 5 0.5 110 55
Media 0.5 106
Sumas 530 261
Compra de arroz
Precio (wi) Cantidad (xi) wi.xi
Mes 1 0.5 100 50
Mes 2 0.6 80 48
Mes 3 0.4 120 48
Mes 4 0.5 120 60
Mes 5 0.5 110 55
Media 0.5 106
Sumas 2.5 261
El resumen de 5 números es el conjunto de datos conformado por min, Q1, Med, Q3 y Máx
min 12 12
Q1 24 12
Med 38 26
Q3 45 19
Máx 60 41
min Q1 Med
0 20 40 60 80
istribución Normal
ormal Estándar
=(∑▒(𝑋−𝜇)^2 X= cada valor
μ= Media aritmética de la población
N= Tamaño de la población
esviación cuadrada
70570
dar de la media
sis. En general si se detectan, hay que eliminarles
más exacto
wi = peso de la variable
Xi = observación (valor)
Med Q3 Max
40 60 80 100 120
ría de la distribución
e derecho es más largo, la distribución tiene un sesgo positivo
PROBABILIDAD