Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2° Semestre – Sección B
Profesora:
Lic. Alicia Magdalena A. Castillo G.
Lic. en Análisis de Sistemas y Matemática
Días de Clases:
Jueves de 13:00 a 16:00 hs. (14:40 receso de
20 minutos)
Asistencia:
75% según el Reglamento Interno
Evaluación:
Primera Parcial: 15
Segunda Parcial: 15
Trabajo Práctico : 10 Total: 40
Programa de Estudios y bibliografía:
disponible en www.fpune.edu.py
Materiales:
calculadora científica, cuaderno, etc.
Bibliografía
Básicos
SPIEGEL, Murray R. “Probabilidad y Estadística”. Mc
Graw-Hill. Bogotá. 1997.
MILLER. “Probabilidad y Estadística para Ingenieros”.
Prentice-Hall. 1992.
MEYER, PRADO y CUÉLLAR. “Probabilidad y
Aplicaciones Estadísticas”. Addison – Wesley
Iberoamérica. 1986.
Complementarias
GARCÍA, F. “Estadística”. Mc Graw-Hill. Madrid. 1994.
SPIEGEL, Murray R. “Estadística”. Mc Graw-Hill.
Madrid. 1997
ESTADÍSTICA
vi fi hi hi %
Claros 7 7 / 50 = 0,14 14
Verdes 3 3 / 50 = 0,06 6
Azules 5 5 / 50 = 0,10 10
Marrones 25 25 / 50 = 0,50 50
Negros 10 10 / 50 = 0,20 20
50 1 100
Elementos de la Estadística
Variables Estadísticas:
Cuantitativas Cualitativas
•Discretas •Ordinal
•Continuas •Categóricas
Clasificación de variables
Escalas de medición de las variables
Variables
CualitativaoAtributo CuantitativaoNúmerica
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32,
31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29,
29.
1ro) Ordenamos los datos de menor a mayor
27, 28, 28, 29, 29, 29, 29, 29, 29, 30, 30, 30, 30, 30, 30, 30,
1 2 6 7
31, 31, 31, 31, 31, 31, 31, 31, 32, 32, 32, 33, 33, 33, 34
1
8 3 3
Temperatura Nro de días
27 1
28 2
29 6
30 7
31 8
32 3
33 3
34 1
Total 31
Variable Frec. Abs.
xi fi Frec. Relat. Frec. Porc. Frec. Acum.
“Temperatur “Cantidad fri fp Fi
as Máximas” de días”
100%
Variable Frec. Abs.
xi fi Frec. Relat. Frec. Porc. Frec. Acum.
“Temperatur “Cantidad fri fp Fi
as Máximas” de días”
27 1 0,032 3,2 1
28 2 0,064 6,5 3
29 6 0,194 19,4 9
30 7 0,226 22,6 16
31 8 0,258 25,8 24
32 3 0,097 9,7 27
33 3 0,097 9,7 30
34 1 0,032 3,2 31
Totales 31 1 100
Ejemplo:
Se ha realizado una encuesta a 30 profesores de un
colegio sobre la antigüedad en la docencia en años
completos. Los resultados fueron:
4, 11, 3, 7, 9 , 5 , 4 , 1 ,2 ,11 ,16 ,4 ,20 ,15 ,2 ,10 ,7 ,6 ,4 ,10 ,8 ,12 ,12 ,5 ,8
10,1, 6 ,3 ,15
15, 16, 20
b) Calculamos: - El rango: 20 – 1 = 19
Número de
Ya tuvo dengue individuos
Si 246
No 2314
Variables Cuantitativas discretas o
continuas tabuladas en intervalos
Variables Cuantitativas
Nivel de Colesterol Cantidad de
Discretas (mg/100 ml) hombres
Número de Número de 80-120 13
hermanos alumnos
120-160 150
0 4
160-200 442
1 6
200-240 299
2 8
240-280 115
3 10
280-320 34
4 7
320-360 9
5 5
360-400 5
GRAFICOS
ESTADÍSTICOS
“Una imagen vale más que mil palabras”
70.1
68.0
66.8
65.4
63.8
10
7.9
8 7.3
Tasa desempleo
6.5 6.4
5.7 5.5 5.7
6
0
2003
2004
2005
2006
2007
2008
2009
2002
Año
Bolivia 3.5
Paraguay 3.0
Peru 2.6
Argentina 2.2
Mexico 2.1
EEUU 2.1
Uruguay 2.0
Francia 2.0
Chile 1.9
Brasil 1.9
Alemania 1.4
Japón 1.3
Empleado / Obrero
privado
Empleado / Obrero 33.0%
público
8.0%
Empleado Dependientes
doméstico
7.0%
Empleador o patrón
Familiar no 6.0%
remunerado
11.0%
Independientes
Cuenta propia
35.0%
Fuente: EPH 2009
GRAFICO DE LINEAS
Población urbana y rural
70%
60%
Porcentaje urbano/rural
50%
40%
30%
20%
10% Urbana
Rural
0%
1950 1962 1972 1982 1992 2002
Año del Censo
Fuente: DGEEC
GRAFICO PARA
DATOS AGRUPADOS
POLIGONO DE
FRECUENCIAS
HISTOGRAMA
La estadística de resumen
Desempeño Número de
(puntos) técnicos
12 - 16 4
17 - 21 8
22 - 26 15
27 - 31 23
32 - 36 10
TOTAL 60
Primero se calcularán las marcas de clase (Xi );
es decir, el valor intermedio de cada clase
Marca de Frecuencia
clase x
clase ( i ) absoluta(fi)
12 - 16 14 4
17 - 21 19 8
22 - 26 24 15
27 - 31 29 23
32 - 36 34 10
Total 60
x 1575
14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10) 60
x 4 + 8 + 15 + 23 + 10
x 26.25
Interpretación: Si se elige al azar a un
trabajador técnico de este hospital, se espera
que tenga un puntaje de 26,25 en su
evaluación de desempeño.
g)Ventajas y desventajas de la media aritmética
Ventajas:
Concepto familiar para muchas personas
Es única para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no están
agrupados, su cálculo es tedioso
Si los datos están agrupados en clases con
extremos abiertos, no es posible calcular la
media.
La Mediana
c) Reglas
16 - 19 1
Total 30 Mo = 5,9
Interpretación: Durante un mes, el número más
frecuente de errores de facturación en esta
clínica es 6.
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos
como cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan
una o más clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribución
amodal).
En otros casos la distribución tiene varias
modas, lo que dificulta su interpretación.
MEDIDAS DE DISPERSION
Rango
El rango se define como la diferencia entre
el valor máximo y mínimo de un conjunto
de datos.
Rango = Valor máximo – Valor mínimo
El
rango no mide la variabilidad de los
datos intermedios.
DESVIACIÓN MEDIA
La desviación media es la media
aritmética de los valores absolutos de las
desviaciones respecto a la media.
La desviación media se representa por
DM
Datos Sueltos Datos Agrupados
σ 𝒙−𝒙ഥ σ 𝒙− 𝒙
ഥ .𝒇
𝑫𝑴 = 𝑫𝑴 =
𝒏 𝒏
Varianza
La varianza es la media del cuadrado de las
desviaciones de los datos con respecto al
promedio.
Esta medida tiene las unidades de los datos
pero elevadas al cuadrado lo que dificulta
su interpretación.
Datos Agrupados Datos Sueltos
σ 𝒙𝟐. 𝒇 σ 𝒙−𝒙ഥ 𝟐
𝑺𝟐 = ഥ𝟐
−𝒙 𝟐
𝑺 =
𝒏 𝒏
Coeficiente de variabilidad
No tiene unidades de medida.
Es una medida relativa de variabilidad y
permite realizar comparaciones entre
conjuntos de observaciones con distintas
unidades o medias diferentes.
A veces se considera que un CV mayor a
50% indica alta dispersión en los datos .
CV poblacional CV muestral
S
CV 100% CV 100%
x
DESVIACIÓN TÍPICA
La desviación típica es la raíz cuadrada
de la varianza.
Es decir, la raíz cuadrada de la media de
los cuadrados de las puntuaciones de
desviación.
La desviación típica se representa por S
𝑺= 𝑺𝟐
MEDIDAS DE POSICIÓN
En el caso de las medidas de posición sólo
estudiaremos para datos agrupados, pues tienen
mayor significación que los datos sueltos.
1. CUARTILES
Los cuartiles son los tres valores de la variable que
dividen a un conjunto de datos ordenados en
cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores
correspondientes al 25%, al 50% y al 75% de los
datos.
𝒌. 𝒏
− 𝒇𝒂𝒄
𝑸𝒌 = 𝑳𝒊 + 𝟒 .𝒄
𝒇𝒌
2. DECILES
Los deciles son los nueve valores que dividen la
serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%,
al 20%... y al 90% de los datos.
𝒌. 𝒏
− 𝒇𝒂𝒄
𝑫𝒌 = 𝑳𝒊 + 𝟏𝟎 .𝒄
𝒇𝒌
3. PERCENTILES
Los percentiles son los 99 valores que dividen la
serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al
1%, al 2%... y al 99% de los datos.
𝑘. 𝑛
− 𝑓𝑎𝑐
𝑃𝑘 = 𝐿𝑖 + 100 .𝑐
𝑓𝑘
Ejemplo:
La tabla muestra la experiencia (en años) de las
enfermeras de un gran centro hospitalario
Experiencia Trabajadores
(años)
0-3 18
4-7 42
8 - 11 68
12 - 15 120
16 - 19 40
20 - 23 34
24 - 27 12
Total 334
¿Sobre qué edad se ubica el 25% de las
enfermeras de mayor experiencia?
75 % 25 %
P75
Menor Mayor
Experiencia Experiencia
K = 75
Kn 75(334)
Lugar del P75 250,5o (de los números ordenados )
100 100