Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Es un valor representativo que representa a toda la información. La mayor parte de los conjuntos de
datos muestran una tendencia a agruparse alrededor de un valor central. Estos valores se llaman
medidas de tendencia central. Entre ellos tenemos:
a) MEDIA ARITMETICA.
Media aritmética para datos no agrupados.- Es una de las medidas de tendencia central, que
representa un valor con respecto a toda la información. Para denotar la media de una población
utilizaremos y x cuando se trate de la media de una muestra. La media de una muestra es
igual a
x
x i
Ejem. Hallar la nota promedio (media aritmética) de un alumno que registro las siguientes
calificaciones:
Estadísticos
Notas
N Válido 10
Perdidos 0
Media 11,7000
Pá gina 1
ESTADISTICA I
Media aritmética para un conjunto de datos agrupados. -La media para datos agrupados es la
1 m
x xi f i
siguiente: n i 1
Ejemplo: Los siguientes datos corresponden al número de hijos registrado en 15 familias. Encontrar
el número promedio de hijos.
N de hijos
xi fi xifi
1 3 3 La obtención de la media finalmente se convierte en
2 2 4
1 m
xi f i 42
3 6 18
x
4 3 12 n i 1 = 15 = 2.8 = 3 hijos
5 1 5
Total n = 15 42
Rspta. El promedio de hijos por familia es de 3.
NOTA.- Debido a que el cálculo de la media aritmética se basa en todas las observaciones,
cualquier valor extremo afecta mucho su resultado; distorsionando así el resultado de la
información; entonces las media no es el mejor promedio para describir o resumir un conjunto
de datos que tiene valores extremos.
Media ponderada.- La media ponderada es una medida de tendencia central, que se construye
asignando a cada clase un peso, y obteniendo un promedio para los pesos.
x́=
∑ w i xi
∑ wi
Donde
xi = dato
Ejemplo:
En una materia dada se asignan pesos de importancia, de la siguiente forma: Unida I (20% de
la calificación), Unidad II (25% de la calificación), Unidad III (20% de la calificación), Unidad
IV (15% de la calificación), Unidad V (20% de la calificación). Si las calificaciones de un
alumno son 18 en la primera unidad, 15 en la segunda, 13 en la tercera unidad, 10 en la
cuarta unidad y 8 en la última unidad. Es decir, se tienen la siguiente tabla:
Pá gina 2
ESTADISTICA I
III 20% = 13
IV 15% = 10
V 20% = 8
x́=
∑ w i x i = 20∗18+25∗15+20∗13+15∗20+20∗8 = 1305 =13.05
∑ wi 100 100
b) MEDIANA
Mediana para datos no agrupados.- La mediana de un conjunto finito de valores es aquel valor
que divide al conjunto en dos partes iguales, de forma que el número de valores mayor o igual a
la mediana es igual al número de valores menores o igual a estos. Su aplicación se ve limitada ya
que solo considera el orden jerárquico de los datos y no alguna propiedad propia de los datos,
como en el caso de la media.
A continuación se muestran los criterios para construir la mediana. Se puede construir los
siguientes criterios:
Me= X n+1
2
Cuando el número de valores en el conjunto es par, no existe un solo valor medio, si no que
existe dos valores medios, en tal caso, la mediana es el promedio de los valores, es decir, la
mediana es numéricamente igual a
X n +X n
+1
2 2
Me=
2
1.- Es única.
2.- Es simple.
3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la
media aritmética.
Ejemplo:
Pá gina 3
ESTADISTICA I
Ordenar: 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3, 4, 4
Dados los siguientes datos: 10, 21, 13, 44, 20, 17, 42, 13 Hallar la mediana.
N=8 ( par )
X n +X n X 8+ X 8 X 4 + X 5 20+17
+1 +1
Me= 2 2
= 2 2 = = = 18.5
2 2 2 2
Estadísticos
Diashospitaliación
N Válido 14
Perdidos 0
Mediana 1,0000
Pá gina 4
ESTADISTICA I
c) MODA
Moda para datos no agrupados.-La moda es la medida que se relaciona con la frecuencia con
que se presenta el dato o los datos con mayor incidencia, con lo que se considera la posibilidad
de que exista más de una moda para un conjunto de datos. La notación mas frecuente es: Mo .
Esta medida se puede aparecer tanto para datos cualitativos como cuantitativos. Se dice que
cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas
bimodal, cuando la muestra contiene más de un dato repetido se dice que es multimodal y un
último caso es cuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra es
amodal.
Ejemplos:
a).- 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3
b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, 3, 4, 6, 3, 3,4
Pá gina 5
ESTADISTICA I
Las modas de este conjunto de datos son ____ y ___ya que ambas tienen la mas alta
frecuencia, por lo que la muestra es ______
c).- 1, 2, 3, 4, 5, 6, 7, 8, 9
La muestra ___ contiene ningún dato repetido por lo que se considera que la muestra es ___
no tiene moda.
Clases de Distribuciones
X́ = Me = Mo
X́ < Me < Mo
Pá gina 6
ESTADISTICA I
Mo< Me< X́
La estatura en 20 personas dio como resultado los siguientes valores, halle el tipo de distribución
X́ = 1.50
Me = 1.63
Mo = 1.65
MEDIDAS DE DISPERSIÓN
La dispersión mide cuan alejados están un conjunto de valores respecto a su media aritmética. Así cuanto
menos disperso sea el conjunto más cerca del valor medio se encontrarán sus valores. Este aspecto es de vital
importancia para el estudio de múltiples sistemas. Entre las medidas de dispersión se tiene:
Pá gina 7
ESTADISTICA I
a) Rango o recorrido.- Es la medida más simple de dispersión. Es la diferencia entre el valor más grande y el
más pequeño de un conjunto de valores. Esta medida presenta problemas que la hacen poco apta para usos
estadísticos. Puede verse afectada por valores extremos, poco representativos. Además, esta medida al
aumentar el número de valores aumenta o se queda igual pero nunca disminuye.
R = Xmax – Xmin
Ejem.
Se quiere medir la variabilidad respecto a las notas de dos secciones, observando que en la seccion A las
notas varian de 10 a 16 puntos, mientras que en la sección B las notas varian de 12 a 16 puntos. ¿ En cual de
las secciones existe menor variabilidad en cuanto a las notas?
Solucion
X min = 10 X min = 12
RA = 16 – 10 = 6 RB = 16 – 12 = 4
b) Varianza (S2).-Es un estadístico de dispersión, que indica la variabilidad de los datos. Este valor tiene
unidades cuadráticas por consiguiente no puede ser interpretado.
- Varianza para datos no agrupados.- Su cálculo (para datos simples) se verifica según la fórmula:
2
2 ∑ ( x i− X́ )
S=
n−1
donde:
– Varianza para datos discretos.- Cuando se tiene datos discretos con sus respectivas frecuencias absolutas,
el cálculo de la varianza se realiza mediante la fórmula:
2
2 ∑ f i ( xi − X́ )
S=
n−1
xi: datos de la variable
Pá gina 8
ESTADISTICA I
- Varianza para datos agrupados .- Si los datos están agrupados, el cálculo de la varianza se realiza
mediante la fórmula:
2
2∑ f i ( X i− X́ )
S=
n−1
Esta medida logra describir adecuadamente la dispersión del conjunto de datos, pero tiene un inconveniente: su
resultado se expresa en unidades cuadradas, algo difícil de entender en la mayoría de las situaciones prácticas, y
por demás disonante en relación con la medida de tendencia central utilizada. Sería algo así como años
cuadrados, o pesos cuadrados.
c) Desviación Estándar.-Es la raíz cuadrada positiva de la varianza, cuya respuesta se da en las unidades
originales, es la medida de variación más utilizada en el mundo de las estadísticas. También conocida como
desviación típica, es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los
valores puntuales del promedio en una distribución. De hecho, específicamente, la desviación estándar es "el
promedio de la distancia de cada punto respecto del promedio". Su símbolo es S (por ser la raíz cuadrada de la
varianza).
Ejm.
1. Los siguientes datos corresponden al tiempo que 5 alumnos utilizan el internet para investigar cierto
tema, las horas utilizadas fueron: 2.3 3.1 2.9 1.3 2.6 horas. Halle la desviación
estándar.
X́ =
∑ xi = 12.2 = 2.44
n 5
Pá gina 9
ESTADISTICA I
Interpretación puntual: El tiempo promedio que utilizan 5 estudiantes para investigar es de 2.44 horas____
= [1.73; 3.15]
Interpretación Intervalar: _El tiempo que es utilizado para investigar por 5 estudiantes esta entre 1.73 horas
hasta 3.15 horas.__________
2. Los siguientes datos corresponden a la temperatura en 6 días registrado en la ciudad del Cusco, los
cuales fueron: 18°C, 17°C, 12 °C, 8 °C, 13 °C, 15°C. Halle la desviación estándar.
X́ =
∑ xi =¿13.83
n
2
∑ ( X i− X́ )
=13.36 Desviación estandar S =√ 13.36=3.65
2
S=
n−1
[ 10.18; 17.48]
Interpretación Intervalar: La temperatura registra en 5 dias en la ciudad del Cusco varía entre 10.18°C hasta
17.48°C___________________________________________________________ _________
d) Coeficiente de variación.- Este coeficiente sirve para comparar la dispersión entre dos o más conjuntos de
datos, y además la comparaciones da aun cuando las variables tienen diferentes unidades de medida. El
coeficiente de variación (CV), que expresa a la desviación típica como porcentaje de la media, se realiza
mediante:
Pá gina 10
ESTADISTICA I
Medidas de localización. - Son los valores que dividen a la distribución en 100, 10 y 4 partes iguales.
Q1 divide al 25%
nk
Q2 divide al 50% Qk=Li+ C (
4
−F i−1
fi )
Q3 divide al 75%
D1 divide al 10%
nk
D2 divide al 20% Dk=Li+ C (
10
−Fi −1
fi )
D9 divide al 90%
P1 divide al 1%
nk
P23 divide al 23% Pk=Li +C (
100
−Fi−1
fi )
P99 divide al 99%
Ejercicios
Pá gina 11
ESTADISTICA I
Media 42,2714
Mediana 43,0000
Moda 45,00
Desv. Desviación 7,77570
Varianza 60,461
Mínimo 26,00
Máximo 60,00
Percentiles 10 32,0000
20 36,0000
30 38,0000
40 39,0000
50 43,0000
60 44,6000
70 45,0000
80 48,0000
90 54,0000
Triglicéridos
Utilizando la base de datos Mundo 95. Sav, completar los espacios en blanco
Pá gina 13
ESTADISTICA I
Estadísticos
Mortalidad
infantil
(muertes por Tasa de
Esperanza Personas 1000 natalidad
Esperanza de de vida Alfabetizadas nacimientos Ingesta diaria (por 1.000
vida femenina masculina (%) vivos) de calorías habitantes)
N Válidos 109 109 107 109 75 109
Perdidos 0 0 2 0 34 0
Media 70.16 64.92 78.34 42.313 2753.83 25.923
Mediana 74.00 67.00 88.00 27.700 2653.00 25.000
Desv. típ. 10.572 9.273 22.883 38.0792 567.828 12.3609
Varianza 111.762 85.984 523.640 1450.027 322428.334 152.792
Asimetría -1.109 -1.080 -.994 1.090 .170 .446
Error típ. de asimetría .231 .231 .234 .231 .277 .231
Curtosis .213 .336 -.160 .365 -1.207 -1.147
Error típ. de curtosis .459 .459 .463 .459 .548 .459
Mínimo 43 41 18 4.0 1667 10.0
Máximo 82 76 100 168.0 3825 53.0
Percentiles 25 66.50 61.00 62.00 9.250 2247.00 14.000
50 74.00 67.00 88.00 27.700 2653.00 25.000
75 78.00 72.50 98.00 64.500 3236.00 35.000
En la tabla se observa que la esperanza de vida femenina promedio es de 70.16 años; mientras que en los
varones es de 64.92 ±9.27 años, se registró un mínimo del 18% de personas alfabetizadas y un máximo del
100% de alfabetizados; Menos del 25% de la mortalidad infantil es de 9.250 muertes por 1000 nacimientos
vivos, el 50% tiene una indigesta diaria de 2653 calorías.
Gráficos: Histograma
20
20
15
15
Frecuencia
Frecuencia
10 10
5 5
a) Analizar las variables salario actual, salario inicial , meses de contrato y experiencia previa
Estadísticos
Meses desde el Experiencia
Salario actual Salario inicial contrato previa (meses)
N Válido 474 474 474 474
Perdidos 0 0 0 0
Media $34,419.57 $17,016.09 81,11 95,86
Mediana $28,875.00 $15,000.00 81,00 55,00
a
Moda $30,750 $15,000 81 0
Desv. Desviación $17,075.661 $7,870.638 10,061 104,586
Pá gina 14
ESTADISTICA I
En la tabla se observa que el salario actual promedio es de $_34.419.57_; el 50% de los trabajadores recibieron
un salario inicial de $_15,000__, frecuentemente se contrataron __81____ meses, La experiencia previa de los
trabajadores en promedio fue de _95.86__ meses, con una desviación de _104.586__meses. El 80% de los
mínima previa fue de __0__meses y un máximo de __476____meses; al 50% de los trabajadores los contrataron
__81__meses.
Pá gina 15