Está en la página 1de 122

UTP

ESTADÍSTICA Y PROBABILIDADES

DOCENTE:
M. Sc. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

DEFINICIÓN:

Es la ciencia fundamentada en la Matemáticas que nos


proporciona un conjunto de métodos que se utilizan para
recolectar, resumir, clasificar, analizar e interpretar el
comportamiento de los datos con respecto a una característica
materia de estudio o investigación.

Con el único propósito de que sirva como punto de apoyo en la


toma de decisiones

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

OBJETIVOS DE LA ESTADÍSTICA
• Descripción

• Análisis

• Predicción

RAMAS DE LA ESTADÍSTICA
Estadística Descriptiva

Es el conjunto de métodos que implican la recolección,


presentación y caracterización de un conjunto de datos a fin de
describir en forma apropiada las diversas características de esta.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Estadística Inferencial

Es el conjunto de métodos o técnicas que posibilitan la


generalización o toma de las decisiones en base a una formación
parcial obtenida mediante técnica descriptiva.

POBLACIÓN
Es un conjunto de elementos (que consiste de personas,
animales, objetos, etc.) que contienen una o más características
en común, observables que se puedan medir.

Ejemplo: En un estudio sobre el Nivel Económico y Rendimiento


Académico de los estudiantes de una Universidad Nacional. La
población en estudio está conformada por los estudiantes de esa
Universidad Nacional.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

TIPOS DE POBLACIÓN

Por el número de elementos que la componen se clasifica en:


Población Finita.- Una población es aquella que tiene un
número limitado de elementos. Por ejemplo: Las edades de los
alumnos de la escuela de Ing. Civil dela UCV en el semestre
2009-II.
El tamaño de la población finita se simboliza por “N”.

Población Infinita.- Una población infinita es aquella que no


tiene límite o cuota. Por ejemplo: la población de personas
infectadas con VIH.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

MUESTRA
Es una parte o pequeña porción representativa y adecuada de la
población. Representativa en el sentido de reflejar fielmente las
características de la población de la cual procede y defiere de ella
sólo en el tamaño. Adecuada, quiere decir que debe incluir un
número óptimo y mínimo de elementos de la población. Este
número óptimo se determina mediante el empleo de las fórmulas
del muestreo. El tamaño de una muestra se simboliza “n”.

UNIDAD DE ANÁLISIS
Es todo elemento Indivisible que conforma la población, pudiendo
ser: aulas, carpetas, animales, instituciones, personas, etc.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

PARÁMETRO
Es una medida resumen que describe una característica de toda la
población.

Los parámetros más usados son:

• La Media Poblacional =  (que se lee mu)

• Desviación Estándar Poblacional =  (que se lee sigma)

• Varianza Poblacional 2 = (que se lee sigma al cuadrado)

• Proporción Poblacional = P (que se lee pe)

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

ESTADíGRAFO

Es una medida resumen que describe una característica de la


muestra.
_
La media de una muestra = X
Desviación estándar de una muestra = S

Varianza de una muestra = S2

Proporción de una muestra = P

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

VARIABLE

Es una característica definida en la población, que puede tomar


dos o más valores (que pueden ser cualidades o números). Las
variables se clasifican según su:

Naturaleza

Es una característica definida en la población, que puede tomar


dos o más valores (que pueden ser cualidades o números).

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Variable Cualitativa
Es aquella característica cuyos valores o respuestas son
cualidades o atributos. Por ejemplo: Sexo, Estado Civil, Lugar de
Procedencia, Nivel Económico, Tipo de Inflación, etc.

Variable Cuantitativa
Es aquella característica cuyos valores resultan de la operación de
contar o de medir. Como por ejemplo: Número de Hijos, Peso en
Kg. , Talla en cm, etc.

Variable Cuantitativa Discreta


Es aquella característica cuyos valores resultan de la
operación de contar y están expresados en los NÚMEROS
NATURALES (N).
Por ejemplo: número de hermanos, N° de hijos, N° de veces
que postula a la universidad, etc.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Variable Cuantitativa Continua

Es aquella característica cuyos valores o respuestas son


cantidades que resultan de la operación de medir y sus
valores están expresados por los números reales “ R”.
Por ejemplo: Ingreso Mensual, Talla en cm., temperatura,
etc.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

DATO

Es la respuesta que adquiere la característica de estudio en cada


unidad de análisis.

Por ejemplo: Si se le pregunta por su edad en años a un alumno


de la escuela de Ing. De Sistemas de la USAT y su respuesta es
21 años (dato).

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Escala de Medición
Escala de medición Tipo de variable Ejemplos
Variable cualitativa Sexo, estado civil,
Escala Nominal lugar de procedencia,
etc.
Variable cualitativa Grado de instrucción,
Escala Ordinal orden de mérito, etc.
Variable cuantitativa Temperatura, presión,
Escala de Intervalo continua de origen coeficiente intelectual,
convencional. puntuaciones del nivel
de estrés, etc.
Variable cuantitativa Edad en años, peso
Escala de razón de origen natural. en kg, ingresos
mensual en soles,
número de hijos, etc.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

LABORATORIO Nº 01

1. Las variables cuantitativas pueden ser


___________________ o ___________________

2. ____________________, es el conjunto de elementos que


contienen una o más características en común, observables y
que se pueden medir.

3. Una muestra __________, quiere decir que debe incluir un número


óptimo y mínimo de elementos de la población.

4. _____________, Es una característica definida en la población, que


puede tomar dos o más valores (que pueden ser cualidades o números).

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

5. En las siguiente lista de variables, indicar a qué clase


corresponde cada una según su naturaleza y escala de
medición.

a. Precio en soles.
b. Nº niveles de una vivienda.

c. Tipo de Crédito Bancario.

d. Material de construcción.

e. Número de acciones.

f. Tipo de suelo.

g. Coeficiente intelectual.

h. La calificación en la escala de 0 a 20 en la primera práctica calificada

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

6. Indique el tipo de Población según el número de elementos


que la conforman, unidad de análisis, variable según la
naturaleza del dato, escala de medición de la variable que
corresponda

a. Nº de personas por metro cuadrado en la ciudad de


Lambayeque. Año 2010.
b. Tipo de financiamiento de las empresas constructoras en el
departamento de Lambayeque.

c. Ingreso mensual familiar de los alumnos de la Especialidad de


Ing. Civil de la UCV, matriculados el ciclo 2010-I.

d. Gasto mensual en alimentación de las familias del cercado de


Chiclayo.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

RECOPILACIÓN DE DATOS

TÉCNICAS DE RECOLECCIÓN DE DATOS

- La observación.

- La experimentación.

- La encuesta.

- La entrevista.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

DISTRIBUCIÓN DE FRECUENCIAS

Después de la recopilación de los datos, es necesario


resumirlos y presentarlos en forma tal, que faciliten su
comprensión y su posterior análisis y utilización, para ello se
ordenan en cuadros y luego se representan en gráfico.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

TODO CUADRO ESTADÍSTICO DEBE TENER

1. Número.- Es el código de Identificación del cuadro. Este


número se escribe a continuación de la palabra “cuadro”. Por
ejemplo cuadro N° 1.3 indica el tercer cuadro del capítulo uno.

2. Título.- Expresa en forma completa y concisa el contenido del


cuadro.

Ejemplo: Lugar de procedencia por Dpto. de los Estudiantes de


Ing. Civil-UCV- Chiclayo 2007.

3. Encabezamiento.- Es la primera fila del cuadro, en el se explica


las categorías y el objeto de cada una de las columnas, es decir
indica la naturaleza de los datos inscritos en cada celda que se
hallan debajo.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA Y PROBABILIDADES

4.Columna Principal o Matriz.- Es aquella en que se anotan las


categorías o las diferentes clases de la escala de clasificación
utilizada.

5. Cuerpo.- Es el contenido numérico del cuadro.

6. Notas Explicativas o Calle.- Se agregan debajo del cuerpo del


cuadro cuando es necesario algunas observaciones sobre
alguna columna o hilera del mismo.

7. Fuente.- Sirve para nombrar la entidad responsable de donde


se obtuvieron los datos.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

ERRORES EN LA PRESENTACIÓN DE CUADROS

- Disposición incorrecta de los datos.

- Títulos y encabezamientos incompletos e inadecuados.

- Cuadros que representan solamente porcentajes.

- Cuadro sobrecargado.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Distribución Unidimensional de Frecuencias


Variable Cualitativa
Cuadro N°
Título
Variable ni hi hi %
cualitativa
C1 n1 h1 h1 * 100
C2 n2 h2 h2 * 100
. . . .
. . . .
. . . .
Cm nm hm hm x 100
TOTAL n 1.00 100
Fuente:
ni = Frecuencia absoluta simple ni
hi = Frecuencia relativa simple = n
ni
hi % = Frecuencia relativa simple porcentual = *100
n
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

GRAFICAS DE VARIABLE CUALITATIVA

- Barras.- Son barras rectangulares vertical u horizontal, cuya


altura (o largo) es proporcional a su frecuencia.

- Sectores Circulares.- Los datos de cada categoría se


representan por un sector circular cuyo ángulo en el centro es
igual a hi * 360°.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo:

Los datos que se dan a continuación corresponden al lugar de


procedencia por departamento en muestra de 20 Estudiantes del IV ciclo
de la Escuela de Ing. Civil de una Universidad privada, matriculados
en el semestre académico 2008-I.

Lambayeque Cajamarca Lambayeque Cajamarca Lambayeque


Amazonas Cajamarca Lambayeque Amazonas Lambayeque
Amazonas Amazonas Piura Lambayeque Lambayeque
Cajamarca Piura Amazonas Lambayeque Piura
Con los datos construya un cuadro estadístico y grafique la
distribución.

SOLUCIÓN:

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Cuadro N° 01

Lugar de procedencia por departamento de los alumnos del IV


ciclo de la Escuela de Ing. Civil de una Universidad privada,
matriculados en el semestre académico 2008-I.

Lugar de procedencia por ni hi hi %


departamento
Lambayeque 8 0.40 40
Amazonas 5 0.25 25
Cajamarca 4 0.20 20
Piura 3 0.15 15
TOTAL 20 1.00 100

FUENTE: Archivos de Dirección de Escuela de la UPSP.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Gráfico de Barras:

GRAFICO N° 01
LUGAR DE PROCEDENCIA

10
8
6
ni

4
2
0
Lambayeque Amazonas Cajamarca Piura

FUENTE: Cuadro N° 01

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Gráfico de Sectores Circulares :

GRAFICO N° 02 LUGAR DE
PROCEDENCIA

Lambayeque
Amazonas
Cajamarca
Piura

FUENTE: Cuadro N° 01

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA Y PROBABILIDADES

DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE


CUANTITATIVA DISCRETA

Sean x1, x2, …, xn un conjunto de “n” observaciones discretas y


sean y1, y2, …, ym el conjunto de valores diferentes que toman los
datos originales (m  n).
Variable cuantitativa ni Ni hi Hi hi % Hi %
discreta
y1 n1 N1 h1 H1 h1 * 100 H1 * 100
y2 n2 N2 h2 H2 h2 * 100 H2 * 100
. . . . . . .
. . . . . . .
. . . . . . .
ym nm Nm Hm Hm hm * 100 Hm * 100
TOTAL n - 1.00 - 100 -

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

ni = Frecuencia absoluta simple.

Ni = Frecuencia absoluta acumulada

hi = Frecuencia relativa simple

Hi = Frecuencia relativa acumulada

hi % = Frecuencia relativa simple porcentual

Hi % = Frecuencia relativa acumulada porcentual.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

GRAFICAS DE VARIABLE CUANTITATIVA DISCRETA

- Barras.

- Bastones .

Ejemplo:

Se registró el número de hijos de 15 Trabajadores de construcción


civil de la ciudad de Chiclayo. Referidas al 20/02/2008.

2 1 3 3 2

1 5 4 5 3

3 3 2 3 4

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Con los datos construya un cuadro estadístico. Grafique la


distribución.
CUADRO N°___:
TÍTULO:______________________

N° hernanos ni Ni hi Hi hi % Hi %

TOTAL -----

Fuente : _______________________________

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE CUANTITATIVA


CONTINUA

Sean x1, x2, …, xn un conjunto de datos de tipo continuo.

El cuadro estadístico tiene la siguiente forma.


Variable cuantitativa Yi ni Ni hi Hi hi % Hi %
continua

y 0´  y1´ y1 n1 N1 h1 H1 h1 * 100 H1 * 100


y1´  y 2´ y2 n2 N2 h2 H2 h2 * 100 H2 * 100
. . . . . . . .
. . . . . . . .
. . . . . . . .
y m´ 1  y m´ ym Nm Nm Hm Hm hm * 100 Hm *
100
TOTAL - n - 1.00 - 100 -

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

y ´j 1  y ´j
y1 = Marca de clase = 2

ni = Frecuencia absoluta simple


i
Ni = Frecuencia absoluta acumulada  ni
i 1

hi = Frecuencia relativa simple ni


n
i
Hi = Frecuencia relativa acumulada  hi
i 1

hi % = Frecuencia relativa porcentual

Hi % = Frecuencia relativa acumulada porcentual

Se utilizará intervalos del tipo  y  y , el número de intervalos que


´
i 1
´
i

debe tener un cuadro estadístico no debe ser menor a 4 ni mayor a


15.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Construcción de los intervalos de clase

• Rango = xmax – xmin = R

• Número de intervalos = 1 + 3.3 (log n )= N.I

• Amplitud de clase = Rango / Número de intervalos

• Rango modificado = R’ = amplitud de clase por número de


intervalos.

• R’ – R >= 0

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

GRAFICAS DE LA DISTRIBUCIÓN POR INTERVALOS

HISTOGRAMA.- Es una gráfica de barras rectangulares juntas. La


base de cada barra es proporcional a la amplitud del intervalo, y la
altura es proporcional a su frecuencia (absoluta o relativa o
porcentual).

POLIGONO DE FRECUENCIAS.- Es una gráfica poligonal cerrada,


que se obtiene uniendo con segmentos de recta, los puntos que
tienen proporcionalmente como abscisa a la marca de clase y
como ordenada a la frecuencia respectiva. Se cierra en ambos
extremos en las marcas de clase adyacentes de frecuencia cero.

OJIVAS.- Son polígonos de frecuencias acumuladas, existen dos


tipos de ojivas: ojiva menor que y ojiva mayor igual que.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Ejemplo: Un experto en computadoras, tratando de optimizar la operación


de un sistema, reunió datos sobre el tiempo, en microsegundos, entre las
solicitudes de servicio de un proceso especial.

25645 35940 56213 42600 42562 37500 78811


12802 42830 46789 41300 43870 38900 49658
42520 37800 22620 40900 38236 40230 52368
39820 15623 58654 30456 37850 42700 50234
42003 39850 65382 28900 5635 36924 55346
20563 43200 1583 44210 35680 35480 11564
42570 44125 68973 43290 39682 34963 62108
37560 34251 27600 39540 43568 39247 64752
43580 40653 44258 38900 44258

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Con los datos construya:

- Un cuadro estadístico completo.


- Un histograma y un polígono de frecuencias simples
-Ojiva menor que y ojiva mayor igual

Solución:
Para elaborar el Cuadro estadístico primero construimos los intervalos de
clase semi abiertos.

1. Rango = Xmáx – Xmin = 78811-1583 = 77228


2. Número de intervalos = 1 + 3.3 (log 60) = 7
3. AC = 77228 / 7 = 11032.6 =11033
4. R’ = AI * NI = 11033*7 = 77231
5. R’ – R = 77231 – 77228 = 3 (como el valor es impar se divide en dos
partes distintas muy cercanas que sean igual a 3, por ejemplo 1 y 2; restar
el menor valor a Xmin. = 1583 y el mayor valor sumarle a Xmax. = 78811).

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Cuadro N° 03
Tiempo en microsegundos

Tiempo en
microsegundos yi ni Ni hi Hi hi % Hi %
 1582-12615 7098.5 3 3 0.05 0.05 5,0 5,0
12615-23648 18131.5 4 7 0.07 0.12 7.0 12.0
23648-34681 29164.5 5 12 0.08 20.0 8,0 20,0
34681-45714 40197.5 36 48 0.60 80.0 60,0 80,0
45714-56747 51230.5 6 54 0.10 90.0 10,0 90,0
56747-67780 62263.5 4 58 0.07 97.00 7.0 97.0
67780-78813 73296.5 2 60 0.03 100.0 3,0 100,0
Total 60 --- 1 --- 100,0 -----
Fuente: Área de informática y Sistemas de la Empresa MC.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Gráfico N° 04
Tiempo en microsegundos
40

30

20

10

0
1582-12615 12615-23648 23648-34681 34681-45714 45714-56747 56747-67780 67780-78813

Tiempo

Fuente: Cuadro Nº03


Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Gráfico N° 05

Fuente: Cuadro Nº03

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Se elabora la siguiente tabla para que sirva como ayuda para la ojiva “menor que

Tiempo en ni Ni
microsegundos
Menor que 12615 3 3
Menor que 23648 4 7
Menor que 34681 5 12
Menor que 45714 36 48
Menor que 56747 6 54
Menor que 67780 4 58
Menor igual que 78813 2 60
Total 60 ---

En el eje Y colocamos los valores de la frecuencia acumuladas y en el eje X


colocamos los límites superiores de cada intervalo.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Gráfico N° 06
Tiempo en microsegundos
60

50
Frecuencia absoluta acumulada

40

30

20

10

1582-12615 12615-23648 23648-34681 34681-45714 45714-56747 56747-67780 67780-78813


Tiempo

Fuente: Cuadro Nº03


Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Ojiva “Mayor igual que”

Tiempo en ni Ni *
microsegundos
Mayor igual que 1582 3 60
Mayor igual que 12615 4 57
Mayor igual que 23648 5 53
Mayor igual que 34681 36 48
Mayor igual que 45714 6 12
Mayor igual que 56747 4 6
Mayor igual que 67780 2 2
Total 60 ---

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Gráfico N° 07
Tiempo en microsegundos
70
60
50
40
30
20
10
0
[ 1582- [12615- [23648- [34681- [45714- [56747- [67780-
12615> 23648> 34681> 45714> 56747> 67780> 78813]
Fuente: Cuadro Nº03

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

MEDIDAS DE POSICIÓN:

- Centralización.

- Localización

Medidas de Posición
Son aquellas que describen la posición que ocupa la
distribución de frecuencia respecto a un valor de la variable.
Se distinguen dos tipos: Las medidas de tendencia central y
medidas de localización.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Medidas de centralización
Se llaman así porque sus valores tienden a ocupar
posiciones centrales o intermedias entre el menor y mayor
valor del conjunto de datos, a partir de la cual se calculan
estas medidas. Las medidas de tendencia central más
usadas son la medida aritmética, la medida geométrica,
medida armónica, medida ponderada mediana.

La Media Aritmética (Media o Promedio)


Es el estadígrafo de posición más importante, se define y
calcula dividiendo la suma de los valores de la variable
entre en número de observaciones o valores. Puede
calcularse cuando los datos están tabulados o no tabulados.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Cálculo de la Media para los datos NO TABULADOS: La Media


que se obtiene a partir de “n” datos originales Xi se denomina
MEDIA ARITMETICA SIMPLE, se le denota X por y se obtiene
mediante la siguiente fórmula: n

X1  X2  X3  .....  Xn X i
X  i 1

n n
Ejemplo: Los ingresos mensuales en $ de 5 Trabajadores de
una Empresa maderera son: 320, 390, 330, 400, 372. Calcular
el ingreso medio de la muestra.

Solución:
X : Ingreso mensual en $.

X1 = 320, X2 = 390, X3 = 330, X4 = 400, X5 = 372

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Interpretación :

El Ingreso mensual promedio o el ingreso mensual medio de

los Trabajadores de la Empresa maderera es 362,4 $.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Cálculo de la Media para datos TABULADOS:

La media obtenida a partir de los datos agrupados en tablas de


frecuencia (con o si intervalos), definida como:

Y * n i i
Y  i 1
n
Ejemplo: Calcular e interpretar la media aritmética de los
datos agrupados en la siguiente tabla de distribución de
frecuencias: Número de trabajadores por posta médica.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Nº de Nº de Postas
Trabajadores ni Yi ni
Yi
Y1 = 2 n1 = 1 Y1 n1 = 2
Y2 = 3 n2 = 3 Y2 n2 = 9
Y3 = 4 n3 = 7 Y3 n3 = 28
Y4 = 5 n4 = 6 Y4 n4 = 30
Y5 = 6 n5 = 3 Y5 n5 = 18
TOTAL n = 20 87
m

Y * n i i
87
Y  i 1
  4.35 Trabajadores por posta médica.
n 20
Como es variable discreta se puede interpretar como 4
trabajadores.
Interpretación : Se espera que cada posta médica tenga 4
trabajadores en promedio.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

PROPIEDADES DE LA MEDIA ARITMETICA:


Propiedad 1: Si todos los valores observados X1, X2, X3, ……., Xn
son iguales a “b” ( “b” es una constante ), entonces:
n

b b  b  b  .....  b nb
X 
i 1
 b
n n n

Propiedad 2: La Media del producto de una constante por una


variable es igual al producto de la constante por la media de la
variable.
n

Si, Yi  aXi ; entonces  aX i


y i 1
 ax
n

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Propiedad 3: La Media de la suma de dos o más variables, es igual a


la suma de las medias de cada una de dichas variables.

x  y  x  y

Propiedad 4: La media de una variable más una constante, es igual a


la media de la variable más la constante.
Si, Yi  Xi  b ; entonces y  x  b

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Media Geométrica

Puede calcular a partir de datos:

MG =
n x1  x 2  x 3  ....  x n

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

DatosTabulados

 m 
  ni log y i 
x  anti log  i 1 
 n 

 

La medida geométrica se utiliza para promediar razones (a/b),


índices a/b en %), proporciones (a/a+b), tasas de cambio (a-b)/b,
que varían con el tiempo, entre otros.

Ejemplos:

1.Un ahorro de $100.00 dólares acumula intereses variables


de 3%, 5%, 8%, durante 3 años, calcular:

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

a)La tasa de crecimiento del ahorro por año.

b)La tasa promedio del crecimiento del ahorro en los tres años.

Solución:

a)
Tasas Año Ahorro

1 – 03 1 100 + (0.03) (100) = 103


1 – 05 2 103 + (0.05) (103) = 108.15
1 - 08 3 108.15 + (0.08) (108.15) = 116.802
b)
MG =
3
1.03  1.0815  1.16802  1.05313

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

2. Suponga que la población de una ciudad aumentó de 10000


a 12600 en el periodo de 1980 a 1984 como se indica en el
siguiente cuadro:

Año Población Tasas de cambio Log. (x)


(x) (año base 1980)
1980 10 000 1.050 0.0212
1981 10 500 1.067 0.0282
1982 11 200 1.071 0.0298
1983 12 000 1.050 0.0212
1984 12 600
TOTAL 0.1004

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

SOLUCIÓN:

   log(x1 )  log(x 2 )  ...  log(xn )


Log.  x   
  n

0.1004
  0.0251
4

 x  anti log(0.0251) 1.0595

Luego, la tasa promedio de crecimiento es de 5.95 % por año.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Media Armónica

La media armónica de n valores no nulos x1, x2, … xn es el número,


xh que se define como el recíproco de la media aritmética de los
recíprocos de esos n valores.
 n
Esto es: xH  n
1
 i 1 x1
La media armónica se utiliza para obtener promedios de valores
que están en relación inversa como la velocidad y el tiempo:

NOTA: La media armónica esta a su vez menor que la media


geométrica, esta a su vez menor que la media aritmética. Esto es:
  
xH  x  x

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo:

Tres secretarias escriben 40, 50 y 80 palabras por minuto, si


cada una de ellas escribe un mismo texto, calcule la velocidad
media.
 3 3
xH  
1 1 1 0.025  0.02  0.0125
 
40 50 80

3
  52.17
0.0575

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Media Ponderada

El promedio ponderado permite calcular un promedio que toma en


cuenta la importancia o el peso que tiene cada valor sobre el total.
n

 x w i i
xw  i 1
n

w
i 1
i

Donde:
Xw = Símbolo para la media ponderada.

Xi = Valores de las observaciones individuales.

Wi = Peso asignado a cada observación.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo:
Encontrar el promedio obtenido por alumno de Ingeniería de
Sistemas de la UDCH en el ciclo 2005-I.

Curso Créditos Promedio


Wi X1
• Estadística y probabilidades. 3 12
• Álgebra 4 11
• Teoría de Sistemas 4 14
• Base de Datos 4 13
• Administración 2 15
TOTAL 17

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Promedio ponderado obtenido por el alumno en el ciclo 2005-I.

 1213   11 4   14  4   13  4   15  2


xw 
17
 36  44  56  52  30 218
xw  
17 17


x w  12.8235

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

La Mediana (Me)

La mediana de un conjunto de n determinaciones X1, X2, X3, …, Xn,


es el número de en medio cuando las determinaciones se acomodan
en orden ascendente(o descendente) separando a la distribución en
dos partes iguales.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Cálculo de la Mediana para datos no tabulados.

Denotemos por xi el i-ésimo valor de X cuando la muestra de tamaño n se acomoda


en orden ascendente.

Por ejemplo se tiene un conjunto de datos: 5, 4, 6, 3, 7

Calcular la mediana.

Para calcular la mediana se ordenan los datos en forma ascendente o en forma


descendente, si el número total de datos (n) es impar la mediana sería el valor
ubicado en el centro.
3, 4, 5, 6, 7

En este caso la mediana es igual a Me = 5

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Por ejemplo si se tiene un número par de datos:

9, 7, 10, 8

Ordenamos los datos:


7, 8, 9, 10

Luego la mediana sería

Me = (8 + 9) / 2 = 8.5

Lic. Carlos Daniel Gonzales Hidalgo


n
2ESTADÍSTICA

Cálculo de la mediana para datos Tabulados de una


variable cuantitativa discreta

1. Calcular n / 2

2. Verificar si el valor de n / 2 aparece o no como frecuencia absoluta


acumulada.

i. Si n / 2 aparece como frecuencia absoluta acumulada entonces,

N j-1 <= n / 2 < N j

La mediana es igual al valor de la variable al cuál está referido Nj-1 más el valor
de la variable al cuál está referida Nj dividido por dos.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

ii. Si no aparece como frecuencia absoluta acumulada entonces,

N j-1 < n / 2 < N j

La mediana es igual al valor de la variable al cuál está referida N j.

Ejemplo:

Calcular la mediana de la Tabla 3. que corresponde a la


distribución de 20 postas médicas según el número de
trabajadores.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Solución:

TABLA Nº 3

Nº de
Trabajadores ni Ni
Yi
Y1 = 2 n1 = 1 N1 = 1
Nj-1
Y2 = 3 n2 = 3 N2 = 4
n/2 =10
Y3 = 4 n3 = 7 N3 = 11 Nj

Y4 = 5 n4 = 6 N4 = 17

Y5 = 6 n5 = 3 N5 = 20

TOTAL n = 20
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Aquí, n = 20; luego n/2 = 20/2 = 10


Luego la frecuencia absoluta acumulada inmediata superior a 10 es
N3 = 11; entonces:
j=3 Nj = N3 = 11
j-1 = 2 Nj-1 = N2 = 4
Entonces
La mediana es Y3 (el valor al cuál está referido Nj )

Me = Yj = Y3 = 4
Me = 4
Interpretación: El 50 % de las postas médicas tienen 4 o menos
trabajadores, y el otro 50% de las postas tienen más de 4
trabajadores.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Variable Continua:
La mediana se calcula como sigue:

 n 

 2 N j 1 
Me  Y ' j 1  C  

 N j N j 1 
 
Donde :
I.Me = Intervalo Mediano al cuál está referido Nj
Nj = Frecuencia Absoluta Acumulada inmediata superior a n/2
Nj-1 = Frecuencia Absoluta Acumulada inmediata inferior a n/2
n = Número de observaciones.
Y 'j1 = Límite inferior del intervalo Mediano (I.Me)
C = Amplitud del I.Me.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo: Calcular la mediana de la siguiente tabla que


corresponde a la distribución de 50 pacientes según su edad.

Edad Nº de
(años) Pacientes Ni
[ Li - Ls ) ni
26 – 35 n1 = 2 N1 = 2

35 – 44 n2 = 6 N2 = 8

44 – 53 n3 = 5 N3 = 13 Nj-1
I.Me 53 – 62 n4 = 15 N4 = 28
Nj
Li
62 – 71 n5 = 14 N5 = 42

71 – 80 n6 = 5 N6 = 47

80 – 89 n7 = 3 N7 = 50

TOTAL n = 50

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Aquí n = 50 ; luego n/2 = 50/2 = 25

Luego Nj (Frecuencia absoluta acumulada inmediata superior a


n/2) es : N4 = 28, entonces
j = 4 ……………. Nj = N4 = 28
j-1 = 3 ……………. Nj-1 = N3 = 13
Como n/2 > Nj-1, es decir 25 > 13, entonces:
 n 

 2 N j 1 
Me  Y ' j 1  C  

 N j N j 1 
 

 50  13 
Me  53  9  2 
 28  13 
 

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Me  53  9 12   53  7.2  60.2


 15 

Me = 60.2 años

Interpretación :

El 50 % de los pacientes atendidos por emergencia en el Hospital


Docente Las Mercedes de Chiclayo tienen menos de 60.2 años de
edad, el otro 50% de pacientes superan esta edad.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Estadígrafos de localización

Señalan la localización de los valores más frecuentes o


de valores extremos. Los más usados son:
los Cuartiles, los Deciles, los Percentiles, la Moda.

LOS CUARTILES (Qr)


Los cuartiles son estadígrafos que dividen al total de las
observaciones, debidamente ordenadas, en cuatro
partes iguales. Estas medidas son: El Primer cuartil Q1 ,
el segundo cuartil Q2 , y el tercer cuartil Q3.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Utilizaremos los cuartiles solamente para datos agrupados en


intervalos de clase. Las fórmulas para la determinación de los Q1 ,
Q2 , Q3 son semejantes a la usada para el cálculo de la mediana.

 rn 
 4  N j 1 
Q  Y ' j 1  C  
 N j  N j 1 
r

 

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Donde :
I.Qr = Intervalo que contiene al cuartil, r.
Nj = Frecuencia Absoluta Acumulada inmediata superior a
rn/4
Nj-1 = Frecuencia Absoluta Acumulada inmediata inferior a rn/4
n = Número de observaciones.
Y' j1 = Límite inferior del intervalo que contiene al cuartil r.
C = Amplitud del intervalo cuartil.

Ejemplo: Calcular los cuartiles de la tabla 3 que corresponde a la


distribución de 50 pacientes según su edad.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA BÀSICA

a) Determinación de Q1:

TABLA Nº 3

Edad (años) Nº de
[ Li - Ls ) Pacientes Ni
Ni
26 – 35 n1 = 2 N1 = 2

35 – 44 n2 = 6 N2 = 8
I.Q1
44 – 53 n3 = 5 N3 = 13
Li
53 – 62 n4 = 15 N4 = 28

62 – 71 n5 = 14 N5 = 42

71 – 80 n6 = 5 N6 = 47

80 – 89 n7 = 3 N7 = 50

TOTAL n = 50
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Como n = 50 , r = 1, Entonces rn/4 = 1x 50 /4 = 12.5


Luego Nj = N3 = 13,
j = 3 ……….. Nj = N3 = 13,
j-1 = 2……….. Nj-1 = N2 = 8

 rn 

 4 N j 1 
Q  Y ' j 1  C  
 N j  N j 1 
r

 

 12.5  8 
Q1  44  9  
 13  8 

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA BÀSICA

 4.5 
Q1  44  9    44  8.1  52.1
 5 

Q1  52.1

Interpretación:

El 25 % de los pacientes atendidos por emergencia en el Hospital


Docente Las Mercedes de Chiclayo tienen menos de 52.1 años de
edad, el otro 75% de pacientes superan esta edad.

Determinación de Q2.
Q2 = Me = 60.2 años

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Determinación de Q3.

TABLA Nº 3

Edad (años) Nº de
[ Li - Ls ) Pacientes Ni
Ni
26 – 35 n1 = 2 N1 = 2

35 – 44 n2 = 6 N2 = 8

44 – 53 n3 = 5 N3 = 13

53 – 62 n4 = 15 N4 = 28

I.Q3 62 – 71 n5 = 14 N5 = 42
Li
71 – 80 n6 = 5 N6 = 47

80 – 89 n7 = 3 N7 = 50

TOTAL n = 50
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Como n = 50 , r = 3, Entonces rn/4 = 350/4 = 37.5


Luego Nj = N5 = 42,
j = 5 ……………. Nj = N5 = 42
j-1 = 4 ……………. Nj-1 = N4 = 28

 rn 

 4 N j 1 
Q  Y ' j 1  C  
 N j  N j 1 
r

 

 37.5  28 
Q3  62  9  
 42  28 

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

 9.5 
Q3  62  9    62  6.1071  68.1
 14 

Q1  68.1

Interpretación:

El 75 % de los pacientes atendidos por emergencia en el Hospital


Docente Las Mercedes de Chiclayo tienen menos de 68.1 años de
edad, el otro 25% de pacientes superan esta edad.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

DECILES (Dr)

Los deciles son estadígrafos que dividen al total de las


observaciones, debidamente ordenados, en 10 partes
iguales.

 rn 
 10  N j 1 
D  Y ' j 1  C  
r
N j  N j 1 

 

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Donde :
I.Dr = Intervalo que contiene al decil r.
Nj = Frecuencia Absoluta Acumulada inmediata superior a
r n / 10
Nj-1 = Frecuencia Absoluta Acumulada inmediata inferior a
r n / 10
n = Número de observaciones.
Y' j1 = Límite inferior del intervalo que contiene al decil r
C = Amplitud del intervalo que contiene al decil r.

Ejemplo: Calcular el primer decil y el noveno decil de la tabla 3


que corresponde a la distribución de 50 pacientes según su edad.
Solución:
Determinación de D1:
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

TABLA Nº 3:
Edad (años) Nº de
[ Li - Ls ) Pacientes Ni
ni
26 – 35 n1 = 2 N1 = 2

35 – 44 n2 = 6 N2 = 8

44 – 53 n3 = 5 N3 = 13

53 – 62 n4 = 15 N4 = 28

62 – 71 n5 = 14 N5 = 42

I.D9 71 – 80 n6 = 5 N6 = 47

Li 80 – 89 n7 = 3 N7 = 50

TOTAL n = 50

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Aquí: n =50 , r = 9, luego rn/10 = 950/10 = 45


Entonces Nj = N6 = 47
Aquí : j = 6 …………… Nj = N6 = 47
j-1 = 5 …………………………. Nj-1 = N5 = 42
 rn 
  N j 1 
D  Y ' j 1  C  10 
r

 N j N j 1 

 

 45  42  3 
D9  71  9    71  9    71  5.4
 47  42  5 

D9  76.4 años

Interpretación: El 90 % de los pacientes atendidos por


emergencia en el Hospital Docente Las Mercedes de Chiclayo
tienen menos de 76.4 años de edad, el otro 10% de pacientes
superan esta edad.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

LOS PERCENTILES (Pr)

Los percentiles son estadígrafos que dividen al total de las


observaciones, debidamente ordenados, en 100 partes iguales.
Se denota por: Pr , r = 1,2,3, …, 99.

 rn 

 100 N j 1 
Pr  Y ' j 1  C   
 N j N j 1 
 

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Donde :

I.Pr = Intervalo que contiene el Percentil r.


Nj = Frecuencia Absoluta Acumulada inmediata superior a
r n / 100
Nj-1 = Frecuencia Absoluta Acumulada inmediata inferior a
r n / 100
n = Número de observaciones.
Y' j1 = Límite inferior del intervalo que contiene al Percentil r
C = Amplitud del I.Pr.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo: Calcular el Percentil 70 de la tabla 3 que corresponde a


la distribución de 50 pacientes según su edad.
Solución:
Determinación del P70:

TABLA Nº 3:

Edad (años) Nº de
[ Li - Ls ) Pacientes Ni
Ni
26 - 35 n1 = 2 N1 = 2
35 - 44 n2 = 6 N2 = 8
44 - 53 n3 = 5 N3 = 13
53 - 62 n4 = 15 N4 = 28
I.P70 62 - 71 n5 = 14 N5 = 42
Li
71 - 80 n6 = 5 N6 = 47
80 – 89 n7 = 3 N7 = 50
TOTAL n = 50

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

n = 50 , r = 70, luego rn/100 = 7050/100 = 35 ,


entonces Nj = N5 = 42
j = 5 ………… Nj = F5 = 42
j-1 = 1 ………… Nj-1 = F4 = 28

 rn 
 100  N j 1 
P  Y ' j 1  C  
N j 
r
N j 1 
 

 35  28  7
P70  62  9    62  9    62  4.5
 42  28  14 
P70  66.5 años

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Interpretación:

El 70 % de los pacientes atendidos por emergencia en el

Hospital Docente Las Mercedes de Chiclayo tienen una

edad menor de 66.5 años, el otro 30% de pacientes

superan esta edad.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

LA MODA (M0)

La Moda de un conjunto de n observaciones X1, X2, X3, …. Xn ,


es el valor de X que se repite con mayor frecuencia, esto es, es el
valor más frecuente en la distribución. La moda no siempre existe
y no siempre es única, en general se tiene que :

•La distribución que no tiene Moda se llama Amodal.


•La distribución que tiene una moda se llama Unimodal.
•La distribución que tiene dos modas se llama Bimodal.
•La distribución que tiene más de dos modas se llama Multimodal.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Cálculo de la Moda para datos no tabulados.


Ejemplo: Considere los pesos (en Kg) de 9 adultos.
82, 65, 59, 74, 60, 67, 71, 73, 70.

Determine la moda.
Solución:
Estas 9 medidas no definen una moda, por tanto la distribución es
Amodal.

Ejemplo: Considere la distribución de los pesos de 12 adultos.


63, 67, 70, 69, 81, 57, 63, 73, 68, 63, 83, 71
Determinar el peso Modal.
Solución:
El valor que se repite con mayor frecuencia es 63 (se repite 3
veces) y el resto ocurre una vez cada uno.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Luego la Moda de estas observaciones es :


Mo = 63 kilos.
Interpretación : La mayoría de los adultos pesan 63 kilos.

Calculo de la Moda para datos tabulados.

Variable Discreta: En este caso la Moda se determina por el valor


de Yi que más veces se repita (es decir, la que presente la mayor
frecuencia absoluta simple ni ).

Ejemplo: Determine la Moda de la tabla 4 que corresponde a la


distribución de 20 postas médicas según el número de
trabajadores.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Solución:
TABLA Nº 4

Nº de Nº de
Trabajadores Postas
Yi ni
Y1 = 2 n1 = 1
Y2 = 3 n2 = 3
Y3 = 4 n3 = 7
Y4 = 5 n4 = 6
Y5 = 6 n5 = 3
TOTAL n = 20

La frecuencia absoluta simple máxima es : n3 = 7


Luego el valor de la Moda es el valor de la variable que
corresponde a la frecuencia n3 = 7 : Mo = Y3 = 4.
Mo = 4
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Interpretación : La mayoría de las postas médicas tienen 4


trabajadores.

Variable Continua: Existen diversas fórmulas, tales como:

 
n  
j n j 1

MoY 'j 1  c    
  
 n j n j 1 n j n j 1 
Donde :
nj = Es la mayor Frecuencia Absoluta Simple.
nj-1 = Frecuencia Absoluta Simple inmediata anterior a nj.
nj+1 = Frecuencia Absoluta Simple inmediata posterior a nj.
I.Mo = Intervalo Modal que contiene a nj.
Y 'j1 = Límite Inferior del Intervalo Modal (I.Mo).
C = Amplitud del Intervalo modal.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Ejemplo: Determine la Moda de la tabla 3. que corresponde a la


Distribución de 50 pacientes según edad.

Solución:
TABLA Nº 3
Edad (años) Nº de
[ Li - Ls ) Pacientes
ni
26 - 35 n1 = 2
35 - 44 n2 = 6
44 - 53 n3 = 5
I.Mo 53 - 62 n4 = 15
62 - 71 n5 = 14
Li 71 - 80 n6 = 5
80 – 89 n7 = 3
TOTAL n = 50 n = 50

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

La mayor Frecuencia Absoluta Simple es : nj = n4 = 15, luego:


j = 4, entonces nj = n4 = 15
j-1 = 3, entonces nj-1 = n3 = 5
j+1 = 5, entonces nj+1 = n5 = 14
Y´j-1 = 53, C=9

ii) Calculamos la Moda.

 n  
j n j 1

MoY 'j 1  c    
  
 n j n j 1 n j n j 1 
 14  14 
M0  53  9    53  9    53  6.63  59.63
 5  14  19 

M0  59.63

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Estadigrafos de Dispersion o Concentracion.

Las medidas de dispersión son los que cuantifican el grado de


concentración o de dispersión de los valores de la variable en torno
de un promedio o valor central de la distribución.
Dos conjuntos de datos pueden tener la misma localización central,
y no obstante ser muy diferentes, si uno está mas disperso que el
otro. Ejemplo:

(A) (B)

9 10 11 12 13 14 15 6 7 8 9 10 11 12 13 14 15 16 17 18

x  12, Me  12 x  12, Me  12

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

En ambos casos, se tiene la misma Media y la misma Mediana y


sin embargo, no se necesita mucho esfuerzo para darse cuenta
que son muestras significativamente diferentes.
Las medidas de dispersión se necesitan para dos propósitos
básicos:
Para verificar la confiabilidad de los promedios.
Para que sirva como base para el control de la variación de la
misma.
Se puede decir que los términos concentración y dispersión pueden
ser usados indistintamente, pues se da la relación:

Alta dispersión ……………… Baja concentración.


Baja dispersión ……………… Alta concentración.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Las medidas de dispersión más utilizados son : Recorrido o


Rango, Varianza, Desviación Estándar, Coeficiente de
Variación

La varianza
Es la medida de dispersión más importante, y expresa el grado de
dispersión de las observaciones respecto a la Media Aritmética.

Varianza Poblacional.

Se define como la media Aritmética del cuadrado de las


desviaciones de las observaciones con respecto a su Media .
N

  Xi   
2

2  i 1

N
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Varianza de una Muestra.


Se define como la media Aritmética del cuadrado de las
desviaciones de las observaciones con respecto de la Media
Aritmética de esos datos. Es decir :

Para datos no tabulados si n<30. Para datos no tabulados si n>=30

 x  x   x 
n n
2 2
i i x
S 
2 i 1 S2  i 1

n 1 n

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

 y 
m
2
i  y ni
Para datos tabulados si n<30.
S 
2 i 1
n 1

 y 
m
2
i  y ni
S2  i 1
Para datos tabulados si n>=30.
n

Calculo de la Varianza:
Ejemplo: Las frecuencias cardiacas de 5 niños son:
130, 132, 127, 129, 132, pulsaciones por minuto.
Determinar la varianza de la frecuencia cardiaca de la muestra.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Solución:
Se determina la Media aritmética de la muestra .
n

X i
650
x i 1
  130
n 5
TABLA Nº 5

 X  X
2
Xi Xi  X i

X1 = 127 -3 9
X2 = 129 -1 1
X3 = 130 0 0
X4 = 132 2 4
X5 = 132 2 4

 
5 5
 Xi  650
2
Xi  X  18
i1 i1

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

 x  x
n
2
i
S2  i 1

n 1

18
S 2
  4,5
4

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo: Determine la Varianza de la tabla 2 que corresponde a


la distribución de 20 postas médicas según el Nº de trabajadores.

SOLUCION:
TABLA Nº 2

Nº de trabajadores
Nº de postas
Yi

Y1 = 2 n1 = 1
Y2 = 3 n2 = 3
Y3 = 4 n3 = 7
Y4 = 5 n4 = 6
Y5 = 6 n5 = 3
TOTAL n = 20

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo: Usando la fórmula práctica, determinar la varianza de la tabla 3


que corresponde a la distribución de 50 pacientes según su edad.

Solución: TABLA Nº 3
Edad(años) Marca de clase Nº de Pacientes
[ L i – Ls ) Yi ni

26 – 35 Y1 = 30.5 n1 = 2
35 – 44 Y2 = 39.5 n2 = 6
44 – 53 Y3 = 48.5 n3 = 5
53 – 62 Y4 = 57.5 n4 = 15
62 – 71 Y5 = 66.5 n5 = 14
71 – 80 Y6 = 75.5 n6 = 5
80 – 89 Y7 = 84.5 n7 = 3

TOTAL n = 50

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

La Desviacion Estandar o Tipica


La desviación Estándar o típica, se define como la raíz
cuadrada de la varianza

S S 2

Es uno de los estadígrafos de dispersión de mayor uso, en


el cual las unidades de la variable ya no están elevadas al
cuadrado.
La Desviación Estándar al igual que la varianza, es no
negativa. El cálculo de la Desviación Estándar es muy
simple si se conoce la varianza.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo: La desviación Estándar de las frecuencias cardiacas de 5


niños (Ejemplo Anterior) es:

S² = 4.5
S  S2  4.5  2.12132
S = 2.12132 pulsaciones por minuto

Interpretación:
Las frecuencias cardiacas de los niños varían en 2.12
pulsaciones por minuto respecto a la pulsación promedio.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo: La desviación estándar de la


Distribución de 20 postas Médicas según el
número de trabajadores (Ejemplo anterior) es:
S² = 1.1868
S = 1.089 trabajadores
Interpretación : El número de trabajadores
de las postas médicas varía en un trabajador
respecto al valor promedio.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA

Ejemplo: La desviación Estándar de la


distribución de 50 pacientes
según edad (ejemplo anterior)
es:
S² = 175.2245
S = 13.237
Interpretación: la edad de los pacientes atendidos por
emergencia en el Hospital Las Mercedes de Chiclayo
varían en 13.237 años respecto a la edad promedio.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

El Coeficiente de Variación
El coeficiente de variación es el indicador relativo del grado de
dispersión de los valores respecto de su promedio, el mismo que
está expresado en tanto por ciento.

El valor de este indicador no está afectado por la unidad de


medida, por lo tanto es útil para la comparación en términos
relativos del grado de concentración en torno a la media de dos
distribuciones distintas.

En general, cuando el coeficiente de variación es menor de 33%


se dice que la distribución es homogénea, si el coeficiente de
variación es superior o igual a 33% se considera que la
distribución es heterogénea o tiene alto grado de dispersión.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo: Determinar el coeficiente de variación de las


frecuencias cardiacas de 5 niños (Ejemplo Anterior)
Solución:
Se tiene que pulsaciones por minuto, y S = 2.12132
Entonces:
S
C.V.   100
X
2.12132
C.V.   100
130

C.V.  1.63%

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Interpretación:

Las frecuencias cardiacas de los niños varían en


1.63% respecto a la frecuencia cardiaca
promedio, se puede decir que los datos son
homogéneos o presentan una alta concentración.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Estadígrafos de Forma
Son medidas que dan información a cerca de la
dirección de las variaciones de la distribución.
Estas son las medidas de Asimetría y las medidas
de apuntamiento o Cúrtosis.

Coeficiente de Asimetría
El concepto de asimetría de una distribución
indica la de formación horizontal de las
distribuciones de frecuencia. Se tiene que:

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

fi fi fi

Mo =X = Me Yi Mo < Me <X Yi  X < Me < Mo Yi


(a) DISTRIBUCION SIMETRICA (b) ASIMETRICA POSITIVA (c) ASIMETRICA NEGATIVA

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Entre los estadígrafos de asimetría se tiene:


Los propuestos por Karl Pearson:

Media  Moda Y  M0
AS1  
Desviación Estándar Sy

AS2 
3 Media  Mediana 


3 Y  Me 
Desviación Estándar Sy

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

El propuesto por Arthur Boeley.

AS 
 Q3  Q2    Q2  Q1 
Q3  Q1

En general de acuerdo al valor de AS, se tiene:


Si, AS = 0 : La distribución es simétrica.
Si, AS > 0 : La distribución es sesgada hacia la derecha, es decir;
tiene ASIMETRIA POSITIVA.
Si, AS < 0 : La distribución es sesgada hacia la izquierda, es decir;
tiene ASIMETRIA NEGATIVA.

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Ejemplo: En la distribución de la tabla 2.2. de 50


pacientes atendidos por Emergencia según su edad se
conoce:
Y = 59.3 , Me = 60.2 , Mo = 59.63 , Q1 = 52.1 ,
Q2 = Me , Q3 = 68.1 S = 13.237
¿Cuál es la Asimetría?
Solución:
Con fines ilustrativos, se calculará todas las fórmulas
de asimetría. (solo se usa una de ellas)

Y  M0 59.3  59.63
AS1    0.0249  0
Sy 13.237

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

AS2 

3 Y  Me   3 59.3  60.2  0.204  0
Sy 23.237

 Q  Q2    Q2  Q1    68.1  60.2    60.2  52.1 7.9  8.1


AS  3   0.0125  0
Q3  Q1 68.1  52.1 16

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Medida de Apuntamiento o Cúrtosis


Cúrtosis, es el grado de deformación vertical
(apuntamiento) de una distribución de frecuencias.
Con relación
 al grado de apuntamiento, se puede
tener curvas : Leptocúrtica , Mesocúrtica, y
Platicútica.

fi fi fi

Y´ Y´ Y´
a) LEPTOCURTICA b) MESOCURTICA c) PLATICURTICA

Lic. Carlos Daniel Gonzales Hidalgo


ESTADÍSTICA

Para medir el grado de apuntamiento se utiliza el COEFICIENTE DE KURTOSIS,


denotado por:

Q3  Q1
K
2 P90  P10 

Donde : Q3 : Tercer Cuartil P10 : Percentil 10


Q1 : Primer Cuartil P90 : Percentil 90

Si, K = 0.263 : La curva de distribución de frecuencias es MESOCURTICA.


Si, K > 0.263 : La curva de distribución de frecuencias es PLATICURTICA.
Si, K < 0.263 : La curva de distribución de frecuencias es LEPTOCURTICA

Lic. Carlos Daniel Gonzales Hidalgo