Está en la página 1de 96

°42&s

Estadística,
Probabilidad
< y Tecnología
Salida Matemática y Tecnología
cu
<
O
I
«ft
LJ
?
f
un
» I

•A,ll> *

?

PROYECTO
I
SABER
HACER
V SANTILLANA
índice

Unidad 1 : M edidas de ten dencia central 05

1. M edidas de tendencia central 06


►Media artim ética (x) 06

►ventajas y desventajas de la m edia aritm ética 07

2. Media arim ética para datos agrupados 08

►Usando la tecnología: M icroso ft Excel 08


►Usando la tecnología: Lenguaje R 10

►La m ediana (Me) 11

3. M ediana para datos agrupados 13

►Usando la tecnología: M icroso ft Excel 14


►Usando la tecnología: Lenguaje R 16

4. La m oda (Mo) 17

►La m oda para datos agrupados 17


►Usando la tecnología: M icroso ft Excel 19

►Usando la tecnología: Lenguaje R 20

5. La m edia geom étrica (G) 21

►Usando la tecnología: M icrosoft Excel 22


►Usando la tecnología: Lenguaje R 23
6. La m edia arm ónica (H) 24

►Usando la tecnología: M icroso ft Excel 24

►Usando la tecnología: Lenguaje R 25

© Santillana, S. A.
U n id a d 2: M e d id a s d e p o s ic ió n 29

1. M edidas de posición 30
►Percentiles (Pk)........................ ............................................................................... 30
2. Percentiles para datos agrupados 32
3. Cuartiles (Q k) ... ............................................................................ 34
4. Deciles (Dk) ................ ................. .............................................35
►Usando la tecnología: M icroso ft Excel 35
►Usando la tecnología: Lenguaje R 37

U n id a d 3: M e d id a s d e d is p e rs ió n 41

1. M edidas de dispersión o variabilidad 42


►Rango (R) 42
►Usando la tecnología: M icroso ft Excel 43
►Usando la tecnología: Lenguaje R 45
2. Desviación m edia 46
►Desviación m edia 46
►Usando la tecnología: M icroso ft Excel 48
►Usando la tecnología: Lenguaje R 49
3. Varianza ... .................................................................................... 50
4. Desviación típica o estándar (S) 52
►Usando la tecnología: M icroso ft Excel 53
►Usando la tecnología: Lenguaje R 54
5. Coeficiente de variación (CV) 55
►Usando la tecnología: M icroso ft Excel 56
►Usando la tecnología: Lenguaje R 57

©Santillana, S. A.

_______________
U n id a d 4; P ro b a b ilid a d e s ta d ís tic a 61

1. Probabilidad estadística 62

►Conceptos previos 62
2. Definición de probabilidad 65

3. Eventos m utuam ente excluyentes y no m utuam ente excluyentes ..... 67

4. Diagrama del árbol 70

5. Valor esperado de un evento 71

►Usando la tecnología: M icroso ft Excel 72

►Usando la tecnología: Lenguaje R 73

U n id a d 5: Correlación y regresión sim ple 81

1. C orrelacción 82

►Análisis de correlación sim ple . 82

►Regresión lineal sim ple 86

►Usando la tecnología: M icroso ft Excel 88

►Usando la tecnología: Lenguaje R 92

©Santillana, S. A.
Estructura de las unidades
La estructura de las unidades del libro E stadística, P ro b ab ilid ad e s y Tecnología es la siguiente:

Página inicial

N úm ero seguido del título de la unidad.


tendencia
Medidas
central Introducción del tem a a estudiar.
«retóbe a RepúD"«1
-financieras para Qe,ei

C o m p e te n c ia s esp ecíficas
D e strezas q u e se e sp e ra n del
estudiante al cu lm inar el trabajo
con la unidad.

C o n te n id o s
Desglose de los conceptos
presentes y trabajados
a lo largo de la unidad.

E jem plos
Ejem plos resueltos para apoyar
Páginas de contenido el proceso de enseñanza-aprendizaje.
Exposición
de conceptos y Medidas de tendencia central

procedim ientos Es evidente que un número importante de datos tiende a agruparse alrededor
de ciertos valores centrales (intervalos), y consecuentemente, el resto se distri­
buye por encima y por debajo de estos intervalos de mayor frecuencia. A partir
presentes en la de este comportamiento, se determina que en las distribuciones muéstrales
hay un valor que es el más frecuente y alrededor del cual se agrupa el resto de
El precio en ro$ de la gasolina premium para las 10 semanas desde el 8
de septiembre 2017 al 17 de noviembre 2017 fueron los siguientes:
221.8,220.3,216.3,215.3,211.3,210.3,211.8,215.8.220.8,225.8.
los valores; este puntaje se considera representativo de toda la distribución a
doble página. estos valores, que representan la tendencia de una distribución, se les deno- ¿Sabes cuál fue el precio promedio de ia gasolina premium en esa
semanas?
De acuerdo con la fórmula 1.1, el promedio para el precio de la gasi
premium es:
Maniquíes no son Iguales a la Media de gasolina premium , « " » “ * “ g S j f f n T ”

jf 2218+220.3*216.3*2153.211.3+210.3+211,8*215.8*220é*225.8
,a las medidas que
lasmujeresreales: Estatura en ma­ ■ La puntuación promedio de los estudiantes del Nivel Secundario en la asig­
niquíes 6 pies, en muieres Spies a natura de Matemáticas en las Pruebas Nacionales fue de 17.17 en la primera
pulgadas: cintura en manquies 23 convocatoria del ario 2017.
pulgadas, en las moeres29 pulga­
das. y así con las demás medidas
denotando notables diferencias

S ab er m ás or y. además, facilitan ia comparación de diferen­


1.2 Ventajas y desventajas de la media aritmética
nedia aritmética, como un solo número que
tes conjuntos de puntuaciones de una variable. A continuación, se van a des­ ds completo, tiene importantes ventajas
cribir las medidas de tendencia central, representativas de la distribución, más
e trata de un concepto familiar para la mayoría de
Inform aciones armónica, la mediana y la moda Para
para am pliar 1.1 Media aritmética (Jf)
c o m e n ta r
conocim ientos.
o) para datos no agrupados: )T- -*¡p-
er medida estadística, la
Actividades
• Aunque la media es confiable en cuanto a que ton

dia geométrica y la
Donde I * indica el total de sumar todos los valores de una distribución de valores del conjunto de datos, puede verse afectad
que no son representativos del resto de los datos de retroali-
armónica y las relaciones La media aritmética, también «amada promedio o simplemente media, es la medi­
biecieron las 8 notas de la
da de tendencia central más conocida y usada en la práctica debido básicamente,
a la sencillez de su cálculo y a que es el fundamento de un gran número de técni­ en el centro educativo y
ss muy grande, podría ser tedioso calcular la
m entación
escala musical que conoce­ cas estadísticas, la media aritmética indica la tendencia general de una distribu­ compara con los demás
mos hoy en dia (do re mi
(a sol la si DO)
ción de frecuencias de una variable y es el valor central alrededor del cual están la
mayoría de las oOseivaciones Por otro lado, a diferencia de otros índices de ten­
compañeros ¿Quién tiene
el promedio más alto? y refuerzo.
dencia central, solo puede calcularse para var

©Santillana, S. A.
5
Páginas de actividades y de evaluación
y
C o n tro l del a p re n d iza je . Ejercicios de final de unidad, donde se ponen a prueba
los conocim ientos adquiridos por los estudiantes al térm in o del trabajo con la unidad.

M e d id a s d e p o sició n

i Una encuesta sobre el número de llamadas telefónicas por celular realizada con una 5. La siguiente distribución de frecuencias corresponde a los salarios de los emplea­
muestra de usuarios la semana pasada reveló la siguiente información. dos de una empresa manufacturera.

30 42 12 46 39 37 34 46 32 f,

15.0-15.49 7 7
• Calcula e interprete: 15.5-15.99 18 25
Percentil: 33,66 y 85 Cuartil: 1 y 3 Decil: 2 y 5 16.0 -16.49 32 57

2. La siguiente información se refiere a los precios de venta, en miles de dólares, de 16.5 -16.99 45 102
casas que se vendieron en la ciudad, durante el 2010 .
17.0-17.49 52 154

Precio de venta 17.5-17.99 28 182


(M iles de USS) 18.0-18.49 16 198

18.5 -18.99 8 206

Total 206

• Calcula e interpreta:
Cuartil 2

7. Analiza el siguiente cuadro que muestra la evolución de la distribución del ingreso c


cápita entre 1987 y 1998 según quintiles (divide a la muestra en 5 partes iguales).

• Calcula e interpreta:
Años
Percentil: 30,65 y 92
1987 1990 1992 1994 1996 1998
3. una muestra de ocho estudiantes reveló que poseían la siguiente calificación e
Física: I 4.3 4.4 4.6 4.3 4.1 4.1

52 76 64 79 80 74 66 69 II 7.9 8.2 8.5 8.2 8.2 8.2

III 11.7 12.3 12.2 12 11.9 11.8


• Calcula e interpreta: cuartil: 1 y 3 Decil: 2 y !
Percentil: 33,66 y 85 IV 19 18.1 18.4 18.5 19.1 19.1

4 los siguientes datos corresponden a la masa (en kg) de 24 mujeres de 17 años. V 572 56.9 56.3 56.9 56.7 56.9

44 48 50 50 51 Total 100 100 100 100 100 100

• Investiga sobre el monto de ingresos per cápita en los años que indica el cuadro y
actualiza los valores por año y quintil (Consultar Enhogar 2007).
• Calcula e interpreta: • Establece el significado de los quintiles y su aporte como complemento a la media
Cuartil 1 aritmética que es el ingreso per cápita.

c„mu»w a.„*»aEí°"*"caV
„„eBMdaanm*»"'
I , txp»“ '“ " 1* * 0 M ¡tn.P„ortatrte'
„ „ m e t » 18® 16

E valuación
. Niveles te
resenta Prueba de la adquisición
W0de.aV-eP'«e- _ aegere„e8^ *
,c asonantes al muestran ' ^ ^ 10 pu.— - de las destrezas propias
oucióh°e'
. u , m« # a a *a » c a
— de la asignatura, desglosadas
en térm in os de las com petencias
específicas.

, dominica"8 *“

4 0«re"*^fv1V7S. fle,rerema",0(l0'Cert“a'
rica?
! mediana,
. oetermma 'a _ o mayor QU
media aritmética ■ia media a" BT^ t'Ca'
ntn de datos-tórne
n\nica na so n
"■
u « i i i a M « am'
o t a s « " " 0168 . , » e l * » KCOT
^ ^ a i e « ¿ aro6„,oa. ^ « n g K W ia l.aRepa*800“ '

5SÍgi'e" __ .........

^—---~.JTíiiei»«la-— , eedm« "° a A p re n d iz a je a u tó n o m o

o M edición de los logros m ediante


una escala de tres niveles de dom inio.

© Santillana, S. A.
6
1 I 2 3 4 5 6 7 8 9 10

Medidas de tendencia
central
El Ministerio de industria y Comercio de la República Dominicana coordina el proceso de aná­
lisis de variables económicas y financieras para determinar los precios de los combustibles.

C o m p e te n c ia s
Identifica m edia geom étrica y
arm ó n ica , c o m o m edid a de
tendencia central.
Define media, mediana, moda,
m edia g e o m é tric a y m e d ia
arm ónica.
Utiliza herram ientas te c n o ló ­
gicas para re a liza r cá lcu lo s
con m e d id a s de te n d e n c ia
central usando herram ientas
tales com o: M icrosoft Excel y
Lenguaje R.

C o n te n id o s
■ M edia aritm ética
■ M ediana
■ M oda
■ M edia geom étrica
■ M edia arm ónica

©Santillana, S. A.
7
€ § Medidas de tendencia central
Es evidente que un núm ero im portante de datos tiend e a agruparse alrededor
de ciertos valores centrales (intervalos), y consecuentem ente, el resto se d istri­
buye por encim a y por debajo de estos intervalos de m ayor frecuencia. A partir
de este co m porta m iento, se d e term ina que en las d istrib u cio n e s m uéstrales
hay un valor que es el más frecuente y alrededor del cual se agrupa el resto de
los valores; este puntaje se considera representativo de toda la distribución. A
estos valores, que representan la tenden cia de una distrib ución , se les d en o­
m ina: m e d id a s de te n d e n c ia c e n tra l
De seguro has escuchado el concepto de prom edio, m edida de tendencia cen­
tral que m uestra el valor central de los datos. Los prom edios aparecen a diario
en televisión, en el periódico, en Internet y en otras publicaciones. He aquí al­
Maniquíes no son iguales a la gunos ejem plos:
realidad. La revista Health deter­
minó en un estudio que las medi­ ■ El precio prom edio de un galón de gasolina prem ium , en la República Dom i­
das "promedio" de los maniquíes nicana, era de RDS215.47 de a cu e rd o con un e stu d io llevado a cabo por
no son iguales a las medidas que ProConsum idor.
estas deberían de representar en
■ La puntuación prom edio de los estudiantes del Nivel Secundario en la asig­
las mujeres reales: Estatura en ma­
natura de M atem áticas en las Pruebas Nacionales fue de 17.17 en la prim era
niquíes 6 pies, en mujeres 5 pies 4
pulgadas; cintura en maniquíes 23 convocatoria del año 2017.
pulgadas, en las mujeres 29 pulga­ ■ La puntuación prom edio de un estudiante al finalizar el prim er sem estre de
das, y así con las demás medidas clases en la asignatura de Lengua Española fue de 92.4.
denotando notables diferencias.
■ El gasto prom edio sem anal en com ida en un hogar es de RD$250.0.
Las m edidas de tendencia central perm iten representar toda la distribución de
frecuencias con un único valor y, adem ás, facilitan la com paración de dife re n ­
tes conjuntos de puntuaciones de una variable. A continuación, se van a des­
cribir las m edidas de tendencia central, representativas de la distribución, más
utilizadas en el análisis de datos: la m edia aritm ética, m edia geom étrica, m edia
arm ónica, la m ediana y la m oda.

1.1 Media aritmética (X)


La m e d ia a ritm é tic a es el valor o btenido al sum ar to d o s los datos y divid ir el
resultado entre el núm ero total de datos. A esta m edida tam bién se le conoce
Pitágoras com únm ente con el nom bre de p ro m ed io .

Los pitagóricos exam inaron Ix


M e d ia a ritm é tic a (p ro m e d io ) para d a to s no agrup ados; X =
las razones y proporciones
entre los núm eros enteros;
la m edia aritm ética, la m e­ D onde £ x indica el to ta l de sum ar to d o s los valores de una d istrib u ció n de
dia g e o m é trica y la m edia datos y n indica la cantidad de datos de la m ism a distribución.
a rm ó n ica y las relacione s La media aritmética, tam bién llamada prom edio o sim plem ente media, es la m edi­
entre ellas; con estas esta­ da de tendencia central más conocida y usada en la práctica debido, básicamente,
blecieron las 8 notas de la a la sencillez de su cálculo y a que es el fundam ento de un gran núm ero de técni­
escala musical que conoce­ cas estadísticas. La media aritm ética indica la tendencia general de una distribu­
m os hoy en día (do re mi ción de frecuencias de una variable y es el valor central alrededor del cual están la
fa sol la si DO). mayoría de las observaciones. Por otro lado, a diferencia de otros índices de te n ­
dencia central, solo puede calcularse para variables cuantitativas.

8 ©Santillana, S. A.
Ejemplo: precio gasolina premium
El precio en RD$ de la gasolina prem ium para las 10 sem anas desde el 8
de s e p tie m b re 2017 al 17 de n o vie m b re 2017 fu e ro n los sig u ie n te s:
221. 8 , 220.3, 216.3, 215.3, 211.3, 210.3, 211. 8 , 215.8, 220.8, 225.8.
¿Sabes cuál fue el precio prom edio de la gasolina prem ium en esas 10
semanas?
De acuerdo con la fórm ula 1.1, el prom edio para el precio de la gasolina
prem ium es:

M e d ia d e gasolina p re m iu m = g“m§-de los Precios de las 10 semanas


cantidad de precios
Pensamiento lógico, creativo y
crítico. Promedio del salario de
V _ 221.8+220.3+216.3+215.3+211.3+210.3+211.8+215.8+220.8+225.8
los profesores: En cada una de las
10
32 provincias de la República Do­
minicana un investigador conoce
el salario promedio de maestros X = - - fp - = 216.95
de Secundarla. El promedio de las
32 provincias es de RDS50,631.0, El prom edio sem anal de los precios de la gasolina prem ium para las 10
pero ¿es este el salario promedio sem anas fue de RD$216.95.
de todos los profesores de Secun­
daria en la República Dominicana?

1.2 Ventajas y desventajas de la media aritmética


La m edia a ritm é tica, com o un solo núm ero que representa a un co n ju n to de
datos com pleto, tiene im portantes ventajas.
■ Se trata de un concepto fam iliar para la mayoría de las personas y es in tu iti­
vam ente claro.
■ Cada conjunto de datos tiene una m edia; es una m edida que puede calcular­
se y es única deb ido a que cada c o n ju n to de datos posee una y solo una
media.
■ Por últim o, la m edia es útil para llevar a cabo pro ce d im ie n to s estadísticos
com o la com paración de m edias de varios conjuntos de datos.
Sin em bargo, co m o cu a lq u ie r m edida estadística, la m edia a ritm é tica tie n e
desve ntajas que debem os conocer.

PARA COMENTAR ■ A u nque la m edia es co n fia b le en cu a n to a que to m a en cuen ta to d o s los


A valores del co n ju n to de datos, puede verse afectada por valores extrem os
Calcula el prom edio de ca­ que no son representativos del resto de los datos.
lifica cio n e s de las asigna­ ■ Somos incapaces de calcular la m edia para un co njunto de datos que tiene
tura s que cursas este año clases de extrem o abierto en la parte inferior o superior de la escala.
en el c e n tro e d u c a tiv o y
c o m p a ra con los d e m á s ■ Si el co njunto de datos es m uy grande, podría ser tedioso calcular la m edia
com pañeros. ¿Quién tiene de form a m anual.
el prom edio m ás alto? ■ No se puede calcular para un conjunto de datos donde los valores de estos
indiquen un orden jerárquico.

©Santillana, S. A. 9
€È Media aritmética para datos agrupados
Cuando la variable está agrupada en una distribución de frecuencias, la m edia
aritm ética se calcula por la fórm ula:

M e d ía a ritm é tic a (p ro m e d io ) para d a to s agrup ados: X =

em plea un valor para representar a todos los que se encuentran en cada clase.
Este valor que representa a todos los de su clase es el punto m edio de clase o
el valor central de cada clase (Xi) el cual es, precisam ente, el prom edio entre
los 2 lím ites de cada clase.

Ejemplo: Puntuaciones de Inglés


En la tabla siguiente se m uestran las puntuaciones agrupadas en clases
de un grupo de 50 estudiantes en una prueba de inglés.

Puntuaciones f, x¡ X, * fi X = 4,185 _= 83.7


6 5 -7 0 3 67.5 202.5
7 0 -75 5 72.5 362.5
La p u n tu a ció n p ro m e d io
7 5 -8 0 8 77.5 620 en la prueba de Inglés de
8 0 -85 12 82.5 990 los 50 e stu d ia n te s es de
8 5 -9 0 10 87.5 875 83.7 puntos.
9 0 -95 7 92.5 647.5
95-100 5 97.5 487.5
Total 50 4,185

Com o podem os observar, la m edia a ritm é tica aprovecha toda la infor­


m ación disponible en los datos, ya que para su cálculo es necesario u ti­
lizar todas las puntuaciones de los sujetos.

2.1 Usando tecnología: Microsoft Excel


En la siguie nte página se m uestra la lista de precios de la gasolina prem ium
para 10 sem anas desde el 9 de se p tie m b re de 2017 al 17 de no vie m b re de
2017 digitados en Excel.
Para calcular el prom edio haciendo uso de este program a se deben seguir los
siguientes pasos:
■ Ubicarnos en la celda en la cual querem os alm acenar el resultado del prom e­
dio obtenido.
■ Hacer clic en la opción insertar función (fx).
Excel es una aplicación que per­ ■ En la ventana resultante elegir la función (PROMEDIO).
mite realizar hojas de cálculo, que
se encuentra integrada en el con­ ■ Después seleccionar los valores (precios de gasolina) de los que querem os
junto ofimático de programas Mi­ obtener el prom edio.
crosoft Office. ■ Hacer clic en Aceptar.

10 © Santillana, S. A.
B C
GASOLINA
Fecha Rango de vigencia GASOLINA
i PREMIUM 1
Fecha Rango de vigencia
PREMIUM
2 10/11/2017 11 A L 1 7 D E NOV 2017 225.80 2 10/11/2017 11 AL 17 DE NOV 2017 225.80
3 03/11/2017 04 AL 10 DE NOV 2017 220.80 3 03/11/2017 04 AL 10 DE NOV 2017 220.80
4 27/10/2017 28 O C T A L 03 DE NOV 2017 215.80 4 27/10/2017 28 O C T A L 03 DE NOV 2017 215.80

5 20/10/2017 5 20/10/2017 21 AL 27 DE O C T 2017 211.80


21 AL 27 DE OCT 2017 211.80
6 13/10/2017 14 AL 20 DE O C T 2017 210.30
6 13/10/2017 14 AL 20 DE OCT 2017 210.30
7 06/10/2017 07 AL 13 DE O C T 2017 211.30
7 06/10/2017 07 AL 13 DE OCT 2017 211.30
8 29/09/2017 30 S E P T AL 06 DE O C T 2017 215.30 I
8 29/09/2017 30 SE P T A L 06 DE OCT 2017 215.30 9 22/09/2017 23 AL 29 DE S E P T 2017 216.30 1
9 22/09/2017 23 AL 29 DE SEPT 2017 216.30 10 15/09/2017 16 AL 22 DE S E P T 2017 220.30 I
10 15/09/2017 16 AL 22 DE SEPT 2017 220.30 11 08/09/2017 09 AL 15 DE S E P T 2017 221.80
11 08/09/2017 09 AL 15 DE SEPT 2017 221.80 12 Promedio RD$ 216.95

g ¡ C O M P E T E N C IA A M B IE N T A L Y DE LA S A L U D

Q Cantidad de nicotina en los cigarrillos


• La nicotina presente en los cigarrillos es un com puesto pernincioso para la salud de las personas. Los
efectos dañinos de la nicotina se buscan reducir colocando filtros a los cigarrillos. Abajo se presentan
las cantidades de nicotina (en m g por cigarrillo) de una m uestra de cig arrillo s sin filtro y con filtro.
Responde la siguiente interrogante: ¿Por qué es conve nie nte que los cig arrillo s tengan filtro s que
reduzcan la cantidad de nicotina?

Sin filtro 1.7 1.7 1 .1 1.4 1 .1 1.4 1 .0 1 .2 1 .1

Con filtro 0.4 1 .2 0 .8 1 .0 1 .1 1 .1 0 .8 0 .8 0 .8

©Santillana, S. A. 11
2.2 Usando la tecnología: Lenguaje R
Al ejecutar el program a R, nos aparece la siguiente ventana de com andos:

!*lí|a¡M«|o|[S||S|
HKCMOte

Ir version 3.4.0 (2017-04-21) — "You Stupid Darkness"


Res un entorno y len­ ¡ Copyright (C) 2017 The R Foundation for Statistical Computing
jPlatform: x86_64-w64-mingw32/x64 (64-bit)
guaje de program a­ ¡R es un software libre y viene sin GARANTIA ALGUNA.
ción con un enfoque al jUsted puede redistribuirlo bajo ciertas circunstancias.
¡Escriba 'license()' o 'licence()' para detalles de distribución.
análisis estadístico. IR es un proyecto colaborativo con muchos contribuyentes.
¡Escriba 'contributors()' para obtener más información y
|'citation()' para saber cómo citar R o paquetes de R en publicaciones.

¡Escriba 'demoO 1 para demostraciones, 'helpO' para el sistema on-line de ayuda,


lo 'help.start()' para abrir el sistema de ayuda HTML con su navegador,
jiEscriba 'q()' para salir de R.

I[Previously saved workspace restored)

>1

j,. ,,,,,,..... .................. ....... ,..... ........

R es un program a estadístico basado en com andos, al cual debem os de in tro d u cir los
com andos y los datos para que este nos m uestre los resultados deseados.
Para in troducir un conjunto de datos {d a to l, dato2,...} con el nom bre Y escribim os:
x= c (d a to i,d a to 2 ,...)
El com ando en R se usa para o b tene r la m edia aritm é tica o prom edio de un conjunto
de datos en mean(x).
Para o b te n e r en R el p ro m e d io de los precios de la gasolina prem ium , en la línea de
com andos (después del sím bolo de línea "> ") digitam os lo siguiente:
> X = C (221.8, 220.3, 216.3, 215.3, 211.3, 210.3, 211.8, 215.8, 220.8, 225.8) > m ean(x)
[11216.95

.inangflgBB,
|> x = c (221.8, 220.3, 216.3, 215.3, 211.3, 210.3, 211.8, 215.8, 220.8, 225.8)
I > mean(x)
[ (1) 216.95

12 © Santillana, S. A.
2.3 La mediana (Me)
La m ediana de una variable X, representada por M e, se define com o el valor
que divide la d istrib u ció n de frecu encias en dos partes iguales, co n teniend o
cada una el 50 % de las observaciones. Esta sola observación es el elem ento
que está m ás al centro del conjunto de valores.
Las p rin cip ales p ro p ie d a d e s d e la m e d ia n a son las siguientes:
■ No influyen en ella valores extrem adam ente grandes o pequeños. Por consi­
guiente, la m ediana es una valiosa m edida de ubicación cuando dichos valo­
res se presentan.
■ Es calculable para datos de nivel ordinal o más altos.
El p ro c e d im ie n to para e n c o n tra r la m edia na en d a to s no a g ru p a d o s es el
siguiente:
■ O rdenar la serie (conjunto de valores), de m enor a mayor, aunque no nece­
sariam ente en ese orden.
■ D eterm inar la posición central, esta se encuentra dividiendo entre 2 el núm e­
ro de elem entos m ás 1 o, en sím bolos, Posición M e = -Ü ± L .
2
■ Identificar el valor que ocupa esta posición central, que es la m ediana.
■ Cuando el núm ero de observaciones es impar, la m ediana coincide con uno
de los valores de la distribución, pero cuando el núm ero de observaciones es
par, la posición de la m ediana será una fracción, es decir se ubicará en m edio
de los dos valores que están en el centro de la distribución; debido a esto se
prom edian estos dos valores para determ inar la m ediana.

Ejemplo: Tiempo de distancia recorrida


A continuación se m uestran los tiem pos en m inutos en que el equipo de
atletism o del centro educativo recorrió 1 km en un día normal de práctica.

N u n ca u tilic e s el té rm in o
p ro m e d io para r e fe rirte a
c u a lq u ie r m e d id a de te n ­
den cia c e n tra l. La m edia na
no se debe c o n fu n d ir con la
m edia a ritm é tic a , ya que lo
norm al es que sean d ife re n ­ La mediana, además de ser una medida de tendencia central, también es con­
tes entre sí. siderada una medida de posición.

©Santillana, S. A. 13
Elemento del arreglo de datos 1 2 3 4 5 6 7
Tiempo en minutos 4.2 5.0 4.3 9.0 5.1 4.8 4.7

Ordenando los datos, obtenemos:

Elemento del arreglo de datos 1 2 3 4 5 6 7


Tiempo en minutos 4.2 4.3 4.7 4.8 5.0 5.1 9.0

Determinando la posición de la mediana:

Pacientes Posición M e = = 7 +1 = — = 4
2 2 2

El valor del cuarto elemento de la distribución de los tiempos en minutos es 4.8.


La mediana del tiem po del equipo de atletism o del centro educativo al reco­
rrer 1 km en un día norm a de práctica es de 4.8 minutos.
C alculem os ahora la m ediana de un arreglo con un núm ero par de e le­
m entos, considerando los datos m ostrados en la siguiente tabla referen­
tes al núm ero de pacientes tratados diariam ente en la sala de em ergen­
cias de un hospital. Los datos están organizados en orden descendente.

Elemento del arreglo de datos 1 2 3 4 5 6 7 8


Número de pacientes 86 52 49 43 35 31 30 11

La mediana de este conjunto de datos sería:

Posición M e = n + 1 = 8 + 1 = — = 4.5
2 2 2

Elemento del arreglo de datos 1 2 3 4 5 6 7 8


Número de pacientes 86 52 49 43 35 31 30 11

C om o la m ediana es el e le m e n to núm ero 4.5 del arreglo, necesitam os


calcular el prom edio de los elem entos cuarto y quinto. El cuarto elem en­
to de la tabla es 43 y el quinto 35. El prom edio de estos dos elem entos es
igual a 43 +3,5 _ 3 9 po r consiguiente, 39 es la m e d ia n a del n ú m e ro de
p a cientes p o r día tra ta d o s en la sala de em e rg e n cia s d u ra n te el p e río ­
do de 8 días.

La m ediana es co m ú n m e n te utilizada en variables cualitativas que poseen


una escala ordinal. Esta m edida, adem ás de la m oda, es la única que se pue­
den em plear en datos que poseen una escala ordinal.

14 ©Santillana, S. A.
w Mediana para datos agrupados
C uando los d atos están agrupa dos en ta b la s de fre cu e n cia s, la m ediana se
calcula u tiliza n d o un p ro c e d im ie n to de in te rp o la ció n , sie ndo su fó rm u la de
cálculo la siguiente:

( y - Fr 1)
M e d ia n a para d a to s agrup ados: M e = L, + f * AC

Donde:

L¡: lím ite inferior real del intervalo en que debe caer la m ediana.

y : lugar(lntervalo) en la co lum na de fre cu e n cia s acum uladas en que debe


caer la m ediana.

F - 1: frecuencia acum ulada hasta el Intervalo anterior al de la m ediana.

f¡: frecuencias sim ples dentro del intervalo en donde debe caer la m ediana.

AC: tam año del Intervalo de la clase.

Ejemplo: Puntuaciones de Inglés


La tabla sig uie nte m uestra las p u n tu a cio n e s de un g ru p o de 50 e s tu ­
diantes en una prueba de Inglés, agrupados en clases.

Puntuaciones fi x¡ F,
6 5 -7 0 3 67.5 3
7 0 -75 5 72.5 8
7 5 -8 0 8 77.5 16
8 0 -85 12 82.5 28
8 5 -9 0 10 87.5 38
9 0 -9 5 7 92.5 45
95-100 5 97.5 50
Total 50

Para el cá lculo de la m ediana se requiere de las clases, fre cu e n cia s y


frecuencias acum uladas de la tabla de intervalos.

C om o se puede observar, la tabla a n te rio r está organizada de m enor a


m ayor. A co n tin u a ció n , se d e talla el p ro c e d im ie n to para el cá lcu lo de
dicho estadístico:

■ Se calcula — = ~ = 25.
2 2
■ 25 se ubica en las frecuencias acum uladas en el intervalo 80 - 85. A
este Intervalo se le denom ina la clase mediana.

©Santillana, S. A. "j 5
■ Se determ ina F 1 que corresponde a la frecuencia acum ulada a n te rio r a ia clase
m ediana; en este caso es igual a 16.
■ De igual m anera, se señala el va lo r de f¡, o sea, la fre cu encia sim ple d e n tro de la
clase m ediana, que resultó ser igual a 1 2 .
■ El tam año del intervalo, AC, para este problem a es de (5).
■ Finalm ente, se sustituye en la fórm ula de la m ediana:

'
M e = 80 + 2 5 -1 6 * 5 -8 0 + — * 5
12 I 12

= 80 + (0.75 * 5) = 80 + 3.75 = 83.75

El valor de la m ediana para estos datos es de 83.75 y se considera que deja por enci­
ma y por debajo de él al 50 % de los datos de la distribución.
Com o se puede observar, el valor de la m ediana es prácticam ente Igual al de la media
aritm ética, situación que se presentará siem pre que se analicen datos muéstrales. Sin
em bargo, siem pre aspirarem os a que la diferencia entre estos dos estadísticos sea la
m enor posible.

3.1 Usando la tecnología: Microsoft Excel


La tasa de ca m bio de re fe re n cia del m e rca d o es calcula da co m o un p ro m e d io p o n d e ra ­
do de to d a s las tra n s a c c io n e s realizada s p o r e n tid a d e s fin a n c ie ra s y a ge nte s de dam -
blo antes de las 5:30 p.m . para el caso del dólar.
O b te n e r la m ediana de los p ro m e d io s m ensuales de la tasa de c a m b io (Venta) del d ólar
estad o u n id e n se para el año 2016 usando M ic ro s o ft Excel.
M icro so ft Excel puede calcular la m ediana de un co n ju n to de datos in d epen die nte m en te
de que estos se encuentren ordenados o no.
Para calcular la mediana haciendo uso de este programa se deben seguir los siguientes pasos:
■ Ubicarnos en la celda en la que querem os alm acenar el resultado de la mediana.
■ Hacer clic en la opción Insertar función (f_x).
■ En la ventana resultante elegir la función (MEDIANA) de las funciones estadísticas.
■ Después seleccionar los valores (Venta) de los que querem os o b tene r la m ediana, rango
de celdas desde D4 hasta D15.
■ Hacer clic en A ce p ta r.

16 ©Santillana, S. A.
¡ T a s a s d e C a m b io d e l d ó la r d e R e f e r e n c ia
d e l M e r c a d o S p o t , P r o m e d io M e n s u a l *
Año M es Compra Venta
2016 Ene 45.5254 45.6154
2016 Feb 45.6625 45.7642
2016 Mar 45.7152 45.8094
2016 Abr 45.7682 45.8535
2016 May 45.8115 45.9010
2016 Jun 45.8652 45.9541
2016 Jul 45.9255 45.9945
2016 Ago 45.9421 46.0061
2016 Sep 46.0803 46.1746
2016 Oct 46.3447 46.4371
2016 Nov 46.4897 46.5893
2016 Die 46.5858 46.6741

- .................. '
J«N%o Inicio Irwcrtar DncñodepAgiiM Fó-mul*i flitoí Pcvnii VnU Pioqumaitor 9 ' ■ -.

- - A A - 3 «* - S Afuctaltolto 6+v* ■1 f c m m ■ □ ■ e s a . p t •
*• i-p'»'fornaio N * i B — ' A ' ■ 1 íimbmíi ycenti,. • S • % « • ; *onr-.Wo Unífornuto | jj S J H B SISS■ ■ mm M R BZSB&m SSZE9HI = *««*» b»™«í» <*#" .■ bu* « y

• i A

A a B C D E G H M *
|Tasas de Cam bio del dólar de Referencia
del Mercado Spot, Promedio M ensual *
Año Mes Compra Venta
2016 Ene 45.5254 45.6154
2016 Feb 45.6625 1 45.7642
2016 Mar 45.7152 45.8094
2016 Abr 45.7682 45.8535
2016 May 45.8115 45.9010
2016 Jun 45.8652 45.9541
2016 Jul 45.9255 45.9945
2016 Ago 45.9421 46.0061 La m ediana
2016 Sep 46.0803 46.1746
2016 Oct 46.3447 46.4371
de la tasa de cam bio
2016 Nov 46.4897 ; 46.5893 del dólar
2016 Die 46.5858 ! 46.6741
Fuente: Estadísticas Económicas del Banco C
estadounidense
la República Dominicana, Año 2016. para la venta en el año
45.9743 2016 fue de 45.9743
pesos por dólar.
o? «¡ -j A

C Santillana, S. A.
3.2 Usando la tecnología: Lenguaje R
utilizan do R para obtene r la m ediana de la tasa de cam bio del dólar estadounidense para la
com pra en el año 2016, debem os utilizar el com ando m edian (x).
ingresando en la línea de com andos (>) los datos de la tasa de cam bio para la com pra del
dólar:
> X = c(45.5254, 45.6625, 45.7152, 45.7682, 45.8115, 45.8652, 45.9255, 45.9421, 46.0803,
46.3447, 46.4897, 46.5858)
> m edian(x)
[1] 45.89535

A c o n tin u a c ió in se m u e stra n las ta sas de c a m b io del e u ro en la R epública D om inican a


d u ra n te 14 años. Se desea sa b e r cuál ha sid o la m edia na de la tasa de c a m b io del eu ro
d u ra n te esos 14 años.

Año 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017

C o m p ra 48.55 35.68 40.55 44.17 49.39 48.91 47.58 52.68 50.42 55.41 57.69 49.83 50.89 53.62

18 © Santillana, S. A.
Q í La moda (Mo)
La m oda es el valor que m ás se repite, es decir, el que tiene m ayor frecuencia.
La m oda es de especial utilidad para resum ir datos de nivel nom inal. Es posible
determ inar la m oda para todos los niveles de datos, nom inal, ordinal, de inter­
valo y de razón. La m oda tam b ién tie n e la ventaja de que no Influyen en ella
valores extrem adam ente grandes o pequeños.
No obstante, la m oda tiene sus desventajas, por las cuales se le utiliza con m e­
nor frecuencia que la m edia o la m ediana. Entre sus desventajas está el caso
de que en m uchos conjuntos de datos no existe la m oda, porque ningún valor
se presenta m ás de una vez.
Por ejemplo, no hay m oda en el siguiente conjunto de datos de precios: $19, $21,
$23, $20 y $18. Sin embargo, com o cada valor es diferente, podría argum entarse
que cada valor es la m oda. Cuando un conjunto de datos no tiene m oda, este
conjunto se considera com o am odal, es decir, que carece de moda.
Por el contrario, en el caso de algunos conjuntos de datos hay más de una moda.
$upongam os que las edades de los m iem bros de un club son 2 2 ,2 6 ,2 7 ,2 7 ,3 1 ,3 5
y 35. Am bas edades, 27 y 35 son modas. Así, este agrupam iento de edades se de­
nomina bimodal (tiene dos modas). Alguien podría cuestionar la utilización de dos
modas para representar la ubicación de este conjunto de datos de edades.

4.1 La moda para datos agrupados


Cuando los datos están agrupados en tablas de frecuencias, la m oda se calcu­
la utilizando la fórm ula de cálculo siguiente:

M e d ia n a para d a to s agrup ados: M o = L + 1 * AC


d1 + d2

Donde:
L¡ = lím ite in ferio r de la clase m odal (la clase que contiene la m oda, esta es la
que contiene la m ayor frecuencia absoluta).

©Santillana, S. A. "| g
AC = tam a ño del intervalo de la clase.
d 1 = la diferencia entre la frecuencia absoluta de la clase m odal y la frecuencia
absoluta de la clase anterior.
d 2 = la diferencia entre la frecuencia absoluta de la clase m odal y la frecuencia
absoluta de la clase siguiente.

Ejemplo: Edad de padres de familia


Las edades de 60 padres de fam ilia se m uestran agrupadas en una serie
de clases y frecu encias en la tabla siguiente. D e term inar la m oda para
estos datos.

G rupo d e ed a d f¡
4 5 -5 0 4
5 0 -5 5 21
En estos datos agrupa dos ya
5 5 -6 0 14
s o lo se tie n e una cla se con
6 0 -6 5 7
m a yo r fre c u e n c ia , la q u e va
6 5 -7 0 10 de 50 a 55 y, por lo tanto, solo
7 0 -7 5 1 se tiene una m oda.
7 5 -8 0 3
Total 50

El pro ce d im ie n to para de te rm in a r la m oda se resum e en la fórm ula 1.4


m ostrada anteriorm ente.
Sustituyendo los valores en la fórm ula 1.4, se tiene:

Me = 50+ - 2 1 ~ 4 ---------- * 5 = 50 + - ~ 1 / • * 5 = 50 + 4 f * 5
(2 1 -4 )+ (21-14) 17 + 17 24

= 50 + (0.7083) * 5 = 53.542

La edad m odal del g ru p o de padres de fa m ilia es de 53.542 años.

B C O M P E T E N C IA A M B IE N T A L Y DE LA S A L U D

C3 Se ha d e sa rro lla d o una nueva vacuna co n tra la d ifte ria para ap lica rla a niños. A n ­
te rio rm e n te el nivel de p ro te c c ió n e stá n d a r o b te n id o por a n tig uas vacunas es de
1 p g /m l un m es después de la in m u n iza ció n . Con la nueva vacuna se han o b te n id o
los sig u ie n te s d a to s del nivel de p ro te cció n en p g /m l al tra n s c u rrir un m es:

12.5 13.5 13 13.5 13 12.5 13.5 14 13.5 13 13 14 14.5 13 12 13.5 13.5 12.5 12.5 12.5

¿Cuál es la m oda del nivel de protección al tran scurrir un m es de la nueva vacuna?

20 © Santillana, S. A.
4.2 Usando la tecnología: Microsoft Excel
M icrosoft Excel calcula la m oda con la función MODAO. H aciendo uso de esta
función no es necesario agrupar u ordenar los datos para determ inarla; la fu n ­
ción de Excel hace to d o el trabajo.
Las ca lifica cio n e s de un e stu d ia n te en 20 p ru e b in e s fu e ro n 5 , 3 , 6 , 5 ,4 ,5 ,2 ,
8 , 6 , 5 ,4 , 8 , 3, 4, 5 ,4 , 8 , 2, 5 ,4 . H allar la m oda de estas calificaciones.

Usando la fu nció n de Excel para d e te rm in a r la m oda de las calificaciones de


los 2 0 pruebines del estudiante, se realizan los siguientes pasos:
■ U bicarnos en la celda que querem os alm acenar nuestro el resultado de la
m oda.
■ Hacer clic en la opción insertar función (fx).
■ En la ventana resultante elegir la función (MODA) de las funciones estadísticas.
■ Después seleccionar los valores (Calificaciones) de los que querem os obtener
la m oda, rango de celdas desde A 2 hasta A 2 1 .
■ Hacer clic en A ce p ta r.
La m oda de c a lific a c io n e s de los 20 p ru e b in e s to m a d o s p o r un e s tu d ia n te
es de 5 puntos.

©Santillana, S. A. 21
4.3 Usando la tecnología: Lenguaje R
Al ser R un program a estadístico, para el cálculo de algunos datos estadísticos
es necesario instalar bibliotecas que contienen funciones específicas para rea­
lizar dichos cálculos, un e jem p lo es la biblioteca "M odee st", la cual se utiliza
para calcular la m oda de una distribución. Para instalar la biblioteca es necesa­
rio te n e r acceso a Internet y posicionarse en la barra de estado en paquetes ->•
Instalar paquetes y, luego, elegir un mirror, para luego descargar las bibliotecas
deseadas.
Al descargar la biblioteca "M odeest" se debe usar la función mfv(x) para deter­
m inar la m oda de un conjunto de datos.
D espués de desca rga r la b ib lio te ca "M o d e e s t" d e b e m o s de cargar esta en
nuestro sistem a R. Para cargarla debem os de:
1) Ir al m enú principal y hacer clic en Paquetes.
2) Hacer clic en cargar paquetes.
3) De la lista de paquetes seleccionar "M odeest".
4) Hacer clic en A ce p ta r.
Después de tener cargada la biblioteca "M odeest" en nuestro R, procedem os a
Ingresar los datos a los cuales querem os calcular la m oda.
> X = C(5, 3, 6 , 5, 4, 5, 2, 8 , 6 , 5, 4, 8 , 3, 4, 5, 4, 8 , 2, 5, 4)
> mfv(x)

[1] 5

¿retuvo ¿dfcor ysuofi«r Mise Póqueres

> local({pkg <- select.list(sort(.packages(all.available = TRUE)),graphics=TRUE)


+ if(nchar(pkg)) library(pkg, character.only=TRUE)})

This is package 'm o d e e s t ' written by P. PONCET.


For a complete list of functions, use 'library(help = "modeest")1 or 'help.start()'

Warning message:
package 'modeest' was built under R version 3.4.3
> x=c(5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4)
> mfv(x)
[1] 5
>l

La m oda de calificaciones de los 20 pruebines tom a dos por un estudiante es


de 5 puntos.

22 ©Santillana, S. A.
& La media geométrica (G)
La m edia geom étrica resulta útil para de te rm in a r el cam bio prom edio de por­
centajes, razones, índices o tasas de cre cim ie n to , y se d e fin e co m o la raíz
n-ésim a del producto de los n datos o valores de la variable.
Posee am plias aplica cione s en la a d m in istra ció n y la econom ía, ya que con
frecuencia hay interés en d e term inar los cam bios porcentuales de ventas, sa­
larios o cifras económ icas, com o el producto interno bruto, los cuales se com ­
binan o se basan unos en otros.

M e d ia g e o m é tric a : G = < y x .,* x 2 * ... * X n

La m edia geo m é trica siem pre es m enor o igual (nunca m ayor) que la m edia
aritm ética. Todos los datos deben ser positivos.

Ejemplo: Tasa de promoción


Se tiene la tasa de prom oción de los 6 grados de Nivel Básico de un cen­
tro educativo. Se desea d e te rm in a r la tasa p rom edio de p rom oció n de
los 6 grados.

1ro. 96.1 % 2dO. 95.5 % 3ro. 89.9 % 4tO. 91.8 % 5tO. 92.8 % 6tO. 93.6 %

Debido a que estos datos están expresados en tasas, el estadístico ideal


es la m edia geom étrica. A plicando la fórm ula 1.5 y sustituyendo los va­
lores, obtenem os:
G = ^ 96.1 * 95.5 * 89.9 * 91.8 * 92.8 * 93.6

= f¡ 657,849,108,739.37 = 9 3 .3 %
La tasa de p ro m o ció n p ro m e d io de los 6 grados de Básica de un c e n ­
tro e d u c a tiv o es de 93.3 %.

■2«
asi 18S2 3S?J ÍÍS * 18« S98é 1«17 1*28 19 » 1950 l«M 59T2 It t i 19« 20« 20«
gíwranweIiíia-Mt-CBPfMSaESíftM»!»} — M a M in a iC O f fM ortk {ngh»«eiUJ

La media geométrica se utiliza con más frecuencia para calcular


la tasa de crecimiento porcentual promedio de algunas series da­
das, a través del tiempo.

23
5.1 Usando la tecnología: Microsoft Excel
M icrosoft Excel calcula la m edia geom ètrica con la función MEDIA.GEOMO.
Calculando la tasa prom edio de prom oción de los 6 grados de un centro edu­
cativo de Prim aria del ejem plo a n te rio r haciendo uso de Excel, se tiene:

Usando la función de Excel para determ inar la m edia geom étrica de la tasa de
prom oción, se realizan los siguientes pasos:
■ Ubicarnos en la celda en la que querem os almacenar el resultado de la media.
■ Hacer clic en la opción In s e rta r función (fx).
■ En la ventana re su lta n te elegir la fu n ció n (MEDIA.GEOM) de las fu n cio n e s
estadísticas.
■ Después seleccionar los valores (tasa de prom oción) de los que querem os
obtene r la m edia geom étrica, rango de celdas desde B3 hasta B 8 .
■ Hacer clic en A ce p ta r.
La tasa de p ro m o c ió n p ro m e d io de los 6 g ra d o s de P rim a ria de un c e n tro
e d u ca tivo es de 93.3 %.

© Santillana, S. A.
5.2 Usando la tecnología: Lenguaje R
Para calcular la m edia geom étrica en R hacem os uso de dos funciones (prod(x) y
length(x)), ya que no hay una fu nció n específica para este estadístico. H arem os
uso de los datos de la tasa de prom oción de los grados del centro de Primarla.
Ingresando en la línea de com andos lo siguiente:
> X = C(96.1, 95.5, 89.9, 91.8, 92.8, 93.8)
> m ediaGeom = prod(x)A(1/length(x))
> mediaGeom
[1] 93.29248

\c RGui (64-bit)
firc h iv o £ditar Visualizar M «c Paquetes Ventanas Ayuda

l<*lálHIM*|o||»||«|
U R Consolé

> x = c (9 6 .1 , 9 5 .5 , 8 9 .9 , 9 1 .8 , 9 2 .8 , 93.8)
> mediaGeom = prod(x)A (1/length(x))
> mediaGeom
[1 ] 9 3 .2 9 2 4 8
>I

P e n s a m ie n to lógico, c re a tiv o y crítico: El fa cto r de crecim ie nto prom edio de


dinero com puesto con tasas de interés anual del 10 %, 5 % y 2 % puede obtenerse
calculando la m edia geom étrica de 1.10,1.05 y 1.02.
Calcula el fa c to r de cre cim ie n to prom edio. ¿Qué porcentaje de la tasa de cre ci­
m ie n to sería equivalente a te n e r tres tasas de crecim iento sucesivas del 10 %, 5 %
y 2 %? ¿El resultado es igual a la m edia del 10 %, 5 % y 2 %?

OSantillana, S. A. 25
La media armónica (H)
La m edia arm ónica es el recíproco de la m edia aritm ética de los recíprocos de
los valores individuales.
Se le suele utilizar para p rom edia r distintas velocidades desarrolladas en dis­
tancias iguales, tiem pos, rendim iento, etc.
Una desventaja de esta es que cuando algún valor de la variable es 0 o cerca­
no a cero no se puede calcular.

M e d ia arm ó n ic a H = — — ——
— + — + ... - X
x, x2 xn
Juan Pablo Montoya fue quien esta­
bleció el tiem po de la vuelta más
rápida de la historia en la Fórmula 1
(F1), un récord que hoy sigue vigen­ Ejemplo: Velocidad media
te. El colom biano rodó en Monza
con su Williams FW36 a una Increí­
Supóngase que una fam ilia realiza un viaje en autom óvil a una ciudad y
ble velocidad media de 262.24 km/h cubre los prim eros 100 km a 60 km /h, los siguientes 100 km a 70 km /h y
(162,950 m/h). los últim o s 100 km a 80 km /h. Calcular, en esas condiciones, la ve lo ci­
dad m edia realizada.
D ebido a que estos d a to s co rre sp o n d e n a ve lo cid a d e s en d istan cias
iguales, es útil utilizar la m edia arm ónica:

H= = 69.04 km /h
1 1 1 0.0167 + 0.0143 + 0.0125 0.0435
60 70 80

La ve lo cid a d m edía a la que via jó la fa m ilia fu e de 69.04 Km /h.

6.1 Usando la tecnología: Microsoft Excel


M icrosoft Excel calcula la m edia geom étrica con la función MEDIA.ARMOO.
Un laboratorio de productos farm acéuticos ha asignado a un grupo de 6 traba­
jadores para com pleta r una orden de 700 artículos de un m ism o tipo. Las tasas
de productividad (medida en m inutos por artículo) de cada uno de los trabaja­
dores están dadas a continuación: 8 ,1 1 ,7 ,7 ,1 8 ,6 .

■ í *
X ■/ MItNA.ABMOfB/B/)

A B C D E
Trabajador Productividad
MCDU.UMO
1 8 i«-«".' «M» 53 ■«I W W
2 11
3 7
. |TUTTI
4 7
5 18
6 6 ■lUMtkkllMl. UM0KII1

M e d ia Arm ónica M O (B 2:B 7 )

26 ©Santillana, S. A.
■ U bicarnos en la celda que que rem os alm acenar el resultado de la m edia
arm ónica.
■ Hacer clic en la opción In s e rta r función (fx).
■ En la ventana resultante elegir la fu nció n (MEDIA.ARMO) de las fu n cio n e s
estadísticas.
■ Después seleccionar los valores (Productividad) de los que querem os obtener
la m edia arm ónica, rango de celdas desde B3 hasta B8 .
■ Hacer clic en A ce p ta r.
La p ro d u c tiv id a d p ro m e d io de lo s 6 e m p le a d o s es de 8.29 m in u to s p o r
a rtícu lo .

> x = c(8, 11, 7, 7, 18, 6)


> armónica = l/mean(l/x)
> armónica
[1] 8.289061
>i

6.2 Usando la tecnología: Lenguaje R


Para c a lc u la r la m e d ia a rm ó n ic a en R se c a lc u la la m e d ia a ritm é tic a de
los re c íp ro c o s de cada valor. H a rem os uso de los d a to s de p ro d u c tiv id a d
de los 6 tra b a ja d o re s para c o m p le ta r una o rd e n de 700 a rtículos.
Ingresar en la línea de com andos lo siguiente:
>X = 0(8,11,7,7,18, 6)
> arm ónica = l/m e a n ( 1 /x)
> arm ónica
[1] 8.289061

CSantillana, S. A. 27
M e d id a s d e t e n d e n c ia c e n tr a l
CONTROL DEL APRENDIZAJE

1. Diez personas adultas que visitaban una pizzería, elegidas al azar, calificaron el sabor
de una nueva pizza de sushi en una escala de 1 a 50, en la que el 1 indica que no les
gusta el sabor y 50 que sí les gusta. Las calificaciones fueron las siguientes:

34 39 40 46 33 31 34 14 15 45

• Obtén la m edia aritm ética, m ediana y moda de la puntuación obtenida para la nueva
pizza.

2. Una m u e stra de arch ivo s de personal de o ch o em p le a d o s en las in sta la cio n e s de


una em presa de fa b rica ció n de envases plá stico s reveló que d u ra n te el ú ltim o se­
m e stre estos fa lta ro n a la em presa la sig u ie n te ca ntid ad de días por enferm e dad:

2 0 6 3 10 4 1 2

• Calcula la cantidad de días de ausencia prom edio de estos 8 trabajadores, la m edia­


na y m oda de días de ausencia los trabajadores.

3 Un p ro ve e d o r de In te rn e t del país ela b o ró una d is trib u c ió n de fre cu e n cia s sobre la


edad de los usuarios de In te rn e t. D e term ina la m edia a ritm é tic a , m ediana y m oda
de edad de esos usuarios.

Edad (años) F recu encia

10 a 20 3
20 a 30 7
30 a 40 18
40 a 50 20

50 a 60 12

4 En la s ig u ie n te ta b la se m u e s tra n los re s u lta d o s de una e n cu e sta que se hizo a


100 persona s ace rca del n ú m e ro de horas p o r sem ana que u tiliz a n in te rn e t. Cal­
cula e in te rp re ta : la m edia a ritm é tic a , m ediana y m oda.

Hora Frecu encia


Oa 5 8

5 a 10 23
1 0 a 15 38
15 a 20 20

20 a 25 11

© Santillana, S. A.
v e d ia g e o m é tric a

En un e x p e rim e n to q u ím ic o se to m a ro n las s ig u ie n te s te m p e ra tu ra s (en grados


centígrados). C alcula la te m p e ra tu ra prom edio .

13.4 12.5 1 1 .8 13.6

Las tasas de in te ré s de 10 bonos se m u e stra n a c o n tin u a ció n . C alcula e in te rp re ta


la tasa prom edio.

5% 2 % 3% 7% 4% 4.5 % 2.5 % 3.5 % 6 % 4%

M ed ia a rm ó n ica

En una com petencia participan 5 pilotos, que realizan un recorrido de 1 000 kiló m e ­
tros. Se m uestra a contin uación el tie m p o en segundos que ta rd ó cada uno de ellos
en te rm in a r el trayecto. Calcula e in terpreta el tie m p o m edio de la com petencia.

Una em presa agrícola dedicada a la p ro d u cció n de p láta nos tie n e 10 te rre n o s de


siem bra de distintos tam años. En la últim a cosecha se recolectó cie rto núm ero de ki­
logram os de cada uno de ellos. Calcula e in terpreta la producción m edia de plátanos
en los 1 0 terrenos.

T erren o Producción

A 1 500

B 2 100

C 1 234

D 2 356

E 3 478

©Santillana, S. A.
C o m u n ic a

1. Explica la relación entre la m edia aritm ética, m edia geom étrica y la m edia arm ónica.

R a z o n a y a r g u m e n ta

2. Para cada uno de los sig u ie n te s casos, id e n tific a una razón im p o rta n te p o r la que
la m edia y la m ediana no son esta d ístico s que tenga s e n tid o utilizarlo s.
• Códigos postales: 12601, 90210, 02116, 76177,19102.
• Niveles de estrés de distintos em pleados: 2 ,3 ,1 ,7 ,9 .

M o d e la y r e p r e s e n ta

3. A 35 aspirantes al puesto de gerente general de una im portante em presa se les aplica un exam en de aptitud
gerencial. A continuación se m uestran las calificaciones obtenidas por ellos. Representa en una tabla de d istri­
bución de frecuencias con intervalos de clase de 1 0 puntos y obtén:

La m edia aritm ética La mediana • La moda

60 65 74 78 85 89 94
63 67 75 79 86 89 94
65 67 75 79 86 90 97
65 68 77 85 87 91 97
66 69 77 85 87 93 100

R e s u e lv e p r o b le m a s

4. El increm ento porcentual de ventas de los pasados 7 años en una em presa dom inicana fue de 5.91,8.75,3.12,
12.60, 4.75, 9.23 y 11.78.
• Determ ina la m edia geom étrica del increm ento porcentual.
• Determ ina la m edia aritm ética del increm ento porcentual.
• ¿La m edia aritm ética es igual o m ayor que la m edia geom étrica?

U tiliz a h e r r a m ie n t a s te c n o ló g ic a s
• Haciendo uso de Excel y Lenguaje R, calcula el siguiente conjunto de datos: la m edia aritm ética, la m ediana,
la m oda, la m edia geom étrica y la m edia arm ónica.
• Las edades de una m uestra de turista s canadienses que vuelan de Hong Kong a la República Dom inicana son
las siguientes: 32, 21, 60, 47, 54,17, 72, 55, 33, 41, 52, 45, 63, 75,15, 32 y 23.

APRENDIZAJE AUTÓNOMO
Reconoce los conceptos de m edia, m ediana, m oda, m edia geom étrica
y m edia arm ónica com o m edidas de tendencia central.
□ □ □
Calcula las m edidas de tendencia central: utilizando hoja de cálculo,
Lenguaje R.
□ □ □
Establece la diferencia entre la m edia aritm ética y la m edia geom étrica
utilizando diferentes softwares. □ □ □
30 ©Santillana, S. A.
i 2 ! 3 4 5 6 7 8 9 10

Medidas de posición
La Encuesta de Ingresos y Gastos de los Hogares (ENIGH) llevada a cabo por la Oficina Nacional
de Estadística (ONE) recurre a las medidas de posición para describir la intensidad de los ingre­
sos y gastos por hogar; la última fue llevada a cabo en el año 2007.

@ne
O ficin a n ac io n al de e s ta d ís tic a

Encuesta Nacional de ingresos y Gastos de los Hogares


C o m p e te n c ia s
■ Define cuartiles, deciles y per­
c e n tile s c o m o m e d id a s de
posición.
■ Calcula e Interpreta cuartiles,
d e c ile s y p e rc e n tile s c o m o
m edidas de posición para da­
to s no agrupados.
■ utiliza herramientas tecnológi­

2007
cas para realizar cálculos con
m edidas de posición usando
herram ientas tales com o; M i­
crosoft Excel y Lenguaje R.

C o n te n id o s
■ Percentiles.

Resultados Genera ■ Cuartiles.


■ Deciles.

O Santillana, S. A. 31
Medidas de posición
Las m e d id a s o ín d ice s de p o sició n , ta m b ié n d e n o m in a d o s fra c tile s , in for­
m an acerca de la posición relativa de un su je to con respecto a su g ru p o de
referencia, den tro de la distribución de frecuencias de la variable. Es decir, indi­
can la posición de una puntuación con respecto a un grupo, utilizando a este
com o m arco de referencia.
Dado que se trata de localizar la posición de un sujeto en una distribución deter­
minada, para construir un índice de posición, debem os dividir la distribución en un
núm ero de partes o secciones ¡guales entre sí en cuanto al núm ero de observa­
ciones. Por ejemplo, si querem os dividir una distribución en dos partes iguales,
necesitamos un único valor para esa partición, que coincide con la mediana de la
distribución (recuerda que la m ediana divide la distribución en dos partes, cada
una con el 50 % de los sujetos). En el caso de querer dividirla en tres partes, cada
una con un tercio de los sujetos, necesitam os dos valores de la variable, y así su­
cesivamente. Dependiendo de cuántos valores de la variable utilicem os para divi­
dir la distribución, podemos hablar de diferentes medidas de posición.
A continuación, vam os a describir tres m edidas de posición o fractiles: los per-
ce n tile s, los c u a rtile s y los deciles. Estos fractiles se utilizan con m ucha fre ­
cuencia en la práctica, especialm ente los dos prim eros.

1.1 Percentiles (Pk)


Los perce n tile s, tam bién denom inados centiles, son los 99 valores de la varia­
ble que dividen en 1 0 0 partes iguales la distribución de frecuencias.
El p e rc e n til k, den ota do por Pk, es un valor de la variable de interés que deja
por debajo de sí un porcentaje k de sujetos, donde k = 1 ,2 ,..., 99.
El percentil 50, P50, de una distribución deja por debajo de sí al 50 % de los su­
je tos y por encim a al o tro 50 %. Podem os observar que esa definición coincide
con la de m ediana de una distribución estudiada previam ente.
En efecto, el valor de la m ediana coincide con el percentil 50 de la distribución.
De este modo, la m ediana es uno de los 99 posibles percentiles de una d is tri­
bución, en concreto, el percentil 50. Por este m otivo, el cálculo de los percenti­
les lo vam os a realizar utilizando una extensión del m étodo expuesto para la
m ediana. La diferencia entre el cálculo de la m ediana y de los percentiles e stri­
ba en que en la m ediana se trataba de localizar la posición de -P -

En cam bio, en los percentiles, y de form a más general, se hace en base al nú­

Las medidas de posición requieren m ero k ■Este núm ero es igual a ( n * ^ cuando calculam os el per­
que exista un orden en las catego­
rías de los datos, por lo que solo se centil 50. En efecto, k = 50 por lo que (n + D * 50 = id + H .
100 2
pueden determinar a partir de la
escala ordinal. Por eso antes de em­
pezar a calcularlas hay que ordenar Loca lización de p e rc e n til P„ = (n + V * k
y k 100
los datos de manera ascendente.

32 © Santillana, S. A.
Ejemplo: Ausencias de estudiantes
En un centro educativo, al final del año escolar se ha obtenido la cantidad
de estudiantes que se han ausentado durante al m enos un día en 28 se­
m anas de clases. Se desea o b tene r los percentiles 23 y 71 de la cantidad
de estudiantes que faltaron a clases al m enos un día en 28 semanas.
43 47 10 14 5 34 11 11 5 37 41 11 24 9 10 12 25 31 3 34 16 1 7 20 38 32 12
48
■ Primero, ordenam os los 28 datos (nótese entonces que n = 28).
1 3 5 5 7 9 1 0 1 0 1 1 11 11 12 12 1 41 6 20 24 25 31 32 34 34 37 38 41 43
47 48

■ El percentil 23 estaría en la posición: (2 8 +1 qq* 23 = 6 -6 7

Se procede a determ inar el percentil 23 de la siguiente manera:


P 23 = Valor en la posición 6 + fracción x (valor en la posición 7 - valor
en la posición 6 )
P 23 = 9 + 0 . 6 7 x 0 0 - 9 )

P23 = 9 + 0.67 X 1 = 9 + 0.67 = 9.67


■ El percentil 71 estaría en la posición: ^ ^ q q * 71 = 20.59.
Se procede a determ inar el percentil 71 de la siguiente manera:
P71 = Valor en la posición 20 + fracción x (valor en la posición 21 - valor
en la posición 2 0 )
P 71 = 32 + 0.59 X (34 - 32)
P71 = 32 + 0.59 x 2 = 9 + 1.18 = 33.18

ggf C O M P E T E N C IA C IE N T ÍF IC A

II Las siguientes tem peraturas fueron obtenidas en un laboratorio de quí­


m ica de la U niversidad A u tó n o m a de Santo D om ingo (UASD) con un
te rm ó m e tro eléctrico (en °C) de 24 tubos de ensayo, con el fin de de­
PARA COMENTAR
sarrollar un com puesto quím ico, obteniéndose los siguientes datos:

Existen 7 equ ipos de bas­ ■ Determ ina el percentil 25, y 70.


quetbol, y están ordenados
según cantid ad de ju egos 25 28 25 27 25 32
ganados. Si el 75 % de ellos 35 32 39 32 32 21
ha ganado menos de 47 ju e ­
25 29 26 41 19 32
gos, ¿qué pe rce n til re p re ­
senta este porcentaje? 30 30 29 32 21 27

C Santillana, S. A.
33
Percentiles para datos agrupados
P „ = 10.5
El p ro ce d im ie n to que se sigue para d e te rm in a r el va lo r de los percentiles en
, * « • • • • ëlSl una serie de clases y frecuencias es el m ism o que se vio antes para la m edia­
OBD is i B i E í i a D B I I S K a E i
na, salvo que se sustituye en el proceso de interpolación (en la fórm ula) la po­
25%' 75%
sición correspondiente. Así, la fórm ula es la siguiente:
El percentil 25 deja por debajo al
25 % de la distribución de datos y n* k
deja por encima el 75 % de esta. 100
Percentil para datos agrupados P : AC

Donde:

L¡: lím ite inferio r real del intervalo en que debe caer el percentil.
n * k
: lugar(intervalo) en la co lu m n a de fre cu e n cia s a cum uladas en que
debe caer el percentil.

F-1 : frecuencia acum ulada hasta el intervalo anterior al del percentil.

f ¡ : frecuencias sim ples den tro del intervalo en donde debe caer el percentil.

AC : tam año del intervalo de la clase.

Ejemplo: Ausencias de estudiantes


En la tabla siguiente se m uestran las puntuaciones agrupadas en clases
de un grupo de 50 estudiantes en una prueba de Inglés.

Puntuaciones f, F¡
6 5 -7 0 3 3
70 -7 5 5 8
7 5 -8 0 8 16
80 -8 5 12 28
8 5 -9 0 10 38
90 -9 5 7 45
95-100 5 50
50

Para el cálculo del percentil se requiere de las colum nas intervalos, fre ­
cuen cias y fre cu e n cia s acum uladas de la tabla de in tervalos (ver tabla
anterior). C om o se puede observar, la tabla está organizada de m enor a
mayor. A continuación, se detalla el p rocedim iento para el cálculo de d i­
cho estadístico: CALCULAR EL PERCENTIL 85.

34 © Santillana, S. A.
■ s e c a lc u la ^ f = ^ = 4 2 . 5 .

■ 42.5 se ubica en las frecuencias acum uladas en el intervalo 90 - 95. A


este intervalo se le denom ina la clase que c o n tie n e el p e rce n til k.
■ Se determ ina FM que corresponde a la frecuencia acum ulada anterior
a la clase que contiene el percentil; en este caso es igual a 38.
■ De igual m anera se señala el va lo r de f¡, o sea, la fre cu e n cia sim ple
den tro de la clase que contiene el percentil, que resultó ser igual a 7.
■ El tam año dei intervalo, AC, para este problem a es de (5)

■ Finalm ente se sustituye en la fórm ula del percentil:

P85 = 90 + ( (4Z57~ 38) * 5 ) = 90 + j - i J L * 5 j = 90 + (0.643 * 5)

= 90 + 3.21 = 93.21
El va lo r del percentil 85 para estos datos es de 93.21 y se considera
que deja por debajo de él al 85 % de los datos de la d istrib u ció n , e x­
presando esto que "El 85 % de los e stu d ia n te s alcanzaron una c a lifi­
c a ció n m e n o r de 93.21 p u n to s ", en otras palabras, "el 85 % de los
e stu d ia n te s o b tu v ie ro n una ca lifica ció n in fe rio r a 93.21 p un tos".

8 C O M P E T E N C IA A M B IE N T A L Y DE LA S A L U D

Q Una de las aplicaciones prácticas m ás conocidas de los percentiles está en la m edida del peso y la altura
de los bebés para conocer si hay algún problem a en su desarrollo. Según los m édicos, el peso ideal para
una niña de 12 m eses es de 9.53 kg y la estatura ideal es de 74.3 cm . A contin uación, se m uestran los
pesos en kg de una m uestra de 50 niñas de 12 meses. D eterm ina los percentiles 3 3 ,7 5 y 90.

Peso en Kg. f, F,
9 .0 3 -1 0 .0 3 8 8

1 0 .0 3 -1 1 .0 3 11 19

1 1 .0 3 -1 2 .0 3 3 22

1 2 .0 3 -1 3 .0 3 4 26

1 3 .0 3 -1 4 .0 3 11 37

1 4 .0 3 -1 5 .0 3 13 50

Total g e n eral 50

©Santillana, S. A. 35
0 Cuartiles (Qk)
_______03 Los cuartiles son tres valores de la distrib u ció n que dividen en cuatro partes
02 de igual frecuencia a la distribución.
01 El p rim e r cu a rtil, que se representa por Qv deja por debajo de sí al 25 % de los
sujetos y por encim a al 75 % restante. Com o se puede d ed ucir fácilm ente, se
25% 25% 25% 25%
corresponde con el percentil 25 de la distribución, esto es, Q 1 = P25.
i i
El segundo cuartil, Q2, deja por debajo de sí al 50 % de los sujetos y por encim a
Qi ^2 Q3 al o tro 50 %. Es equivalente al percentil 50, y, por ende, a la m ediana de la dis­
tribución, Q 2 = P50 = Me.
Los cuartiles dividen en 4 partes
iguales una distribución de datos. Por últim o, el te rc e r cuartil, Q3, deja por debajo de sí al 75 % de los sujetos y
por encim a al 25 % restante. Se corresponde con el percentil 75 de la d istrib u ­
ción, Q 3 = P75.
Debido a la equivalencia con los percentiles, para el cálculo de los tres cu a rti­
les vam os a utilizar los m étodos propuestos para los percentiles. En concreto,
Q 1 lo calculam os m ediante P25, Q 2 con P50, y Q 3 con P75.

Localización de cuartil a = -(n-+ D * k


K A

Cuartil para datos agrupados

Por otra parte, los cuartiles se utilizan para construir índices para el estudio de
la variabilidad de una distribución de frecuencias.
A continuación, se muestra un diagrama que representa las equivalencias de los
cuartiles con los percentiles. Q 1 = P25 = 25 %; Q2 = = M e = 50%; Q3 = P75 = 75%.

P IO P20 P30 P40 P60 P70 P80 P90

Valor Q2 = M e Valor
P25 = Q1 P75 = Q3
m ínim o Q2 = P50 m áxim o
P50 = 50%

36 © Santillana, S. A.
© Deciles (Dk)

Los deciles son nueve valores que dividen en diez partes iguales a la d istrib u ­
ción. Se representan por D ¡( donde i = 1,2,
El prim er decil, D 1 deja por debajo de sí al 10 % de los sujetos, el D2 al 20 %, el
D3 al 30 % y así hasta el D 9 que deja por debajo de sí al 90% de los sujetos. De
este modo,
D 1= Pr 10' D2= P 20' ’‘ '
D 5 = P50 = M e D = P90
‘'*' ^ 9

Deciles - Percentiles Cuartiles - Percentiles

JTJ
n
o

O
Los hogares, en las encuestas de D 2 = P20
Ingresos y gastos, son clasificados
en declles. ^ Qi ” 25
D 3 = P30
Q

CL
II

o
D = P
^2 "50
D 6 = P 60
D 7 = P 70

^ ^3 W5
D 8 = P80
D 9 = 1P90

Por lo tanto, tam b ién podem os calcular los deciles a p a rtir de los percentiles
correspondientes.

Localización de deciles D, = (-n + ']'> *k


k 10

I in ¡-i /
Deciles para datos agrupados D„ = L + — — f7
K i
*AC

4.1 Usando la tecnología: Microsoft Excel


En M icro so ft Excel solo existen dos fu n cio n e s para las m edidas de posición
a n te rio rm e n te m encionadas, la fu nció n para los percentiles es PERCENTIL.
EXCO y para los cuartiles es C U ARTIL. e x c O. Si se desea calcular algunos de
los deciles, se utiliza el percentil equivalente al decil deseado.
A continuación, se listan los precios oficiales del gas licuado de petróleo (GLP)
en las prim eras 9 sem anas del año 2017.

©Santillana, S. A.
37
PERÍODOS SEMANALES - AVISOS DE PRECIOS GLP
31 DIC. AL 06 ENE 2017 103.10
07 Al 13 ENE 2017 106.10
14 AL 20 ENE 2017 104.60
21 AL 27 ENE 2017 103.60
28 Al 03 DE FEB 2017 105.00
04 AL 10 FEB 2017 108.00
11 AL 17 FEB 2017 108.00
18 al 24 FEB 2017 111.00
25 FEB AL 03 MARZO 2017 109.50

Usando la función de Excel para determ inar los percentiles deseados, se reali­
zan los siguientes pasos:
■ Ubicarnos en la celda que querem os alm acenar el resultado de los percenti­
les o cuartiles deseados.
■ Hacer clic en la opción Insertar función (fx).
■ En la ventana resultante elegir la función (PERCENTIL.EXC) de las funciones
estadísticas.

« X ■ Ü K <‘W iïÈ Ë Ê Ë 1 S3ES3B dZOIVt C23HHI


Roitapapeles fi Fuente Alineación

B14 X ✓ -*PLRCENIIL.FXC(B2:B10,0.3i)
<

CO

Á C D E F G H 1 J K *

PERIODOS SEMANALES -
AVISOS DE PRECIOS GLP v:' ' ' "i ’ xJ
31 DIC. AL 06 ENE 2017 103.10 PERCEHTtLEXC
Matriz BiBtO f t ] • (103.1;106.1;104.6(103.6;105; 108(106...
07 Al 13 ENE 2017 106.10 K 0.33 ¡ t ] • 0J3
• 104.72
14 AL 20 ENE 2017 104.60 Cevuehre el percent« » esimo de lot vaio es de un rango, donde » está en el rango 0- 1, enduswo.
Matin s la matri; o rango de datos aue detine la posición relativa.
21 AL 27 ENE 2017 103.60
28 Al 03 DE FEB 2017 105.00 Resultado de la fórmula » 104.72
04 AL 10 FEB 2017 108.00 Aceptar Cancelar |

11 AL 17 FEB 2017 108.00


18 al 24 FEB 2017 111.00
25 FEB AL 03 MARZO 2017 109.50
I Percenti! 25 = Cuartil 1
[Percentil 75 = Cuartil 3
|Percentil 90 = Decil 9
¡Percentil 33 =+PERCENTIL.EXC(B2:B10,0.33)

■ Después seleccionar los valores (GLP) de los que querem os obtene r los per­
centiles o cuartiles deseados, rango de celdas desde B2 hasta B10.
■ Indicar el percentil a obtener. SI deseam os el percentil 25 = cuartil 1, Ingresa­
m os el valor 0.25; si deseam os el percentil 33, Ingresam os en el valor 0.33, y
así sucesivam ente.
■ Hacer clic en Aceptar.

38 © Santillana, S. A.
PERIODOS SEMANALES -
AVISOS DE PRECIOS GLP
31DIC. AL 06 ENE 2017 103.10
07 Al 13 ENE 2017 106.10
14 AL 20 ENE 2017 104.60
21 AL 27 ENE 2017 103.60
28 Al 03 DE FEB 2017 105.00
04 AL 10 FEB 2017 108.00
11 AL 17 FEB 2017 108.00
18 al 24 FEB 2017 111.00
25 FEB AL 03 MARZO 2017 109.50
Percentil 25 = Cuartil 1 104.1
Percentil 75 = Cuartil 3 108.75
Percentil 90 = Decil 9 111
Percentil 33 104.72

P25: En el 25 % de las sem anas consultadas el precio del GLP estuvo por debajo
de los 104.1 pesos.
P75: En el 5 % de las sem anas consultadas el precio del GLP estuvo por debajo
de los 108.75 pesos.
P ^: En el 90 % de las sem anas consultadas el precio del GLP estuvo por debajo
de los 1 1 1 pesos.
P 33 : En el 33 % de las sem anas consultadas el precio del GLP estuvo por debajo
de los 104.72 pesos.

4.2 Usando la tecnología: Lenguaje R


La función en R que calcula los percentiles y cuartiles es quantileO , a la cual
se le establecen la variable que tiene los datos alm acenado y los percentiles o
cuartiles que deseam os obtener.

N o ta: R o b tie n e los percentiles y cu a rtile s hasta el va lo r calculado, es decir,


Indica qué porcentaje de los datos es igual o m enor al valor resultante. Debido
a esto los resultados de estos estadísticos pueden ligeram ente d ife rir de los
calculados en Excel y con la fórm ula.

Em pleando los datos del precio sem anal del GLP para obtene r los m ism os per­
centiles, obtenem os en R lo siguiente:

OSantillana, S. A. 39
M e d id a s d e p o s ic ió n
CONTROL DEL APRENDIZAJE

1. Una encuesta sobre el núm ero de llam adas telefónicas por celular realizada con una
m uestra de usuarios la sem ana pasada reveló la siguiente inform ación.

52 43 30 38 30 42 12 46 39 37 34 46 32 18

• Calcula e interprete:
Percentil: 33 , 6 6 y 85 - Cuartil: 1 y 3 Decil: 2 y 5

2 La sig u ie n te in fo rm a c ió n se re fie re a los p recio s de venta, en m iles de dólares, de


casas que se ve n d ie ro n en la ciudad, d u ra n te el 2 0 1 0 .

P recio de v e n ta
Frecu encia
(M ile s de US$)

1 2 0 -1 5 0 4
1 5 0 -1 8 0 18
1 8 0 -2 1 0 30
2 1 0 -2 4 0 20

240 - 270 17
270 - 300 10

300 - 330 6

• Calcula e interpreta:

Percentil: 3 0 ,6 5 y 92

3. Una m u e stra de o ch o e stu d ia n te s re ve ló que poseían la sig u ie n te ca lific a c ió n en


Física:

52 76 64 79 80 74 66 69

• Calcula e interpreta: Cuartil: 1 y 3 - Decil: 2 y 5


Percentil: 33 , 6 6 y 85

4. Los sig u ie n te s d a to s co rre sp o n d e n a la m asa (en kg) de 24 m u je re s de 17 años.

44 48 48 48 48 50 50 51
52 52 54 54 54 55 55 55
55 57 57 57 57 58 60 61

• Calcula e interpreta:

C uartil 1 - Percentil 50 Decil 7

40 © Santillana, S. A.
La sig u ie n te d is trib u c ió n de fre cu e n cia s co rre sp o n d e a los salarios de los e m p le a ­
dos de una em presa m a n u fa ctu re ra .

S alario en m iles RD$ f, F,


1 5 .0 -1 5 .4 9 7 7

1 5 .5 -1 5 .9 9 18 25

1 6 .0 -1 6 .4 9 32 57

1 6 .5 -1 6 .9 9 45 102

1 7 .0 -1 7 .4 9 52 154

1 7 .5 -1 7 .9 9 28 182

1 8 .0 -1 8 .4 9 16 198

1 8 .5 -1 8 .9 9 8 206

Total 206

Calcula e interpreta:
Cuartil 2 Percentil 30 - Decil 90

Analiza el siguiente cuadro que m uestra la evolución de la distribución del ingreso per
cápita entre 1987 y 1998 según quintiles (divide a la m uestra en 5 partes ¡guales).

A ños
q u in til
1987 1990 1 99 2 1 99 4 1996 1 99 8

i 4.3 4.4 4.6 4.3 4.1 4.1

ii 7.9 8 .2 8.5 8 .2 8 .2 8 .2

ni 11.7 12.3 1 2 .2 12 11.9 1 1 .8

IV 19 18.1 18.4 18.5 19.1 19.1

V 57.2 56.9 56.3 56.9 56.7 56.9

Total 100 100 100 100 100 100

Investiga sobre el m onto de ingresos per cápita en los años que indica el cuadro y
actualiza los valores por año y quintil (Consultar Enhogar 2007).
Establece el significado de los quintiles y su aporte com o com plem e nto a la m edia
aritm ética que es el ingreso per cápita.

O Santillana, S. A. 41
C o m u n ic a

1. Define y establece las diferencias entre los percentiles, los cuartlles y los deciles. Explica con ejemplos.

R a z o n a y a r g u m e n ta

2. En un exam en m uy difícil de un centro educativo de la ciudad, el profesor debe aprobar al m enos al 10 % de


los estudiantes. Calcular la nota a partir de la cual el profesor deberá aprobar al estudiante, si las notas de los
estudiantes que tom a ron el exam en fueron las siguientes:

0 20 5 0 0 35 10 5 20 0 15 45 10 0 0 20 40 5 0 45 20

M o d e la y r e p r e s e n ta

3. E stablecim iento de lím ites de velocidad: Aquí se presentan las velocidades registradas (en Km/h) de vehículos,
seleccionados al azar, que viajaban en una sección de la Carretera Duarte de República Dominicana (según datos
de MOPC). Esta sección posee un aviso de límite de velocidad de 80 Km/h. Los Ingenieros de tránsito adscritos a
este ministerio a m enudo establecen los límites de velocidad utilizando la "Regla Del Percentil 85", la cual establece
que la velocidad límite debe ser tal que el 85% de los conductores manejen a esa velocidad o a una más baja.
• Calcula el percentil 85 de las velocidades listadas a continuación.
• C om únm ente los lím ites de velocidad suelen redondearse a un m últip lo de 5, ¿qué lím ite de velocidad sugie­
ren estos datos? Explique su decisión.
• ¿El límite de velocidad que existe en la carretera Duarte sigue la regla del percentil 85?

89 89 94 95 85 97 95 94 89 85 85 95 86 93 89 97 86 93 85 95
77 98 91 73 86 98 89 98 81 94 78 95 80 98 76 97 78 95 76 98

R e s u e lv e p r o b le m a s

4. El departam ento de control de calidad de una em presa de cosm éticos verifica el peso de un frasco de crem a
para la piel de ocho onzas. Los pesos de la m uestra de 10 frascos fabricados la hora pasada son los siguientes:

7.69 7.72 7.8 7.86 7.90 7.94 7.97 8.06 8.09 8 .2 1

• D eterm ine los pesos correspondientes del prim er y terce r cuartiles.

C o n e c ta
• Ingresa a la siguiente dirección w eb: h ttp s ://w w w .o n e .g o b .d o /e n c u e s ta s /e n ig h
• Consulta la Encuesta Nacional de Ingresos y Gastos de los Hogares y com enta la distribución de hogares que
fueron encuestados para dicha encuesta. Identifica que porcentaje de hogares está en los diferentes quintiles,
según tu provincia.

APRENDIZAJE AUTONOMO
--------------------------------------------------------------------------m s m m e s m m M s n m
Calcula cuartiles, deciles, percentiles y quintiles com o m edidas de posición
para datos no agrupados con y sin herram ientas tecnológicas (Geogebra o
Lenguaje R).

Analiza las m edidas de posición a partir de una tabla de frecuencias y la m o­


dela a través de softw ares tales com o: (Lenguaje R o Geogebra).

42 © Santillana, S. A.
Medidas de dispersión
El servicio postal cada año intenta satisfacer más al cliente. En una encuesta llevada a cabo se
determinó que los clientes estaban interesados en recibir sus paquetes o cartas en el tiempo
establecido, ya que esto variaba mucho.

C o m p e te n c ia s
D efine y aplica m e d id a s de
dispersión. Calcula e interpre­
ta las m edidas de dispersión
Analiza las m edidas de disper­
sión a p a rtir de una tabla de
frecuencias y la m odela a tra ­
vés de so ftw a re tales com o:
Lenguaje R o Excel.

C o n te n id o s
■ Rango (R).
■ Desviación m edia (DM).
■ Varianza (S2).
■ Desviación típica o estándar (S).
■ C oeficiente de variación CV.

©Santillana, S. A. 43
Medidas de dispersión o variabilidad
El grado de dispersión de los datos num érico s respecto a un valor prom edio
se llama d isp ersió n o va ria c ió n de los datos. Existen varias m edidas de dis­
persión (o variación), las cuales son: el rango, desviación m edia, la varlanza, la
desviación estándar y el coeficiente de variación.
¿Por q u é e s tu d ia r la dispersión?
Una m edida de ubicación, com o la m edia o la m ediana, solo describe el centro
de los datos. Desde este punto de vista resulta valiosa, pero no dice nada so­
bre la dispersión de los datos. Una m edida de dispersión pequeña Indica que
los datos se acum ulan con proxim idad alred edor de la m edia aritm é tica. Por
consiguiente, la m edia se considera representativa de los datos. Por el contra­
rio, una m edida grande de dispersión indica que la m edia no es confiable.
Una segunda razón para estudiar la dispersión en un co n ju n to de datos co n ­
siste en com parar la variabilidad en dos o más distribuciones.
Las m edidas de dispersión hacen referencia a la variabilidad, o la evaluación de
cuán separados o extendidos están los datos o bien cuánto difieren unos de otros.
Entendiéndose la variación com o el grado en que los datos num éricos tienden a
distribuirse alrededor de un valor central, ¿para qu é sirven? Identificar si una
medida central es adecuada para representar la población de datos, Indicar la re­
lación de un dato con los otros, com prender el riesgo para poder tom ar decisiones
y tam bién son de gran utilidad al com parar distribuciones.

1.1 Rango (R)


El rango, el cual se calcula sim plem ente com o la diferencia entre el m ayor y el
m enor de los valores o, en otras palabras, es igual al m áxim o va lor m enos el
m enor y, com o puede apreciarse, m ide qué tan separados están los datos en
esta sencilla form a:

R ango R = V a lo r m a y o r - V alo r m e n o r

El rango se em plea m ucho en aplicaciones de control de procesos estadísticos


(CPE), debido a que resulta fácil de calcular y entender.
Por otro lado, y com o consecuencia de lo anterior, su principal inconveniente es
que es sensible únicam ente a los valores extrem os de la distribución. De esta
m anera, este índice no captura la poca o m ucha dispersión que pueda existir
entre los restantes valores, que son la gran m ayoría de las puntuaciones. Aun
así, en el análisis de datos se recom ienda Incluir el valor del rango com o Infor­
Los gráficos X-R. Los gráficos de m ación com plem entarla de otras m edidas de dispersión más relevantes.
media vs. rango, también llamados
gráficos X-R, son gráficos que se
realizan para pa monitorear esta­
Ejemplo: Peso de los estudiantes
dísticamente el control de calidad Los pesos de una m uestra de estudiantes en libras son los siguientes:
de piezas en múltiples sectores,
95 103 105 110 104 105 112 90
incluyendo el automotriz. Estos
gráficos permiten detectar la va­ ¿Cuál es el rango d e los pesos?
riabilidad, consistencia, control y R = 1 1 2 - 9 0 = 22 libras
mejora de un proceso productivo.

44 © Santillana, S. A.
1.2 Usando la fenologia: Microsoft Excel
En M icrosoft Excel no existe una función para calcular el rango de un conjunto
de datos. D ebido a e sto se u tilizan dos fu n c io n e s que d e te rm in a n el va lo r
m áxim o y el valor m ínim o de un conjunto de datos. Usando estas dos fu n c io ­
nes se realiza la operación de resta entre estas dos. La función que obtiene el
valor m enor de un conjunto de datos es MINO, y la que obtiene el valor m ayor
es MAX().
Por lo que para obtener el rango de un conjunto de datos en Excel se debe de
realizar la siguiente expresión: = M A X(x) - M lN (x).
Las horas de estudio que 13 estudiantes dedicaron para la preparación de un
exam en se m uestran a continuación.
5 22 10 14 16 18 20 23 25 27 31 11 40

Horas
_ _ _Estudio
___

22
10
14
16
18
20
23
25
27
31
11
___40___
Máxim o |=MAX(B2:B14)
M ínimo
Rango

■ JL

B
1B i Horas Estudio
5
22
10
14 !
16
18
1
20
23
25
27 1
1
31
11 1
40 ¡
1 1 Máximo 40
| i Mínimo =MIN(B2:B14)
i 9 Rango

©Santillana, S. A. 45
P A R A C O M EN TA R
Usando las fu n cio n e s de MAX() y MINO de Excel para d e te rm in a r el rango, s e |
C onsulta en tu clase cuál realizan los siguientes pasos:
de tus com pañeros obtuvo
la m ayor calificación en el ■ Ubicarnos en la celda en la cual querem os alm acenar nuestro resultado.
ú ltim o e xa m e n de M a te ­ ■ Hacer clic en la opción Insertar función (fx).
m áticas y quién o b tu v o la
■ En la ventana resultante, elegir la función (MAXO) de las funciones Estadísticas.
m e n o r c a lific a c ió n en el
m ism o exam en, calcula el ■ D espués se le ccio n a r los valore s (Horas de Estudio) de los que querem os j
ra ngo y c o m e n ta co n tu obtene r el valor m áxim o, rango de celdas desde B2 hasta B14.
profesor y com pañeros.
■ Hacer clic en Aceptar.
■ Ubicarnos en otra celda y volver a repetir los pasos anteriores, pero se debe
elegir la función (MINO)
■ Después se le ccio n a r los valore s (Horas de Estudio) de los que q ue rem os
obtene r el valor m ínim o, rango de celdas desde B2 hasta B14.
■ Hacer clic en Aceptar.
■ Ubicarnos en la celda en donde calcularem os el Rango.
■ En la celda don de ca lcu la re m o s el rango co locam os el signo de igual (=),
después hacem os clic en la celda que contiene el v a lo r m á x im o calculado,
luego colocam os el signo de m enos (-) y hacem os clic en la celda que con­
tiene el v a lo r m e n o r calculado y presionam os Enter.

y *)• a Datos Excel - Excel

Archivo Inicio Insertar Diseño de página Fórmulas Datos Revisar Vista Programador Ç ¿0 c <:> •
VCortar
Mh % Copiar •
S a
% ■ JL m mmma IBiBHIWGB
Portapapeles Q- Fuente Alineación Número Estilos

B16 * : x U -B15-B16

_ _ _ _ _ _

A A C D E F G H
1 H oras Estudio
2 5
3 22
4 10
5 14
6 16
7 18
8 20
9 23
10 25
11 27
12 31
13 11
14 40
15 M á x im o 40
16 M ín im o 5
17 Rango =B15-B16 |
18
i M H o j, ' ■ ©
Señalar

*s p o e □ « a i' ®* % R - >s «i

46 © Santillana, S. A.
Esta im agen m uestra el resultado del rango de horas de estudio que 13 estu­
diantes dedicaron para la preparación de un exam en, 35 horas.

1.3 Usando la tecnología: Lenguaje R


En R se realiza un p ro ce d im ie n to sim ilar que en Excel para calcular el rango
de un conjunto de datos. Después de Introducir los datos deberem os de reali­
zar la operación de resta del valor m áxim o m enos el valor m ínim o de los da­
to s con las funciones m ax() y m ino, respectivam ente.
Utilizando los m ism os datos de las horas de estudio que 13 estudiantes dedica­
ron para la preparación de un examen, procederem os a calcular el rango en R.

laaaKiaoiiga
R RCómate _ o x

> Horas = 0(5,22,10,14,16,18,20,23,25,27,31,11,40)


> Rango = max(Horas)-min(Horas)
> Rango
[1] 35
>i

© Santillana, S. A. 47
m Desviación media
2.1 Desviación media
Una desventaja que presenta el rango radica en que parte de dos valores, el
m ás a lto y el m ás bajo; no to m a en cuen ta to d o s los valores. La desviación
m edia sí tom a to d o s los valores de una distribución; m ide la cantidad pro m e ­
dio respecto de la cual los valores de una población o m uestra varían. En otras
palabras, la d es viació n m e d ia es el prom edio de los valores absolutos de las
desviaciones con respecto a la m edia aritm ética.

D e sviació n m ed ia, d a to s no ag ru p a d o s dm =

Ejemplo: Calificaciones de Pruebas Nacionales, Lengua Española


A co ntin uación, se listan las calificaciones de Pruebas Nacionales en la
m ate ria de Lengua Española ob te n id a en la 1ra. co n vo ca to ria por una
m uestra de estudiantes del Liceo M anuel de Jesús Galván del Nivel M e­
dio en el año 2016:
20 19 19 15 20 16 18 17 18 19
Para realizar m e jo r el proceso de cá lcu lo de la desviación m edia para
una m uestra, colocarem os estos datos en una tabla, com o se m uestra a
continuación.

X ,- X |X, - X| 1.° O b te n e m o s la m e d ia a ritm é tic a


X,
20 1.9 1.9 x= = 4 ^ - = 18.1
n 10
19 0.9 0.9
19 0.9 0.9
2.° O b te n e m o s la desviació n m ed ia
15 -3.1 3.1
20 1.9 1.9 DM = - 1* - * 1 = = 1.3
n 10
16 -2.1 2.1
18 -0.1 0.1 Las calificaciones de Pruebas Nacionales
17 de Lengua Española de una m uestra de
-1.1 1.1
1 0 estudiantes se desvían, en prom edio,
18 -0.1 0.1
1.3 puntos de su m edia de 18.1 puntos.
19 0.9 0.9
181 13

En el caso de que los datos se encuentren agrupados en una ta b la de d is ­


trib u c ió n de frecu encias, se usa la sig u ie n te fó rm u la :

D esviació n m e d ia , d a to s ag ru p a d o s DM =

©Santillana, S. A.
Ejemplo: Calificaciones de Pruebas Nacionales, Matemáticas
A continuación, se m uestra la distribución de frecuencias de la cantidad
de estudiantes que tom a ron Pruebas Nacionales en la 1ra. convocatoria
según el rango de calificación obtenida en la asignatura de M atem áticas
por los estudiantes del Liceo Federico Henríquez y Carvajal del nivel m e­
dio en el año 2016.

Calif fi
6 -9 5
10-13 97
14-17 299
18-21 83
2 2 -2 5 10

2 6 -2 9 5
Total 499

Calif f, x¡ x ,* f , | X, - *1 \xr X \ * f ,
6 -9 5 7.5 37.5 8.09 40.44
10-13 97 11.5 1,115.50 4.09 396.55
14-17 299 15.5 4,634.50 0.09 26.36
18-21 83 19.5 1,618.50 3.91 324.68
22 -25 10 23.5 235 7.91 79.12
2 6 -2 9 5 27.5 137.5 11.91 59.56
Total 449 7,778.50 926.72

SXi * f l _ 7,778.50 _ 8o
F- N 499 1 5 8 9

DM = ~ x l * tí - -?26.72 _
n 499

Las calificacio n e s d e P ruebas N a cio n ales de M a te m á tic a s d e 4 9 9


e s tu d ia n te s del Liceo F e d erico H e n ríq u e z y C a rv aja l se d es vía n ,
en p ro m ed io , 1 .8 6 p u n to s d e su m e d ia de 1 5 .5 9 puntos.

La idea de desviación representa el m ayor o m enor alejam iento de un dato


con respecto a la m edia. La desviación se puede ca lcu la r con respecto a
cualquier valor, no solo respecto a la m edia aritm ética. Esta puede ser posi­
tiva, cero o negativa.

© Santillana, S. A. 41
2.2 Usando tecnología: Microsoft Excel
En M icrosoft Excel existe la funció n DESVPROMO para o b tene r la desviación
m edia de un conjunto de valores de una distribución de datos.
Haciendo uso de las calificaciones obtenidas en Pruebas Nacionales en la asig­
natura de Lengua Española por una m uestra de estudiantes del Liceo M anuel
de Jesús Galván del Nivel M edio en el año 2016 del e je m p lo para datos no
agrupados, procedem os a calcular la desviación m edia en Excel para este con­
ju n to de calificaciones.
Después de in tro d u c ir los d atos en Excel, p ro ce d e m o s a u tiliza r la fu n ció n
DESVPROMO siguiendo los siguientes pasos:
■ D ebem os ubicarnos en la celda que se desea m ostrar el resultado de la des­
viación media.
■ Hacer clic en la opción insertar función (fx).
■ En el co n ju n to de fu n cio n e s estadísticas, se le ccio n a m o s la fu n c ió n DES­
VPROMO.
■ Después seleccionam os el rango de valores (Xi) de los que querem os obtener
la desviación media.

■ Hacemos clic en Aceptar.

Las calificaciones de Pruebas


Nacionales de Lengua Española
de una muestra de 10 estudiantes
■se desvían, en promedio, 1.3 puntos
de su media.

© Santillana, S. A.
50
2.3 Usando tecnología: Lenguaje R
En R no existe una funció n específica para calcular la desviación m edia
de un co n ju n to de datos por lo que debem os de darle las instrucciones La desviación de una variable
paso por paso para obtenerla. x con respecto a la media arit­
m ética X está dada por la di­
Debido a que la desviación m edia es el cociente de la sum atoria de las
ferencia: d = x - X La sum a
diferencias absolutas de cada valor m enos la m edia a ritm é tica entre el
de las desviaciones de todos
total de datos, procedem os de la siguiente manera.
los d atos con respecto a su
■ Introducim os los datos y los alm acenam os en una variable, en este caso, media aritm ética es cero. Para
las calificaciones se han alm acenado en el variable x. c o n o c e r q u ié n pre se n ta un
valor de desviación, que nos
■ Calculam os la cantidad de datos introducidos con la función lengthO y
se alm acenan en una variable, en este caso n. indique cuán cercano o lejano
está de la m edia aritm é tica ,
■ Calculamos la desviación media indicándole a R la fórm ula 3.2. Para este será necesario calcular el valor
caso se usan las fu n cio n e s absO, sum() y meanO, com o vem os en la absoluto de la desviación.
imagen. La función meanO se refiere al prom edio, absO, al valor absolu­
to de las diferencias de cada valor de x respecto a su m edia, y sum o, es
la sum a de cada va lor abso luto de las diferencias calculadas. Esto lo
alm acenam os en la variable DesvMedia y se obtiene el resultado o b te ­
nido en el m ism o ejem plo calculado anteriorm ente.

> Nota = c (20,19,19,15,20/16,18,17,18,19)


> n - length(Nota)
> n
[ 1 ] 10
> DesvMedia = suxnfabs (Nota - mean (Nota)))/n
> DesvMedia
[1] 1.3
>I

0 C O M P E T E N C IA R E S O L U C IÓ N DE P R O B L E M A S

Q Un co le g io o to rg a rá una beca de m a trícu la para la universida d, al a lu m n o cuyo buen re n d im ie n to se


haya m a n te n id o p o r m a yo r tie m p o , en el ú ltim o trim e s tre de 4o de M edia. Para ca lcu la r el m e jo r p ro ­
m e d io solo co n sid e ra ro n algunas asignaturas. Los m e jo re s a lu m n o s de la p ro m o ció n fu e ro n Pablo y
Soledad. La m e d ia a ritm é tic a (p ro m e d io ) de cada uno es 6,3. Si so lo u n o d eb e se r elegido, ¿quién
ganará la beca? Las ca lifica cio n e s son las siguientes:

Lenguaje Matem áticas Sociales Naturales


Pablo 88.6 97.1 82.9 91.4
Soledad 98.6 71.4 100 90.0

v _______________________________________________________________________________________________ y

©Santillana, S. A. 51
% Varianza (S2)
Cada m uestra tiene una varianza, su sím bolo es S2. Para calcular la varianza de
una m uestra, la suma de los cuadrados de las diferencias entre la media y cada
elem ento de la m uestra se divide entre el núm ero total de observaciones en la
muestra m enos 1. Al elevar al cuadrado cada diferencia, logramos que todos los
núm eros sean positivos y, al m ism o tiempo, asignamos más peso a las desviacio­
nes más grandes (desviación es la distancia entre la media y un valor).
La varianza es el prom edio de los cuadrados de las desviaciones de cada dato en
relación con su media, la fórm ula para calcular la varianza de una muestra es:

v a ria n za , d a to s no ag ru p ad o s S2 =

Al principio, cuando calculam os el rango, las respuestas se expresaron en las


m ism as unidades que los datos. (En nuestro ejem plo, las unidades son "peso
en libras de estudiantes"). Para la varianza, sin em bargo, las unidades son el
cuadrado de las unidades de los datos; por ejem plo, "libras al cuadrado". Estas
unidades no son Intu itivam ente claras o fáciles de interpretar. Por esto d eb e­
m os hacer un cam bio significativo en la varianza para calcular una m edida útil
de la desviación que no nos dé problem as con las unidades de m edida y, en
consecuencia, sea m enos confusa.

Ejemplo: Calificaciones de Pruebas Nacionales, Lengua Española


A contin uación, se listan las calificaciones de Pruebas N acionales en la
m ateria de Lengua Española o b tenidas en la 1ra co n vo ca to ria por una
m uestra de estudiantes del Liceo M anuel de Jesús Galván del Nivel M e­
dio en el año 2016.
20 19 19 15 20 16 18 17 18 19
Para realizar m ejor el proceso de cálculo de la varian za para una muestra,
colocarem os estos datos en una tabla, com o se m uestra a continuación.

(X¡ - X) (X ,-X )2 X = I x ¡ = 181 = 18.1


X, n 10
20 1.9 3.61
19 0.9 0.81 K X ;-* )2 24.9 24.9 ñ u - ,
La v a ria n z a s ie m p re será S = ~ n -l = = — = 2767
positiva y será igual a cero 19 0.9 0.81
solo si todas las observacio­ 15 -3.1 9.61 Nota: La va ria n za de un conjunto de da­
nes son las mismas. 20 1.9 3.61 tos no se in te rp re ta , deb ido a que el re­
16 -2 .1 4.41 sultad o de esta se encu entra expresado
La varianza remedia el Incon­
al cuadrado.
veniente que presenta el ran­ 18 -0 .1 0 .0 1

go al utilizar todos los valores 17 - 1 .1 1 .2 1


de la m uestra, en tanto que 18 -0 .1 0 .0 1
el rango solo incluye los va­
19 0.9 0.81
lores m áxim o y m ínim o de la
muestra. 181 24.9

52 © Santillana, S. A.
varian za, d a to s ag ru p ad o s 5 2= ^ (x t- x ì 2* f /
n -1

Ejemplo: Calificaciones de Pruebas Nacionales, Matemáticas


A continuación, se m uestra la distribución de frecuencias de la cantidad
de estudiantes que to m a ro n Pruebas Nacionales según calificación o b ­
tenid a en la asignatura de M a te m á tica s en la 1ra. co n vo ca to ria de la
m uestra estudiantes del Liceo M anuel de Jesús Galván del Nivel M edio
en el año 2016.

Calif fi Debido a que los datos están agrupados,


pue s se p ro c e d e a c a lc u la r cada e le ­
6 -9 5
m e n to de la fó rm u la de la V A R IA N Z A
10-13 97 para DATOS AGRUPADOS.
14-17 299
18-21 83
2 2 -2 5 10

2 6 -2 9 5
Total 499

Calif fi xi xi * fi (Xi - X) (x# - X)2 (xi - x)2 * f i


6 -9 5 7.5 37.50 -8.09 65.42 327.09
10-13 97 11.5 1,115.50 -4.09 16.71 1,621.18
14-17 299 15.5 4,634.50 -0.09 0 .0 1 2.32
18-21 83 19.5 1,618.50 3.91 15.30 1,270.10
2 2 -2 5 10 23.5 235.00 7.91 62.60 625.97
2 6 -2 9 5 27.5 137.50 11.91 141.89 709.46
Total 499 7,778.50 4,556.12

x = J j^ f , = 7,778.50
n 499

S2 = I(Xj - X)2 * fj _ 4,556.12 9.149


n-1 4 9 9-1

A co ntin uación, se m uestran los salarios m ensuales (en m iles de pesos) de


15 trabajadores de una planta envasadora. Calcula la varianza.

6 6.25 7 8 9.5 6 6.25 7.5 8 10 6.25 6.25 7.5 9 10

©Santillana, S. A.
Desviación típica o estándar (S)
Con el fin de lograr una medida de
dispersión en las m ismas unidades
que la variable y que sea más fácil­
m ente interpretable, se calcula la
raíz cuadrada de la varianza y se
obtiene un índice que se denomina
desviación típica o están d ar
Tanto la varianza com o la d es via­
ción típ ic a son índices de dispersión m uy útiles en el desarrollo posterior de
la estadística inferencial estando en la base de num erosas técnicas estadísti­
cas. Por lo general, a la hora de cuan tificar la variabilidad de los datos, la des­
viación típica se suele utilizar m ás que la varianza debido a que se expresa en
las m ism as unidades de m edida que la variable objeto de estudio. Asim ism o,
am bos índices presentan una serie de propiedades de las que pueden desta­
carse las siguientes:
■ El cálculo de la varianza y la desviación típica, a diferencia de otros índices de
dispersión, requieren que se usen todas las puntuaciones observadas en la
distribución.
■ La varianza y la desviación típica m iden la variabilidad de los datos con res­
T e o re m a d e C h e b y s h e v pecto a la media aritm ética, por lo que únicam ente deben aplicarse si estam os
En un c o n ju n to de d a to s utilizando la m edia com o m edida de tendencia central.
(m u e s tra o p o b la c ió n ), la ■ La varianza y la desviación típica siem pre son positivas, nunca serán negativas,
p ro p o rció n de va lore s que es decir, pueden ser iguales o m ayores que cero. Son iguales a cero única­
se e n c u e n tra n a K d e svia ­ m ente si todas las puntuaciones son iguales entre sí. En este caso, no habría
ciones estándares de la m e­ variabilidad o dispersión en los datos. En el resto de los casos la varianza y la
d ia es d e p o r lo m e n o s desviación típica son positivas, siendo sus valores m ayores a m edida que
1 - 1/K 2, siendo K cualquier aum enta la variabilidad de las puntuaciones.
constan te m ayor que 1 .
La desviación estándar es la raíz cuadrada de la varianza, la fórm ula para cal­
De este te o re m a se deriva cular la d es via ció n e s tá n d a r en una m uestra ya sea en d a to s no a g ru p a ­
la siguiente regla em pírica: dos o ag ru p ad o s es:
En cualquier distribución de
fre c u e n c ia s s im é tric a con
Ejemplo: Calificaciones de Pruebas Nacionales,
form a de cam pana, ap ro xi­
Lengua Española y Matemáticas
m adam ente 6 8 % de las ob­
servaciones se encontrarán Em pleando los m ism os resultados de las varianzas calculadas anterior­
entre más y m enos una des­ m ente, ta n to para las calificaciones de Pruebas N acionales de Lengua
via ción e stá n d a r de la m e ­ Española com o tam bién para M atem áticas, tenem os lo siguiente:
dia; cerca de 95 % de las
observaciones se enco ntra­ C álculo p ara d a to s no ag ru p ad o s (Lengua Española):
rán entre m ás y m enos dos
desviaciones estándares de s = n/ í S2T = ^ (2.767) =1.66
la m edia y, de hecho, todas
(99.7 %) estarán e n tre m ás C álculo para d a to s ag ru p ad o s (M a te m á tic a s ):
y m enos tre s desviaciones
estándares de la m edia. S = \¡S r = \J 9 .1 4 9 = 3 .0 2 5

54 © Santillana, S. A.
4.1 Usando la tecnología: Microsoft Excel
En M ic ro s o ft Excel existe n las fu n cio n e s VAR.SO y DESVEST.MO
para o b te n e r la varianza y la desviación e stá n d a r de un c o n ju n ­
to de valore s de una d is trib u c ió n de datos.
H aciendo uso de las ca lifica cio n e s o b te n id a s en Pruebas N a cio­
nales en la a signatura de Lengua Española p o r una m u e stra de
e s tu d ia n te s del Liceo M an u e l de Jesús G alván del N ivel M e d io
en el año 2016 del e je m p lo para d a to s no agrupados, p ro c e d e ­
m os a ca lcu la r la varianza y la desviación e stá n d a r en Excel pa­
ra e ste co n ju n to de calificaciones.
D espués de in tro d u c ir los d atos en Excel, p ro ce d e m o s a u tiliz a r
la fu n c ió n VAR.SO para la varianza y la fu n ció n DESVEST.MO pa­
ra la desviación e stá n d a r sig uie ndo los sig u ie n te s pasos:
■ Debem os ubicarnos en la celda que se desea m ostrar el resulta­
do de la varianza o de la desviación estándar.
■ Hacer clic en la opción insertar función (fx).
■ En el conjunto de funciones estadísticas, seleccionam os la función
VAR.SO 0 DESVEST.MO
■ Después seleccionam os el rango de valores (Xi) de los que que­
rem os obtener la varianza o desviación estándar.
■ Hacemos clic en Aceptar.

© Santillana, S. A.
55
4.2 Usando la tecnología: Lenguaje R
En R existe una función específica para calcular la varianza y la desviación típ i­
ca o está n d a r de un conjunto de datos, estas son var() y sd(), respectivamente.
El p ro ce d im ie n to es m uy sencillo, solo ingresar los datos de la d istrib u ció n y
hacer uso de la función, tal com o se explica a continuación:
■ Introducim os los datos y los alm acenam os en una variable, en este caso, las
calificaciones se han alm acenado en la variable Nota.
■ La función para obtene r la varianza es var(), por lo que ingresam os var(Nota).
■ La función para obtener la desviación estándar es sdO, por lo que ingresam os
sd(Nota).

a p r isa .................... ......


]> Nota = c(20,19,19,15,20,16,18,17,18,19)
1> var(Nota)
| [1] 2.766667
I> sd(Nota)
1 II] 1.66333
J> !

56 © Santillana, S. A.
y Coeficiente de variación (CV)
La varianza y la desviación estándar son m edidas absolutas, porque se basan en
los valores originales de las variables correspondientes. El coe ficien te de varia­
ción es el cociente entre la desviación estándar y la media aritm ética m ultiplicado
por 100. Es una medida relativa de dispersión, ya que esa form a de cálculo Implica
que su valor indica qué proporción de la media representa la desviación estándar.
G eneralm ente interesa establecer com paraciones de la dispersión, entre dife­
rentes m uestras que poseen distintas m agnitudes o unidades de m edida.
El coeficiente de variación tiene en cuenta el valor de la m edia aritm ética, para
establecer un n ú m ero relativo, que hace com parable el grado de dispersión
entre dos o m ás variables,
El coeficiente de variación es Independiente de las unidades que se em pleen.
Debido a esto, el C oeficiente De Variación es útil cuando se trata de com parar
distribuciones en las que las unidades son diferentes, una desventaja del coe­
ficiente de variación es que no es útil cuando el valor de X es cercano a cero.
A continuación, se m uestra una tabla que puede ayudar a la interpretación del
coeficiente de variación. Esta m uestra la variabilidad y la estabilidad de los da­
tos según el coeficiente de variación resultante.

Valor del coeficiente interpretación del coeficiente


de variación (%) Variabilidad Estabilidad
igual a 0 Nula M uy alta
Mayor de 0 hasta 20 Baja Alta
Mayor de 0 hasta 20 Moderada M oderada
Mayor de 60 hasta 90 Alta Baja
Mayor de 90 Muy alta Nula

La fórm ula del c o e fic ie n te d e variació n para una m uestra es:

C o e fic ie n te d e v a ria c ió n C V = - L - * 100


x

Ejemplo: Calificaciones de Pruebas Nacionales,


Lengua Española y Matemáticas
Empleando los m ism os resultados de las desviaciones estándares calcula­
das anteriorm ente, tanto para las calificaciones de Pruebas Nacionales de
Lengua Española com o tam bién para Matemáticas, tenem os lo siguiente:
C álculo para Lengua Española:
CV = - 4
X
- * 100 =
18.1
* 100 = 0.092 * 100 = 9.19%
C álculo para M a te m á tic a s :
CV = 4X - * 100 = 3 ° 25
*3 -'
* 100 = 0.194 * 100 = 19.4%

© Santillana, S. A. 57
5.1 Usando la tecnología: Microsoft Excel
En M icrosoft Excel no existe una función específica para obtene r el coeficiente
de variación, debido a esto debem os de realizar la operación de división entre
la m edia aritm ética y la desviación estándar de las observaciones y m ultiplicar
este resultado por 1 0 0 .
H aciendo uso de las calificaciones obtenidas en Pruebas Nacionales en la asig­
natura de Lengua Española por una m uestra de estudiantes del Liceo M anuel
de Jesús Galván del Nivel M edio en el año 2016.
Después de Introdu cir los datos en Excel, procedem os a utilizar las funciones
PROM EDIOO y DESVEST.MO com o se hizo en los capítulos anteriores:
■ Debemos ubicarnos en la celda que se desea mostrar el resultado del PROMEDIO.
■ Calculam os el prom edio en Excel com o se hizo en el tem a 1.
■ Después, nos ubicam os en la celda que se desea m ostrar el resultado de la
desviación estándar.
■ Calculam os la desviación estándar en Excel com o se hizo en el tem a 3.
■ Dividim os los dos resultados obtenidos; colocam os el signo de Igual (=) en la
celda donde se m ostrará el resultado del coeficiente de variación, escribim os
la fórm ula =B13/B12*100. B13 y B12 son las celdas que contienen la desviación
estándar y el prom edio. Después presionam os Enter.

B m* OUM
birl-CñuKÚdo .*»>1
ficv. V-.U v ....
2V«ur»"«o HQE3S1HBS23ZBHÍ »“ ■" ¡y
Ef CSSHi ESBHBBSSS2S3H
■ £-A £MMyam.' •$- %W:»: BHHBHQQSSHHICBHIBB2Z3HIH f

B c D E F G H 1 J K
Xi XI
20 20
19 19
19 19
15 15
20 20
16 :! 16
18 18
17 17
18 18
19 19
18.1 18.1
idar 1.663 idar 1.663
/ar. 9.19 = / *1 0 0
.i ...
i ■ n tf os C- « *fl

Las c a lific a c io n e s d e L en gua E spañola p re s e n ta n una b aja v a ria b ili­


d ad y una a lta e s ta b ilid a d , con un c o e fic ie n te d e va ria c ió n d e 9 .1 9 %
con relació n a su m ed ia

58 © Santillana, S. A.
5.2 Usando la Tecnología; Lenguaje R
En R no existe una función específica para calcular el coeficiente de variación
de un co njunto de datos, por lo que debem os de darle las instrucciones paso
por paso para obtenerla.
Debido a que el coeficiente de variación es el cociente entre la desviación es­
tándar y la m edia aritm ética m ultip lica do por 1 0 0 , debem os de in tro d u cir esta
m ism a operación en R.
El pro ce d im ie n to es m uy sencillo, solo ingresar los datos de la d istrib u ció n y
realizar la operación com o se explica a continuación:
■ Introducim os los datos y los alm acenam os en una variable, en este caso, las
calificaciones se han alm acenado en la variable x.
> X = C(20, 19, 19, 15, 20, 16, 18, 17, 18, 19)

■ A lm acenam os el resultado del coeficiente de variación en una variable (Coe-


fVar) ingresando la siguiente expresión en la línea de com andos:
> CoefVar = (sd(x)/mean(x)) * 100
■ Escribim os el nom bre de la variab le donde alm acenam os el resultado del
coeficiente de variación (CoefVar) y presionam os Enter, el resultado será el
siguiente:
> C o efV ar
[1] 9.189668

Archivo £drtar ^oualizar M1« Eaquetes Ventanas Afuda

l* |g |a lM 1Q II« IW
Itft Contele

> Nota = c(20,19,19,15,20,16,18,17,18,19)


> CoefVar = (sd(Nota)/mean(Nota))*100
> CoefVar
[1] 9.189668

E p o e a ■ ■ • «• % »i c % y

59
M e d id a s d e d is p e r s ió n o v a r ia b ilid a d
CONTROL DEL APRENDIZAJE

m|
1. Una fábrica de dulces elabora 10 diferentes productos. A continuación, se presentan
los costos de producción por cada 1 0 0 piezas de las diferentes golosinas.

Calcula:
P rod ucto C o stro RD$
a) M edia a ritm é tic a del co s to de los
• i
Bombón $20 productos.
Caramelo duro $33
b) El rango de costo.
Caramelo suave $41
c) La desviación media del costo de los
Chocolate $63 productos.
Cocada $38 d) La desviación típica o estánda r del
Mentas $27 costo de los productos.

Nuez / $56 / e) El coeficiente de variación del costo


de los productos.
Oblea $ 19
f) Interpreta los resultados de los inci­
Paleta $ 16
sos a, b, c, d, e y f.
Tamarindo $52

2. La sig uie nte d istrib u ció n de fre cu encias co n tie n e los costo s de e le ctricid a d de una
m uestra de 70 hogares de dos habitaciones durante el m es de m ayo del año pasado.

• Calcule:
C osto
C o stro RD$ a) La m edia a ritm é tica del costo
e le c tric id a d (RD$)
de electricidad.
701 a 900 2
b) El rango de costo.
901 a 1 100 5
c) La desviación m edia
1101 a 1 300 3
del costo de electricidad.
1 301 a 1 500 10
d) La varianza del costo
1 501 a 1 700 15 de electricidad.
1 701 a 1 900 18 e) La desviación típica o estándar del
1 901 a 2 100 9 costo de electricidad.
2 101 a 2 300 5 f) El coeficiente de variación
del costo de electricidad.
2 301 a 2 500 3
g) Interpreta los resultados
Total 70
de los incisos a, b, c, d, e y f.

3. Un gru p o de a lum n os o b tu v o las sig uie nte s m arcas, en sa lto con garrocha, e xp re ­
sadas en m etros:

2.50; 2.80; 2.60; 3.00; 2.90.


• Com prueba que la sum a de las desviaciones de estos datos respecto a X es 0.
• Calcula la desviación m edia de los datos.

60 ©Santillana, S. A
4, En una m ism a p ru e b a de M a te m á tic a s dos cu rso s A y B, o b tu v ie ro n re s u lta d o s
cuyos d atos esta d ístico s son los siguientes:

De acuerdo con estos datos:


Curso A Curso B
- Un a lu m n o del cu rso A o b tu v o un
X 75.7 77.1 95.7 y uno del c u rso B un 94.3. ¿A
cuál de los alum nos le fue m e jo r en
s 10 5.7 la p rueba , en re la ció n a su curso?
Justifica la respuesta.

5 La ta b la de d is trib u c ió n de fre cu e n cia s m u e stra la p u n tu a ció n o b te n id a p o r 1 800


a lu m n o s de 5to. de P rim a ria a 2do. de S ecundaria en un c u e s tio n a rio de c u ltu ra
general.

P u n ta je F recu encia Haz el cálculo de la desviación estándar de


la distribución.
0 -2 21
3 -5 50 • ¿A qué cantidad de pun tos corresponden
los valores de X - S y X + S.
6 -8 110
9 -1 1 241
1 2 -1 4 423
1 5 -1 7 457
1 8 -2 0 275
2 1 -2 3 134
2 4 -2 6 66
2 7 -2 9 23
Total 1 800

6 , El a ná lisis de las n otas de un cu rso señala q u e en a m b o s trim e s tre s el p ro m e d io


en M a te m á tica s es 72.9. Al té rm in o del p rim e r y segu ndo trim e s tre s , la nota m á xi­
m a es 100 y la m ín im a es 46. Sin e m b a rg o , los a lu m n o s tie n e n la se n sa ció n de
m ejores re su lta d o s en un trim e s tre que en otro .

100 80 61 100 77 61 100 76 71 91 74 70


99 77 61 97 74 59 87 74 67 86 74 59
93 74 59 90 74 59 81 73 67 79 71 66
83 69 59 81 69 46 77 71 64 76 71 64
80 69 46 80 64 46 76 71 46 76 71 46

• Responde las siguientes preguntas:


- ¿Cuánto es el rango en cada trim estre? ¿Qué trim estre tiene un rango m enor?
Según el rango, ¿qué trim estre presenta calificaciones m ás dispersas?
¿Cuánto es el valor de la desviación m edia en cada trim estre?
Según la situación, ¿cómo interpretarías la desviación media?
¿Corrobora la "sensación" de los estudiantes?

©Santillana, S. A.
I* y
6'
11
EVALUACIÓN fí

C o m u n ic a p-
*
V
1. Define con tus propias palabras las m edidas de dispersión.
rs a
2. Expresa la diferencia entre desviación m edia y desviación estándar.
>-• -
R a z o n a y a r g u m e n ta

3. En un examen de un centro educativo, el profesor debe aprobar al 10 % de los estudiantes. Calcular la nota prom e­
dio de los estudiantes. ¿Cuál es la medida de dispersión ideal para representar la variabilidad de estas notas?

0 20 5 0 0 35 10 5 20 0 15 45 10 0 0 20 40 5 0 45 20

M o d e la y r e p r e s e n ta

4. La siguiente tabla m uestra la estatura de 25 alum nos (en centím etros), agrupados en 5 equipos de basquetbol.

E1 E2 E3 E4 E5
165 172 151 162 162
175 174 170 168 169 - * ^
180 165 160 168 156
168 169 172 164 159
162 170 150 162 158

• Calcula el rango de estatura para cada equipo. • Calcula la desviación estándar para cada equipo.
• Calcula la m edia de estatura para cada equipo. • Calcula el coeficiente de variación para cada equipo.

R e s u e lv e p r o b le m a s

5. Dos em presas m uestran los siguientes índices de porcentuales de rentabilidad (en porcentajes).

Rentabilidad empresa 1 Rentabilidad empresa 2


15 18 25 18 21.4 19.4
7 27 32 16.5 22.9 18.6
6 7.5 41 15.6 12 24
35.5 22.5 15 20 25 17.5

Calcula el rango de estatura para cada equipo.


Calcula la desviación estándar para cada equipo.
A partir de la inform ación anterior, ¿en cuál de las dos em presas conviene invertir? Justifica su respuesta.

APRENDIZAJE AUTONOMO
Analiza las m edidas de dispersión a p a rtir de una tabla de frecu encias y la
m odela a través de softw are tales com o: (Lenguaje R o Geogebra).
Resuelve problem as diversos que im pliquen el cálculo de las m edidas de dis­
persión utilizando program as y softw ares tales com o Lenguaje R, Geogebra,
Gretl, R proyectos u otros.

62 ©Santillana, S. A.
Probabilidad estadística
La probabilidad ofrece la transición entre la estadística descriptiva y los métodos ¡nferenciales.
Cada uno de los componentes de la probabilidad permiten que los resultados sean expresados
en un lenguaje que los Ingenieros y científicos requieren.

C o m p e te n c ia s
■ Reconoce d ife re n te s fo rm a s
para calcula r probabilidades
de e v e n to s s im p le s y c o m ­
puestos. C onstruye y realiza
c á lc u lo s de p ro b a b ilid a d e s
con eventos y fenóm enos na-
tu ra le s c o m o m o d e lo s para
predecir otras situaciones
■ Utiliza la calculadora para in­
fe rir re su lta d o s p re ciso s de
situaciones que im pliquen el
uso de probabilidades. Utiliza
diversas herram ientas te cn o ­
lógicas para realizar cálculos
de probabilidades.

C o n te n id o s
■ Probabilidad estadística, Con­
ceptos y propiedades. Eventos
m utuam ente excluyentes y no
m utuam ente excluyentes. Dia­
grama del árbol. Valor esperado.

©Santillana, S. A. 63
Probabilidad estadística
%
La probabilidad es un conce pto que la m ayor parte de las personas com pren­
de intuitivam ente. Por ejem plo, casi todas las personas saben que la probabili­
dad de ganar o perder una apuesta con el lanzam iento de una m oneda es de
r 50 %. En otras palabras, al lanzar una m oneda, existe la m ism a probabilidad de
que caiga hacia arriba cualquiera de sus 2 lados, cara o escudo.

$ En estadística se analizan situaciones inciertas, com o las posibles característi­


cas de una población con base en una m uestra, por lo cual es necesario estu­
d ia r la probabilidad en fo rm a sistem ática y se puede com enza r por tra ta r de
defin ir la p ro b a b ilid ad co m o una m e d id a c u a n tita tiv a de la posibilidad
d e o cu rren cia d e un e v e n to in c ie rto
En probabilidad se acostum bra representar los eventos con letras m ayúsculas
{A, B, C , ...}. Se representa com o P(A) la probabilidad de ocurrencia del evento
A o, m ás sim plem ente, la probabilidad del evento A.

1.1 Conceptos previos


■ E x p e rim e n to aleatorio : Son situaciones o ensayos que im plican resultados
inciertos, es decir, son aquellas situaciones que dan lugar a experiencias de
azar. Un experim ento aleatorio puede repetirse bajo las m ism as condiciones
y sus resultados no pueden predecirse antes de su realización.
E jem plo
► Lanzar una m oneda, es un expe rim e nto aleatorio, debido a que no se sa­
be si saldrá cara o escudo.
► Lanzar un dado, es un e x p e rim e n to aleatorio, d e b id o a que no se sabe
con anterioridad que núm ero saldrá.
► Los juegos de azar com o la ruleta, las cartas (barajas), los pronósticos de­
portivos, la Lotería Nacional, etc.
■ E spacio m u e s tra l: Es el co n ju n to de todos los resultados posibles de un
e xpe rim e nto aleatorio. El espacio m uestral de un e xp e rim e n to aleatorio se
representa con la letra (E).
Ejem plo:
P afn u tí Lvovich >■ El Espacio m uestral al lanzar una m oneda es E = (cara, escudo}, es decir,
C h eb ysh ev el tam año del espacio m uestral es 2 , ya que solam ente hay dos posibles
(1821 - 1 89 4) resultados.
Chebyshev es uno de los cé­ ► El espacio m uestral al lanzar un dado es E = {1 ,2 , 3 ,4 , 5, 6 }, es decir, el
lebres m atem áticos del siglo tam año del espacio m uestral es 6 , ya que solo hay 6 posibles resultados.
XIX, creador de varias escue­
las m a te m á tic a s en Rusia ► El espacio m uestral de un m azo de cartas es E = {As, 2 de corazón, 10 de
basándose en sus investiga­ tr é b o l,...}, es decir, el tam a ño del espacio m uestral es 52, ya que hay 52
ciones sobre variables alea­ cartas diferentes en un mazo.
torias y esperanza m atem áti­ ■ E ventos o sucesos: es cualquier subconjunto del espacio m uestral. También
ca, para el posterior cálculo se define com o los resultados posibles del experim ento aleatorio. Los eventos
de probabilidades. o sucesos se clasifican en:

64 © Santillana, S. A.
► Eventos sim ples: se especifican de acuerdo con una sola característica;
por ejem plo, los eventos sim ples del lanzam iento de un dado son los nú­
m eros 1,2, 3 ,4 ,5 y 6 .
► E v e n to s c o m p u e s to s : están fo rm a d o por 2 o m ás e ve n to s sim ples.
M ientras que un evento com puesto en el experim ento aleatorio de lanzar
un dado podría ser la ocurrencia de un núm ero impar, ya que incluiría a
los eventos sim ples 1 ,2 y 3.
► Evento seguro: es el que ocurre siempre en un determ inado experimento.
► E v e n to im p o sib le : es el que nunca ocurre en un d e te rm in a d o e xp e ri­
m ento. Se representa por 0 .

Ejemplo: Gira la ruleta


Se hace girar la ruleta de la siguiente figura. Determ ina el espacio m ues­
tral y los distintos tipos de sucesos.
Espacio m u estral: E = {1 ,2 ,3 ,4 }
E ventos sim ples: {1}, {2}, {3} y {4}
E ventos co m p u esto s: núm ero par [2 ,4}, núm ero
im par {1,3}
E vento seguro: que salga un núm ero de 1 a 4,
( 1 , 2 ,3 ,4 }
E ven to im p osible: que salga el núm ero 5.

Vamos a definir ahora algunas operaciones con sucesos, basadas en la corres­


pondencia con la teoría de conjuntos, que nos resultarán útiles más adelante.
Tom em os estos eventos del lanzam iento de un dado com o ejem plo:
PARA COMENTAR A = {4} «obtener un cuatro»

Al lanzar al aire dos B = {2, 4, 6} «obtener un núm ero par»


monedas: C = {3, 6} «obtener un m últip lo de 3»
■ Determina el espacio UNIÓ N:
muestral.
Llam arem os unión de dos sucesos A y B, y lo representarem os por A u B, al
■ identifica los eventos subconjunto de E form ado por los sucesos elem entales que pertenecen a A, a
simples. B o a am bos a la vez:
■ Identifica los eventos En el ejem plo: A u B = {2, 4, 6}
compuestos.
INTERSECCIÓN:
■ identifica un evento
Llam arem os intersección de dos sucesos A y B, y lo representarem os por A n
seguro.
B, al su b co n ju n to de E fo rm a d o solam ente por ios sucesos elem entales que
■ Identifica u evento pertenecen a A y a B.
imposible.
Ejemplo: A n B = {4}

©Santillana, S. A. 65
Cuando la Intersección de dos sucesos no contie ne ningún elem e nto se dice
que son Incom patibles o excluyentes y, por tanto, no pueden verificarse sim ul­
táneam ente. Siguiendo con el ejem plo, los sucesos A y c lo son.
Ejemplo: A n C = { } = 0
CO M PLEM ENTARIO :
Llamaremos com plem entario de un suceso A, y lo representaremos por A, al sub-
conjunto de E form ado por los sucesos elementales que no pertenecen a A:
Ejemplo: Á = {1, 2, 3, 5, 6}
Para su representación podem os utilizar los diagram as de V enn, am pliam ente
utilizados en la Teoría de Conjuntos. En la figura siguiente se representan gráfi­
cam ente los sucesos anteriores.

A U B

A n b

D ia g ra m a d e v e n n
A
Los diagram as de Venn son
una form a para representar
g rá fic a m e n te c o n ju n to s ,
s u b co n ju n to s, in te rs e c c io ­
nes y u n io n e s . E stos son
lla m a d o s así en h o n o r de
John Venn, que los com enzó
a usar en 1880.
9 Definición de probabilidad
La probabilidad de un evento es un núm ero real (o m edida) que se le asigna al
evento y que, de algún m odo, Indica qué tan verosím il se considera. Si A es un
evento, entonces la probabilidad de A se denota con el sím bolo P(A). El fin de
la probabilidad es ca lcu lar la «p o sib ilid ad » d e o cu rren cia d e un suceso
La defin ición clásica, form ulada por Lap lace, indica que: «La p ro b a b ilid a d
d e un suceso es igual al c o c ie n te e n tre el n ú m e ro d e casos fa v o ra b le s
d e q u e ocu rra ese suceso y el n ú m e ro d e casos posibles en el su p u es­
to d e q u e to d o s los casos te n g a n la m ism a o p o rtu n id a d de o c u rrir (es
decir, sean ig u a lm e n te probables)».

P ierre-S im o n Laplace P(A) = Número de casos favorables del evento


(1 7 4 9 -1 8 2 7 ) Número total de eventos posibles
Laplace, co m o estadístico,
sentó las bases de la teoría
analítica de la probabilidad.
Establece la ley de Laplace Ejemplo: Lanzamiento de dado
que asigna p ro b a b ilid a d e s Se realiza el e xp e rim e n to de lanzar un dado al m o m e n to de Iniciar un
a sucesos equiprobables. juego de parchís. ¿Cuál es la probabilidad de que salga el núm ero 5? Los
posibles resultados son:

Hay solo un resultado favorable (cinco puntos) en el c o n ju n to de los 6

resultados Igualm ente posibles, por consiguiente:


-*■ Número de eventos favorables
P(5) = ~2~ = 0 .1 6 7
O ----------------- ->■ Número total de eventos posibles

Si m u ltip lica m o s el resultado de la probabilidad por 100 podem os in ter­


pretarlo. (0.1 67 X 1 0 0 = 16.7 %)

Al la n za r un d ad o h ay un 1 6 .7 % de p ro b a b ilid a d d e q u e nos sal­


ga el n ú m e ro 5.

¿Cuál es la probabilidad del evento "sale un núm ero par"?

Hay tres resultados favorables (un dos, un cuatro y un seis) en el conjun­


to de seis resultados igualm ente posibles. Por consiguiente,

P (n ú m ero par) = = 0 .5

(0 .5 x 1 0 0 = 50 %)

Al la n za r un d ad o hay un 5 0 %
d e p ro b a b ilid a d d e q u e nos salga
un n ú m e ro par.

©Santillana, S. A. 67
P ro p ied ad es d e la p robabilidad:

La probabilidad es cuantificable numéricamente con un nú­


0 < P(A)<1
mero comprendido entre cero y uno, inclusive.

La probabilidad de ocurrencia del espacio muestral es igual a


P(E)=1
1, es decir, es un evento seguro.

La probabilidad de un suceso A puede obtenerse también res­


P(A) = 1 - P(A)
tando de uno la probabilidad de su complementario Á.

Si denom inam os S el evento de que la persona está sana, entonces la probabi­


lidad de la persona esté sana es P(S) = ^ , es decir, 100 enferm os de un total
180
de 180 individuos.

Si denom inam os F el evento de que la persona fum a, entonces la probabilidad


de que la persona fu m e es P(F) = , es decir, 70 fum a dores de un to ta l de
loU
180 individuos.

La probabilidad de que la persona elegida esté sana y al m ism o tie m p o fum e


es: P(S n F) = , es decir, existen 10 personas de las 180 que están sanas y
loO
fum an.

Entonces la probabilidad de que la persona elegida esté sana o fum e es:

P(S U F) . P(S) + P(F) - P(S n NF) = m + M . J2. = m m 0.8889

Por lo tanto, si m ultiplicam os este resultado por 100, (0.8889 x 100 = 88.89 %), exis­
te una probabilidad de 88.89 % de que la persona elegida esté sana o fume.

3 C O M P E T E N C IA P E N S A M IE N T O LÓ G IC O , C R E A T IV O Y C R ÍT IC O

O A 110 lectores se les preguntó cuáles seccio­


nes del periódico leían más y se encontró lo
siguiente: 60 prefieren las noticias nacionales,
28 eligen las internaciona les, 2 2 política, 1 0
nacionales e internacionales, 6 nacionales y
política, 2 internacionales y política, 1 nacional,
internacional y política. ¿Cuál es la probabili­
dad de que un le ctor to m a d o al azar lea na­
cionales o internacionales?

68 ©Santillana, S. A.
Eventos mutuamente excluyentes
r y no mutuamente excluyentes
■ Eventos m u tu a m e n te excluyentes. El hecho de que un evento se presente
significa que ninguno de los demás eventos puede ocurrir al mism o tiempo.
La variable género da origen a resultados m utuam ente excluyentes: hom bre
y mujer. Un em pleado seleccionado al azar es hom bre o mujer, pero no pue­
de te n e r am bos géneros. Una pieza fabricada es defectuosa o no lo es. La
pieza no puede ser defectuosa o no defectuosa al m ism o tiem po.
Eventos m utuam ente
■ Regla d e la a d ic ió n p ara e v e n to s m u tu a m e n te e x c lu y e n te s : Si dos
excluyentes.
eventos A y B son m utuam ente excluyentes, la regla de la adición establece
que la p ro b a b ilid a d d e q u e o cu rra uno u o tro es igual a la su m a d e
sus p ro b a b ilid ad es . Esta regla se expresa m ediante la siguiente fórm ula:

P(A U B) = P(A O B) = P (A ) + P(B)

Ejemplo: Llenado de bolsas


Una m áquina a utom ática llena bolsas de plástico con una com binación
de garbanzos, brócoli y otras verduras. La mayoría de las bolsas contiene
el peso correcto, aunque, com o consecuencia de la variación del tam año
del garbanzo y de otras verduras, un paquete podría pesar m enos o más.
Una revisión de 4,000 paquetes que se llenaron el m es pasado arrojó los
siguientes datos:

Número Probabilidad de que


Peso Evento
de Paquetes ocurra el evento
Menos peso A 100 100/4 000 = 0.025
Peso satisfactorio B 3 600 3 600/4 000 = 0.9
Más peso C 300 300/4 000 = 0.075

Total 4 000 1

¿Cuál es la p ro b a b ilid a d d e q u e un p a q u e te en p a rtic u la r p es e


m en o s o pese m ás?
El resultado "pesa m enos" es el evento A. El resultado "pesa m ás" es el
evento C. Al aplicar la regla de la adición para eventos m utu am e nte ex­
cluyentes se tiene:

P(A O C) = P(A) + P(C) = 0 .0 2 5 + 0 .0 7 5 = 0 .1 0


4 *1

Observe que los eventos son m u tu a m e n te excluyentes, lo cual significa


que un paquete de verduras m ixtas no puede pesar m enos, tener el peso
satisfactorio y pesar más al m ism o tiem po.

©Santillana, S. A. 69
Eventos no M u tu a m e n te Excluyentes Dos o más eventos son no m utua­
m ente excluyentes cuando estos pueden ocurrir al m ism o tiempo, es decir, que
a la hora de que suceda no se descarta la posibilidad de que suceda otro.
Ejem plo: si se lanzan 2 dados al aire existe la posibilidad de que salga 6 en
cualquiera de los 2 dados lanzados, o tro caso puede ser, sacar un 5 y una
carta de espadas, es un evento no m utu am e nte excluyente, pues podem os
to m a r una carta y sacar un 5 de espadas. Tam bién, sacar un 9 y una carta
Eventos no m utuam ente negra, es un evento no m u tu am e nte excluyente, pues podem os to m a r el 9
excluyentes. de espadas o el 9 de trébol.
Ahora, una vez definida la probabilidad y descritas sus diferentes propiedades,
cabe atender al cálculo de la probabilidad de dos o más eventos aplicando la
regla d e la adición
Regla d e la A d ición para Eventos no M u tu a m e n te Excluyentes: SI dos
eventos A y B son no m utu am e nte excluyentes, la regla de la adición esta­
blece que la probabilidad de que ocurra uno u o tro es Igual a la sum a de sus
probabilidades m enos la probabilidad de que am bos ocurran al m ism o tie m ­
po. Esta regla se expresa m ediante la siguiente fórm ula:

P(A U B)=P(A O B)= P(A) + P(B) - P(A D B)

Ejemplo: Hábitos de fumar y enfermedad


La siguie nte tabla m uestra la asociación e n tre el háb ito de fu m a r y el
desarrollo de una enferm edad. Estos datos provienen de un estudio de
seguim iento a 180 individuos.

Enfermos Sanos Total

Fumador 60

No fumador 20

Total 80

S uponga q u e se desea e le g ir al azar


Jacob B ern oulli una_ p e rso n a de la ta b la . ¿Cuál es la
(1 6 5 4 -1 7 0 5 ) probabilidad de que la persona elegida
■ Bernoulli perm itió el avan­ esté enferm a o no fum e, o que esté en­
ce de m uchas teorías m a­ ferm a y al m ism o tiem po no fum e?
tem áticas, incluida la Teo­ Si den o m in a m o s E el even to de que la
ría de la Probabilidad. Para persona está enferm a, entonces la pro­
esta últim a, su obra m ás babilidad de la persona esté e n fe rm a
destacable es A rs Conjec- es P(E) = 80/180, es decir, 80 enferm os
tandl, publicada en 1713 de un total de 180 individuos.
con carácter postum o.

70 © Santillana, S. A.
Si denom inam os NF el evento de que la persona No Fuma, entonces la proba-
110
bilidad de la persona no fum e es P(NF) = es decir, 110 no fum adores de
loU
un total de 180 Individuos.

La probabilidad de que la persona elegida esté enferm a y al m ism o tiem po no


?0
fum e es: P(E n NF) = — es decir, existen 20 personas de las 180 que están
loU
enferm as y no fum an.

Entonces la probabilidad de que la persona elegida esté Enferma o No Fume es:

P(E U NF) = P(E) + P(NF) - P(E n NF) = _ _ J L = J Z jL 0 .9444

Por lo ta n to , si m u ltip lic a m o s e s te re s u lta d o p o r 1 0 0 (0 .9 4 4 4 x 1 0 0 =


9 4 .4 4 %), e x is te una p ro b a b ilid ad de 9 4 .4 4 % de q u e la perso na e le g i­
da e s té e n fe rm a o no fu m e

C O M P E T E N C IA R E S O L U C IO N DE P R O B L E M A S

Q Reglas de la adició n
• En una escuela de Idiom as de 300 estudiantes inscritos, 100 se encuentran en curso de inglés y 80
en curso de Francés. Estas cifras incluyen a 30 inscritos en am bos cursos. Si se elige un estudiante
al azar, ¿cuál es la probabilidad de que esté inscrito en inglés o en Francés?
Se encontró que 70 % de los turistas viajan a Venecia, 80 % visitan Roma y 6 0 1 i van a am bas ciuda-
des. ¿Cuál es la probabilidad de que un turista vaya a Venecia o Roma?

• En un paquete hay 6 pliegos de cartulina blanca, 4 de cartulina azul y 5 de


cartulina rosa. ¿Cuál es la probabilidad de que al to m a r uno sea blanco, azul
o rosa?
• Una alcancía llena de m onedas contiene: 25 de $ 5 ,1 2 de $ 1 0 ,4 de $25. Si
se saca una m oneda al azar, ¿cuál es la probabilidad de que su denom inación
sea de $5 o de $25?

©Santillana, S. A. 71
Q Diagrama del árbol
Esta es una técnica de conteo que nos perm ite enum erar los resultados posibles
F —- FFF de un experim ento aleatorio que consta de dos o más pasos. En el cálculo de la
G—- FFG probabilidad se requiere conocer el núm ero de elem entos que form an parte del
F ---- - FGF espacio muestral, estos se pueden determ inar con la construcción del diagrama
de árbol.
G — - FGG
El diagrama de árbol es una representación gráfica de los posibles resultados del
F — - GFF
experimento, el cual consta de una serie de pasos, donde cada uno de los pasos
G— - GFG tiene un núm ero finito de maneras de ser llevado a cabo. Se utiliza en los proble­
F— - GGF mas de conteo y probabilidad.

G — ^ GGG Para la construcción de un diagrama en árbol se partirá poniendo una rama para
cada una de las posibilidades, acompañada de su probabilidad. Cada una de estas
Diagrama de árbol. El diagrama ramas se conoce com o rama de primera generación.
de árbol nos permite enumerar
todos los resultados posibles de En el final de cada rama de primera generación se constituye a su vez, un nudo del
un experim ento aleatorio que cual parten nuevas ramas conocidas com o ramas de segunda generación, según
consta de dos o más pasos. las posibilidades del siguiente paso, salvo si el nudo representa un posible final del
experim ento (nudo final).
Hay que tener en cuenta que la construcción de un árbol no depende de tener el
m ism o núm ero de ramas de segunda generación que salen de cada rama de pri­
mera generación y que la suma de probabilidades de las ramas de cada nudo ha
de dar 1 .
El siguiente diagrama de árbol m uestra todos los posibles resultados y sus proba­
bilidades al lanzar una m oneda 3 veces.

1er. lanzamiento 2do. lanzamiento 3er. lanzamiento

Pícara, cara, cara) = (0.5 x 0.5 x 0.5) = 0.125

Pícara, cara, cruz) = (0.5 x 0.5 x 0.5) = 0.125

Pícara, cruz, cara) = (0.5 x 0.5 x 0.5) = 0.125


9 ^
P(cruz) = 0.5 P(cara, cruz, cruz) = (0.5 x 0.5 x 0.5) = 0.125
PARA COMENTAR
P(cruz, cara, cara) = (0.5 x 0.5 x 0.5) = 0.125
El equipo de baloncesto del
c e n tro e d u c a tiv o dese a P(cruz, cara, cruz) = (0.5 x 0.5 x 0.5) = 0.125
co n feccionar una bandera
P(cruz, cruz, cara) = (0.5 x 0.5 x 0.5) = 0.125
que co nteng a dos franjas
ve rtica le s de colores d ife ­
P(cruz, cruz, cruz) = (0.5 x 0.5 x 0.5) = 0.125
rentes. Los colores por ele­
gir son: azul, amarillo, verde
y blanco. ¿Cuántas o p c io ­
nes de colores tienen para
diseñar la bandera? Si sum am os las probab ilidad es de o currencia de los tre s lanzam ientos, esto
nos dará 1 .

72 © Santillana, S. A.
Q Valor esperado de un evento
El valor que se espera obtene r de un experim ento estadístico se llama el v a lo r
e s p e ra d o , ta m b ié n llam ado " e s p e ra n z a m a te m á tic a " . Tam bién lo llam a­
m os "m edia", y esta es la palabra que vam os a seguir usando. Si tiram o s una
m oneda 10 veces, esperam os que salga 5 veces "cara" y 5 veces "cruz". Espe­
ram os obtene r este valor porque la probabilidad de que salga "cara" es 0.5, y si
lanzam os la m oneda 10 veces, obtenem os 5. Por lo tanto, 5 es la media.
Debido a que una variable X puede adoptar diferentes valores con probabilida­
des dadas, a esta variable se le denom ina v a ria b le a le a to ria . Cuando se tie ­
nen todos los valores que una variable aleatoria puede adoptar y sus probabi­
lidades, entonces tenem os una fu n ció n de prob ab ilid ad .
La e s p e ra n za m a te m á tic a o v a lo r e s p e ra d o de una variable aleatoria es la
sum a de los pro d u cto s que se obtie nen al m u ltip lica r todos los valores de la
variab le aleatoria con sus respectivas probabilidades. La e s p e ra n z a m a te ­
m á tic a o v a lo r e s p e ra d o de una variable aleatoria se expresa en form ula de
la siguiente manera:

E(x) = l x n * P (xn) = X, * P(x.,) + x 2 * P(X2) + ... + x n* P (xn)

Ejemplo: Lanzar 4 monedas


C onsiderem os el expe rim e nto aleatorio en el que se lanzan 4 m onedas al
aire y se registra el núm ero de caras. El espacio m uestral asociado a este
expe rim e nto es E = (CCCC, CCCE, CCEC, CCEE, CECC, CECE, CEEC,
CEEE, ECCC, ECCE, ECEC, ECEE, EECC, EECE, EEEC, EEEE}; es decir,
este expe rim e nto tiene 16 posibles resultados, esto constituye un espa­
cio m uestral de 16 posibles resultados, donde los núm eros de caras pue­
den ser 0 ,1 ,2 ,3 y 4.
Si denom inam os a X com o núm ero de caras, los valores que X adoptaría
y las probabilidades de ocurrencia de cada valor de X es com o se m ues­
tra en la siguiente tabla, denom inándose a esta función de probabilidad.

Número
0 1 2 3 4
de caras (X)
PARA COMENTAR
Probabilidad
- V = 0.0625 ^ 0 .3 7 5 - U 0.0625
de x P(X) 16 f ? = ° - 25 tV 0-25 16

A p lica n d o la fó rm u la 4.4 ob te n d re m o s el núm ero de caras esperado al


»e lanzar 4 monedas.
E(x) = X x n * P(xn)
= (0 X 0.0625) + (1 X 0.25) + (2 X 0.375) + (3 X 0.25) + (4 X 0.0625)
Si lanzam os dos d ad os y
sum am os los resultados de E(x) = I X n * P(Xn) = 0 + 0.25 + 0.75 + 0.75 + 0.25 = 2
estos, ¿cuál sería el va lo r Si lan zam o s 4 m oned as, in d e fin id a c a n tid a d d e veces, en p ro m e ­
esperado a obtener? dio o b te n d re m o s 2 caras cada v e z q u e se lan cen las m o n ed as

© Santillana, S. A. 73
5.1 Usando la tecnología: Microsoft Excel
En M icrosoft Excel no existe una función específica para obtene r el valor espe­
rado o esperanza m atem ática de una variable aleatoria. Se debe de especificar
a Excel la operación m atem ática a realizar para obtenerla.
A continuación, se m uestra la función de probabilidad del núm ero de unidades
que se vendieron en una distribuidora de autom óviles los últim os 500 días. Desea­
mos determ inar la cantidad esperada de vehículos que se venderían en un día, es
decir, determ inar el prom edio de vehículos que se venderían diariamente.

Número de autos Número


P(X)
vendidos por día (X) de días (f)

0 90 90/500 =0.18
1 200 200/500 = 0.4
2 100 100/500 = 0.2
3 80 80/500 =0.16
4 25 25/500 =0.05
5 5 5/500 =0.01
Total 500 1

u tiliz a n d o la fó rm u la de va lo r esperado, d e b e m o s de e sp e cifica r a Excel la


operación m atem ática a realizar para obtene r la cantidad esperada de vehícu­
los a vender diariam ente, siguiendo los siguientes pasos:
■ Después de te n e r los datos en nuestra hoja de Excel, debem os de dedicar
una colum na para el cálculo del producto del valor de la variable X y la pro­
babilidad de X P(X). En este ejem plo se utilizó la colum na E.
■ En la celda correspondiente (E2) indicam os la operación m atem ática a realizar,
esta es m ultiplicar, escribim os, =+D 2*A 2 y presionam os Enter. Estas celas son
las que contienen los valores de la variable X (A2) y la probabilidad asociada
al valor de la variable X (D2).
■ Repetimos dicha operación m atem ática para cada celda debajo de esta, cam ­
biando solam ente el núm ero de la fila.

A B C D 1 E
á A B C D | E F
N úm ero de Au tos Núm ero de Autos
N úm ero de Número de
V end idos por día P(X) X * P(X) Vendidos por día P(X) X * P(X)
Días (f) Días (f)
1 (X) 1 (X)
i 2 0 90 90/500 = 0.18 0
2 0 90 90/500 = 0.18 i = +D 2*A 2
3 1 200 200/500 = 0.4 0.4
3 1 200 200/500 = 0.4 0.4
4 2 100 100/500 = 0.2 0.4
4 2 100 100/500 = 0.2 0.4 5 3 80 80/500 = 0.16 j =+D5*A5
5 3 80 80/500 = 0.16 0.48 6 4 25 25/500 = 0.05 0.2
6 4 25 25/500 = 0.05 0.2 7 5 5 5/500 = 0.01 0.05

7 5 5 5/500 = 0.01 0.05 8 Total 500 1


9
8 Total 500 1

74 ©Santillana, S. A.
■ Al finalizar de calcular cada producto se procede a sum ar dichos productos. Para esto utili­
zamos la función SUMAO, hacemos clic en insertar función (fx), y elegimos la función SUMAO
■ Seleccionam os los valores a ; ;umar, desde la celda E2 hasta la celda E7, la función en
Excel se verá así = SU M A (E 2 E7), y hacem os clic en Aceptar.

d A B

■■

N úm ero de Autos
w
Vendidos por día
. .
N um ero de
^ P(X ) X * P(X)

Ü 0 90 90/500 - 0.18 0
1 1 200 200/500= 0.4 0.4

M
H 2
3
100
80
100/500 -
80/500 =
0.2
0.16
0.4
0.48

S 4 25 25/500 ■ 0.05 0.2


1 5 5 5/500 = 0.01 0.05
1 1.53

L __________

En p ro m e d io se e s p era q u e d ia ria m e n te se ven d an 1.53 v e h íc u lo s d u ra n te 500 d ía s

5.2 Usando la tecnología: Lenguaje R


En R no existe una función específica para o b tene r el valor esperado o esperanza m ate­
m ática de una variable aleatoria. Se debe de especificar a R la operación m atem ática a
realizar para obtene rla. El p ro ce d im ie n to es m uy sencillo, solo Ingresar los datos de la
distribución y realizar la operación com o se explica a continuación:
■ introducim os los datos y los alm acenam os en una variable, en este caso, el núm ero de
autos vendidos por día se han alm acenado en el variable x.
> X = C(0, 1, 2, 3, 4, 5)

■ Introducim os los datos de la probabilidad de los autos vendidos por día y se han alm a­
cenado en el variable Px.
> PX = C(0.18, 0.4, 0.2, 0.16, 0.05, 0.01)

■ Le in dica m os a R que deseam os m u ltip lic a r cada va lo r de x por su corre sp o n d ie n te


p5 valor de probabilidad alm acenada en Px, esto lo logram os con la siguiente instrucción,
L 1, 2, 3, 4, 5) alm acenando dicho resultado en la variable xPx.
P.18, 0.4, 0.2, 0.16, 0.05, 0.01)
I * Px

.40 0.40 0.48 0.20 0.05


> xP x = X * Px
> XPX
[1] 0.00 0.40 0.40 0.48 0.20 0.05

■ Com o el valor esperado es la sum atorla del producto de x m ultip lica do por su corres­
pon dien te probabilidad P(x), le Indicam os a R que nos sum e dichos resultados con la
función sumO.
> sum (xPx)
[1] 1.53

En p rom edio se espera que d iariam ente se vendan 1.53 vehículos durante 500 días.

© Santillana, S. A. 75
P r o b a b ilid a d E s ta d ís tic a
CONTROL DEL APRENDIZAJE

1 P rim e ro se lanza un d ad o y d e sp ués una m oneda , realiza un d ia g ra m a de árb o l


para fo rm a r el espacio m uestral.

2 Un a g e n te de ve n ta s realiza 10 vista s d ia ria s y d e s c u b rió que la p ro b a b ilid a d de


realizar c ie rto n ú m e ro de ventas está de scrita p o r la sig u ie n te d istrib u ció n . C alcu­
la la ca ntid ad de ventas p ro m e d io que realizaría el v e n d e d o r en o tra s 1 0 visitas.

3 Se realizó un estudio para conocer el estado civil de los padres de 540 alum nos de una
escuela primaria. Hay 333 parejas casadas, 183 divorciadas y 24 viudos. ¿Cuál es la proba­
bilidad de que, al elegir un niño al azar, tenga padres divorciados?

4. Una em isora de radio anunció que daría un prem io en efectivo a 50 personas selec­
cionadas al azar de entre 1 0 , 0 0 0 llam adas que se recibieron d u ra n te los ú ltim o s 2
meses. ¿Cuál es la probabilidad de que los participantes ganen un prem io?

5 Una persona debe e legir una ru le ta de las que aparecen a c o n tin u a ció n para ju gar
con dos a m igo s m ás. ¿Cuál deb ería e le g ir si q u ie re te n e r m ás p ro b a b ilid a d e s de
ganar (cada c o lo r re p resenta a un p a rticipante)? Justificar.

76
6 En la figura, se tie n e una ru le ta en que la flecha puede in d ica r cualesqu iera de los
4 s e c to re s y ella nunca cae en los lím ite s de d ich o s se ctores. ¿Cuál(es) de las s i­
g u ie n te s p ro p o sicio n e s es(son) verdadera(s)?

1
• La probabilidad de que la flecha apunte al num ero 1 es de - y .

• La probabilidad de que la flecha apunte al núm ero 2 es de .


2
• La probabilidad de que la flecha apunte al num ero 2 o al 3 es de — .

7. C uatro co rre dores ig ualm en te calificados, Juan, G uillerm o, Eduardo y David, corren
los 1 0 0 m etros planos y se registra el orden de llegada:
• ¿Cuántos eventos sim ples hay en el espacio m uestral?
• Si los corredores están igualm ente calificados, ¿qué probabilidad se debe asignar a
cada evento sim ple?
• ¿Cuál es la probabilidad de que David gane la com petencia?
• ¿Cuál es la probabilidad de que David gane y Juan quede en segundo lugar?

8
• ¿Cuál es la probabilidad de que Eduardo llegue en últim o lugar?

. Una ban d e ja tie n e 3 so b re s rojos, 2 so b re s verdes, 2 so b re s b la n co s y un so b re


azul (to d o s los so b re s son de igual fo rm a y ta m a ñ o ). Si se to m a un s o b re de la
bandeja sin m irar:
• a) ¿Cuál es el color con m ayor probabilidad de ser escogido?
• b) ¿Cuál es el color con m enor probabilidad de ser escogido?
• c) ¿Qué colores tienen igual probabilidad de ser escogidos?

9 Al lanzar dos m oneda s se consideran los sig u ie n te s even tos: A: O btener al m enos
una cara; B: O btener solo una cara.
• D eterm inar
a) P(A o B)
b) P(A y B)

©Santillana, S. A. 77
C o m u n ic a
EVALUACIÓN

1. Define con tus propias palabras la probabilidad.


• Un envase contiene 3 bolas, 1 roja, 1 verde y 1 azul. Si se considera el experim ento
de extraer 2 bolitas del envase, describe el espacio m uestral del experim ento.

R a z o n a y a r g u m e n ta

2. En una bodega hay 200 sillas con algún d e sp e rfe cto : 40 sin respaldo, 45 sin asiento, 60 con una pata rota
y 55 con 2 patas rotas. Si se to m a una silla al azar:
• ¿Cuál es la probabilidad de que no tenga respaldo?
• ¿Cuál es la probabilidad de que no tenga ni una pata rota?

M o d e la y r e p r e s e n ta

3. Unos e stu d ia n te s diseñan ca m ise ta s para la realización de su p ro m o ció n de fin de estudios. Los ta m a ñ o s
de las ca m ise tas son: (S = Sm all, M = M é d iu m , L = Large y XL = X tra Large); con dos diseños (T = T radicio­
nal, I = in novad or) y de tre s co lo re s (A = A zul, V = Verde, N = Negro), ¿C uántos m o d e lo s d ife re n te s se p u e ­
den realizar? Realiza un d ia g ra m a de á rb o l. ¿Cuál es la p ro b a b ilid a d de cada p o sib le c o m b in a c ió n , si la
pro b a b ilid a d de cada o p ció n es la siguiente?:

Tamaño: P(S)= 0.25 P(M) = 0.25 P(L) = 0.25 P(XL) = 0.25

Diseño: P(T)= 0.5 P(l) = 0.5

Colores: P(A)= 0.333 P (V) = 0.333 P(N) = 0.333

R e s u e lv e p r o b le m a s

4. Se sabe que, en intervalos de 15 m inutos tom ados aleatoriam ente, el núm ero de clientes que llegan a una ca­
fetería sigue la d istrib u ció n de probab ilidad es que se m uestra en la sig uie nte tabla. Calcula la cantid ad de
clientes prom edio a esperar en los próxim os 15 m inutos.

C lie n te s (X) P(X)


1 0.04
2 0.15
3 0 .2 0

4 0.25
5 0.19
6 0 .1 0

7 0.05
8 0 .0 2

Total 1

APRENDIZAJE AUTONOMO

Realiza cálculos de probabilidades para eventos sim ples y com puestos. □ □ □

M uestra interés en resolver problem as de la vida diaria que im pliquen


el cálculo deprobabilidades. □ □ □
78 © Santillana, S. A.
1 2 3 4 5 ) 6 7 8 9 10

Correlación y regresión
simple
Mayormente nos interesa saber las relaciones que existen entre dos o más variables, asumien­
do que estas no funcionan Independientemente, sino que los valores de una afectan o se re­
lacionan con la otra.

C o m p e te n c ia s
Define correlación y regresión
simple.
■ in terpreta co e ficie n te de co­
rrelación y coeficientes de la
ecuación de regresión.
■ Utiliza herram ientas te c n o ló ­
gicas para realizar cálculos de
c o e fic ie n te de co rre la ció n y
an á lisis de re g re sió n lineal,
usando h e rra m ie n ta s com o
M icrosoft Excel y Lenguaje R.

C o n te n id o s
■ Análisis de correlación sim ple
■ Análisis de regresión sim ple

©Santillana, S. A. 79
Correlación
1.1 Análisis de correlación simple
Correlación: Grupo de técnicas para m edir la asociación entre dos variables. En
el análisis de correlación se obtiene el c o e fic ie n te de correlación (r), el cual
brinda una medida cuantitativa de la fuerza de la relación entre dos variables.
La ¡dea básica del análisis de corre lación es re p o rta r la asociación entre dos
variables. Por lo general, el prim er paso es representar los datos en un d ia g ra ­
m a d e dispersión
El diagram a de dispersión consiste en localizar cada par de puntos (X, Y) en un
sistema de coordenadas rectangulares, que se construye en el cuadrante carte­
siano en el cual tanto X (eje horizontal) com o Y (eje vertical) son positivos.
Las características del coeficiente de correlación son las siguientes:
■ El coeficiente de correlación de la m uestra se identifica con la letra minúscula (r).
■ M uestra la dirección y fuerza de la relación lineal (recta) entre dos variables
en escala de intervalo o en escala de razón.
■ Varía de - 1 hasta 1, Inclusive.
■ Un valor cercano a 0 indica que hay poca asociación entre las variables.
■ Un valor cercano a 1 indica una asociación directa o positiva entre las variables.
■ Un va lo r cercano a - 1 Indica una asociación Inversa o negativa entre las
variables.
Un coeficiente de correlación es una estim ación m atem ática de la relación entre
dos o más variables. El valor del coeficiente de correlación estará com prendido
entre 1 y - 1, pasando por cero. El m áxim o valor que puede alcanzar un coeficien­
te de correlación positivo es 1; esto Indica que la relación es perfecta entre los
valores de X e Y. Por lo tanto, decim os que estam os ante una relación de este tipo,
cuando la posición que ocupa el sujeto en la variable X es exactam ente la misma
que ocupa en la variable Y. En el m om ento en que esta situación no se dé siste­
máticamente, el valor de r será m enor a 1.00, y se aproximará a cero (0) a medida
que las diferencias de posición (rango) sean mayores.
Por o tro lado, cuando el valor de r es igual a - 1 , estam os ante una correlación
perfecta negativa y corresponde al valor de r más alto con este signo. Esto nos
indica que el sujeto m ás alto en X es el m ás bajo en Y, el segundo sujeto más
alto en X es, a su vez, el segundo sujeto más bajo en Y, y así sucesivam ente. SI
esta relación in versam e nte p ro porcio nal no se cu m ple sistem áticam ente, el
valor de r va a d ism inuir y se aproxim ará a cero en la m edida en que las d ife ­
rencias de posición en am bas variables sean mayores.
La correlación se centra en dos aspectos de la relación: la dirección que puede
ser positiva o negativa, y el grado, fuerza o m agnitud, que se refiere al va lo r
cu a n tita tivo de la relación. Cuando la relación es perfecta (1 o - 1), la p redic­
ción de una variable hacia la otra es exacta; cuando la correlación es im perfec­
ta (r < 1) ó (r > - 1), la predicción es aproxim ada y se debe establecer el m ar­
gen de error, sie n d o esta la s itu a c ió n m ás co m ú n cu a n d o se tra b a ja con
Karl Pearson. muestras. Cuando no hay correlación (r = 0), no se puede hacer predicción.

80 © Santillana, S. A.
Relación buena pero Relación débil Relación buena pero
no m u y fuerte no m u y fuerte

1 - c ).5 t .5 1

O
Correlación Correlación
positiva perfecta negativa perfecta

La fórm ula para determ inar el coeficiente de correlación es la que se presenta


a continuación:

Ix y £ x ) gy)
C o e fic ie n te d e c o rrelació n r= n
£ y )2
xy n

A continuación, se m uestran 4 figuras de diagram as de dispersión que repre­


sentan los posibles tipos de relación entre 2 variables. La figura a) es un ejem ­
plo de relación lineal positiva, m ientras que la figura b) es un ejem plo de la re­
lación lineal inversa (negativa), ya que puede apreciarse que, al au m e n ta r la
variable X, dism inuye el valor de la variable Y. En la figura c) se m uestra el caso
de una relación que no es lineal (se aprecia fácilm ente que la relación es curvi­
línea). Finalm ente, en la figura d) se ilustra ei caso de un diagram a de disper­
sión que m uestra la nula relación entre ias 2 variables utilizadas para elaborar
el diagrama.

a) Relación lineal positiva b) Relación lineal negativa

_•••••••••.
•••••
• • • • • • • • • • , • ;•
•••••••

*••••••••

o
c) Relación curvilínea d) Ninguna relación

©Santillana, S. A. 81
Ejemplo: El ingreso y ahorro de las familias
El gerente de un banco desea saber si puede considerarse que el ahorro
de las fam ilias (variable Y) está relacionado con sus ingresos (variable
X). En la tabla siguiente se m uestran los resultados obtenidos para una
m uestra de 10 fam ilias. Los ingresos y ahorros están expresados en m i­
les de pesos dom inicanos (RD$).

Puntuaciones Ingresos (X) Ahorros (Y)


1 28.0 1 .0 0

2 44.0 2 .2 0

3 27.0 0.90
4 2 2 .0 1 .0 0

5 23.0 0.85
6 41.0 2.80
7 39.0 2 .0 0

8 42.0 1.50
9 31.0 1.50
10 41.0 2.50

La representación de estos datos en un diagram a de dispersión se ¡lus­


tra en la siguiente figura.

D iag ram a d e disp ersio n


3 000
2 500
g 2 000
C/5

2 1 500
O
< 1 000

500
0
o 5 000 10 000 15 000 20 000 25 000 30 000 35 000 40 000 45 000 50 000
Ingresos (x)

El diagram a de dispersión m uestra que la relación entre las variables (X,


Y) parece ser rectilínea (lineal) y directa (al aum entar el valor de la varia­
ble X, aum enta el va lo r de la Y), es decir, te n ta tiva m e n te y de m anera
visual podem os notar que m ientras aum entan los ingresos de las fa m i­
lias, el ahorro de estas tam bién aum enta.

82 © Santillana, S. A.
Ahora debem os de obtener el coeficiente de correlación (r) para d e te rm i­
nar la d irección y fuerza de la relación lineal entre estas dos variables,
para esto utilizarem os la fórm ula del coeficiente de correlación (r). Orga­
nizando los cálculos en una tabla, obtenem os lo siguiente:

Ingresos A h o rro s
Fam ilia X * Y X2 Y2
(X) (Y)
1 28.0 1.00 28.00 784.0 1 000
2 44.0 2.20 96.80 1 936.0 4 840
3 27.0 0.90 24.30 729.0 0.810
4 22.0 1.00 22.00 484.0 1 000
5 23.0 0.85 19.55 529.0 0.723
6 41.0 2.80 114.80 1 681.0 7 840
7 39.0 2.00 78.00 1 521.0 4 000
8 42.0 1.50 63.00 1 764.0 2 250
9 31.0 1.50 46.50 961.0 2 250
10 41.0 2.50 102.50 1 681.0 6 250
Total 338 16.25 595.45 12 070 30 963

S ustituyendo los valores correspondientes en la fórm ula, se tiene:

(338) (16.25)
595.45 -
r= 10
12 0 70 - J338FI * [30 963 - (16-25)2 ]
10 J L 10 J

5 492 50
595.45- - 5 VZSU
10

12 07 0 - 114244j * [30i96 264-06


10-1 L • 10

595.45 - 549.25 K 46.20


J [12 070 -1 1 424.4] * [30 963 - 26 406] J [645.6] * [4 556]

r _ — 46.20------- _ r _ — 46J0— _ o g52


I------------------- 54 236
J 2 941 515

El c o e fic ie n te d e co rrelació n (r) es igual a 0 .8 5 2


Un coeficiente de correlación (r) = 0.852, indica que hay una asociación di­
recta o positiva entre las variables, dicha asociación es fuerte, ya que es un
coeficiente cercano a 1. En otras palabras, hay una relación fu e rte y di­
recta e n tre los ingresos y los ahorros en la m uestra de fam ilias

©Santillana, S. A. 83
1.2 Regresión lineal simple
A travé s del e stu d io de las co rre la cio n e s se lo g ró ana lizar la asociación que
existe e n tre dos o m ás variables. Se con sig u ió e sta b le ce r que las m a g n itu ­
des de e stas re la c io n e s se podían d e te rm in a r c u a n tita tiv a m e n te a tra vé s
del c o e fic ie n te de c o rre la c ió n , ade m á s de e s ta b le c e rs e el s e n tid o de las
m ism as: positivo, n e g ativo o ausencia de co rre la ció n .
Pero la re la ció n de va ria b le s nos p e rm ite o b te n e r in fo rm a c ió n que va m ás
allá de lo a n te rio rm e n te se ñ a la d o . T am bién p e rm ite a lc a n z a r u n o de los
o b je tiv o s m ás a p re c ia d o s en la In ve stig a ció n : la p re d ic c ió n , es decir, se
d e s e a e s tim a r el v a lo r d e la v a ria b le d e p e n d ie n te Y con b as e en un
v a lo r s e lecc io n ad o d e la v a ria b le in d e p e n d ie n te X.
La té c n ic a para d e s a rro lla r la e cu a ció n y p ro p o rc io n a r las e s tim a c io n e s o
p re d iccio n e s se d e n o m in a análisis de regresión.
En el aná lisis de reg re sió n , el o b je tiv o es u tiliz a r los d a to s para tra z a r una
línea re cta que re p re se n te m e jo r la re la ció n e n tre las dos variables. N u es­
tro p rim e r e n fo q u e es u tiliz a r un diagram a de d isp e rsió n para visu a liza r la
posició n de la línea, tal co m o vim o s en el diagram a de d ispersión del e je m ­
plo de a n á lis is de c o rre la c ió n . E xiste un m é to d o que p ro p o rc io n a lo que
c o m ú n m e n te se co n o ce c o m o re cta del "m e jo r a ju s te ", e ste es el P rin ci­
pio de los M ín im o s C uadrados.
La e cua ción de una re cta tie n e la fo rm a :

Ecuación de reg resió n lin e a l Y = a + bx

donde:
Y, que se lee Y prim a, es el v a lo r de la e stim a ció n de la va ria b le Y para un
Francis G alton
v a lo r X seleccionado.
(1 8 2 2 -1 9 1 1 )
a, es la in te rs e c c ió n Y. Es el v a lo r e s tim a d o de Y cu a n d o X = 0. En o tra s
In tro d u jo el té rm in o regre­
palabras, a es el v a lo r e s tim a d o de Y d o n d e la re cta de re g re sió n cruza el
sión en su libro Natural In­
eje Y cuando X es cero.
h e rita n c e (1889). Se c o n ­
c e n tró en el e s tu d io de la b, es la pendiente de la recta, o el cam bio prom edio en Y por cada cam bio de
altura de hijos a partir de la una unidad (ya sea aum ento o reducción) de la variable independiente X.
a ltu ra de sus p a d re s, lle ­
X, es cu a lq u ie r va lo r de la va ria b le in d e p e n d ie n te que se seleccione.
g a n d o a la c o n c lu s ió n de
que los p a d re s m u y a lto s La e cu a ció n de la re g re sió n lineal es e x a c ta m e n te la m ism a que la e c u a ­
tenían una te n d e n cia a te ­ ció n de c u a lq u ie r línea, a es la in te rs e c c ió n con Y y b es la p e n d ie n te . El
n e r h ijo s q u e h e re d a b a n p ro p ó s ito de un a ná lisis de re g re sió n es ca lcu la r los va lo re s de a y b para
p a rte de esta a ltu ra , pero d e sa rro lla r una e cua ción lineal que se a ju ste m e jo r a los datos.
que revelaban tam bién una Las fó rm u la s de los c o e fic ie n te s a y b son:
te n d e n c ia a re g re s a r a la
m edia. A esto Galton le d e ­ y xv Ex) gy)
nom inó Ley de la Regresión C o e fic ie n te b b = — - - ----------- 0 ----------
Universal.

84 ©Santillana, S. A.
C o e fic ie n te a a = Y - bx

Después de determ inar los coeficientes a y b se procede a sustituir estos en la


fifi ifii Kiil i l i i ifii 1H I~ ecuación de regresión lineal, para estim ar o predecir el valor de la variable de­
pendiente Y.
Usemos el ejem plo m ostrado en el análisis de correlación, el ingreso y ahorro
de las familias.

Ejemplo: El ingreso y ahorro de las familias


El gerente de un banco desea saber si puede considerarse que el ahorro
de las fam ilias (variable Y) está relacionado con sus ingresos (variable X).
En la ta b la s ig u ie n te se m u estran ios re su lta d o s o b te n id o s para una
m uestra de 10 familias. Los ingresos y ahorros están expresados en m i­
les de pesos dom inicanos (RD$).

Familia in gresos (X) A h o rro s (Y)


1 28.0 1 .0 0

2 44.0 2 .2 0

3 27.0 0.90
4 2 2 .0 1 .0 0

5 23.0 0.85
6 41.0 2.80
7 39.0 2 .0 0

8 42.0 1.50
9 31.0 1.50
10 41.0 2.50

A estos datos le calculam os la ecuación de regresión, en la siguiente ta ­


bla se m uestran los cálculos.

Familia ingresos (X) A h o rro s (Y) X * Y X2


1 28.0 1 .0 0 28.00 784.0
2 44.0 2 .2 0 96.80 1 936.0
3 27.0 0.90 24.30 729.0
4 2 2 .0 1 .0 0 2 2 .0 0 484.0
5 23.0 0.85 19.55 529.0
6 41.0 2.80 114.80 1 681.0

7 39.0 2 .0 0 78.00 1 521.0


8 42.0 1.50 63.00 1 764.0
9 31.0 1.50 46.50 961.0
10 41.0 2.50 102.50 1 681.0

Total 338 16 .2 5 5 9 5 .4 5 12 0 7 0

© Santillana, S. A. 85
Sustituyendo en las fórm ulas los coeficientes a y b son los siguientes:

P rim ero calcu lam o s el c o e fic ie n te b:

(338) (16.25) 5,492.50


D 10 10
b= -
12,070 - 12,070 -
10 10
(3 3 8 )2 1 1 4 ,2 4 4

595.45 - 549.25 = 46.20 =b=0 0716


12,070-11,424.4 645.6

Segundo, calcu lam o s el c o e fic ie n te a:

a = -1-6-2^ -0.0716 ' 338 1.625 - 0.0716 (33.8) = 1.625 - 2.42 = a = - 0.795
10 l 10

Sustituyendo los coeficientes a y b en la ecuación de regresión, obtenemos:

Y = - 0 .7 9 5 + 0 .0 7 1 6 X

Los coeficientes se pueden Interpretar de la siguiente m anera: Si alguna


fam ilia no percibe ingresos (X = 0) sus a h o rro s d is m in u y e n 7 9 5 p e ­
sos. A dem ás, por cada 1 000 pesos de Ingresos en la fam ilia, sus a h o ­
rros a u m e n ta n 7 1 .6 pesos

SI deseam os e stim ar o predecir cuál sería el a ho rro de una fam ilia que tiene
Ingresos de RD$ 50 000, debem os de sustituir X por 50, debido a que los coefi­
cientes están expresados en m iles de pesos, por lo que la ecuación quedaría
de la siguiente form a:
Y = - 0 .7 9 5 + 0 .0 7 1 6 (5 0 ) = - 0 .7 9 5 + 3 .5 8 = 2 .7 8 5
Esto quiere decir, que si una fam ilia posee ingresos de RD$50 000 el ahorro de
esta fam ilia sería de RD$2 785 pesos.

1.3 Usando la tecnología: Microsoft Excel


En este tem a se ha utilizado el co m p le m e n to de "Análisis de datos" de Excel.
Este com plem e nto originalm ente no viene activado, debem os de activarlo. Pa­
ra activarlo, en el menú, debemos hacer clic en "Archivo'', de la lista de o p cio­
nes seleccionam os "O pciones". En la ventana que nos aparece hacem os clic
en "C om p lem entos", después en la lista de opcione s de "A dm inistrar" selec­
cionam os la opción "C om plem entos de Excel" y después al botón "ir...".

86 ©Santillana, S. A.
^ ---- H : D ft • :
Archivo Irwro V Insertar Oseño de pagina Formulas D

* ¿SP*
H Copar -
Calibo • i: - A A

*T #Cop«rfBmHíB N * ** ■' i ' A ’ ?•*


Portapapeles H Fuente

Nos aparecerá una ventana con los


Complementos de Excel, para activarlos,
hacemos clic en el recuadro para colocar Para acceder al co m p le m e n to activado, vam os a la pestaña
el cotejo al complemento que deseamos "D atos" ubicada en el m enú, después en la cinta de o p cio ­
activar, en nuestro caso, los que dicen nes de este m enú, en el e xtre m o derecho, verem os el co m ­
"Herramientas para análisis", después plem ento de "Análisis de datos".
hacemos clic en el botón "Aceptar".

Complementos
■ E f *

Aceptar j
iij£j Herramientas para análisis - v p ( Cantetar __j
N^Soltei

Automatización .

Herramientas pan análisis


Proporciona herramientas de análisis de datos pan anaHsIs
estadísticoy de ingeruena

©Santillana, S. A. 87
D ñ s « í§3

ágina Fórmulas Datos Revisar Vista Programador Q tC


Bfc fij^ Bü Consultas y conexiones
■ rg
es Conexiones Actualizar | Ordenar Filtro I
tes existentes todo - *
C o n s u lt a s y c o n e x io n e s O r d e n a r y fj

Al d a r clic aquí, aparece una ve n ta n a con un lista d o de Técnicas de A nálisis


de Datos, la cual in cluye la de "R egresión ", d e b e m o s bajar ene lista d o y se­
le ccio n a r dicha té cn ica . C uando se hace clic en esta técnica, hacer c lick en
el bo tó n A ceptar, después nos a p a rece la s ig u ie n te pantalla:

C om o puede verse, deb erá n a n o ta rse los rangos de la hoja de Excel en las
casillas de "R ango Y d e e n tra d a " y de "Rango X d e e n tra d a " . Le in d ic a ­
m o s las re fe re n c ia s de ce ld a s q u e c o n tie n e n los d a to s de In g re s o (X ) y
A h o rro (Y) con sus co rre s p o n d ie n te s encabezados; ta m b ié n d eb e a ctiv a r­
se la casilla "R ótulos" en e s te c u a d ro de d iá lo g o de Excel para in d ic a r al
p ro g ra m a q u e se in c lu y e ro n los e n ca bezad os. De e sta m a n e ra so lo resta
a c tiv a r la casilla "R ango d e salida" en la se cció n "O p cio nes d e salida" y
m a rca r alguna celda vacía ubicada hacia abajo y a la d e recha de los datos
para q u e a p a rtir de ella aparezca n los d a to s re s u lta n te s de e s te c o m p le ­
m ento. Finalm ente, se hace clic el b o tó n "A ce p ta r" y se o b tie n e n los re su l­
ta d o s que se m u e stra n en las sig u ie n te s tablas.

©Santillana, S. A.
Resumen

E stad ísticas de la regresión

Coeficiente de correlación múltiple 0.851836886

Coeficiente de determinación RA2 0.72562608

RA2 ajustado 0.69132934

2.50
Error típico 0.395303075

Observaciones 10

A n álisis d e varia n za

G rados Sum a P ro m ed io V alor crítico


F
d e lib e rta d de cuadrados d e los cu ad rad o s de F

Regresión 1 3.30613383 3.306133829 21.15729021 0.00175613

Residuos 8 1.25011617 0.156264521

Total 9 4.55625

inferior Superior inferior Superior


C oeficientes E rro r típico Estadístico t Probabilidad
95% 95 % 95.0 % 95.0 %

Intercepción - 0.793773 0.540508 - 1.468569 0.180139 - 2.040187 0.452640 - 2.040187 0.452640

ingresos (X) 0.071561 0.015558 4.599705 0.001756 0.035685 0.107438 0.035685 0.107438

Estas tablas de resultados contienen mucha más inform ación que aquella que se
ha revisado hasta aquí. Por ahora solo se contem plan los conceptos que se han
aprendido. Solo utilizaremos la tabla de Estadísticas de Resumen, ya que contiene
el coeficiente de correlación, que resultó igual que el calculado en el ejemplo, pero
más preciso, con m ayor núm ero de decimales, y la cantidad de observaciones, y la
última tabla, ya que contiene los coeficientes de la ecuación de regresión.
En la últim a tabla, en la colum na "C oeficientes" pueden apreciarse los valores
-0 .7 9 3 7 7 3 y 0.071561, catalogados com o In te rc e p c ió n e In g re s o (X), res­
pectivam ente. Intercepción es la m ism a ordenada al origen (coeficiente a), es
decir, el punto en el que la recta cruza (intercepta) al eje vertical, solo que con
m ayor precisión que la ob te n id a en el cá lculo m anual. En ta n to que Ingreso
m arca la pendiente, lo cual lleva a la m ism a ecuación de regresión, pero m ás
o 'e c s a , con m ayor núm ero de decim ales:
Y = - 0 .7 9 3 7 7 3 + 0 .0 7 1 5 6 1 X

© Santillana, S. A. 89
1.4 Usando la tecnología: Lenguaje R
En el softw are R los com andos básicos para realizar una C o rrelació n y obtener
los coeficientes de la Ecuación d e reg resió n lin eal son: "cor" (correlation) y
"Im" (linear m odels), respectivam ente.
Para ejecutar am bos com andos, prim ero Ingresam os a R los datos de cada va­
riable; utilizarem os los datos de Ingreso y A h o rro d e las fam ilia s, que hem os
visto en ejem plos anteriores para verificar que los resultados obtenidos sean los
mismos.
■ in g resar los d a to s d e Ingresos y A h o rro s a R:
> Ingresos = C(28, 44, 27, 22, 23, 41, 39, 42, 31, 41)
> A horros = C(1, 2.2, 0.9, 1, 0.85, 2.8, 2 ,1 .5 ,1 .5 , 2.5)
■ Para re a liza r un d ia g ra m a d e d ispersión y v e rific a r v is u a lm e n te la re ­
lación e n tr e a m b a s v a ria b le s , in g re s a m o s el c o m a n d o "plotO " de la
s ig u ie n te m anera:
> plot(Ahorros~lngresos)

Archivo Hiftófico P.ed*menston#r Vontmts


SUS

« e C) * *1 c 4

■ Para obtener el coeficiente de correlación entre estas dos variables, Ingresamos


lo siguiente:
> cor(A horros, Ingresos)
[1] 0 .8 5 1 8 3 6 9
Com o podem os ver, este resultado es el m ism o que el calculado m anualm en­
te com o el obtenido utilizando Excel.

© Santillana, S. A.
■ Para o b te n e r los c o e fic ie n te s de la Ecuación d e R egresión Lineal e m ­
p le a m o s la fu n ció n "Im O ", donde el p rim e r argum ento es el nom bre de la
variable dependiente y el segundo es el de la variable independiente "Im (Y -X )";
p rim e ro alm acenam os el resultado en una variab le y después utilizam os la
fu n ció n "su m m aryO " para que nos brinde un resum en con los datos de la
regresión lineal obtenida:
> Regresión = Im (A horros-ingresos)
> s u m m a ry (Regresión)
Com o podem os ver, este resultado es el m ism o que el calculado m anualm en­
te com o el obtenido utilizando Excel.
■ Con los siguientes com andos le agregam os la re c ta d e regresión que m ejor
se ajusta a los datos con la función "ablineO" y tam bién estim am os o podem os
predecir el valor de Y según los coeficientes de la ecuación de regresión, sus­
titu ye n d o los valores de estos en la ecuación y asignándole un valor a X, por
ejem plo el valor usado en el ejem plo anterior.
> a b lin e (Regresión)
> Y = -0.7 9377+ 0.07156 * 50
>Y
[1] 2 .7 8 4 2 3

Archivo Histórico Jtedimír

I R Graphics. Om m 2 (ACTIVE)

p o e cj *i + <? 4 1

©Santillana, S. A. 91
C o r r e la c ió n y R e g re s ió n S im p le
CONTROL DEL APRENDIZAJE

1. Después de un exam en de m ate m áticas se preguntó a 10 estudiantes el núm ero de


horas que habían e studiado y la ca lificación que ob tu vie ro n . Los resultados se pre­
sentan a continuación.

Horas de Puntuación
Estudiante
Estudio (X) (Y)
1 10 98
2 5 91
3 1 62
4 2.5 73
5 8 96
6 4 92
7 3 88

8 7 93
9 6.5 95
10 4 90

• Elabore el diagram a de dispersión.


• D eterm ine el coeficiente de correlación entre las horas de estudio y la puntuación.
• D eterm ine ecuación de regresión.
• A partir de la ecuación encontrada cual sería la puntuación de un estudiante si este
estudiara 6 horas.

2. Una m u e s tra de 10 fa m ilia s re ve ló las s ig u ie n te s c ifra s p o r ta m a ñ o de fa m ilia y


ca n tid a d gastada en d ive rsió n p o r sem ana.

Familia Tamaño Familia (X) Cantidad Gastada (RD$)


1 3 4,800
2 6 5,050
3 5 7,325
4 6 6,255
5 6 6,890
6 3 5,385
7 4 3,590
8 4 4,415
9 5 5,770
10 3 4,420

• Elabore el diagram a de dispersión.


• D eterm ine el coeficiente de correlación entre el tam a ño de la fam ilia y la cantidad
gastada en diversión.
• D eterm ine ecuación de regresión.
• A partir de la ecuación encontrada cual sería la cantidad que se gastaría en diversión
si la fam ilia es de 2 m iem bros.

92 © Santillana, S. A.
A c o n tin u a c ió n , se m u e s tra n la tasa de p ro m o v id o s del s is te m a e d u c a tiv o y el
p o rc e n ta je de hog are s pobres, según p ro vin cia , para el p e río d o 2010-2011 en la
R epública D om inicana.

P rovincia Tasa d e p ro m o vid o s (%) % hog ares pob res


AZUA 87.23 65.2
BAORUCO 81.67 74.5
BARAHONA 82.63 65.2
DAJABÓN 8 8 .0 0 53.9
DISTRITO NACIONAL 91.20 26.7
DUARTE 86.97 42.6
ELÍAS PIÑA 83.11 83.2
EL SEIBO 78.99 70.7
ESPAILLAT 86.64 34.0
HATO MAYOR 85.98 62.4
HERMANAS MI RABAL 87.44 36.8
INDEPENDENCIA 84.31 72.9
LAALTAGRACIA 84.87 51.8
LA ROMANA 87.67 45.3
LA VEGA 86.07 31.4
MARÍA TRINIDAD SÁNCHEZ 88.13 42.0
MONSEÑOR NOUEL 88.41 27.3
MONTE CRISTI 89.61 61.3
MONTE PLATA 88.90 70.1
PEDERNALES 80.31 74.6
PERAVIA 8 6 .2 2 46.7
PUERTO PLATA 89.84 37.2
SAMANÁ 87.77 48.9
SAN CRISTÓBAL 87.11 36.2
SAN JOSÉ DE OCOA 86.47 61.7
SAN JUAN 82.74 63.0
SAN PEDRO DE MACORÍS 87.89 47.5
SÁNCHEZ RAMÍREZ 87.99 46.2
SANTIAGO 88.05 30.8
SANTIAGO RODRÍGUEZ 88.31 48.3
SANTO DOMINGO 90.82 33.6
VALVERDE 86.54 56.3

H aciendo uso de M ic ro s o ft Excel y Lenguaje R, o b te n e r:


C o e ficie n te de co rre la ció n
E cuación de regresión
Diagram a de disp e rsió n I J

©Santillana, S. A.
C o m u n ic a
1. Expresa la im p o rta n c ia del diagram a de dispersión.
2. D efine el c o e fic ie n te de co rre la ció n .
3. D efine regresión lineal sim ple.

R a z o n a y a r g u m e n ta
O
4. Una em presa eléctrica estudia la relación entre kilow atts-hora (KW/h) (miles) consum idos y el núm ero de habi­
taciones de una residencia privada familiar, una m uestra aleatoria de 1 0 casas reveló lo siguiente:

Núm de viviendas 1 2 3 4 5 6 7 8 9 10
Número de habitaciones 12 9 14 6 10 8 10 10 5 7
Kilowatts-hora (miles) 9 7 10 5 8 6 8 10 4 7

• D eterm ina la ecuación de regresión.


• Encuentra el núm ero de kilow atts-hora, en miles, de una casa de 6 habitaciones.

M o d e la y r e p r e s e n ta

5. El jefe de la Policía Nacional aum entará el núm ero de policías para reducir los delitos de una determ inada ciudad.
Antes de tom ar una decisión final, este realiza una encuesta en otras ciudades, de tam año similar, para determ inar
la relación entre el núm ero de policías y el núm ero de delitos reportados. A continuación, la inform ación muestral.

Ciudad 1 2 3 4 5 6 7 8
Policías 15 17 25 27 17 12 11 22
Número de delitos 17 13 5 7 7 21 19 6

• Traza un diagram a de dispersión y determ ina el coeficiente de correlación.


• Interpreta el coeficiente de correlación. ¿Te sorprende que sea negativo?

R e s u e lv e p r o b le m a s

6 . Una m uestra de 10 fam ilias del área de Punta Cana reveló las siguientes cifras por tam a ño de fam ilia y canti­
dad gastada (en US$) en diversión por semana.

Familia
Tamaño fam iliar
D
3
2
6
3
5 6
5
6
6
3 4
8
4
9
5
10
3
Cantidad gastada en diversión 99 104 151 129 142 111 74 91 119 91

• Traza un diagram a de dispersión, determ ina el coeficiente de correlación y la ecuación de regresión.


• ¿Existe una asociación positiva entre la cantidad gastada en diversión y el tam año de la fam ilia?
• Si el tam año de la fam ilia fuera 2, ¿cuál sería la cantidad por gastar de esta fam ilia en diversión?

APRENDIZAJE AUTONOMO
1 C
M uestra interés en resolver problem as de la vida diaria que im pliquen
determ inar la relación y predicción entre dos variables.
□ □ □
A precia el uso de la calculadora, so ftw ares diversos, com o el Lenguaje R y
otros, para d e term inar la relación y realizar predicciones entre dos variables.
□ □ □
94 ©Santillana, S. A.
Glosario...
■ A n álisis de reg resió n y correlació n . Estudia la relación que puede existir entre dos o más
variables de una m uestra.
■ C o e fic ie n te d e variació n . Cociente entre la desviación estándar y la m edia aritm ética m ul­
tiplicad o por 1 0 0 .
■ C o m p le m e n to . El com plem ento de un conjunto A es el conjunto que se form a por todos los
elem entos que no pertenecen a ese conjunto.
■ D atos. Constituyen la m ateria prim a de la estadística.
■ D a to s con tinuos. Se pueden expresar con tal precisión que llega un m o d e rn o e r e c u e e :
difícil distinguir entre un núm ero y el siguiente.
■ D a to s d isco n tin u o s o d iscretos. Por su naturaleza expresan ra rtiria riK s q H n i t K y f i r « .
m ente distinguibles unas de otras.
■ D esviación es tá n d a r. M ide la dispersión de los d a to s alrededor déla m a fe a a tm é a B a .R á E
cuadrada de la varianza.
■ D esviación m e d ia P rom edio de los valores absolutos de las (Herencias entre c ate dalo y
su media.
■ Escala d e in te rv a lo . En esta la distancia entre dos unidades de metfida es tr t fcrm eypep
m ite que se realicen operaciones aritm éticas (adición, sustracción, división y m ultipfecacnt
■ Escala de razón. Funciona com o la escala de intervalo, pero el cero absoluto se ra a a ca­
rencia total de la característica que mide.
■ Escala no m in al. La m edición consiste en determ inar si los casos que se presentan pertene­
cen o no a determ inados objetos de una distribución.
■ Escalas o rd in a le s . Son ordenaciones en las que se presentan relaciones de m ayor que o
después de (>) y m enor que o antes de (<).
■ Espacio m u estral. C onjunto de todos los sucesos m utuam ente excluyentes y colectivam en­
te exhaustivos de un experim ento aleatorio.
■ E stadística. Disciplina m atem ática considerada com o un conjunto de técnicas para el análi­
sis de datos.
■ E stad ística D e scrip tiva. Se ocupa del análisis de los datos sin utilizar m uestras para hacer
inferencias.
■ E stad ística In fe re n cial. Parte de la Estadística que por m edio del m uestreo infiere con clu ­
siones acerca de la totalidad de una población.
■ E vento. Suceso o hecho de interés para algún estudio estadístico.
■ E ven to s in d e p e n d ie n te s . Suceden cuando la ocurrencia de uno de ellos no tie n e efecto
sobre la probabilidad de ocurrencia del otro.
■ Eventos m u tu a m e n te exc lu y e n te s . Eventos que no pueden ocu rrir al m ism o tiem po.
■ E x p e rim e n to ale a to rio . Situaciones o ensayos que im plican resultados inciertos.
■ F recu encia re la tiv a Es la proporción de casos en cada categoría.

©Santillana, S. A. 95
■ in te rc e p c ió n . Es la m ism a ordenada al origen, es decir, el p u n to en el que la recta cruza
(intercepta) al eje vertical.
■ In te rp re ta c ió n te ó ric a o clásica d e la p ro b a b ilid ad Parte de que cuando no hay razones
para preferir uno de los posibles resultados o sucesos, se considera que todos tienen la m is­
ma probabilidad de ocurrir.
■ M e d ia a ritm é tic a o p ro m ed io . M edida que se calcula sum ando el total de los datos o va­
lores de la variable para luego dividir esa sum a entre el núm ero de datos sumados.
■ M e d ia a rm ó n ic a . Es el recíproco de la m edia a ritm é tica de los recíprocos de los valores
individuales.
■ M e d ia g e o m é tric a . Raíz n-ésim a del producto de los n datos o valores de la variable.
■ M e d ia p o n d erad a. Se utiliza principalm ente para darle un peso relativo diferente a cada uno
de los valores de la variable.
■ M e d ia n a . Valor que ocupa el lugar central en una serle ordenada.
■ M ed id as. N úm eros sim ples que representan características de conjuntos de datos.
■ M o d a, valor que m ás se repite, es decir, el que tiene m ayor frecuencia.
■ M u e s tra . S ubconjunto de los elem entos de una población.
■ Población. Conjunto de todos los elem entos o unidades de interés para un estudio determinado.
■ Proporción. Se calcula dividiendo el núm ero de casos que tienen la característica de interés
entre el total de elem entos de la m uestra (o de la población).
■ P u n to m ed io de clase o v a lo r c e n tra l d e cada clase Valor que se considera representa­
tivo de todos los de su clase.
■ R. Es un entorno de softw are libre para com putación y gráficos estadísticos.
■ Rango. Diferencia entre el m ayor y el m enor de los valores; m ide qué tan separados están los
datos.
■ S eries d e d ato s agrup ados. Tablas de datos en las que se resum en estos de acuerdo con
la frecuencia con la que se repiten o según determ inados intervalos de valores.
■ T eo re m a d e C h ebysh ev. D eterm ina la proporción m ínim a de valores que se encuentran en
un núm ero específico de desviaciones estándar en relación con la media.
■ Teoría d e la p ro b a b ilid ad . Se ocupa de analizar y determ inar la opo rtunidad de ocurrencia
de diversos sucesos aleatorios.
■ V ariable. Característica que se m ide al hacer determ inadas observaciones y que puede asu­
m ir diferentes valores.
■ V a ria b le a le a to ria . Es aquella cuyo valor num érico se determ ina m ediante el resultado de
una situación incierta.
■ v a ria b le p re d ic to ra . Es una variable in dependiente que se utiliza para hacer pronósticos
sobre la variable dependiente.
■ V a ria n za . M ide la dispersión de los datos alred edor de la m edia aritm é tica. / P rom edio de
cuadrados.

También podría gustarte