Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística Básica
Guía didáctica
120 horas
CARRERA CICLO
Economia 2
Administración Pública
Administración de Empresas
Psicologia
ÁREA
ADMINISTRATIVA
Departamento de Economía
Estadística Básica
Guía didáctica
Autor:
Carlos Anibal Correa Granda, PhD.
Asesoría virtual
www.utpl.edu.ec
ESTADÍSTICA BÁSICA
Guía didáctica
Carlos Anibal Correa Granda, PhD.
4.0, CC BY-NY-SA
Primera edición
ISBN digital - 978-9942-25-469-6
La versión digital ha sido acreditada bajo la licencia Creative Commons 4.0, CC BY-NY-SA:
Reconocimiento-No comercial-Compartir igual; la cual permite: copiar, distribuir y comunicar
públicamente la obra, mientras se reconozca la autoría original, no se utilice con fines comerciales
y se permiten obras derivadas, siempre que mantenga la misma licencia al ser divulgada. https://
creativecommons.org/licenses/by-nc-sa/4.0/deed.es
19 de marzo, 2019
2. Índice
2. Índice 4
3. Introducción 8
4. Bibliografía 11
4.1. Básica 11
4.2. Complementaria 12
PRIMER BIMESTRE
1.1. Introducción 17
1.4. Variables 23
Autoevaluación 1 29
2.1. Introducción 31
Autoevaluación 2 57
UNIDAD 3. MEDIDAS DE TENDENCIA CENTRAL 60
3.1. Introducción 60
3.3. Mediana 64
3.4. Moda 69
Autoevaluación 3 80
4.1. Introducción 83
4.2. Definición 84
4.5. Varianza 89
Autoevaluación 4 105
SEGUNDO BIMESTRE
Autoevaluación 5 120
Autoevaluación 6 135
UNIDAD 7. DISTRIBUCIONES DE PROBABILIDAD DISCRETA 138
Autoevaluación 7 154
Autoevaluación 8 173
7. Solucionario 176
3. Introducción
De igual manera, cada uno de nosotros en nuestra vida diaria estamos empleando
o refiriendo información sea de tipo cualitativa o cuantitativa, lo que nos muestra
la importancia de realizar un tratamiento adecuado y por ello su estudio y
aplicabilidad siguen manteniendo vigencia en los diferentes ámbitos del quehacer
humano. Por citar ejemplos, la estadística se utiliza en los negocios, en el turismo,
en la medicina, en el deporte, en la cocina, etc.
Así pues, vamos a seguir la planificación prevista para cada uno de los bimestres
y me permito indicarle que es importante el desarrollo de las autoevaluaciones
que constan al finalizar cada unidad temática, de forma que conozca sus logros
y también determine si es necesario reforzar algún tema que no haya sido lo
suficientemente abordado.
Es importante recordarle también, que siempre estoy presto para recibir cualquier
inquietud o comentario, de manera que juntos podamos construir conocimiento y
aprender algo nuevo.
¡Saludos y éxitos!!!!!
4. Bibliografía
4.1. Básica
Correa G., C. (2018). Guía didáctica Estadística Básica. Loja, Ecuador: Editorial
de la Universidad Técnica Particular de Loja.
4.2. Complementaria
Pagano, Robert (2008). Estadística para las ciencias del comportamiento. México
D.F.: Cengage Learning Editores S.A.
El texto presenta una amplia gama de ejercicios con las mismas temáticas
del texto básico desde otro punto de vista, en este se estudia la distribución
de frecuencias, medidas de tendencia central, medidas de variación,
probabilidades e inferencia acerca de las desviaciones estándares y de las
proporciones.
▪▪ Siga paso a paso las sugerencias que se le dan tanto en esta guía didáctica
como en el texto básico de manera que no pase por alto ninguno de los
aspectos desarrollados en cada tema, a veces, pueden resultarnos muy
elementales y a lo mejor los pasamos por alto, sin embargo, son de gran
importancia en el desarrollo de los procedimientos para resolver cada uno de
los casos presentados.
▪▪ Tome en cuenta que todos los documentos que se encuentran previstos para
el desarrollo de la asignatura tienen un propósito y por ello no los descuide.
Todos los contenidos de estos materiales y recursos le ayudarán a tener
éxito en la misma.
PRIMER BIMESTRE
1.1. Introducción
En esta primera unidad, estableceremos las bases suficientes que nos permiten
comprender la importancia del estudio de la estadística y los elementos que se
consideran importantes para el desarrollo de los diferentes indicadores que usted
utilizará al momento de realizar una investigación sobre las diferentes temáticas
que se plantean.
1.2.1. Definición
1.2.2. Importancia
Cuando se define a la estadística, hemos dicho que es la ciencia que nos provee
de las herramientas necesarias para ayudarnos a comprender las características
de un tema u objeto investigado y que a partir de ello se pueden tomar decisiones
sobre la situación actual pero también sobre la situación futura que se podría
esperar.
Esto nos lleva a identificar dos espacios, un primero que nos dice que se
realiza una descripción de lo observado y otro momento en donde a través de
diferentes técnicas y con base a una información previa llegamos a proyectar o
pronosticar una situación futura. Estas son las razones por las que se realiza una
diferenciación de dos tipos de estadística:
▪▪ Descriptiva
▪▪ Inferencial o inductiva
Esta imposibilidad de trabajar con todos los elementos que forman parte de
la población nos lleva a trabajar con una parte de la misma que se denomina
muestra. Una muestra es un conjunto reducido de elementos que forman
parte de la población pero que tienen una característica principal es que son
representativos.
Cuando es necesario revisar todos los detalles del objeto en estudio se aplica
un Censo que implica la revisión de las características de todos los elementos
que comprende la población a estudiarse, por lo general esto se realiza para
levantar censos poblacionales, pero por todas sus implicaciones esto se realiza
en períodos amplios de tiempo como en el caso de Ecuador que se realiza cada
10 años.
Ahora bien, una vez que hemos comprendido el alcance y las características de
los tipos de estadística, sabemos que al realizar una investigación vamos a tener
algunas variables que analizar, lo que también nos lleva a considerar ¿qué es una
variable?
1.4. Variables
1.4.1. Clasificación
Para nuestro caso, vamos a considerar que las variables se pueden diferenciar
según su tipo en:
Cada una de las variables a su vez se pueden identificar con su nivel de medición,
así usted habrá leído en el texto básico que cada uno de los niveles de medición
en los que se presentan las variables con sus correspondientes características,
son los siguientes:
▪▪ Nominal
▪▪ Ordinal
▪▪ De intervalo
▪▪ De razón
Como queda indicado, una de las razones por las cuales se estudia la estadística,
es precisamente porque en toda actividad se genera información sea de tipo
cualitativo o de tipo cuantitativo.
a. Fuentes primarias
• Encuestas
• Entrevistas
• Datos recogidos en laboratorio
• Observación directa
• Censo
b. Fuentes secundarias
• Informes escritos
• Revistas
• Periódicos
• Boletines oficiales
• Publicaciones de diferente índole
Bien, una vez que hemos desarrollado los temas referentes a esta primera
unidad, es conveniente que usted vaya trabajando en actividades que le permitan
identificar claramente la aplicabilidad a su formación profesional, por ello lo invito
a desarrollar las siguientes actividades:
Actividades recomendadas
4. Reflexione sobre la fuente de origen de los datos, ¿es una fuente primaria o
secundaria?
Autoevaluación 1
5. ( ) Las variables cuantitativas, son aquellas en las que cada objeto
estudiado identifica una característica distinta.
2.1. Introducción
Una vez que hemos abordado los temas iniciales sobre lo que significa el estudio
de la estadística y ha desarrollado la capacidad de identificar adecuadamente la
o las variables con las que estamos trabajando en un proceso de investigación,
podemos iniciar a revisar el tratamiento de la información para que a través de las
formas de presentarla podamos a su vez describir en forma adecuada el objeto
investigado.
En esta unidad, precisamente abordaremos estos temas, pues hay que identificar
la forma en la que se sugiere presentar la información, pero decidir también de
acuerdo con el volumen o complejidad de la información recogida el uso de una u
otra técnica.
Iniciamos con los datos simples y luego abordamos los datos complejos que
requieren utilizar procedimientos para presentar los datos de manera que se
pueda abordar a conclusiones sobre el tema investigado.
Le invito a que vayamos trabajando cada una de las temáticas y aplicar las
mismas a problemas reales de su entorno.
18 19 21 26 18 25 18 21 18 20
y lo que podemos hacer es ordenarlos de acuerdo con algún criterio y con ello ya
podemos analizar el tema de interés:
18 18 18 18 19 20 21 21 25 26
Como vemos en este caso es algo simple que no requiere mayor tratamiento
para su análisis, así como para los datos cuantitativos, lo mismo podemos
trabajar cuando se trata de una variable cualitativa porque como quedó indicado
anteriormente, lo que nos determina la variable cualitativa es una característica.
Cuando el número de datos que forman parte del objeto investigado es grande y
no es posible distinguir sus características principales a través de la observación
simple, es necesario buscar la forma de presentar los datos mediante un arreglo
específico. Para ello resulta útil el uso de una tabla de datos en la que se
pueden identificar las categorías de la variable y junto a cada una de ellas su
correspondiente frecuencia que constituye el número de veces que se encuentra
la categoría de la variable en el conjunto de datos.
15 14 16 20 18 16 15 14 18 20
17 15 18 20 14 18 19 14 17 12
16 19 20 15 17 14 19 20 16 15
A simple vista, sería muy difícil considerar las características del grupo en cuanto
se refiere a las calificaciones, pero si presentamos la información a través de una
tabla de datos ordenada, podremos alcanzar un mejor análisis.
Cabe indicar que en toda tabla de datos siempre es importante que se identifique:
▪▪ Diagramas de barras
▪▪ Gráficas de pastel
Ahora bien, ¿qué sucede cuando la información no se puede revisar y analizar sin
mediar un tratamiento mayor?
Para trabajar esta parte, realice una lectura comprensiva del tema que se
encuentra desarrollado en el texto básico y trate de enunciar una definición propia
sobre lo que significa una tabla de distribución de frecuencias.
No existen reglas fijas para distinguir cuándo se debe construir una tabla de
distribución de frecuencias, sin embargo, es preciso tomar en cuenta algunos
detalles que nos llevan a su elaboración:
c. Límites de clase, son los valores extremos de cada uno de los intervalos
y por ello diferenciamos los límites inferior y superior. Cuando la variable
es continua el límite superior es igual al límite inferior de la siguiente clase
o intervalo, en cambio, cuando se trata de una variable discreta, el límite
superior de una clase es diferente al límite inferior de la siguiente.
2k ≥ n
donde:
2k ≥ 80
Ahora bien, podría suceder que la investigación por alguna razón considere
como un dato previo el tamaño o anchura de los intervalos en los que se
deben presentar los datos. En esta situación podemos determinar el número
de clases o intervalos con la siguiente fórmula:
Rango o recorrido
Número de intervalos =
ancho del intervalo
Rango o recorrido
tamaño de clase =
número de clases o intervalos
Ahora bien, una vez que se han identificado a los elementos y que se ha
comprendido a qué se refiere cada uno de ellos, vamos a su aplicación a través
de la construcción de una tabla de distribución de frecuencias.
15 35 48 89 67 35 56 67 95 80
45 68 75 99 25 48 52 49 87 18
98 52 48 69 84 69 24 35 75 63
47 19 28 60 42 36 39 69 99 40
59 100 39 56 68 65 29 49 58 60
15 29 40 48 28 59 50 26 40 94
73 59 60 49 27 83 62 37 30 52
89 73 70 59 40 93 63 60 62 58
15 19 28 48 25 35 24 26 30 18
15 29 39 49 27 36 29 35 40 40
45 35 40 56 28 48 39 37 58 52
47 52 48 59 40 59 50 49 62 58
59 59 48 60 42 65 52 49 75 60
73 68 60 69 67 69 56 60 87 63
89 73 70 89 68 83 62 67 95 80
98 100 75 99 84 93 63 69 99 94
Xmáx = 100
X min = 15
3. Establecemos el rango o recorrido de la variable; en este caso,
dado que se trata de una variable discreta porque estamos hablando de
“calificaciones”, tendremos que:
R = Xmáx − X min+ 1
R = 100 − 15 + 1
R = 86
Esto significa que la variable calificaciones en este conjunto de personas
recorre 86 puestos.
2k ≥ n
Rango o recorrido
tamaño de clase =
número de clases o intervalos
86
tamaño de clase =
7
tamaño de clase = 12,29
tamaño de clase ≅ 13
X min = 15 − 3 = 12
Xmáx= 100 + 2= 102
Estudiantes
Calificaciones Tabla de conteo (frecuencia
absoluta simple) ni
12 24 ||||| 5
25 37 ||||||||||||| 13
38 50 ||||||||||||||||| 17
51 63 ||||||||||||||||||| 19
64 76 ||||||||||||| 13
77 89 |||||| 6
90 102 ||||||| 7
Total 80
Estudiantes
Marcas de clase
Calificaciones (frecuencia absoluta
Xi
simple) ni
12 24 5 18
25 37 13 31
38 50 17 44
51 63 19 57
64 76 13 70
77 89 6 83
90 102 7 96
Total 80
Estudiantes
Frecuencia
(frecuencia Frecuencia relativa
Calificaciones relativa simple
absoluta simple) simple hi
hi %
ni
12 24 5 0,0625 6,25
25 37 13 0,1625 16,25
38 50 17 0,2125 21,25
51 63 19 0,2375 23,75
64 76 13 0,1625 16,25
77 89 6 0,075 7,5
90 102 7 0,0875 8,75
Total 80 1 100
Frecuencia
Estudiantes
absoluta
Calificaciones (frecuencia
acumulada
absoluta simple) ni
“menor que” Ni
12 24 5 5
25 37 13 18
38 50 17 35
51 63 19 54
64 76 13 67
77 89 6 73
90 102 7 80
Total 80
Frecuencia
Estudiantes
absoluta
Calificaciones (frecuencia absoluta
acumulada
simple) ni
“Mayor que” Ni
12 24 5 80
25 37 13 75
38 50 17 62
51 63 19 45
64 76 13 26
77 89 6 13
90 102 7 7
Total 80
Para esta frecuencia, partimos del total de datos y vamos restando aquellos
que quedan tras de los límites inferiores de cada uno de los intervalos.
Así, por ejemplo, si nos preguntamos ¿cuántos estudiantes han obtenido
calificaciones iguales o superiores a 51 puntos?, podemos responder que
son 45 estudiantes o si queremos conocer el número de estudiantes que han
obtenido calificaciones iguales o superiores a 77 puntos, podemos afirmar
que son 13 los estudiantes.
Frecuencia Frecuencia
Estudiantes
absoluta relativa
Calificaciones (frecuencia
acumulada “Mayor acumulada
absoluta simple) ni
que” Ni “Mayor que” Hi
12 24 5 80 100
25 37 13 75 93,75
38 50 17 62 77,5
51 63 19 45 56,25
64 76 13 26 32,5
77 89 6 13 16,25
90 102 7 7 8,75
Total 80
▪▪ Histograma
▪▪ Polígono de frecuencias
▪▪ Ojivas
Cada uno de los cuales tiene sus características específicas y su aplicación según
la frecuencia que se utilice. Veamos cada uno
Otro aspecto para considerar es que, si los intervalos de clase son del
mismo tamaño, entonces la base de las barras debe tener la misma longitud
y la altura de las barras que se ubica en el eje de las ordenadas considera
las frecuencias simples sean absolutas o relativas.
Estudiantes
(frecuencia Calificaciones
Calificaciones
absoluta simple) (límites reales)
ni
12 24 5 11,5 24,5
25 37 13 24,5 37,5
38 50 17 37,5 50,5
51 63 19 50,5 63,5
64 76 13 63,5 76,5
77 89 6 76,5 89,5
90 102 7 89,5 102,5
Total 80
c. Ojivas, este tipo de representación gráfica es útil para mostrar los valores
acumulados, es por ello que se utilizan las frecuencias acumuladas y pueden
representarse tanto para valores absolutos como para valores relativos. A
través de este gráfico se pueden identificar valores que se encuentran en
una determinada posición que sea de interés para el investigador.
Si bien es cierto, hasta aquí hemos analizado todos los aspectos relacionados
con la construcción, presentación y representación gráfica de los elementos que
intervienen en una tabla de distribución de frecuencias, considero importante que
se tomen en cuenta los siguientes aspectos que también resultan importantes y
de utilidad en el análisis de información.
Bien, espero que todo lo que hemos revisado hasta el momento haya sido de
su agrado y le haya resultado interesante, especialmente porque a través de
su comprensión, aplicación y análisis, tiene las herramientas que le permitirán
abordar cualquier investigación, especialmente cuando se trata de información
cuantitativa.
Como habrá comprendido también estos son temas de carácter general que
conllevan su aplicación en cualquier campo de actividad humana, es decir que en
las asignaturas que forman parte de la malla curricular tendrán plena vigencia y
podrá observar su utilidad en el campo profesional.
Actividades recomendadas
Siempre será importante que todos los temas que vamos desarrollando
encuentren su utilidad y aplicabilidad en temas o problemas reales, por ello le
invito a que practique la forma de recoger información, organizarla y presentarla.
Para ello le propongo las siguientes actividades:
¿Le parecieron interesantes estas actividades?, Que bueno, me alegra que así
sea.
Con este ánimo, creo que es el momento de constatar cuánto hemos avanzado
en el estudio de esta unidad, para lo cual le invito a desarrollar la siguiente
autoevaluación.
Autoevaluación 2
a. Histograma.
b. Polígono de frecuencias.
c. Ojiva.
a. Cero.
b. Uno.
c. Total, de datos.
a. absoluta simple.
b. relativa simple.
c. relativa acumulada.
14. Los valores que se encuentran en los extremos de cada uno de los
intervalos de clase se denominan:
a. Marcas de clase.
b. Límites.
c. Anchura de clase.
15. La condición que nos permite establecer el número de intervalos de clase es:
a. 2k = n
b. 2k ≥ n
c. 2k ≤ n
3.1. Introducción
Sin embargo, muchas veces se requieren cifras o indicadores que nos muestren
la realidad del objeto investigado, es por ello que en esta unidad, nos insertamos
en el tratamiento de las medidas de tendencia central, porque lo que queremos
es encontrar algún o algunos valores que sean representativos de la realidad
analizada, así por ejemplo, muchas veces hablamos de las ventas y si queremos
conocer lo sucedido en un período determinado con las ventas anuales,
tendremos muchas informaciones que posiblemente no nos permiten tener un
panorama claro de lo que queremos conocer, pero si frente a ello tenemos un
valor que nos indique por ejemplo el promedio de ventas, será distinto porque ya
con ese valor podremos tener una idea más clara de lo que sucede con la variable
o el objeto investigado.
Le invito a que revise cada una de las medidas y sobre todo reflexione en su
aplicabilidad y utilidad para el análisis estadístico. Debo decir también que es
importante que vayamos asegurando el conocimiento, comprensión de cada una
de ellas para que lleguemos a su aplicación y análisis.
De la lectura que ha realizado en el texto básico, usted observa que allí se refiere
a las medidas de ubicación, pues le diré que nos referimos a lo mismo, algunos
autores llaman medidas de ubicación porque precisamente se refiere al lugar o
espacio que ocupa cada una de ellas. Hablamos de medidas de tendencia central
porque estamos considerando aquella medida representativa y que por lo general
es aquella que se identifica con las características puntuales y relevantes de los
datos.
∑X i ∑X i
X= i =1 µ= i =1
n N
X i = valor observado X i = valor observado
n = número de datos N = número de datos
Serie ordenada n n
∑X n i i ∑X n i i
X= i =1
µ= i =1
n N
X i = valor observado X i = valor observado
ni = frecuencia de cada valor ni = frecuencia de cada valor
n = número de datos N = número de datos
Tabla de distribución n n
de frecuencias ∑X n i i ∑X n i i
X= i =1 µ= i =1
n N
X i = marca de clase X i = marca de clase
ni = frecuencia de cada clase ni = frecuencia de cada clase
n = número de datos N = número de datos
Para ampliar la información de cada una de estas variantes, revise los ejemplos
que se encuentran desarrollados en el texto básico.
Los datos con los que venimos trabajando fueron resumidos en la siguiente tabla
de distribución de frecuencias.
Estudiantes Marca de
Calificaciones (frecuencia clase Xini
absoluta simple) ni Xi
12 24 5 18 90
25 37 13 31 403
38 50 17 44 748
51 63 19 57 1083
64 76 13 70 910
77 89 6 83 498
90 102 7 96 672
Total 80 4404
Para calcular la media aritmética utilizamos la fórmula para datos muestrales que
se presentan mediante una tabla de distribución de frecuencias:
∑X n i i
X= i =1
n
4404
X=
80
X = 55 ,05
3.3. Mediana
Seguramente con la lectura y la reflexión que hizo sobre este tema, usted ha
podido establecer algunas características puntuales como por ejemplo que:
▪▪ Con este resultado identificamos el dato que ocupa la posición central al que
le corresponde el valor mediano.
Por ejemplo:
14 – 15 – 15 – 18 – 20 – 22 – 23 – 23 – 26 – 80
n
PosMe =
2
10
PosMe =
2
PosMe = 5
En este caso si contamos las posiciones desde el menor el dato número 5 estaría
ocupado por el 20 y si contamos desde el mayor hacia abajo el dato 5 estará
ocupado por el valor 22. Tomamos los dos valores y establecemos el promedio,
en este caso sería:
20 + 22
Me =
2
42
Me =
2
Me = 21
Esto significa que el valor mediano del conjunto de datos es 21, o dicho de otra
forma podemos afirmar que el 21 supera al 50% de observaciones y es superado
por el 50% restante.
Frecuencia
Estudiantes
absoluta Calificaciones
(frecuencia
Calificaciones acumulada (límites
absoluta
“Menor que” reales)
simple) ni
Ni
12 24 5 5 11,5 24,5
25 37 13 18 24,5 37,5
38 50 17 35 37,5 50,5
51 63 19 54 50,5 63,5
64 76 13 67 63,5 76,5
77 89 6 73 76,5 89,5
90 102 7 80 89,5 102,5
Total 80
80
PosMe =
2
PosMe = 40
Me = 53 , 92
Le invito a revisar los ejercicios resueltos en el texto básico y para que amplíe la
comprensión y aplicación de esta medida, realice los ejercicios planteados.
Continuemos trabajando sobre las medidas que nos permiten describir las
características de un conjunto de datos, en este caso veremos lo que significa la
moda.
3.4. Moda
Como afirmamos es otra medida que tendencia central, que como su nombre
lo indica nos ayuda a reconocer aquel valor que se encuentra repetido el mayor
número de veces dentro de un conjunto de datos.
Por lo general hablamos de modas cuando nos referimos a las prendas de vestir,
a la tecnología, a los equipos, a la música, al baile, etc. y decimos que es lo que
está de moda. Es decir, nos estamos refiriendo a aquello que se encuentra en
forma común dentro de un espacio o de un ambiente.
Para datos no agrupados, lo hacemos por simple inspección de los valores, si los
ordenamos vamos a observar aquellos que se encuentran el mayor número de
veces y ese es el valor modal.
Cabe indicar que en un conjunto de datos podemos encontrar uno o más valores
modales, así como también ninguno.
Ejemplo:
15 – 18 – 16 – 23 – 26 – 23 – 18 – 24 – 22 – 15 – 18 – 16 – 18 – 22 – 15–18
15 – 15 – 15 – 16 – 16 – 18 – 18 – 18 – 18 – 18 – 22 – 22 – 23 – 23 – 24 – 26
Por simple inspección de los datos, podemos confirmar que el valor modal de este
conjunto de datos es 18, porque es el que se repite el mayor número de veces.
Ahora para el caso de los datos que se presentan mediante una tabla de
distribución de frecuencias el cálculo lo realizamos considerando los siguientes
pasos:
Donde:
Li = Límite real inferior del intervalo modal
∆1= Diferencia entre la frecuencia del intervalo modal y premodal
∆ 2= Diferencia entre la frecuencia del intervalo modal y postmodal
i= tamaño o anchura de la clase o intervalo modal
Estudiantes
(frecuencia Calificaciones
Calificaciones
absoluta simple) (límites reales)
ni
12 24 5 11,5 24,5
25 37 13 24,5 37,5
38 50 17 37,5 50,5
51 63 19 50,5 63,5
64 76 13 63,5 76,5
77 89 6 76,5 89,5
90 102 7 89,5 102,5
Total 80
Mo = 53 ,75
Como hemos observado las tres medidas pueden ser aplicadas a un conjunto
de datos, su aplicación depende de las necesidades del investigador, pero
también de la estructura de los datos, ya hemos visto que en el caso de que en
un conjunto de datos existan valores extremos o en una tabla de distribución
de frecuencias exista un intervalo abierto, no será posible calcular la media
aritmética.
En el caso de que sea factible el cálculo de las tres medidas, los resultados
obtenidos nos ayudan a identificar la forma en la que se encuentran distribuidos
los datos de manera que esta sería otra característica a tomarse en cuenta.
X Me
= = Mo
Mo < Me < X
X < Me < Mo
Hasta aquí hemos analizado las tres principales medidas de tendencia central,
le invito a desarrollar ejercicios adicionales considerando todos los aspectos que
hemos trabajado hasta el momento.
Ahora, nos vamos a dirigir a revisar otras medidas que también nos permiten
caracterizar a un conjunto de datos o a datos que tienen características diferentes,
me refiero a la aplicación de la media ponderada y de la media geométrica.
Revise en el texto lo referente a estas medidas.
Podemos decir que esta medida es una variante de la media aritmética, cuando
los datos se presentan de manera distinta a las mencionadas anteriormente.
Lea en el texto básico esta parte y defina lo que usted considera que es una
ponderación.
Xw =
∑X w
i i
∑w i
Donde:
X w = media ponderada
X i = valor que toma la variable
wi = peso o ponderación asignado a cada valor de la variable
Tabla 15. Datos de los empleados por niveles y salario por hora
SALARIO
EMPLEADOS
NIVEL POR HORA XiWi
Wi
Xi
A 10 50 500
B 20 35 700
C 30 20 600
D 90 10 900
TOTAL 150 115 2700
Xw =
∑X w
i i
∑w i
2700
Xw =
150
X w = 18
Esto significa que el salario promedio por hora que se paga en esta empresa es
de 18 dólares.
Debemos tener presente que la media geométrica siempre es menor o igual pero
nunca mayor que la media aritmética.
Actividades recomendadas
Hasta aquí hemos trabajado con las medidas de tendencia central, es importante
que hayan quedado comprendidos todos los temas y que usted se encuentre
en la capacidad de definir cada una de las medidas, de recordar y aplicar las
características correspondientes y sobre todo poder interpretar y analizar los
resultados.
Para ello le recomiendo que realice los ejercicios que se encuentran en el texto
básico al finalizar cada uno de los temas, así como también aquellos que se
encuentran en la primera parte del resumen del capítulo 3 del texto, desde el
ejercicio 63 hasta el 74.
Autoevaluación 3
1. ( ) Las medidas de tendencia central son aquellas que permiten tener
un valor representativo del conjunto de datos analizados.
a. Cero.
b. Uno.
c. Total de datos.
12. Para conocer el valor que se encuentra ocupando la posición central dentro
del conjunto de datos analizado, debemos calcular la:
a. Media aritmética.
b. Mediana.
c. Moda.
a. simétrica.
b. asimétrica negativa.
c. asimétrica positiva.
a. Unimodal.
b. Bimodal.
c. Multimodal.
15. La media geométrica es útil para determinar los valores promedios cuando la
variable cambia en forma:
a. geométrica.
b. aritmética.
c. adimensional.
4.1. Introducción
Una vez que ya hemos trabajado sobre las medidas que permiten describir a un
conjunto de datos y haber determinado características puntuales como son las
medidas de tendencia central, nos corresponde continuar en la identificación de
algunos otros elementos que aporten a la comprensión de las características de la
información recolectada sobre el tema que se está investigando.
Por esta razón, iniciamos esta segunda parte de nuestro estudio de la estadística
básica con el abordaje de los conceptos y las medidas de dispersión.
Aquí podremos trabajar en varias medidas de dispersión, cada una de las cuales
tiene una aplicación propia de acuerdo con las necesidades del investigador y
también de acuerdo con las características de la información.
Las medidas de variación son de gran utilidad porque a través de ellas se puede
llegar a tomar decisiones adecuadas, pues, si bien las medidas de tendencia
central nos permiten tener un valor referencial, a través de las medidas de
dispersión podemos llegar a conocer la variabilidad del conjunto de datos.
4.2. Definición
Al hablar de medidas, significa que podemos encontrar varias, tal cual lo hicimos
al referirnos a las medidas de tendencia central. Su aplicación dependerá
en primer lugar de las necesidades de la investigación, pero también de las
características de los datos a los cuales estamos analizando.
R = X max − X min
R 189 − 153
=
R 36 + 1
=
2. Considera a todos los valores del conjunto a diferencia del rango o recorrido
que solamente toma los dos valores extremos.
3. Toma en cuenta los valores absolutos de las diferencias entre cada uno de
los valores registrados y la media aritmética.
DM =
∑X i −X
n
Luego, identificamos las diferencias en términos absolutos entre cada valor con
respecto a la media de la siguiente manera:
|8–9| = 1 |9–9| = 0
|6–9| = 3 |8–9| = 1
|8–9| = 1 |11–9| = 2
|12–9| = 3 |9–9| = 0
|10–9| = 1
1+3+1+3+1+0+1+2+0
DM =
9
12
DM =
9
DM = 1 ,33
Este resultado nos dice que, en promedio, la distancia entre cada uno de los
valores con respecto a la media aritmética es de 1,33.
DM =
∑X i − X ni
n
Le invito a aplicar esta medida al ejemplo que hemos venido trabajando en las
medidas de tendencia central.
Estudiantes
Marca
(frecuencia
Calificaciones de clase Xi - Xi - ni
absoluta simple) Xini
Xi
ni
12 24 5 18 90 37,05 185,25
25 37 13 31 403 24,05 312,65
38 50 17 44 748 11,05 187,85
51 63 19 57 1083 1,95 37,05
64 76 13 70 910 14,95 194,35
77 89 6 83 498 27,95 167,7
90 102 7 96 672 40,95 286,65
Total 80 4404 1371,5
1371 ,5
DM =
80
DM = 17 ,14
4.5. Varianza
Quizá una de las desventajas de la medida anterior consiste en que, al tomar los
valores absolutos de las diferencias, no identificamos la posición de cada valor,
si se encuentra sobre o por debajo de la media aritmética, por ello se establecen
otras medidas como la varianza que posteriormente nos permite llegar a la
desviación típica o estándar.
Ahora sí, podemos volver al texto básico allí usted puede encontrar la explicación
de lo que significa la varianza y las características que identifican a esta medida
de dispersión. Le invito a realizar una lectura reflexiva considerando sobre todo
las diferencias con respecto a lo conocido de la desviación media absoluta.
En el texto puede identificar la fórmula de cálculo que se aplica para el efecto por
lo que no me voy a detener en el desarrollo y explicación de la misma.
Al igual que con la varianza, le invito a revisar en el texto básico la explicación que
se realiza sobre lo que significa esta medida de dispersión.
Por mi parte quisiera agregar que cuando nos referimos a la desviación típica
algunos autores también la conocen como desviación estándar y precisamente
se denomina típica porque se constituye en la diferencia o separación que se
presenta con mayor frecuencia dentro del grupo de datos, respecto a la media
aritmética.
Hay que considerar que existe una diferencia cuando se trata de datos
poblacionales y datos muestrales. Como denominador en un caso se utiliza
el total N y en el otro caso se utiliza el denominador (n-1); el porqué de esta
diferenciación lo podrá encontrar con la lectura en el texto básico.
Ahora, le invito a desarrollar los ejemplos que nos permiten comprender mejor la
aplicación de esta medida.
(8 – 9)2 = 1 (9 – 9)2 = 0
(6 – 9)2 = 9 (8 – 9)2 = 1
(10 – 9)2 = 1
26
σ2 =
9
σ 2 = 2 , 88
σ = 2 , 88
σ = 1 ,70
Estudiantes
(frecuencia Marca de
Calificaciones absoluta clase (Xi - )2 (Xi - )2ni
Xini
simple) Xi
ni
12 24 5 18 90 1372,7025 6863,5125
25 37 13 31 403 578,4025 7519,2325
38 50 17 44 748 122,1025 2075,7425
51 63 19 57 1083 3,8025 72,2475
64 76 13 70 910 223,5025 2905,5325
77 89 6 83 498 781,2025 4687,215
90 102 7 96 672 1676,9025 11738,3175
Total 80 4404 35861,8
Recordemos que en este ejercicio la media aritmética es igual a 55,05 de allí que
al realizar la diferencia de la marca de clase con respecto a la media aritmética y
elevarla al cuadrado nos da un resultado para el primer intervalo de 1372,7025 y
luego al multiplicarlo por la frecuencia absoluta simple correspondiente nos da un
valor de 6863,5125. Así trabajamos con cada uno de los intervalos para llegar a
obtener luego la sumatoria de todos los valores.
σ 2 = 448 ,2725
σ = 21 ,17
Con este resultado ya podemos indicar que típicamente los valores se encuentran
dispersos con respecto a la media aritmética en 21,17 puntos lo que nos muestra
el grado de dispersión de todo el conjunto de 80 estudiantes.
S
CV = * 100
X
σ
CV = * 100
µ
Para comprender mejor su aplicación, desarrollemos el siguiente
ejemplo:
Como podemos observar, tenemos dos grupos de datos, los primeros expresados
en dólares y los segundos expresados en años, necesitamos comparar estos dos
grupos, por lo que determinamos el coeficiente de variación.
40 2
CV = * 100 CV = * 100
200 20
CV = 20% CV = 10%
En este ejemplo observamos que existe mayor dispersión relativa con respecto
a la media aritmética en los bonos pagados en comparación con el conjunto de
años de servicio, esto significa que se puede determinar mayor variabilidad en
los valores observados sobre el pago de bonos que en el conjunto de valores
investigados sobre los años de servicio.
Allí encuentra los tipos de sesgo y la forma de calcularlo. Bajo esta consideración,
vamos a encontrar tres tipos de conjuntos de valores, los mismos que pueden ser:
▪▪ De Pearson
▪▪ Calculado con software
En la lectura del texto que usted realizó ha establecido que la desviación típica
o estándar es la medida de dispersión de mayor uso para conocer la variabilidad
de los datos, sin embargo, muchas veces es necesario establecer una posición o
ubicación específica para conocer el valor que toma la variable en determinada
posición, por ello precisamos considerar otras medidas que nos permiten
identificar el valor de la variable en una posición definida.
4.9.1. Cuartiles
Los cuartiles son aquellas medidas que dividen al conjunto de datos en cuatro
partes iguales y por ello calculamos tres cuartiles.
Si se trata del cuartil uno (Q1) el valor nos indica que el 25% de datos se
encuentran por debajo de ese valor y que el 75% de los datos supera a dicho
valor.
El cuartil dos (Q2), es igual al valor de la mediana ya que este valor supera al
50% de los datos y es superado por el 50% restante. Como vemos es la misma
interpretación del valor mediano.
El cuartil 3 (Q3), será entonces aquel valor que supera al 75% de los datos y es
superado por el restante 25% de ellos.
n
PosQ1 =
4
2n n
PosQ=
2 =
4 2
3n
PosQ3 =
4
4.9.2. Deciles
Al igual que en el tratamiento de los cuartiles, ahora vamos a decir que los deciles
serán aquellas medidas que dividen en diez partes iguales al conjunto de datos
por tanto tendremos nueve deciles para calcular.
En este caso cada uno de los deciles va a representar un 10 por ciento que se va
acumulando en cada caso, de manera que, si nos corresponde interpretar el valor
obtenido como D3, diremos que el valor supera a las tres décimas partes de los
datos y es superado por las restantes siete décimas partes.
Su cálculo lleva el mismo procedimiento que para los cuartiles con la diferencia de
que en lugar de dividir para cuatro ahora dividimos para diez y determinamos así
la posición del dato que sea de interés.
Así como hemos dividido en cuatro y en diez partes, también podemos dividir en
cien partes al conjunto.
4.9.3. Percentiles
D1 = P10
D2 = P20
Q1 = P25
D=
5 P50
= Q=
2 Me
En el texto básico dentro de esta unidad se encuentran otros temas que han sido
trabajados que, si bien no se hallan determinados en nuestro plan de trabajo, sin
embargo, su lectura y revisión le aportarán y serán de utilidad.
Para clarificar la aplicación de estas medidas, vamos a calcular los valores del
decil 1, del cuartil 1 y del percentil 25, con los datos del ejercicio que venimos
desarrollando a lo largo de esta guía.
Calculamos el decil 1:
n
PosD1 =
10
80
PosD1 =
10
PosD1 = 8
Sabremos con este resultado que el dato 8, es el que contiene el valor del decil
1; lo que significa que este dato se encuentra en el intervalo (25 – 37), para ello
observamos en la columna de la frecuencia acumulada.
Calculemos el cuartil 1:
n
PosQ1 =
4
80
PosQ1 =
4
PosQ1 = 20
Este valor resultante nos indica que la primera cuarta parte de los estudiantes se
encuentra por debajo de 39,03 puntos y que las tres cuartas partes restantes tiene
calificaciones superiores a dicho valor.
El valor resultante nos dirá que el 25 por ciento de los estudiantes han obtenido
calificaciones menores a 39,03 puntos y que el 75% restante han obtenido
calificaciones superiores a 39,03 puntos.
Como podemos observar en estas dos últimas medidas sus resultados son los
mismos, de allí que cuando relacionamos las medidas dijimos que el cuartil 1 es
igual al percentil 25.
Con ello cerramos el tratamiento de los temas que comprenden esta unidad
temática, por ello le invito para que realice las actividades que a continuación le
propongo con la finalidad de que vaya practicando la aplicación de cada una de
las herramientas que hemos trabajado.
Actividades recomendadas
Espero que usted al desarrollar todas las actividades que le estoy recomendando
comprenda la aplicabilidad de cada uno de los temas abordados hasta el
momento de manera que con este desarrollo pueda identificar la utilidad de las
distintas estrategias para describir la información recolectada.
Autoevaluación 4
10. ( ) Los cuartiles, deciles y percentiles son medidas que nos permiten
determinar la ubicación de un determinado valor dentro de un
conjunto de datos.
11. Cuando se toma en cuenta los valores absolutos de las diferencias entre
cada uno de los valores observados con respecto a la media aritmética,
estamos calculando la:
a. Desviación estándar.
b. Desviación media.
c. Varianza.
14. La medida que nos permite comparar dos conjuntos de datos que tienen
unidades de medida distintas, es el coeficiente de
a. variación.
b. asimetría.
c. ubicación.
a. Moda.
b. Media aritmética.
c. Mediana.
SEGUNDO BIMESTRE
5.1. Introducción
Así pues, si hablamos de los precios de los productos, podemos afirmar que
existe variación entre un período y otro y por tanto los índices de variación de
precios son considerados en los análisis que se realizan al referirse a un sistema
económico.
En esta unidad veremos este tema y quizá el salto que estamos dando con
respecto al texto básico le pueda parecer un poco extraño, sin embargo, he
considerado pertinente trabajar esta temática ya que estamos desarrollando
la descripción de información y este tema tiene precisamente ese enfoque,
además de que le será de gran utilidad para la comprensión de las lecturas de
De acuerdo con la lectura que realizó en el texto básico, usted puede identificar lo
que significa un número índice.
Podemos afirmar también que los números índices son medidas estadísticas
adimensionales que permiten estudiar la evolución de una variable durante un
período definido.
Los números índices simples son aquellos que nos permiten identificar la
variación de los valores de una variable en un período determinado, es decir
tomando en cuenta el valor referencial que se constituye en la base y el valor final
que se constituye en cambio en el que toma la variable analizada.
600
I= * 100
350
I = 171 , 43
Esto significa que el ingreso promedio mensual de las personas aumentó en el
71,43% durante el período analizado.
Pt
P= * 100
Po
Donde:
De igual manera encuentra que se pueden trabajar los valores promedios de los
índices de precios simples con la finalidad de llegar a conocer un valor de todo el
conjunto de artículos que forman parte de ese grupo.
Este tipo de índices han tenido varios aportes de diferentes autores que
precisamente son conocidos por sus apellidos y que se desarrollan a
continuación.
Quizá uno de los inconvenientes que presenta este tipo de índice es el suponer
que siempre se adquieren las mismas cantidades que aquellas del período base.
P=
∑p q
t 0
* 100
∑p q
0 0
Donde:
Revise el ejercicio resuelto en el texto básico y siga paso a paso su desarrollo con
la finalidad de que analice posteriormente las conclusiones a las que se puede
abordar.
P=
∑p q
t t
* 100
∑p q
0 t
Donde:
pt = precio en el periodo actual t
p0 = precio en el periodo base 0
qt = cantidades en el periodo actual t
No podríamos tener una respuesta exacta porque cada uno tiene sus ventajas y
sus desventajas que como se describe en el texto, nos llevan a tratar otro índice
que se denomina: Índice Ideal de Fisher.
Podríamos decir que este índice se considera como ideal porque toma en cuenta
las características de los dos índices anteriormente indicados.
La canasta básica comprende los productos y servicios que una familia típica
consume en un período definido que por lo general es en forma mensual. Cada
uno de los productos y servicios que forman parte de esta canasta tiene definida
una ponderación que obedece al comportamiento en cuanto a consumo de una
familia típica.
Al igual que en el caso del IPC, el Índice de Precios al Productor (IPP), mide
la variación de los precios de venta de los productos que forman parte de una
canasta básica.
▪▪ Agropecuario
▪▪ Pesquero
▪▪ Minero
▪▪ Manufacturero
En la canasta no se incluyen:
Como una explicación adicional, les puedo indicar que el cálculo de este índice
toma en cuenta la suma de los precios de cierre de las 30 acciones que lo
componen dividido por un divisor que toma en cuenta los ajustes por cualquier
cambio de empresas o divisiones de acciones de una empresa o cualquier otro
evento que pueda ocurrir a lo largo del tiempo.
Actividades recomendadas
Para aplicar los temas que hemos revisado en esta unidad, le recomiendo hacer
lo siguiente:
Autoevaluación 5
1. ( ) Los números índices son medidas que nos permiten observar el
cambio que se ha provocado en la variable analizada a través del
tiempo.
13. Una de las siguientes alternativas, se refiere a las desventajas del uso del
índice de Laspeyres:
a. Producción nacional.
b. Inflación.
c. Nivel de ingreso.
6.1. Introducción
En el texto básico usted encuentra este apartado con el título Enfoques para
asignar probabilidades, allí usted encuentra que hay dos enfoques de los cuales
se derivan los tipos de probabilidad.
▪▪ Clásica
▪▪ Empírica
Dos eventos son mutuamente excluyentes cuando la presencia del uno impide
que se presente el otro al mismo tiempo, por ejemplo, al lanzar una moneda
tenemos dos eventos “cara” y “sello”, si se presenta “cara” ya no se puede
presentar “sello” en este caso la presencia del uno impide la presencia del otro.
En la lectura que realice de este tema, usted va a encontrar en el texto básico que
se identifican las reglas especial y general de la adición.
Estas reglas se aplican cuando los eventos generan exclusión, así pues, la regla
especial de adición se aplica cuando los eventos son mutuamente excluyentes, y
se la calcula a través de la siguiente fórmula:
126 Modalidad Abierta y a Distancia
Guía didáctica: Estadística Básica
Segundo bimestre
De igual manera, las reglas de multiplicación se utilizan cuando existen dos o más
eventos sobre los cuales se debe calcular la probabilidad.
En este caso, como observará en el texto básico, los eventos se caracterizan por
su dependencia e independencia.
Realice los ejercicios propuestos al finalizar cada uno de los temas explicados.
Ahora bien, este diagrama es útil y de fácil desarrollo cuando los eventos
corresponden a un número pequeño, pero cuando ya la cantidad de eventos es
grande, la elaboración del diagrama se vuelve más complicada por ello debemos
insertarnos también en lo que se conoce como el análisis combinatorio.
6.8.1. Permutaciones
Revise en el texto básico estos temas, allí verá que utilizamos el factorial de los
números.
6.8.2. Combinaciones
Para que observe la aplicación de estos temas y familiarizarse con el uso de las
permutaciones y combinaciones, le sugiero que realice los ejercicios que constan
en el texto básico al finalizar esta temática.
Una vez que hemos finalizado con el análisis de los temas previstos para esta
unidad, le propongo que desarrollemos los siguientes ejercicios.
El resultado nos explica que la probabilidad de que el individuo escogido del grupo
de las 130 personas sea un adolescente o un adulto es del 69,23%.
El resultado nos indica que existe el 11,43% de probabilidades que las frutas
extraídas sean una naranja y una manzana, en ese orden.
Actividades recomendadas
2. Establezca ejemplos en los que pueda determinar las diferencias entre las
probabilidades objetiva y subjetiva, haga un listado y exprese por qué las
determina así.
Autoevaluación 6
a. Subjetiva.
b. Clásica.
c. Empírica.
12. La probabilidad de que, al lanzar una moneda, su resultado sea una “cara”, es:
a. 1
b. 0
c. ½
a. P (A o B) = P(A) + P(B)
b. P (A y B) = P(A) * P(B)
c. P (A y B) = P(A) * P(B|A)
14. Para aplicar la regla especial de adición, los eventos deben ser:
a. Mutuamente excluyentes.
b. Colectivamente exhaustivos.
c. Independientes.
a. Regla de adición.
b. Permutaciones.
c. Diagrama de árbol.
Le recuerdo que al final de esta guía puede encontrar las soluciones a esta
autoevaluación y allí podrá conocer el nivel de logro que ha obtenido. Como
siempre le sugiero considerar dicho nivel de manera que, si por alguna razón
su resultado no ha sido satisfactorio, vuelva a revisar los temas en los que ha
experimentado dificultad.
7.1. Introducción
Cada uno de estos tipos de probabilidad tiene sus características que nos llevan a
su aplicación específica, por eso es importante determinar las características del
evento a evaluarse para posteriormente considerar las características del tipo de
distribución que es adecuado emplear.
Lo invito a revisar el texto, allí usted va a encontrar que cuando se habla de una
distribución de probabilidad estamos guardando similitud con la definición de una
tabla de distribución de frecuencias, ya que allí se identifican todos los elementos
que constituyen la población analizada cada uno de los cuales se ubica en un
determinado intervalo o clase.
Continuando con la lectura del texto, encontrará además que para una distribución
de probabilidad de igual manera se van a identificar indicadores que nos muestran
las características de un conjunto de datos.
7.3.1. Media
De esta manera lo que estamos haciendo es, multiplicar cada valor por la
probabilidad asociada al mismo y luego sumamos todos los valores obtenidos con
este producto.
σ = σ2
Para una mayor claridad de lo expuesto anteriormente revise el ejercicio resuelto
en el texto básico en el que se aplica tanto la media aritmética como la varianza y
la desviación típica.
Una vez que se ha identificado que el experimento cumple con las características
de este tipo de probabilidad y por tanto es catalogado como un experimento
binomial, podemos calcular la probabilidad requerida mediante la fórmula que
presentamos a continuación en la que observamos que se aplica el análisis
combinatorio:
donde :
n = número de ensayos
X = número de éxitos de la variable analizada
n C X = número de combinaciones de n elementos tomados X a la vez
π = probabilidad de éxito en cada ensayo
Usted puede y es aconsejable, que aplique la fórmula hasta que vaya tomando
mayor destreza y habilidad en el cálculo de esta probabilidad. Luego puede utilizar
En esta tabla para cada n tiene un bloque de probabilidades en cuya fila superior
se encuentran las probabilidades de éxito desde 0,05 hasta 0,95 y en la primera
columna los valores de X.
▪▪ Como máximo que dos vuelos lleguen tarde, significa que debe calcular las
probabilidades de 0, 1, o 2 y sumar esos posibles resultados.
▪▪ Tres o más vuelos lleguen tarde, esto implica que el resultado de esta
probabilidad vendrá dado por la suma de las probabilidades de 3, 4, o 5.
Media:
Varianza:
De igual manera, revise los ejemplos resueltos en el texto básico en donde podrá
observar la aplicación de estas medidas.
donde :
N = representa el tamaño de la población
S = número de éxitos en la población
X = número de éxitos en la muestra
n = tamaño de la muestra o número de ensayos
C = símbolo de combinación
donde :
µ = media de la cantidad de veces (éxitos)
que se presenta un evento en un intervalo particular
e = constante matemática (2,718281...)
X = número de veces que se presenta un evento
P ( X ) = probabilidad de un valor específico de X
En el anexo B.2 del texto básico puede encontrar una tabla de cálculo para esta
probabilidad, sin embargo, le aconsejo que aplique la fórmula para que observe
su aplicación. Para usar la tabla requiere conocer el valor de µ que se encuentra
en la fila superior y en la primera columna se encuentran los valores de X que es
la probabilidad a encontrarse, por ejemplo si necesitamos calcular la probabilidad
de que X=4 cuando la media es 5, la tabla nos dirá que el resultado es: 0,1755.
Ejercicios de aplicación
n = 15 preguntas
X = adivinar la respuesta
Aprobar = significa que debe cumplir con el 80% o más de las 15 preguntas,
entonces el 80% de las 15 son 12 preguntas, quiere decir que la probabilidad de
aprobar vendría dada por la suma de las probabilidades de 12, 13, 14, 15.
De manera que:
Datos:
n= 5 personas
X= la persona elegida sea zurda
π = 0,15 (probabilidad de que una persona sea zurda)
Según este resultado podemos concluir que la probabilidad de que las cinco
personas a las que se les consulte sean zurdas es, cero.
Como la pregunta se refiere a que todas sean diestras, eso significa que es igual
a calcular que ninguna de las personas sea zurda.
P( X= 1)= 0,391505
P( X= 2)= 0,138178
P( X= 3)= 0,024384
P( X= 4)= 0,002152
P( X= 5)= 0,000076
Como podemos observar es el mismo resultado que nos indica que existe el
55,63% de probabilidades de que al menos una de las personas consultadas sea
zurda.
Hemos resuelto todo lo que se ha solicitado, veamos ahora otro ejemplo en el que
aplicaremos la distribución de probabilidad de Poisson.
µ= 6 x 2 días = (12 promedio de cheques sin fondo que llegan en dos días
consecutivos).
−12
1210 ( 2,718281)
P(= =)
X 10
10!
61917364224 * ( 0,00000614423)
P(= =)
X 10
3628800
380434,826
P(= =)
X 10
3628800
P(= =) 0,1048377
X 10
P(= =) 10,48%
X 10
Actividades recomendadas
Autoevaluación 7
a. La variable es continua.
b. Existen dos resultados posibles, éxito o fracaso.
c. La variable se mide en intervalos de tiempo.
a. 2,718281
b. 3,141592
c. 1
a. Hipergeométrica.
b. Binomial.
c. De Poisson.
Hemos llegado al final del estudio de esta unidad, en la próxima vamos trabajar la
distribución de probabilidad cuando se trata de variables continuas, básicamente
trabajaremos con la distribución de probabilidad normal y con el caso especial
8.1. Introducción
Con esta unidad cerraremos los temas de la asignatura, espero que con ello
pueda continuar en el siguiente nivel del estudio de la estadística inferencial en la
que tendrá la oportunidad de aplicar todas estas temáticas.
Antes de definir lo que significa esta distribución, revise lo que nos dicen los
autores del texto respecto a este tipo de distribuciones de probabilidad. Allí puede
encontrar las características de una familia de distribuciones de probabilidad
uniforme.
Ahora sí, podemos detallar los pasos que se requieren para determinar una
probabilidad.
X −µ
Z=
σ
1. Alrededor del 68% del área bajo la curva normal se encuentra a una
desviación estándar con respecto a la media aritmética: µ±σ
Después de revisar el contenido de este tema, le sugiero también que revise los
ejercicios que se encuentran desarrollados en el texto básico y adicionalmente
es importante que trabaje las autoevaluaciones que constan de igual manera en
el texto, de tal forma que usted se vaya familiarizando con el uso de la tabla de
áreas bajo la curva normal.
Puede leer este acápite en el texto, pues, allí está explicada la forma en la que se
debe trabajar en estos casos.
Una vez que hemos aplicado la corrección por continuidad, se sigue los pasos
que se contemplan para encontrar una probabilidad normal.
Revise este apartado en el texto básico, allí se encuentran explicados los pasos
que se deben seguir para trabajar en estos casos.
Ejercicios de aplicación
Una persona con una buena historia crediticia tiene una deuda promedio de
$15.015. Suponga que la desviación estándar es de $ 3.540 y que los montos
de las deudas están distribuidos normalmente. Determinar la probabilidad
de que la deuda de una persona con una buena historia crediticia:
Desarrollo:
X −µ
Z=
σ
18000 −15015
Z=
3540
Z = 0,8432
• Con este valor obtenido, vamos a leer en la tabla de áreas bajo la curva
normal que se encuentra en el texto básico apéndice B.3; previamente
planteamos el ejercicio y es conveniente hacerlo de manera gráfica
para poder establecer el área a encontrarse:
X1 = 12000
X 2 = 18000
Entonces:
X1 − µ
Z1 =
σ
12000 −15015
Z1 =
3540
Z1 = −0,85
X2 − µ
Z2 =
σ
18000 −15015
Z2 =
3540
Z 2 = 0,84
Gráficamente el área que nos muestra la probabilidad a encontrarse será:
n = 120
π = 0,75
De acuerdo a los resultados (90 y 30) se cumple la condición, por lo que se puede
considerar que este caso es apto para trabajar con la aproximación normal a la
binomial. Bajo esta condición podemos proceder a calcular las probabilidades
solicitadas.
La probabilidad a resolverse sería P(X ≥ 60), esto porque nos pide identificar la
probabilidad de que por lo menos la mitad de las habitaciones estén ocupadas,
significa que pueden ser 60 o más.
X −µ
Z=
σ
59,5 − 90
Z=
4,74
Z = −6,43
Este resultado nos permite afirmar que existe absoluta certeza (100%) de que por
lo menos la mitad de las habitaciones se encuentran ocupadas en un día dado.
Conviene aquí que recuerde la regla empírica en donde se decía que a partir de 3
desviaciones típicas respecto a la media aritmética prácticamente se encuentran
todas las observaciones, por ello en la tabla de áreas bajo la curva normal usted
encontrará hasta el valor de Z=3,09 con el área 0,4990 por ello a partir de este
valor de Z se considera como área 0,5. Para este caso el valor de Z es 6,43 lo que
significa que el área es 0,5.
Este resultado nos permite decir que existe el 2,28% de probabilidades de que
100 o más habitaciones se encuentren ocupadas en un día cualquiera.
Usted puede generar algunas otras preguntas sobre el mismo caso y generar
las respuestas con la finalidad de que adquiera las destrezas suficientes para la
solución de estos casos que se pudieran presentar.
Como podrá observar con este tema llegamos a concluir con los temas previstos
para esta asignatura, espero que le hayan sido de mucha utilidad y que sobre
Actividades recomendadas
Al igual que en las unidades anteriores, reitero mi recomendación para que usted
realice estas actividades que le recomiendo ya que a través de ellas podrá afirmar
los conocimientos adquiridos sobre los temas abordados y sobre todo para que
tenga la certeza de su aplicación e interpretación de los resultados obtenidos.
Autoevaluación 8
a. 1
b. -1
c. 0
a. 0,5
b. 1
c. 0,25
13. Para la probabilidad de que por lo menos ocurra X, se utiliza el área por
encima de:
a. X + 0,5
b. X – 0,5
c. X ± 0,5
14. Según la regla empírica, alrededor del 95% del área bajo la curva normal se
encuentra a:
15. La curva normal se caracteriza por ser simétrica y por ello tiene la forma de:
a. Parábola.
b. Elipse.
c. Campana.
7. Solucionario
AUTOEVALUACIÓN 1
N° Respuesta Retroalimentación
AUTOEVALUACIÓN 1
N° Respuesta Retroalimentación
AUTOEVALUACIÓN 2
N° Respuesta Retroalimentación
AUTOEVALUACIÓN 2
N° Respuesta Retroalimentación
AUTOEVALUACIÓN 3
N° Respuesta Retroalimentación
1 V Se denominan de tendencia central porque
precisamente nos permiten ver los valores
representativos que tienden hacia el centro de todos los
valores.
2 F Todas las medidas de tendencia central pueden ser
calculadas en un mismo grupo de datos, es posible que
de acuerdo a las características de los datos la media
aritmética no sea adecuada como medida, sin embargo,
ninguna de las medidas es dependiente.
3 V Cuando hay un intervalo abierto no es posible calcular
la media aritmética porque no sería posible calcular la
marca de clase de ese intervalo.
4 V El cálculo de la media aritmética toma en cuenta todos
los datos del conjunto analizado y por ello en el caso
de una tabla de distribución de frecuencias, se utiliza la
marca de clase y la frecuencia absoluta simple de cada
intervalo.
5 V Dado que se utilizan todos los valores del conjunto de
datos, si existe un valor extremo éste afecta al resultado
final.
6 F La mediana es el valor que se encuentra ocupando la
posición central dentro de todo el conjunto de datos.
7 V Si existen intervalos abiertos o valores extremos
se puede calcular la mediana, la moda pero no es
adecuado calcular la media aritmética.
8 V Si consideramos que la moda es el dato que se
encuentra con mayor frecuencia, entonces su cálculo
toma en cuenta la frecuencia absoluta simple.
9 V La ponderación es un valor que se asigna a cada uno
de los valores de la variable y que corresponde al
nivel de importancia de cada dato dentro del conjunto
analizado.
10 F El valor de la media geométrica nunca es mayor al valor
de la media aritmética.
AUTOEVALUACIÓN 3
N° Respuesta Retroalimentación
11 a La diferencia entre cada valor con respecto a la media
aritmética determina distancias y luego al sumarla
siempre es igual a cero.
12 b La mediana es el valor que se encuentra ocupando la
posición central dentro de todo el conjunto de datos.
13 a Si los valores de las tres medidas son iguales, significa
que la distribución de los datos es simétrica.
14 c Al tener más de dos valores modales, significa que el
conjunto es multimodal.
15 a Si la variable observa cambios en forma geométrica,
entonces la medida adecuada para determinar su
promedio será la media geométrica.
AUTOEVALUACIÓN 4
N° Respuesta Retroalimentación
1 F Si el valor de la medida de dispersión es mayor significa
que los datos están más separados.
2 V Las medidas de dispersión nos permiten observar cuan
juntos o separados se encuentran los datos respecto a
la media aritmética.
3 V El rango o recorrido muestra precisamente el recorrido
de la variable desde el valor menor hasta el máximo
valor de la variable.
4 F La desviación típica o estándar se origina del cálculo de
la varianza que toma las diferencias cuadráticas entre
cada valor con respecto a la media aritmética.
5 F Al contrario es la varianza la medida que viene
expresada en unidades cuadráticas y por ello para
su interpretación se extrae la raíz cuadrada que se
considera como desviación típica.
6 F El coeficiente de variación nos permite comparar el nivel
de dispersión de dos o más conjuntos de datos.
7 V La igualdad de los valores de las tres medidas nos
permite confirmar que el conjunto de datos es simétrico.
8 V Es correcto porque en la fórmula de cálculo se
considera el triple de la diferencia entre la media
aritmética y la mediana.
9 F El valor del cuartil 2 es igual al valor de la mediana, al
decil 5 y al percentil 50.
10 V Los deciles, percentiles y cuartiles constituyen medidas
de ubicación de los datos.
11 b La desviación media absoluta requiere considerar las
diferencias entre cada valor con respecto a la media
aritmética en términos absolutos, de lo contrario la
sumatoria sería igual a cero.
12 b Un valor expresado en términos absolutos, no considera
el signo de la operación matemática.
AUTOEVALUACIÓN 4
N° Respuesta Retroalimentación
13 c Al expresarse en unidades de medida cuadráticas no
es muy fácil la interpretación del nivel de dispersión del
conjunto de datos.
14 a El coeficiente de variación nos permite comparar el nivel
de dispersión de dos o más conjuntos de datos.
15 c Para hallar cualquiera de las medidas de ubicación, el
procedimiento a seguirse es el empleado en el cálculo
de la mediana.
AUTOEVALUACIÓN 5
N° Respuesta Retroalimentación
1 V Permiten verificar los cambios en una variable con
respecto a un determinado período.
2 V De acuerdo a la definición de un número índice es
importante establecer un punto de referencia que en
este caso es el período base.
3 V Dependiendo de su naturaleza los números índice se
conocen como ponderados y no ponderados.
4 F Un número índice se puede utilizar para una canasta
de bienes o servicios, no solamente para un producto
específico.
5 F En este índice los ponderadores son las cantidades del
período base.
6 F El índice de Fisher utiliza las medias geométricas de los
índices de Laspeyres y de Paasche.
7 V Es correcto, la ponderación en este caso está dada por
la cantidad del período actual.
8 V Efectivamente el índice de Fisher elimina los
inconveniente de los índices de Laspeyres y de
Paasche.
9 F Se utiliza la media geométrica de los índices citados.
10 V Es correcto porque toma en cuenta los valores de las
acciones de todo un conjunto de empresas.
11 a El número índice permite comparar conjuntos de datos
de diferente composición.
12 c El precio se ha incrementado en un 25% ya que el
resultado de 125 toma en cuenta los valores iniciales.
13 b No refleja los cambios que el tiempo genera en los
patrones de compra porque el ponderador de este
índice son las cantidades del período base.
14 b Inflación porque se refiere a la variación de precios que
se han registrado en un período dado.
15 b El recíproco del IPC que nos permite establecer el
poder adquisitivo de un dólar.
AUTOEVALUACIÓN 6
N° Respuesta Retroalimentación
1 V La probabilidad nos permite cuantificar la posibilidad de
que algo se presente o no.
2 F La certeza de que algo se pueda presentar significa que
existe la probabilidad absoluta de que el resultado sea
exitoso.
3 F El cociente entre los resultados favorables sobre los
resultados posibles nos permite conocer la probabilidad
de un evento.
4 V Son excluyente porque si el uno se presenta ya no es
posible la presencia de otro al mismo momento.
5 V Es correcto porque los conocimientos previos son los
que determinan la certeza o no de que se presente un
evento.
6 V La regla especial de adición indica que se presenta uno
u otro en el mismo evento.
7 F La regla de multiplicación de carácter general indica que
dos eventos son dependientes, esto es que un evento
depende de lo que haya sucedido antes.
8 V Cada evento y sus resultado posibles van generando
diferentes resultados a medida que se van identificando
diferentes etapas del experimento.
9 F En las combinaciones no es importante el orden en el
que se presentan los objetos.
10 F En las permutaciones es importante el orden en el que
se presentan los objetos seleccionados.
11 a Es subjetiva porque no responde a información
comprobada sino a las posibles opiniones.
12 c Es 1/2 porque significa que hay 1 cara entre dos
posibles resultados que serían cara y sello.
13 c Nos permite identificar que los eventos son
dependientes entre sí.
14 a La regla especial de adición nos indica que los eventos
son mutuamente excluyentes porque se presenta uno u
otro, mas no los dos al mismo tiempo.
AUTOEVALUACIÓN 6
N° Respuesta Retroalimentación
15 b Se aplica la fórmula de las permutaciones porque
nos indica que es importante el orden en el que se
presentan los objetos seleccionados.
AUTOEVALUACIÓN 7
N° Respuesta Retroalimentación
AUTOEVALUACIÓN 7
N° Respuesta Retroalimentación
AUTOEVALUACIÓN 8
N° Respuesta Retroalimentación
1 V La variable continua al originarse de la medición puede
asumir valores intermedios entre uno y otro.
2 V Una de las formas que asume una distribución de
probabilidad continua son las distribuciones uniformes.
3 F La distribución de probabilidad normal se caracteriza
por ser simétrica.
4 V Una referencia tipificada es la diferencia entre un
valor con respecto a la media aritmética en términos
de desviación típica, por ello su media es 0 ya que
hablamos de una distribución simétrica.
5 V Es necesario transformar primero los valores de la
variable X a referencias tipificadas o valores de Z, que
nos indican cuántas desviaciones típicas se encuentra
alejado el valor de la variable con respecto a la media
aritmética.
6 F Lo correcto es indicar que alrededor del 95% de los
casos u observaciones se encuentras distantes más
menos 2 desviaciones típicas con respecto a la media
aritmética.
7 F La aproximación es considerada como adecuada
cuando los productos mencionados son por lo menos
igual a cinco.
8 V En razón de que estamos trabajando con una variable
discreta es necesario considerar los valores reales de
la variable y por ello se debe realizar la corrección por
continuidad.
9 F Como está incluido el valor de X, lo que se debe es
restar 0,5 al valor de la variable analizada ya que se
consideran todos los valores de allí en adelante.
10 V Una de las características de la distribución binomial es
precisamente de que para cada uno de los eventos, la
probabilidad de éxito se mantiene constante.
11 b Aplicando la fórmula correspondiente el valor de 18 en
términos de Z será igual a -1.
AUTOEVALUACIÓN 8
N° Respuesta Retroalimentación
12 b El área total bajo la curva normal es igual a 1 o 100%
ya que allí se encuentran todos los posibles valores que
toma la variable.
13 b Al aplicar la corrección por continuidad y considerarse
también al valor de X, entonces se debe restar 0,5.
14 b El 95% de los casos u observaciones se encuentran
distantes más menos dos desviaciones estándar con
respecto a la media aritmética.
15 c La curva de una distribución normal tiene la forma
de campana porque se distribuye normalmente y es
simétrica.
8. Referencias Bibliográficas
ÁREA
sociohumanística
192