Está en la página 1de 152

1

Visión
Ser una de las 10 mejores universidades privadas del Perú al año 2020,
reconocidos por nuestra excelencia académica y vocación de
servicio, líderes en formación integral, con perspectiva global;
promoviendo la competitividad del país.

MISIÓN
Somos una universidad privada, innovadora y comprometida con el
desarrollo del Perú, que se dedica a formar personas competentes,
íntegras y emprendedoras, con visión internacional; para que se
conviertan en ciudadanos responsables e impulsen el desarrollo de
sus comunidades, impartiendo experiencias de aprendizaje
vivificantes e inspiradoras; y generando una alta valoración mutua
entre todos los grupos de interés.

Universidad Continental
Material publicado con fines de estudio
Código: ASUC01275

2
Gestión Curricular
Asignatura: Estadística general

Presentación
RESULTADO DE APRENDIZAJE

Al finalizar la asignatura, el estudiante será capaz de analizar información utilizando los


métodos y técnicas de la estadística descriptiva y probabilidad, para brindar información
que sirva para la toma de decisiones.

ORGANIZACIÓN DE LOS APRENDIZAJES

Unidad I Unidad II Unidad III Unidad IV

Distribuciones
Introducción, tipos
bidimensionales y Medidas resumen o Distribuciones de
de distribuciones y
gráficos descriptivas probabilidad
gráficos
comparativos
Resultado de Resultado de Resultado de Resultado de

Aprendizaje: Aprendizaje: Aprendizaje: Aprendizaje:

Al finalizar la unidad, Al finalizar la unidad, Al finalizar la unidad, Al finalizar la unidad,

el estudiante será el estudiante será el estudiante será el estudiante será

capaz de utilizar capaz de comparar capaz de calcular las capaz de calcular e

distribuciones e interpretar los medidas de interpretar

unidimensionales y resultados de las tendencia central, probabilidades en

gráficos estadísticos distribuciones variación, posición distribuciones

para la interpretación bidimensionales en relativa y discretas y continuas

de resultados acontecimientos de deformación para en acontecimientos

estadísticos. sus actividades interpretar datos cotidianos de su


diarias. relacionados a su carrera profesional.
carrera profesional.

Semana 1 - 4 Semana 5 - 8 Semana 9 - 12 Semana 13 - 16

TIEMPO MINIMO DE ESTUDIO:

Unidad I: Unidad II: Unidad III: Unidad IV:

16 horas 16 horas 16 horas 16 horas


Gestión Curricular
Asignatura: Estadística general

Introducción
La Asignatura de Estadística General pertenece al plan curricular de cursos generales, el
cual se desarrolla dentro de la modalidad presencial, la presente guía - auto formativo
material idóneo dentro de su formación Universitaria.
La Estadística General está orientada a adquirir herramientas básicas para reforzar sus
habilidades de inter relación con la sociedad en todos sus ámbitos. Es así, a asignatura trata
de aquellos temas que permite a los estudiantes desarrollar sus habilidades lógicas y más
importantes aún, aplicar lo aprendido en el ámbito profesional y solucionar problemas del
día a día.
De esta manera se desarrollará competencia general de aprendizaje autónomo,
debidamente organizados y sistematizados tomando en cuenta los principios
pedagógicos, por ello en primer lugar se presenta la teoría acompañados de ejemplos, de
igual modo se muestran ejercicios desarrollados, ejercicios y problemas plantados y
finalmente la meta cognición de su aprendizaje.
Para el estudio la guía se sugiere la siguiente secuencia en cada resultado de aprendizaje:
Al finalizar la unidad I, el estudiante será capaz de utilizar distribuciones
unidimensionales y gráficos estadísticos para la interpretación de resultados
estadísticos.
Al finalizar la unidad II, el estudiante será capaz de comparar e interpretar los
resultados de las distribuciones bidimensionales en acontecimientos de sus
actividades diarias.
Al finalizar la unidad III, el estudiante será capaz de calcular las medidas de
tendencia central, variación, posición relativa y deformación para interpretar datos
relacionados a su carrera profesional.
Al finalizar la unidad IV, el estudiante será capaz de calcular e interpretar
probabilidades en distribuciones discretas y continuas en acontecimientos
cotidianos de su carrera profesional.
Por tanto Ud. requiere de un conocimiento directo, práctico de la Estadística General que
permita aplicar y emprender nuevos retos, tomando casos prácticos de su entorno y
logrando conocimientos de la Estadística general a través de una aplicación objetiva, la
motivación y nuevas metodologías para desarrollar y consolidar su desarrollo universitario.

Los autores
Índice
Contenido
Unidad I ..................................................................................................................................................... 1
Semana 1 .................................................................................................................................................. 2
INTRODUCCIÓN A LA ESTADÍSTICA................................................................................................. 2
SESIÓN 1: INTRODUCCIÓN A LA ESTADÍSTICA.............................................................................. 4
1 DEFINICIÓN. .............................................................................................................................. 4
2 UTILIDAD E IMPORTANCIA. .................................................................................................... 4
3 CLASES DE ESTADISTICA. ........................................................................................................ 4
4 TERMINOS UTILIZADOS EN LA ESTADISTICA........................................................................ 5
 Variable cualitativa nominal: .............................................................................................. 6
 Variable cualitativa ordinal: ................................................................................................ 6
4 REDONDEO DE DATOS: .............................................................................................................. 7
Semana 2 ................................................................................................................................................ 12
SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUALITATIVAS ............ 14
1 ORGANIZACIÓN DE LOS DATOS. ...................................................................................... 14
2 DISTRIBUCIÓN DE FRECUENCIAS. ....................................................................................... 14
3 CLASES DE FRECUENCIAS. ................................................................................................... 14
1.1. FRECUENCIAS SIMPLES: ........................................................................................................ 14
1.2. FRECUENCIAS ACUMULADAS: ........................................................................................... 16
2. TABLAS DE FRECUENCIAS – VARIABLES CUALITATIVA. ..................................................... 17
3. TABLA DE FRECUENCIAS – VARIABLE CUALITATIVA DISCRETA. ...................................... 18
Semana 3 ................................................................................................................................................ 21
DISTRIBUCIÓN DE FRECUENCIAS UNIDIMENSIONALES ............................................................. 21
SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUANTITATIVAS ......... 23
1. RECOMENDACIONES: ........................................................................................................... 23
 Los intervalos deben tener igual amplitud. ................................................................... 23
2. PASOS: ...................................................................................................................................... 23
Semana 4 ................................................................................................................................................ 30
GRÁFICOS ESTADÍSTICOS ................................................................................................................ 30
SESIÓN 7: GRÁFICOS ESTADÍSTICOS ESPECIALES....................................................................... 32
Entre las gráficas más utilizadas tenemos: .................................................................................... 32
1. GRÁFICA DE BARRAS. ........................................................................................................... 32
2. HISTOGRAMA. ......................................................................................................................... 32
Gestión Curricular
Asignatura: Estadística general

3. POLÍGONO DE FRECUENCIAS. ............................................................................................ 33


4. OJIVA........................................................................................................................................ 33
5. GRÁFICA DE PUNTOS. ........................................................................................................... 33
6. GRÁFICO DE PARETO. ........................................................................................................... 34
7. GRÁFICO DE TALLO Y HOJAS. ............................................................................................ 34
3. PICTOGRAMA. ........................................................................................................................ 34
4. GRÁFICA CIRCULAR. ............................................................................................................. 35
5. DIAGRAMA DE DISPERSIÓN................................................................................................. 35
6. PIRAMIDE DE POBLACIÓN. .................................................................................................. 36
7. CAJA Y BIGOTES. ................................................................................................................... 36
Unidad II ................................................................................................................................................. 41
EVALUACIÓN DE LA PRIMERA UNIDAD ....................................................................................... 42
Semana 6 ................................................................................................................................................ 44
SESIÓN 11: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS
CUALITATIVOS Y MIXTOS. ................................................................................................................. 46
1. DATOS BIVARIADOS: ............................................................................................................. 46
2. DISTRIBUCIONES ABSOLUTAS MARGINALES: ................................................................... 46
Semana 7 ................................................................................................................................................ 53
SESIÓN 13: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS
CUANTITATIVOS. ................................................................................................................................. 55
1. VARIABLES BIDIMENSIONALES. ........................................................................................... 55
2. DIAGRAMA DE DISPERSIÓN:................................................................................................ 55
Semana 8 ................................................................................................................................................ 61
EVALUACIÓN PARCIAL .................................................................................................................... 61
Unidad III ............................................................................................................................................... 62
Semana 9 ................................................................................................................................................ 63
SESIÓN 17: MEDIDAS DE TENDENCIA CENTRAL. ........................................................................ 65
1. LA MEDIA ARITMÉTICA (𝒙; 𝒙; 𝑴; 𝑴(𝒂)): ............................................................................. 65
2. LA MODA (𝑴𝒐): ...................................................................................................................... 67
3.......................................................................................................................................................... 69
LA MEDIANA (𝑴𝒆): ........................................................................................................................ 69
4.......................................................................................................................................................... 72
RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA. ............................................... 72
Semana 10 .............................................................................................................................................. 76
SESIÓN 19: MEDIDAS DE VARIACIÓN O DISPERSIÓN. .............................................................. 78

2
Gestión Curricular
Asignatura: Estadística general

1. LA VARIANZA Y LA DESVIACIÓN ESTANDAR: ................................................................. 78


2. COEFICIENTE DE VARIACIÓN: ............................................................................................ 81
Semana 11 .............................................................................................................................................. 87
SESIÓN 21: CUARTILES Y PERCENTILES. ......................................................................................... 89
1. CUARTILES: ............................................................................................................................... 89
2. PERCENTILES: ........................................................................................................................... 92
4. RANGO INTERCUARTIL. ......................................................................................................... 94
5. ANALISIS EXPLORATORIO DE DATOS................................................................................. 94
6. GRÁFICA DE CAJA Y VIGOTE. ............................................................................................ 95
7. COEFICIENTE DE CURTOSIS. ................................................................................................. 95
Semana 12 ............................................................................................................................................ 101
EVALUACIÓN DE LA TERCERA UNIDAD ..................................................................................... 101
Unidad IV .............................................................................................................................................. 103
Semana 13 ............................................................................................................................................ 104
SESIÓN 25: PROBABILIDADES FUNDAMENTOS. ......................................................................... 106
1. FUNDAMENTOS. .................................................................................................................... 106
2. EXPERIMENTOS ALEATORIOS Y ESPACIO MUESTRAL. .................................................. 107
3. CONCEPTO DE PROBABILIDAD. ........................................................................................ 111
4. TIPOS DE PROBABILIDAD. ................................................................................................... 111
5. LEYES O AXIOMAS DE LA PROBABILIDAD. ..................................................................... 113
Semana 14 ............................................................................................................................................ 117
SESIÓN 27: DISTRIBUCIÓN BINOMIAL, POISSON. ...................................................................... 119
1. DISTRIBUCIÓN BINOMIAL. .................................................................................................. 119
2. DISTRIBUCIÓN POISSON. .................................................................................................... 123
Semana 15 ............................................................................................................................................ 129
SESIÓN 1: DISTRIBUCIÓN NORMAL .............................................................................................. 131
1. Introducción. ........................................................................................................................ 131
2. Definición............................................................................................................................... 132
3. Curva Norma Tipificada (estándar, o reducida). ...................................................... 134
Semana 16 ............................................................................................................................................ 143
EVALUACIÓN FINAL ........................................................................................................................ 143

3
Unidad I

Resultado de Aprendizaje de la Unidad I:


Al finalizar la unidad, el estudiante será capaz de utilizar distribuciones
unidimensionales y gráficos estadísticos para la interpretación de resultados
estadísticos

ORGANIZACIÓN DE APRENDIZAJES

TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN


SEMANA N° 1 Actividad N° 1 1 Prueba de entrada:

1. Introducción a la estadística Desarrolla la evaluación Evaluación individual de


2. Estadística, división, objetivos, Diagnóstica. desarrollo
definiciones, tipos de datos.
Métodos y fuentes de Actividad N° 2 2 Consolidado 1:
recolección de datos. Evaluación individual de
Elabora un organizador del desarrollo teórico-práctico
SEMANA N° 2 conocimiento haciendo uso de
la guía.
3. Distribuciones de Frecuencias Responde las interrogantes de la
Unidimensionales: Variables guía.
cualitativas, grafico e
interpretación. Gráficos: Actividad N° 3
sectores y barras.
4. Base de datos e variables Aplica una encuesta a sus
cualitativas y cuantitativas
compañeros de clase.
SEMANA N° 3 Elabora tabla de frecuencias
utilizando la variable género y
5. Distribuciones de Frecuencias carrera profesional.
Unidimensionales Variables
cuantitativas, grafico e Actividad N° 4
interpretación. Gráficos:
histograma, ojiva, polígono Elabora una base de datos de la
de frecuencias. encuesta aplicada a sus
6. Distribuciones de Frecuencias compañeros de clase, utilizando
Unidimensionales: Variables el programa del SPSS.
cuantitativas aplicando spss..

SEMANA N° 4: ……….

7. Gráficos estadísticos
especiales: Pareto, tallo y
hoja, pictograma, Otras
gráficas.
8. Gráficos estadísticos
especiales: Pareto, tallo y
hoja, pictograma, otras
gráficas con spss - Excel.

1
Gestión Curricular
Asignatura: Estadística general

Semana 1
INTRODUCCIÓN A LA ESTADÍSTICA
La palabra Estadística procede del vocablo “Estado”, pues
era función principal de los Gobiernos de los Estados
establecer registros de población, nacimientos, defunciones,
impuestos, cosechas... La necesidad de poseer datos cifrados
sobre la población y sus condiciones materiales de existencia
han debido hacerse sentir desde que se establecieron
sociedades humanas organizadas.

Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la civilización han
existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros
símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de
personas, animales o ciertas cosas.

La isla de Cerdeña, existen monumentos prehistóricos pertenecientes a los Nuragas, estos


monumentos constan de bloques de basalto superpuestos sin mortero y en cuyas paredes
se encontraban grabados toscos, signos que han sido interpretados con mucha
verosimilizad como muescas que servían para llevar la cuenta del ganado y la caza.
Los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas
sobre la producción agrícola y los géneros vendidos o cambiados mediante trueque.
En China existían los censos chinos ordenados por el emperador Tao hacia el año 2.200 a.C.

2
Gestión Curricular
Asignatura: Estadística general

HISTORIA LA ESTADISTICA
758 Durante los mil años posteriores a la caída del Imperio Romano se hicieron muy pocas
operaciones estadísticas, con la notable excepción de las relaciones de tierras
LECTURA

pertenecientes a la Iglesia, compiladas por Pipino el Breve y por Carlomagno en los años
758 y 762, respectivamente. En Francia se realizaron algunos censos parciales de siervos
durante el siglo IX.

1532 Debido al temor que Enrique VII tenía de la peste, en el año 1532 empezaron a
registrarse en Inglaterra las defunciones causadas por esta enfermedad. En Francia, más o
menos por la misma época, la ley exigía a los clérigos registrar los bautismos, fallecimientos
y matrimonios.

1540 Alrededor del año 1540, el alemán Sebastián Muster realizó una compilación
estadística de los recursos nacionales, que comprendía datos acerca de la organización
política, instituciones sociales, comercio y poderío militar.

1632 Durante un brote de peste que apareció a fines del siglo XVI, el gobierno inglés
comenzó a publicar estadísticas semanales de los decesos. Esa costumbre continuó
muchos años, y en 1632 los llamados Bills of Mortality (Cuentas de Mortalidad) ya contenían
datos sobre los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt
compiló documentos que abarcaban treinta años, mediante los cuales efectuó
predicciones sobre el número de personas que morirían de diversas enfermedades, así
como de las proporciones de nacimientos de hombres y mujeres que cabía esperar. El
trabajo de Graunt, condensado en su obra Natural and political observations… made upon
the Bills of Mortality (Observaciones políticas y naturales…hechas a partir de las Cuentas de
Mortalidad), fue un esfuerzo de inferencia y teoría estadística.

1691 Gaspar Neumann, un profesor alemán que vivía en Breslau, se propuso destruir la
antigua creencia popular de que en los años terminados en 7 moría más gente que en los
restantes, y para lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad.
Después de revisar miles de partidas de defunción, pudo demostrar que en tales años no
fallecían más personas que en los demás.

Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley,


descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana.
Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las
compañías de seguros.

1760 Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la


palabra estadística, que extrajo del término italiano statista (estadista). Creía, y con
sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del
gobernante consciente. La raíz remota de la palabra se halla en el término latino s t a t u s,
que significa “estado” o “situación”. Esta etimología aumenta el valor intrínseco de la
palabra por cuanto que la estadística revela el sentido cuantitativo de las más variadas
situaciones.
FUENTE: Freedman, D. (1999). «From association to causation: Some remarks on the
history of statistics». Statistical Science 14 (3): 243-258. doi:10.1214/ss/1009212409.
(Revised versión, 2002).
Hald, Anders (2003). A History of Probability and Statistics and Their Applications before
1750. Hoboken, NJ: Wiley. ISBN 0-471-47129-1.

3
Gestión Curricular
Asignatura: Estadística general

ESTADÍSTICA

Propósito:
 Define la estadística e identifica los tipos de datos en situaciones cotidianas.

SESIÓN 1: INTRODUCCIÓN A LA ESTADÍSTICA

1 DEFINICIÓN.
La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a
individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden
deducir algunos significados precisos o algunas previsiones para el futuro.
La estadística, en general, es la ciencia que trata la recopilación, la organización, la
presentación, el análisis y la interpretación de datos numéricos con el fin de realizar una toma
de decisiones más efectiva.

2 UTILIDAD E IMPORTANCIA.

La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para
interpretar la información obtenida, que puede ser aprovechada para demostrar la evolución
de un fenómeno a través de cierto tiempo. En Perú, el Instituto Nacional de Estadística e
Informática (INEI) se encarga de recabar información estadística y geográfica de todo el país,
en diferentes áreas y contextos. Los datos que publica sirven para dar a conocer, a cualquier
persona, la situación en la que se encuentra el área de donde se obtuvo la información. Los
métodos estadísticos se utilizan prácticamente en investigaciones de todas las áreas de
conocimiento, tanto en el ámbito académico, como en el profesional y laboral; en todos ellos
la finalidad es poder resolver un problema, entendiendo que un problema queda definido
como la diferencia entre lo real y lo deseado, en donde la estadística muestra la realidad
para que el investigador pueda analizar sus deseos y con ello tomar una decisión.

3 CLASES DE ESTADISTICA.

a) Estadística descriptiva.
Se orienta en la presentación y clasificación de los datos obtenidos de la población que
se analiza, es decir, describe datos. Esta aplicación de la estadística busca plantear y
resolver problemas específicos y/o hacer previsiones a partir de los datos de una muestra,
dado que es muy difícil estudiar a la población completa. Esta rama de la estadística
concluye a partir de los datos, como la estimación de un resultado.

4
Gestión Curricular
Asignatura: Estadística general

b) Estadística inferencial.
Permite sacar conclusiones sobre una población a partir de una muestra, cuando es difícil
estudiar la población debido a su gran tamaño o que provenga de un proceso que no
se detiene, utilizando a la probabilidad cuando no se está seguro de la verdad.

4 TERMINOS UTILIZADOS EN LA ESTADISTICA.


a) Población:
Conjunto universal de elementos (personas, objetos, cosas, etc.) que contienen uno o
más características observables medibles de naturaleza cualitativa o cuantitativa.
A cada elemento de la población se denomina unidad elemental de observación o
unidad estadística (UE)
Ejemplo:
La población de estudiantes de la Universidad Continental.
En la que cada estudiante (UE) tiene características observables (cualitativas y
cuantitativas) tales como: Estado civil, lugar de procedencia, preferencias, peso, talla,
rendimiento académico, etc.
b) Muestra:
Es una parte o un subconjunto representativo de la población seleccionada mediante
técnicas de muestreo, con el fin de obtener información acerca de la población de la
cual proviene.
Ejemplo:
La muestra de estudiantes del III ciclo de la facultad de Arquitectura de la Universidad
“Continental”.
c) Datos estadísticos:
Son números o medidas que han sido recogidos como resultado de observaciones, los
que se pueden ser comparados, analizados e interpretados.
Ejemplo:
Notas vigesimales: 00, 04, 08, 10, 15 20
Peso: 2kg, 15kgf, 45,6kg, 80N, etc.
d) Variable estadística:
Es cada una de las características definida en la población por el investigador, que
pueden tomar dos o más valores (cualidades o números). Se representan con una letra
del alfabeto: X, Y, Z, etc.
Ejemplo:
En la población formada por los empleados de la Universidad “Continental”, algunas
variables estadísticas definidas son:

5
Gestión Curricular
Asignatura: Estadística general

VARIABLES (características) VALORES (cualitativo o cuantitativo)


X: genero Masculino, femenino
Y: estado civil Soltero, casado, viudo, divorciado
Z: peso en kg 0, 1, 2, 3, 4,……………..
W. número de hijos 0, 1, 2, etc
P: ingresos mensuales Números reales positivos

Clases de variables:
Variable cualitativa:
Son las cualidades, aquí no se pueden realizar operaciones matemáticas.
Ejemplo:
Género: masculino, femenino.
Profesión: docente, abogado, ingeniero, etc.
Estado civil: soltero, casado, viudo, etc.
Es decir, las variables cualitativas se refieren a características o cualidades que no
pueden ser medidas con números. Podemos distinguir dos tipos:
Variable cualitativa nominal:
Presenta modalidades no numéricas que no admiten un criterio de orden.
Ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado,
divorciado y viudo.
Variable cualitativa ordinal:
Presenta modalidades no numéricas, en las que si admite un orden.
Ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa:
Son valores que se obtienen por medición o conteos, aquí se pueden realizar
operaciones matemáticas.
Ejemplo:
N° de estudiantes.
Temperatura,
N° de hijos,
Ingresos mensuales, etc.
Dentro de las variables cuantitativas se encuentran las variables: discretas y
continuas.

6
Gestión Curricular
Asignatura: Estadística general

Variable cuantitativa discreta:


Estas variables no admiten ningún valor entre dos valores consecutivos fijos.
Ejemplo:
N° de hijos: una familia puede tener 0, 1, 2, 3…..hijos,
No puede tener 1.5 o 3.7 hijos.

Variable cuantitativa continua:


Admite cualquier valor de un intervalo considerado o entre dos valores dados, en
la práctica los valores numéricos de las variables continuas siempre son valores
aproximados.
Ejemplo:
Estatura o talla en metros, puede ser: 1.20; 1.45; 1.75; etc
Peso en kilogramos, puede ser: 50; 50.12; 50.20; 51; etc.
Aproximados y redondeados.

e) Escalas de medición:

ESCALA DEFINICIÓN EJEMPLOS


Son aquellas variables cualitativas que Color de
establecen la distinción de los elementos en ojos, género,
NOMINAL
diversas categorías (nombres, etiquetas), sin etc.
implicar algún orden entre ellas
Aquellas variables cualitativas que implican Grado de
orden entre sus categorías, pero no grados Instrucción,
de distancia igual entre ellas, están referidas grado de
ORDINAL
a un orden de jerarquía, donde las satisfacción
categorías expresan una posición de orden. de los
clientes, etc.
Son aquellas variables cuantitativas que Temperatura
suponen a la vez orden y grados de Coeficiente
INTERVALO distancia iguales entre las diversas de
categorías, pero no tienen origen natural, inteligencia
sino convencional, tiene un cero relativo.
Estas variables comprenden a la vez todos Edad, peso,
los casos anteriores, distinción, orden, ingresos,
RAZÓN distancia y origen único natural; el valor se producción,
expresa con un número real tiene un cero etc.
absoluto.

4 REDONDEO DE DATOS:
Consiste en aproximar un número a su valor cercano.
Casos:
a) Cuando la primera cifra eliminada sea menor de 5, la última cifra a redondear debe
mantenerse igual.

7
Gestión Curricular
Asignatura: Estadística general

Ejemplos:
12.743 redondeando a dos decimales, queda 12.74
85.613 redondeando a un decimal, queda 85.6
b) Cuando la primera cifra eliminada es mayor de 5, la última cifra a redondear debe
aumentar en uno.
Ejemplos:
1.658 redondeando a dos decimales, queda 1.66
124.869 redondeando a un decimal, queda 124.9
Según ITINTEC (Instituto de Investigación Tecnológica Industrial y de Normas Técnicas)
considera un caso especial (c), cuando la cifra a eliminar es cinco.
c) Cuando la primera cifra eliminada sea 5, la última cifra retenida debe incrementarse en
una unidad si este es impar, debe mantenerse igual si la última cifra retenida es par o
cero.
Ejemplos:
12.475 redondeando a dos decimales, queda 12.48
14.425 redondeando a dos decimales, queda 14.42
24.205 redondeando a dos decimales, queda 24.20

Problemas Desarrollados

En los ejercicios 1 al 4 determine si el valor dado es un estadístico o un parámetro.


1) Tamaño de la familia. Se selecciona una muestra de hogares y el número promedio (media)
de personas por familia es de 2,58 (según datos de la Oficina censal peruana).
2) Política. En la actualidad, el 42% de los gobernadores regionales del Perú son de izquierda.
3) Titanic. En un estudio de los 2223 pasajeros del “Titanic”, se encontró que 706 sobrevivieron
cuando se hundió.
4) Audiencia televisiva. Se selecciona una muestra de ciudadanos peruanos y se descubre que
la cantidad de tiempo promedio (media) que ven la televisión es de 4,6 horas al día

Respuestas:
1.Estadístico 2. Parámetro 3. Parámetro 4. Estadístico
5) Determine si la variable es cualitativa o cuantitativa y señale si son discretas o continuas.
a) Lugar de residencia
b) Número de vecinos de un edificio.
c) Profesiones de empleados.
d) Número de llamadas telefónicas.
e) Consumo de gasolina cada 200 km.

8
Gestión Curricular
Asignatura: Estadística general

Respuestas:
a. Cualitativo b. Cuantitativo c. Cualitativo d. Cuantitativo e. Cuantitativo
discreto discreto continuo

Problemas Propuestos

1. Identificar si cada una de las siguientes situaciones que se presenta a continuación


representa a una población (P) o a una muestra (M). Luego señale cuántas corresponden a
muestras.
a) Alumnas egresadas del Colegio Estatal “Nuestra Señora del Rosario” durante el
año 2018………………………………………………………………………………………… ( )
b) Habitantes del distrito del Tambo…………………………………………………………. ( )
c) Habitantes de la primera cuadra de la Av. San Carlos………………………………. ( )
d) 50% de los alumnos del Curso de Estadística General de la UCCI…………………. ( )
e) 60 mujeres embarazadas atendidas en el Hospital “D.A. Carrión” ………………… ( )
f) 30 hojas de papel bond……………………………………………………………………... ( )
g) 15 reos del penal de Huamancaca Chico, inculpados por narcotráfico………… ( )
h) Niños nacidos en la Clínica “Ortega” durante los primeros cinco días del mes… ( )
i) 60% de las raciones atendidas en un negocio de comida…………………………. ( )
j) El CI de los estudiantes del 5to. Año de Secundaria de todos los colegios
estatales de Junín……………………………………………………………………………... ( )
k) Edad de 25 pacientes con VIH atendidos en Es Salud Junín………………………… ( )
l) Precio del pollo en 10 puestos de venta del Mercado Mayorista de Huancayo… ( )

2. Señale cuántas son variables cuantitativas continuas de la siguiente lista:


a) Número de cursos que usted está cursando este semestre.
b) Número de penales atajados por el arquero de la selección nacional durante todo el
campeonato Copa Libertadores.
c) Peso de sus compañeros de estudio con los que está llevando el curso de Estadística
General
d) Volumen de una botella de gaseosa comprada en el cafetín de la universidad.
e) Número de libros que usted leyó el año pasado.

3. Identificar la clasificación (variable cualitativa, cuantitativa discreta, cuantitativa continua)


a la que pertenecen las siguientes variables. Luego señale cuántas son variables cualitativas.
a) Número de estudiantes matriculados en la UCCI durante el período 2018 – 10
Variable: ______________________________

9
Gestión Curricular
Asignatura: Estadística general

b) Color de cabello.
Variable: ______________________________
c) Distancia que recorren dos personas caminando durante 5 minutos.
Variable: ______________________________
d) Número de cursos desaprobados por un grupo de alumnos.
Variable: ______________________________
e) Talla de recién nacidos.
Variable: ______________________________
f) Temperatura corporal.
Variable: ______________________________
g) Peso de los alumnos del Primer Semestre de la EAP de Psicología.
Variable: ______________________________

4. Identificar el nivel de medición que se utilizará para medir las siguientes variables. Luego
señale cuántas son de nivel de razón.
a) Número de personas que vive en el distrito de Orcotuna.
________________________________________

b) Temperatura medida en la escala de Fahrenheit


________________________________________

c) Edad en años cumplidos de un grupo de personas


________________________________________

d) Ingreso familiar (bajo, medio, alto)


________________________________________

e) Peso de recién nacidos.


________________________________________

f) Perímetro del cráneo de un cadáver


________________________________________

g) Estado civil de una persona


________________________________________

h) Clase social (baja, media, alta)


________________________________________

i) Simpatía política de un estudiante


________________________________________

10
Gestión Curricular
Asignatura: Estadística general

j) Marcas de cerveza
________________________________________

k) Velocidad de un vehículo (en Km/h)


________________________________________

l) Signo del zodiaco de una persona


________________________________________

m) Presión de aire de una llanta (en Nw/cm2)


________________________________________

5. Una marca de cloro líquido se vende en botellas cuya etiqueta dice contener 128 onzas (un
galón). Debido a múltiples quejas recibidas de consumidores, INDECOPI decide investigar si
la cantidad promedio en las botellas es realmente 128 onzas. En su puesto de inspector de
INDECOPI decide visitar algunos comercios y compra 100 botellas de esta marca de cloro
para corroborar las quejas de los consumidores. El resultado indica que la cantidad promedio
en las botellas es de 126 onzas.
Indique en términos del problema cuánto vale el parámetro.
_________________________________________________________________________________________
_________________________________________________________________________________________

Video de Apoyo

Video 1: Introducción a la Estadística.


https://youtu.be/njgYCEOdb6k

Video 2: Tipos de variables, escala de medición según tipo de variable, ejemplos


https://youtu.be/GOtwu5xiXnw

11
Gestión Curricular
Asignatura: Estadística general

Semana 2
DISTRIBUCIONES DE FRECUENCIAS
UNIDIMENSIONALES

Fisher, Ronald Aylmer, Científico, matemático, estadístico,


biólogo evolutivo y genetista inglés (1890-1962).
Realizó muchos avances en la estadística, una de las
contribuciones más importante fue la inferencia estadística que
descubrió en 1920.

John Graunt, A John Graunt se le atribuye haber iniciado la demografía formal. Sentó las
bases de la “regularidad estadística” al encontrar una “ley” para la mortalidad.
Edmund Halley, En 1693 retomó las tablas sobre la expectativa de vida de la población
diseñadas por John Graunt y las perfeccionó proponiendo algunas fórmulas para calcular
la «población estacionaria» y la manera como la edad está distribuida dentro de esa
población, lo cual fue un gran adelanto no sólo para los futuros estudios sobre demografía
sino para el cálculo actuarial aplicable en el negocio de los seguros de vida
Fisher, Ronald Aylmer, Científico, matemático, estadístico, biólogo evolutivo y genetista
inglés (1890-1962).
Realizó muchos avances en la estadística, una de las contribuciones más importante fue la
inferencia estadística que descubrió en 1920.

12
Gestión Curricular
Asignatura: Estadística general

JOHN GRAUNT Y LA PRIMERA TABLA DE MORTALIDAD


LECTURA

Comerciante bien relacionado en Londres, tuvo acceso a los boletines parroquiales de


mortalidad desde finales del siglo XVI, su base documental. En 1662 depositaba cincuenta
ejemplares de su Natural and Political Observations on the Bills of Mortality en la Royal Sciety,
que creó un comité para examinar la obra y emitió un informe favorable. El propio rey
Carlos II se interesó por la obra y le propuso como miembro.

En un momento en que el continente europeo era devastado por las epidemias, esta obra
resume análisis de las décadas anteriores, y aporta estadísticas vitales sobre los ciudadanos
de Londres, incluyendo las causas de mortalidad, la población total de Londres y la
monogamia, entre otros. Es pionero en calcular la razón de masculinidad al nacer, la tasa
bruta de mortalidad y detecta la estacionalidad de algunos fenómenos demográficos.
Añadió así profundidad al análisis, y la información numérica empezó a tener uso más allá
de los fines políticos y militares.

Pero su contribución más relevante aquí es la elaboración de la primera tabla de


mortalidad. Los registros de que disponía (Bills of mortality de la ciudad de Londres) sólo
especificaban la causa de muerte y el sexo de los fallecidos, pero no su edad. Graunt
dedujo la proporción de muertes anteriores a los 6 años sumando las muertes causadas por
enfermedades infantiles y la mitad de las causadas por sarampión y viruela. Esto sumaba
el 36% de todas las muertes, de manera que podía suponer una supervivencia del 64% a
esa edad. Pero el libro no explica cómo estimó el resto de filas de la tabla, lo que ha
supuesto un motivo de debate constante en la historiografía demográfica. Algunos creen
que simplemente inventó los números, pero otros piensan que Graunt ya estaba dando por
supuesta una ley constante de crecimiento exponencial (µ = .047) que, interpolada,
proporciona los valores intermedios de la tabla. Este supuesto de una fuerza de mortalidad
constante será el manejado poco después por Jan de Witt y Jan Hudde en sus tablas de
mortalidad).

Fuente: Camúñez Ruiz, José Antonio y Basulto Santos, Jesús. (2012) En el alumbramiento
de la estadística moderna: John Graunt. Septem Ediciones.
García González, Juan Manuel. 2011, Observaciones políticas y naturales hechas a partir
de los boletines de mortalidad. EMPIRIA. Revista de Metodología de Ciencias Sociales.
N.o 21, enero-junio, pp. 185-199. ISSN: 1139-5737.
Vilquin Éric (1978). Une édition critique en français de l’œuvre de John Graunt (1620-
1674). Présentation d’un ouvrage hors collection de l’INED. Population, 33e année, n°2,
pp. 413-423.

13
Gestión Curricular
Asignatura: Estadística general

VARIABLES
CUALITATIVAS
Propósito:
 Define las variables estadísticas e identifica los tipos de frecuencias en situaciones
cotidianas.

SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUALITATIVAS

1 ORGANIZACIÓN DE LOS DATOS.


Se entiende por organización de datos a la técnica de resumir y presentar datos, donde
determinado la técnica de agrupamiento de las observaciones, procedemos a su cálculo,
construyendo la tabla de frecuencias.
Posteriormente podremos visualizar tales frecuencias (características) de forma gráfica con el
diagrama o gráfico estadístico apropiado.

2 DISTRIBUCIÓN DE FRECUENCIAS.
Se denomina distribución de frecuencias a los cuadros o tablas numéricos de las variables
recopiladas para su fácil comprensión, interpretación y análisis.
En general una distribución de frecuencias o tabla de frecuencias es una ordenación en forma
de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Aquí se encuentran las diferentes frecuencias tales como:
La frecuencia absoluta.
Frecuencia relativa.
Frecuencia porcentual.
Frecuencias acumuladas

Estos datos organizados también pueden representarse en gráficos estadísticos.


Los datos ordenados y presentados en una tabla para su mejor interpretación y análisis, es
necesario procesarlos en los siguientes casos:
a) Tabla de frecuencias para datos no agrupados en intervalos de clase (variable discreta)
b) Tabla de frecuencias para datos agrupados en intervalos de clase (variable continua)

3 CLASES DE FRECUENCIAS.
1.1. FRECUENCIAS SIMPLES:

a) Frecuencia absoluta o simple (ni o fi)


Es representado como el número de veces que se repite el dato.
La suma de todas las frecuencias absolutas es igual al total (N) de datos observados

14
Gestión Curricular
Asignatura: Estadística general

Ejemplo:
En la siguiente tabla se representa las calificaciones obtenidas por los estudiantes del
III ciclo de Administración de la Universidad Continental, en la asignatura de
Estadística.

Xi ni

𝑋1 = 00 𝑛1 = 6

𝑋2 = 05 𝑛2 = 4

𝑋3 = 10 𝑛3 = 12

𝑋4 = 15 𝑛4 = 13

𝑋5 = 20 𝑛5 = 5

𝑁 = 40

Si n2 =4, se lee: hay 4 alumnos que tienen la nota de 05

b) Frecuencia relativa (hi)


Es el cociente de la frecuencia absoluta (n i) entre el número de observaciones
realizadas(N).
𝒏𝒊
𝒉𝒊 =
𝑵
La suma de todas las frecuencias relativas es igual a uno (1).
Ejemplo:
De el ejemplo anterior.

Xi ni hi

𝑋1 = 00 𝑛1 = 6 0.150 𝑛3 12
ℎ3 = = = 0.3
𝑋2 = 05 𝑛2 = 4 0.100 𝑁 40

𝑋3 = 10 𝑛3 = 12 0.300

𝑋4 = 15 𝑛4 = 13 0.325

𝑋5 = 20 𝑛5 = 5 0.125

𝑁 = 40 1.000

c) Frecuencia relativa simple porcentaje o porcentual (hi%)

𝒉𝒊 % = 𝒉𝒊𝒙𝟏𝟎𝟎%

La suma total de las frecuencias porcentuales es igual a cien (100%)

15
Gestión Curricular
Asignatura: Estadística general

Ejemplo:
Utilizando el ejemplo anterior.
Xi ni hi hi%

𝑋1 = 00 𝑛1 = 6 0.150 15.0%

𝑋2 = 05 𝑛2 = 4 0.100 10.0%

𝑋3 = 10 𝑛3 = 12 0.300 30.0%

𝑋4 = 15 𝑛4 = 13 0.325 32.5%

𝑋5 = 20 𝑛5 = 5 0.125 12.5%

𝑁 = 40 1.000 100.0%

Esta frecuencia, nos permite responder preguntas como:


¿Qué porcentaje de estudiantes tienen notas de…….?
1.2. FRECUENCIAS ACUMULADAS:

a. Frecuencia absoluta acumulada (Ni o Fi)


Es la suma de las frecuencias absolutas simples y la dada en cada categoría o fila.
Es decir:
N1 = n1
N2 = n1 + n2
N3 = n2 + n3
N4 = n3 + n4
……………………….etc.

b. Frecuencia relativa acumulada (Hi)


Es la suma sucesiva de las frecuencias relativas o simples anteriores y la dada.
Se define en cada fila como el cociente de la frecuencia absoluta acumulada (Ni) y
el número total de observaciones.
𝑵𝒊
𝑯𝒊 =
𝑵
H1 = h 1
H2 = h 1 + h 2
H3 = h 2 + h 3
H4 = h 3 + h 4
……………………..etc.

c. Frecuencia relativa acumulada porcentual (Hi% ó Pi%)


Es la suma sucesiva de las frecuencias relativas o simples porcentuales (hi%) anteriores
y la dada.
Se define en cada fila como:
𝑯𝒊% = 𝑯𝒊 𝒙 𝟏𝟎𝟎%

16
Gestión Curricular
Asignatura: Estadística general

d. Marca de clase (Xi ó mi)


Es el punto medio del intervalo:
𝑳𝒊+𝑳𝒔
𝒎𝒊 = 𝟐

Problemas Desarrollados

2. TABLAS DE FRECUENCIAS – VARIABLES CUALITATIVA.

Ejemplo:
En una encuesta de opinión sobre preferencias de bebidas gaseosas por su marca: coca
cola (K), inca cola (I), sprite (S). 30 consumidores dieron las siguientes respuestas.

S S K I I I S K K S I K I S S

I I S K K S S K I K I K S I I

a) Construir la distribución de frecuencias.


b) Graficar la distribución circular y en barras.
Solución
 Construimos la tabla de frecuencias:
CATEGORIA FRECUENCIA ÁNGULO PARA
FRECUENCIA FRECUENCIA
DE RELATIVA GRÁFICO
ABSOLUTA RELATIVA
VARIABLE PORCENTUAL CIRCULAR
Xi ni hi hi% ∝ = 𝒉𝒊𝒙𝟑𝟔𝟎𝟎
I 11 0.367 36.7 1320
S 10 0.333 33.3 120°
K 9 0.300 30.0 108°
TOTAL N =30 1.000 100.0 3600

 Determinando los ángulos para el gráfico circular.


Utilizamos:
∝ = 𝒉𝒊𝒙𝟑𝟔𝟎𝟎
Para la categoría “I”
∝= 𝒉𝒊𝒙𝟑𝟔𝟎𝟎= 0.367 x 3600 = 1320.
Para la categoría “S”
∝= 𝒉𝒊𝒙𝟑𝟔𝟎𝟎 = 0.333 x 3600 = 119.88 = 1200
Para la categoría “K”
∝= 𝒉𝒊𝒙𝟑𝟔𝟎𝟎 = 0.300 x 3600 = 1080

17
Gestión Curricular
Asignatura: Estadística general

ENCUESTA SOBRE LAS BEBIDAS GASEOSAS

K
I
30%
37%

S
33%

Representando la distribución en el gráfico de barras.

Bebidas gaseosas
40

30 36.7
33.3
30
NI%

20

10

0
I S K
XI

3. TABLA DE FRECUENCIAS – VARIABLE CUALITATIVA DISCRETA.

Para realizar el cuadro de distribución de frecuencias de una variable discreta, primero


ordenamos los “n” datos recopilados en forma ascendente.
Podemos representar los datos en tres gráficos: diagrama de barras, polígono de frecuencias
y gráfico de sectores circulares.

Ejemplo:
En una encuesta a 28 hogares, para saber sobre el número de hijos por familia (X), se
obtuvieron las siguientes respuestas.
4 3 2 0 2 1 6 9 4 3 1 2 0 2
3 2 1 4 3 2 3 4 3 2 4 2 9 6
Construir la distribución de frecuencias de la variable X.
Realizar la gráfica de barras.

18
Gestión Curricular
Asignatura: Estadística general

Solución
 Construimos la tabla de distribución de frecuencias del número de hijos por familia(X):
Xi ni hi hi%
0 2 0.07 7
1 3 0.11 11
2 8 0.29 29
3 6 0.21 21
4 5 0.18 18
6 2 0.07 7
9 2 0.07 7
TOTAL N = 28 1.00 100.00

 Realizamos el gráfico de barras (Xi y ni)

Número de hijos

9
6
4
3
XI

2
1
0

0 2 4 6 8 10
NI

Problemas Propuestos

1) En la Universidad Continental se ha realizado una encuesta 200 alumnos sobre el tipo de


atención de esta institución. El 32% afirma que está muy contento, el 40% está contento, el
23% no está contento, y el resto muy descontento. Elabore la tabla de frecuencias e
interprete.
2) Se ha llevado a cabo una encuesta a 27 empresas sobre el número de microcomputadoras
que tienen, encontrando los siguientes resultados:

5 7 9 7 8 5 2 4 3
6 8 7 6 9 8 4 6 4
8 5 9 6 7 9 4 7 5
3) Los directivos de “Real Plaza” realizan una prueba de mercado respecto a la facilidad de
navegación en su nuevo sitio web. Selecciona al azar 18 usuarios frecuentes y les solicita

19
Gestión Curricular
Asignatura: Estadística general

que califique la relativa facilidad para navegar como mala (M), buena (B), excelente (E) o
sobresaliente (S)”. Los resultados son los siguientes, elabore la tabla de frecuencias e
interprete.

B E S B M S
M S E S B E
M M B M E S
4) Para un estudio de accesibilidad, durante 30 días anotamos el número de plazas libres de
aparcamiento a las 5 de la tarde. Elabore la tabla de frecuencias e interprete.
1 1 5 0 5 3 0 3 3 2
2 3 1 1 2 1 2 0 1 3
2 1 5 0 2 2 1 3 3 2

5) Se realizó una encuesta a los trabajadores de la casa de préstamos “Perú Cash”, sobre el
número de hijos. Elabore la tabla de frecuencias e interprete.
2 1 2 4 1 3 2
3 2 3 2 0 3 4
3 2 1 3 2 1 2

Video de Apoyo

Video 1: Tipos de variables estadísticas | Cuantitativas Cualitativas


(https://www.youtube.com/watch?v=nCszHELuwxk)
Video 2: Tabla de frecuencias para variable cualitativa, diagrama de sectores
(https://www.youtube.com/watch?v=rsYCe73_q-I)

20
Gestión Curricular
Asignatura: Estadística general

Semana 3
DISTRIBUCIÓN DE FRECUENCIAS
UNIDIMENSIONALES
En el siglo XIX, la estadística entra en una nueva fase de su
desarrollo con la generalización del método para estudiar
fenómenos de las ciencias naturales y sociales. Galton (1.822-
1.911) y Pearson (1.857-1936) se pueden considerar como los
padres de la estadística moderna, pues a ellos se debe el paso
de la estadística deductiva a la estadística inductiva.

David Huntsberger: Utilizo la palabra estadística con números apilados en grandes


arreglos y tablas, de volúmenes de cifras relativas a nacimientos, muertes, impuestos,
poblaciones, ingresos, deudas, créditos y así sucesivamente.
Sebastián Muster, durante el siglo XVII aportó indicaciones más concretas de métodos
de observación y análisis cuantitativo y amplió los campos de la inferencia y la teoría
Estadística.
Gaspar Neumann, Sionista, teólogo y filólogo alemán, nacido en 1648 y muerto en 1715.
Sus principales obras son: Génesis linguae sanctae, Exodus linguae sanctae y Formulario
de todas las oraciones.

21
Gestión Curricular
Asignatura: Estadística general

ETAPAS DE DESARROLLO DE LA ESTADÍSTICA

La historia de la estadística está resumida en tres grandes etapas o fases.


LECTURA

1. Primera Fase: Los Censos:


Desde el momento en que se constituye una autoridad política, la idea de inventariar de
una forma más o menos regular la población y las riquezas existentes en el territorio está
ligada a la conciencia de soberanía y a los primeros esfuerzos administrativos.
2. Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política:
Las ideas mercantilistas extrañan una intensificación de este tipo de investigación. Colbert
multiplica las encuestas sobre artículos manufacturados, el comercio y la población: los
intendentes del Reino envían a París sus memorias. Vauban, más conocido por sus
fortificaciones o su Dime Royale, que es la primera propuesta de un impuesto sobre los
ingresos, se señala como el verdadero precursor de los sondeos. Más tarde, Bufón se
preocupa de esos problemas antes de dedicarse a la historia natural.

La escuela inglesa proporciona un nuevo progreso al superar la fase puramente


descriptiva. Sus tres principales representantes son Graunt, Petty y Halley. El penúltimo es
autor de la famosa Aritmética Política.

Chaptal, ministro del interior francés, publica en 1801 el primer censo general de
población, desarrolla los estudios industriales, de las producciones y los cambios,
haciéndose sistemáticos durante las dos terceras partes del siglo XIX.

3. Tercera Fase: Estadística y Cálculo de Probabilidades:


El cálculo de probabilidades se incorpora rápidamente como un instrumento de análisis
extremadamente poderoso para el estudio de los fenómenos económicos y sociales y en
general para el estudio de fenómenos “cuyas causas son demasiados complejas para
conocerlos totalmente y hacer posible su análisis”.

Fuente: Pearson, Egon (1978). The History of Statistics in the 17th and 18th Centuries against
the changing background of intellectual, scientific and religious thought (Lectures by Karl
Pearson given at University College London during the academic sessions 1921-1933).
Nueva York: MacMillanPublishng Co., Inc. p. 744. ISBN 0-02-850120-9.

Salsburg, David (2001). The Lady Tasting Tea: How Statistics Revolutionized Science in
the Twentieth Century. ISBN 0-7167-4106-7.
Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty
before 1900. Belknap Press/Harvard University Press. ISBN 0-674-40341-X.

22
Gestión Curricular
Asignatura: Estadística general

VARIABLES
CUANTITATIVAS
Propósito:
 Organizar datos en una tabla de distribución de frecuencias para variables
cuantitativas continuas.

SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUANTITATIVAS

Este cuadro se usa cuando la variable cuantitativa es continua o cuando el número de valores
distintos de una variable discreta es muy grande (N > 20).

1. RECOMENDACIONES:
 Agrupar los datos en no más de 20 intervalos ni menos de 5
 Los intervalos deben tener igual amplitud.
2. PASOS:
1° Identifique el dato mayor y dato menor.
Dato mayor = Xmax
Dato menor = Xmin
2° Hallamos el rango o recorrido (R).
R = Xmax – Xmin
3° Hallamos el número de intervalos (K).
 Si: n ≥ 10, por la Regla de Sturges

K = 1 + 3.322 log(n)
 Por la Ley de Portugal:
 Si: 25 ≤ n ≤ 400

K = ξ𝒏

 Si: 50 < n ≤ 100


K = 1. 8914 + 3.991 log(n)

 Si: n ≤ 50

K = 1 + 3.322 log(n)
 Si: n > 100

K = 2.7560 + 5.8154 log(n)

23
Gestión Curricular
Asignatura: Estadística general

4° Hallamos la amplitud o la longitud del intervalo de clase (C):


𝑹
𝑪=
𝑲
El producto R = K.C debe ser el mínimo y que cubra el recorrido de la variable (K.C
≥ R), es decir primero se considera el producto igual al rango, si no hay este número
se considera el mayor más cercano al rango.
Si los datos de la muestra (n) son enteros, entonces C debe ser entero
Si los datos de la muestra (n) tienen uno o dos decimales, entonces C debe tener
uno o dos decimales.
5° Hallamos los intervalos:
Si ya se conoce el Xmin, K y C
Utilizamos la siguiente fórmula:
𝑰𝒌 = [𝑿𝒎𝒊𝒏 + (𝒌 − 𝟏). 𝑪 − 𝑿𝒎𝒊𝒏 + 𝒌. 𝑪]
Ejemplo:
Las calificaciones obtenidas por un grupo de 45 estudiantes en una prueba escrita de
estadística son:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60

Construya la tabla de distribución de frecuencias.


Solución
Realizando los pasos estudiados:
1° Identifiquemos el dato mayor y dato menor
Dato mayor = Xmax = 89
Dato menor = Xmin = 26
2° Hallamos el rango (R)
R = Xmax – Xmin = 89 – 26 = 63
3° Hallamos el número de intervalos (K)
Si: n = 45
Utilizamos la Ley de Portugal
Si: n ≤ 50 K = 1 + 3.322 log(n)
K = 1 + 3.322 log(45)
K = 1 + 3.322(1.6532)
K = 6.4919

Entonces los posibles valores de K = 6, 7 ó 8

24
Gestión Curricular
Asignatura: Estadística general

4° Hallamos la amplitud o la longitud del intervalo de clase (C):


Utilizamos la siguiente fórmula:
𝑅
𝐶=
𝐾

Como “K” tiene tres posibles valores: (6, 7 ó 8), hallamos tres posibles “C”
𝑅 63
 𝐶1 = = = 10.5 = 11 aplicando R = K.C =6.11 = 66
𝐾 6
𝑅 63
 𝐶2 = = =9 aplicando R = K.C =7.9 = 63 cumple
𝐾 7

(K.C ≥ R)
𝑅 63
 𝐶3 = = = 7.875 = 8 aplicando R = K.C = 8.8 = 64
𝐾 8

Entonces:
Organizamos una tabla de 7 intervalos (K = 7)
Con amplitud de 9 (C = 9)

5° Determinando los extremos de los intervalos [𝑳𝒊 − 𝑳𝑺 ]


Si: Xmin = 26 C=9 K=7
I1 = [Xmin − Xmin + C[ = [26 − 26 + 9[ = [26 − 35 [
I2 = [Xmin + C − Xmin + 2C[ = [26 + 9 − 26 + 2.9[ = [35 − 44 [
I3 = [Xmin + 2C − Xmin + 3C[ = [26 + 2.9 − 26 + 3.9[ = [44 − 53 [
..……….=…………………
………………..=………………………...
Entonces el último intervalo será:
I7 = [Xmin + 6. C − Xmin + 7. C[ = [26 + 6.9 − 26 + 7.9[ = [80 − 89 [

6° Construimos la tabla de distribución de frecuencias:

Frecuencias simples
Intervalos
absolutas relativas porcentaje
[𝑳𝒊 − 𝑳𝑺 [ ni hi h i%
[26 − 35[ 1 0.023 2.3
[35 − 44[ 4 0.089 8.9
[44 − 53[ 5 0.111 11.1
[53 − 62[ 14 0.311 31.1
[62 − 71[ 14 0.311 31.1
[71 − 80[ 5 0.111 11.1
[80 − 89] 2 0.044 4.4
Total N = 45 1.000 100.0

25
Gestión Curricular
Asignatura: Estadística general

HISTOGRAMA

16
14
14 14
12
10
8
NI

6
4 5 5
4
2
1 2
0
26 - 35 35 - 44 44 - 53 INTERVALOS
53 - 62 62 - 71 71 - 80 80 - 89

POLÍGONO DE FRECUENCIAS
16
14 14 14
12
10
8
NI

6
5 5
4 4
2 2
1
0
26 - 35 35 - 44 44 - 53 53 - 62 62 - 71 71 - 80 80 - 89
INTERVALOS

Problemas Desarrollados

1. Los siguientes datos son los pesos en kg de 30 estudiantes del Programa BECA 18, atendidos
en el mes de diciembre del 2017, en el consultorio de nutrición del Hospital ESSALUD -
HUANCAYO:

75.8 69.3 96.2 86.3 99.8 59.4 65.5 76.4


84.6 72.2 74.1 76.0 86.5 65.0 86.2 68.3
70.2 61.8 58.4 69.2 68.4 76.5 81.0 65.9
68.3 75.0 67.3 82.2 72.1 69.0

Determine el cuadro de distribución de frecuencias.

26
Gestión Curricular
Asignatura: Estadística general

Solución
 Identifique el dato mayor y dato menor
Dato mayor = Xmax = 99.8
Dato menor = Xmin = 58.4
 Hallamos el rango o recorrido (R)
R = Xmax – Xmin = 99.8 – 58.4 = 41.4
 Hallamos el número de intervalos (K)
Si: n = 30
 Utilizamos la Ley de Portugal
Si: n ≤ 50 K = 1 + 3,322 log(n)
K = 1 + 3,322 log (30)
K = 5.90
Los posibles valores de: K = 5, 6 ó 7
 Hallamos la amplitud o la longitud del intervalo de clase (C):
𝑅
𝐶=
𝐾
𝑅 41.4
 𝐶1 = = = 8.28 = 8.3 aplicando R = K.C = 5 x 8.3 = 41.5
𝐾 5
𝑅 41.4
 𝐶2 = = = 6.9 aplicando R = K.C =6 x 6.9 = 41.4
𝐾 6
𝑅 41.4
 𝐶3 = = = 5.91 = 5.9 aplicando R = K.C = 7 x 5.9 = 41.3
𝐾 7
Organizamos una tabla de 8 intervalos (K = 6)
Con amplitud (C = 6.9)
 Determinemos los extremos de los intervalos [𝑳𝒊 − 𝑳𝑺 ]
Si: Xmin = 58.4 C = 6.9 K=6
I1 == [58.4 − 58.4 + 6.9[ = [58.4 − 65.3[
I2 = [58.4 + 6.9 − 58.4 + 2. (6.9)[ = [65.3 − 72.2 [
I3 = [58.4 + 2. (6.9) − 58.4 + 3. (6.9)[ = [72.2 − 79.1[
I4 = [58.4 + 3(6.9) − 58.4 + 4(6.9)[ = [79.1 − 86.0[
I5 = [58.4 + 4(6.9) − 58.4 + 5(6.9)[ = [86.0 − 92.9[
I6 = [58.4 + 5(6.9) − 58.4 + 6(6.9)[ = [92.9 − 99.8[

Li - Ls ni hi hi% Ni Hi Hi%
[58.4 − 65.3[ 4 0.13 13 4 0.13 13
[65.3 − 72.2 [ 11 0.37 37 15 0.50 50
[72.2 − 79.1[ 7 0.23 23 22 0.73 73
[79.1 − 86.0[ 3 0.10 10 25 0.83 83
[86.0 − 92.9[ 3 0.10 10 28 0.93 93
[92.9 − 99.8[ 2 0.07 7 30 1.00 100
N = 30 1.00 100

Problemas Propuestos

1. Se ha llevado a cabo un estudio para evaluar los volúmenes de venta (miles de soles por día)
de 24 establecimientos comerciales de Huancayo y se encontraron los siguientes resultados.
Elabore la tabla de frecuencias e interprete.

27
Gestión Curricular
Asignatura: Estadística general

11,7 5,7 10,1 8,5 6,4 2,1


9,1 3,7 5,3 7,8 4,4 9,8
7,4 12,1 5,4 7,4 3,2 1,5
8,4 6,1 5,7 4,7 5,2 4,6

2. En la fábrica de SAZON LOPESA se hizo un estudio sobre el peso (kg) de los trabajadores con
el fin de establecer una orientación sobre nutrición y buena salud. Los resultados fueron los
siguientes: Elabore la tabla de frecuencias e interprete.
60 84 112 120 72 61
70 74 68 90,5 81 75
84 64,2 118 84 96,4 65
84 65 97,5 82 98 62

3. Las calificaciones finales del curso de ESTADISTICA donde las notas están sobre 10 son los
siguientes. Elabore la tabla de frecuencias e interprete.
4,5 8,0 8,5 7,5 6,5 3,5 6,0
4,5 4,5 8,5 8,5 10,0 7,0 6,5
9,5 7,0 6,0 8,5 6,5 6,5 8,5

4. Elabore la tabla de frecuencias e intérprete del registró de tiempo en minutos que demoran
30 estudiantes para ejecutar una tarea, resulto los siguientes datos:

21.3 15.8 18.4 22.1 19.4 15.8 26.4 17.3 11.2 23.4

26.8 22.7 18.0 20.5 11.0 18.2 23.6 24.6 20.5 16.6

8.3 21.9 12.3 23.3 13.4 17.9 12.3 13.4 15.8 19.5

5. La puntuación final en la asignatura de Estadística de 80 estudiantes en la UC, se registra en


la siguiente tabla:

68 84 75 82 68 90 62 88 76 93

73 79 88 73 60 93 71 59 85 75

61 65 75 87 74 62 95 78 63 72

66 78 82 75 94 77 69 74 68 60

96 78 89 61 75 95 60 79 83 71

79 62 67 97 78 85 76 65 71 75

65 80 73 57 88 78 62 76 53 74

86 67 73 81 72 63 76 75 85 77

Construya el cuadro de distribución de frecuencias según los pasos estudiados.

28
Gestión Curricular
Asignatura: Estadística general

Video de Apoyo

Video 1: Variables Estadísticas Cualitativas y Cuantitativas, Nominales y Ordinales, Discretas


y Continuas
(https://www.youtube.com/watch?v=Tb3sgUSd2SQ)

Video 2: Variables Discretas y Continuas - Ejemplos y Ejercicios Resueltos


(https://www.youtube.com/watch?v=fMW5S6JdMzg&list=PL3KGq8pH1bFSLAzS3dccWo7Lgu
caj09Km&index=3&t=0s)

29
Gestión Curricular
Asignatura: Estadística general

Semana 4
GRÁFICOS ESTADÍSTICOS
Los gráficos son medios popularizados y a menudo
los más convenientes para presentar datos, se
emplean para tener una representación visual de la
totalidad de la información. Los gráficos estadísticos
presentan los datos en forma de dibujo de tal modo
que se pueda percibir fácilmente los hechos
esenciales y compararlos con otros.

William Playfair, Ingeniero mecánico y economista político escocés. Trabajó más de 36 años
en el diseño de gráficos estadísticos. Se le considera pionero en el uso del gráfico lineal para
representar series temporales, y fue el creador del gráfico circular, de sectores y de barras.
Michael Van Langren: recogió las distintas estimaciones que se habían hecho de la distancia
que separa Toledo de Roma (12 en total).
C. Joseph Priestley: Utilizo gráficos estadísticos, principalmente mapas destacados en los
años 1700 – 1799.

30
Gestión Curricular
Asignatura: Estadística general

GRÁFICOS ESTADISTICA
Cuando se hace un estudio estadístico se obtiene una gran cantidad de datos numéricos.
Para tener una información clara y rápida de lo obtenido en el estudio se han creado las
LECTURA

gráficas estadísticas.

Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio


para informar basado en los datos recopilados. La eficacia con que se pueda realizar tal
proceso de información dependerá de la presentación de los datos, siendo la forma gráfica
uno de los más rápidos y eficientes, aunque también uno de los que más pueden ser
manipulados o ser malinterpretados si no se tienen algunas precauciones básicas al realizar
las gráficas.

Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno
de ellos de acuerdo al tipo de información que se está usando y los objetivos que se
persiguen al presentar la información.

Entonces, algunas consideraciones que conviene tomar en cuenta al momento de realizar


cualquier gráfica a fin de que la información sea transmitida de la manera más eficaz
posible y sin distorsiones son:

El eje que represente a las frecuencias de las observaciones (comúnmente el vertical o de


las ordenadas) debe comenzar en cero (0), de otra manera podría dar impresiones erróneas
al comparar la altura, longitud o posición de las columnas, barras o líneas que representan
las frecuencias.
La longitud de los espacios que representan a cada dato o intervalo (clase) en la gráfica
deben ser iguales.
El tipo de gráfico debe coincidir por sus características con el tipo de información o el
objetivo que se persigue al representarla, de otra manera la representación gráfica se
convierte en un instrumento ineficaz, que produce más confusión que otra cosa,
innecesario o productor de malinterpretaciones.
Por ejemplo, si se desea representar la proporción de población masculina en un país
conviene más usar una gráfica de pastel o circular que una gráfica de barras al compararla
contra la población femenina; por un lado se puede apreciar dicha proporción, por el otro
se aprecia cuál de las dos poblaciones es mayor.

Hay un punto que conviene remarcar: existe software que permite la construcción rápida y
eficiente de gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán
bonita, bien delineada, bien coloreada o bien presentada esté una gráfica, si no se han
tomado en cuenta consideraciones de este tipo que tienen que ver más sobre el objetivo
de estas herramientas y la Estadística: la transmisión eficiente de la información.

Hay muchos tipos de gráficas estadísticas. Cada una de ellas es adecuada para un estudio
determinado, ya que no siempre se puede utilizar la misma para todos los casos. Tienen una
estructura distinta, lo cual les permite ser utilizados para diferentes objetivos, y es que la
mayoría de las veces utilizan datos o variables distintos.
G
FUENTE: Stigler, Stephen M. (1999) Statistics on the Table: The History of Statistical
Concepts and Methods. Harvard University Press. ISBN 0-674-83601-4

31
Gestión Curricular
Asignatura: Estadística general

GRÁFICOS
ESTADÍSTICOS
Propósito:
 Construye gráficos estadísticos, analiza e interpreta los resultados.

SESIÓN 7: GRÁFICOS ESTADÍSTICOS ESPECIALES.

Un gráfico estadístico es una representación visual de una serie de datos estadísticos, además es
una herramienta muy eficaz, ya que un buen gráfico:

 Capta la atención del lector, ilustrando el mensaje o tema que acompaña.


 Presenta la información de forma rápida, sencilla, clara y precisa.
 Facilita la comparación de datos.
 Destaca las tendencias y el comportamiento de los datos.
Entre las gráficas más utilizadas tenemos:

1. GRÁFICA DE BARRAS.
Cada barra rectangular corresponde a una modalidad, tiene una base constante, y su altura
puede ser medida en unidades de frecuencia relativa, absoluta o porcentual.

2. HISTOGRAMA.
Es una gráfica de barras donde la escala horizontal representa clases de valores de datos y la
escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de
frecuencia y no existe separación entre las barras.

32
Gestión Curricular
Asignatura: Estadística general

3. POLÍGONO DE FRECUENCIAS.
Utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de
los valores de las marcas de clase. Las alturas de los puntos corresponden a las frecuencias
de clase; en tanto que los segmentos lineales se extienden hacia la derecha y hacia la
izquierda, de manera que la gráfica inicia y termina sobre el eje horizontal.

4. OJIVA.
Es una gráfica lineal que representa frecuencias acumulativas. La ojiva utiliza fronteras de
clase a lo largo de la escala horizontal, y que la gráfica comienza con la frontera inferior de
la primera clase y termina con la frontera superior de la última clase. Las ojivas son útiles para
determinar el número de valores que se encuentran por debajo de un valor específico.

5. GRÁFICA DE PUNTOS.
Es aquella donde se marca cada valor de un dato como un punto a lo largo de una escala
de valores. Los puntos que representan valores iguales se apilan.

33
Gestión Curricular
Asignatura: Estadística general

6. GRÁFICO DE PARETO.
Con el Diagrama de Pareto se pueden detectar los problemas que tienen más relevancia
mediante la aplicación del principio de Pareto (pocos vitales, muchos triviales) que dice que
hay muchos problemas sin importancia frente a solo unos graves. Ya que, por lo general, el
80% de los resultados totales se originan en el 20% de los elementos.

7. GRÁFICO DE TALLO Y HOJAS.


Representa datos que separan cada valor en dos partes: el tallo (el dígito ubicado en el
extremo izquierdo) y la hoja (el dígito del extremo derecho). Las hojas se ordenan de forma
creciente y no en el orden en que aparecen en la lista original. Una gran ventaja de la gráfica
de tallo y hojas radica en que nos permite ver la distribución de los datos y, al mismo tiempo,
retener toda la información de la lista original. Otra ventaja es que la construcción de una
gráfica de tallo y hojas implica una forma fácil y rápida de ordenar datos (acomodarlos en
orden), y algunos procedimientos estadísticos requieren de un ordenamiento (como el cálculo
de la mediana o de los percentiles).

3. PICTOGRAMA.
También llamada gráfica de imágenes o pictografía. Es un diagrama que utiliza imágenes o
símbolos para mostrar datos para una rápida comprensión. En un pictograma, se utiliza una
imagen o un símbolo para representar una cantidad específica.

34
Gestión Curricular
Asignatura: Estadística general

4. GRÁFICA CIRCULAR.
También se utilizan para visualizar datos cualitativos. Presenta datos cualitativos como si fueran
rebanadas de un pastel. Para construir una gráfica circular, se divide el círculo en las
proporciones adecuadas. Cada sector corresponde a una modalidad y su correspondiente
ángulo en el centro.

5. DIAGRAMA DE DISPERSIÓN.
Es una gráfica de datos apareados (x, y), con un eje x horizontal y un eje y vertical. Los datos
se aparean de tal forma que cada valor de un conjunto de datos corresponde a un valor de
un segundo conjunto de datos. Para elaborar manualmente un diagrama de dispersión,
construya un eje horizontal para los valores de la primera variable, construya un eje vertical
para los valores de la segunda variable y después grafique los puntos. El patrón de los puntos
graficados suele ser útil para determinar si existe alguna relación entre las dos variables.

35
Gestión Curricular
Asignatura: Estadística general

6. PIRAMIDE DE POBLACIÓN.
Es una representación gráfica de la distribución por edad y sexo de una población en un
momento determinado. Nos pueden brindar información sobre migración de la población,
mortalidad, guerras, epidemias y muchas otras situaciones que se presentan en una
población. Además, que nos ayuda a comparar los resultados de diversos fenómenos.

7. CAJA Y BIGOTES.
Son una representación visual que describe varias características importantes, al mismo
tiempo, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles
y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o
verticalmente.

Problemas Desarrollados

1. La empresa “La Grande” registra las horas extras de los colaboradores en un año
determinado, obteniendo la siguiente tabla:

Intervalos Xi fi Fi hi Hi pi Pi
[38-44> 41 7 7 0.0795 0.0795 7.95% 7.95%
[44-50> 47 8 15 0.0909 0.1705 9.09% 17.05%
[50-56> 53 15 30 0.1705 0.3409 17.05% 34.09%
[56-62> 59 25 55 0.2841 0.6250 28.41% 62.50%
[62-68> 65 18 73 0.2045 0.8295 20.45% 82.95%
[68-74> 71 9 82 0.1023 0.9318 10.23% 93.18%
[74-80] 77 6 88 0.0632 1 6.82% 100.00%
TOTAL 88 1 100.00%
Elaborar el polígono de frecuencia y ojiva, e interpreta

36
Gestión Curricular
Asignatura: Estadística general

Solución:

Interpretación:
De los 88 colaboradores de la empresa “La Grande”,25 trabajan de 56 a menos de 62
horas haciendo el porcentaje en un 28,41%.

2. Determine la tabla de distribución de frecuencia del histograma que se muestra, donde se


observa la cantidad de columnas que tienen 21 construcciones:

Solución:

Intervalos Xi fi Fi hi Hi pi% Pi%


[10-15> 12.5 3 3 0.1429 0.1429 14.29 14.29
[15-20> 17.5 5 8 0.2381 0.3810 23.81 38.10
[20-25> 22.5 7 15 0.3333 0.7143 33.33 71.43
[25-30> 27.5 4 19 0.1905 0.9048 19.05 90.48
[30-35] 32.5 2 21 0.0952 1 9.52 100.00
TOTAL 21 1 100.00

3. A partir del grafico que se muestra elabore su tabla de distribución de frecuencia, donde se
muestran el consumo de 300 comensales de “Rustica”:

37
Gestión Curricular
Asignatura: Estadística general

Solución:

Ventas de
fi Fi hi Hi pi% Pi% ángulo
comida
sándwiches 120 120 0.4 0.4 40 40 144
ensalada 63 183 0.21 0.61 21 61 76
sopa 45 228 0.15 0.76 15 76 54
bebidas 27 255 0.09 0.85 9 85 32
postres 45 300 0.15 1 15 100 54
TOTAL 300 1 100 360

Problemas Propuestos

1. El siguiente cuadro muestra el total de inasistencia de los alumnos del mes, de tres facultades
distintas. Elabora un gráfico de barras. (elige otro gráfico que te parezca conveniente)
FACULTADES
MESES
Ingeniería Derecho Medicina
Julio 30 24 20
Agosto 35 30 38
Septiembre 19 25 25
Octubre 20 19 27
Noviembre 15 20 32
Diciembre 18 22 38

2. La Cámara de Comercio de Huancayo está interesada en conocer de qué manera vienen


desarrollando sus actividades los restaurantes y las pollerías del centro de la ciudad. Para ello
han tomado una muestra de 50 de estos establecimientos y ha revisado el libro de
reclamaciones de cada uno para contabilizar el número de quejas que presentaron los
clientes. Los datos se muestran a continuación:

38
Gestión Curricular
Asignatura: Estadística general

Número
fi Fi
de quejas
1 2 2
2 4 6
3 21 27
4 15 42
5 6 48
6 1 49
7 1 50
TOTAL 50

Construya el gráfico estadístico correspondiente tanto para las frecuencias absolutas


(diagrama de bastones) y las acumuladas (diagrama de escalones).

3. La empresa ELECTROCENTRO S.A. está llevando a cabo un estudio minucioso acerca de los
salarios que perciben los obreros de esta institución, con la finalidad de realizar mejoras
económicas entre su personal. La siguiente tabla muestra los salarios que perciben una
muestra de 26 de estos obreros:
Salarios Cantidad de obreros
2 [750 − 900 >
4 [900 − 1050 >
6 [1050 − 1200 >
7 [1200 − 1350 >
3 [1350 − 1500 >
3 [1500 − 1650 >
1 [1650 − 1800]

Grafique el histograma, polígono de frecuencia y ojiva “Menor que” de dicha tabla.

4. El peso en gramos de 30 objetos de un mismo tipo fue como sigue:


21,3 15,8 18,4 22,7 19,6 15,8 26,4 17,3 11,2 23,9
26,8 22,7 18,0 20,5 11,0 18,5 23,0 24,6 20,1 16,2
08,3 21,9 12,3 22,3 13,4 17,9 12,2 13,4 15,1 19,1

Construir un diagrama de tallo y hojas para los datos indicados, indicar las características de
la distribución.
5. En la siguiente tabla se muestran los resultados después de las evaluaciones a un grupo de
estudiantes de la carrera profesional de contabilidad. (utilizar dos tipos de gráficos)

ESTUDIANTES (GENERO)
CONDICIÓN
Varones Mujeres
Aprobado 65 96
Desaprobado 25 32
Retirado 10 8

39
Gestión Curricular
Asignatura: Estadística general

Video de Apoyo

Video 1: Diagrama de Barras, Polígono de Frecuencias y Gráfica Circular - Ejemplos y


Ejercicios
(https://youtu.be/L2F2VkzsZwU)
Video 2: Tabla de frecuencias para variable cualitativa, diagrama de sectores
(https://www.youtube.com/watch?v=rsYCe73_q-I)

40
Gestión Curricular
Asignatura: Estadística general

Unidad II

Resultado de Aprendizaje de la Unidad II:


Al finalizar la unidad, el estudiante será capaz de comparar e interpretar los
resultados de las distribuciones bidimensionales en acontecimientos de sus
actividades diarias.

ORGANIZACIÓN DE APRENDIZAJES

TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN


SEMANA N° 5 Actividad N° 5 Consolidado 1:
9. Evaluación de la primera Resuelven ejercicios de la primera - Ejercicios para identificar
unidad evaluación de Consolidado I alternativas de solución.
10. Distribuciones de Frecuencias relacionados con los temas de la
Bidimensionales. Datos unidad I. Evaluación parcial:
Actividad N° 6 - Evaluación individual de
cualitativos y mixtos.
Elabora tabla bidimensional de desarrollo teórico-práctico
Gráfico de barras agrupadas.
dos variables cualitativas y mixtas
SEMANA N° 6
e interpreta los resultados, a partir
11. Distribuciones de Frecuencias
de la encuesta realizada a sus
Unidimensionales: Variables
compañeros de clase.
cualitativas, grafico e
Actividad N° 7
interpretación. Gráficos:
Elabora tabla bidimensional de dos
sectores y barras.
variables cuantitativas, interpreta
12. Base de datos e variables la relación positiva o negativa,
cualitativas y cuantitativas utilizando la guía de trabajo.
SEMANA N° 7 Práctica calificada grupal
13. Distribuciones de Frecuencias Actividad N° 8
Unidimensionales Variables Realizan las interrogantes de la
cuantitativas, grafico e evaluación parcial.
interpretación. Gráficos:
histograma, ojiva, polígono de
frecuencias.
14. Distribuciones de Frecuencias
Unidimensionales: Variables
cuantitativas aplicando spss.
SEMANA N° 8
15. Gráficos estadísticos
especiales: Pareto, tallo y hoja,
pictograma, Otras gráficas.
16. Gráficos estadísticos
especiales: Pareto, tallo y hoja,
pictograma, otras gráficas con
spss - Excel.

41
Gestión Curricular
Asignatura: Estadística general

Semana 5
EVALUACIÓN DE LA PRIMERA UNIDAD
SESIÓN 9: EVALUACIÓN DE LA PRIMERA UNIDAD

Problemas de repaso

1. Coca-Cola. Coca-Cola Company tiene 366,000 accionistas y efectúa una encuesta


mediante la selección aleatoria de 30 accionistas de cada una de las 50 entidades de Estados
Unidos. Se registra el número de acciones de cada accionista de la muestra. a. ¿Los valores
obtenidos son discretos o continuos? b. Identifique el nivel de medición (nominal, ordinal, de
intervalo, de razón) de los datos muestrales. c. ¿Qué tipo de muestreo (aleatorio, sistemático,
de conveniencia, estratificado, por conglomerados) se usa? d. Si se calcula el número
promedio (la media) de acciones, ¿el resultado es un estadístico o un parámetro? e. Si usted
fuera el ejecutivo en jefe de Coca-Cola Company, ¿qué característica del conjunto de datos
consideraría usted que es extremadamente importante? f. ¿Qué es lo que está incorrecto al
evaluar la opinión de los accionistas enviando un cuestionario por correo, que éstos podrían
llenar y regresar por el mismo medio?

2. El Directorio y la Gerencia de la Universidad Continental han realizado un estudio para


conocer la opinión de los padres de familia de los estudiantes en general, respecto a las
nuevas carreras que se vienen ofertando. Para ello, durante la semana de matrículas se aplicó
una encuesta a 860 padres de familia elegidos aleatoriamente, dentro de las instalaciones del
campus universitario, donde se obtuvo como resultado que el 87% de los encuestados se
manifestaron en total acuerdo por la innovación en carreras profesionales que se viene
impulsando (las respuestas iban de “Totalmente en desacuerdo” a “Totalmente de acuerdo”).
De estudios anteriores se sabía que sólo el 55% de los padres de familia de los estudiantes de
esta casa superior de estudios apoyaban la iniciativa de fomentar nuevas carreras en años
pasados.
Del enunciado anterior, indique:
a) Población y parámetro: ________________________________________________________________
b) Muestra y estadístico: __________________________________________________________________
c) Variable: ______________________________________________________________________________
d) Tipo de variable: _______________________________________________________________________
e) Nivel de medición: _____________________________________________________________________
f) Unidad estadística: _____________________________________________________________________

42
Gestión Curricular
Asignatura: Estadística general

3. Las calificaciones finales del curso de ESTADISTICA GENERAL donde las notas están sobre 10 y
son los siguientes. Elabore la tabla de frecuencias e interprete.
4,5 8,0 8,5 7,5 6,5 3,5 6,0
4,5 4,5 8,5 8,5 10,0 7,0 6,5
9,5 7,0 6,0 8,5 6,5 6,5 8,5
4. Los sistemas de cómputo fallan por muchas razones, entre ellas las fallas de hardware o
software, errores del operador, sobrecargas del sistema mismo y a otras causas. La tabla
siguiente muestra los resultados obtenidos en un estudio acerca de las causas de fallas en una
muestra de 98 sistemas de cómputo. Usted debe priorizar entre las dos principales causas de
falla de los sistemas de cómputo. Elabore el gráfico apropiado que permita visualizar dicho
propósito.

TIPO DE FALLA FRECUENCIA


Hardware 9
Operador 20
Sobrecarga 55
Software 8
Otras 6

5. Como parte de un informe que deberán presentar al Ministerio de Trabajo, se ha tomado los
datos referentes a los sueldos mensuales de una muestra de empleados de la Municipalidad
Distrital de Huancayo. Los datos se muestran en la siguiente ojiva. Se pide reconstruir la tabla
y contestar: ¿Qué porcentaje de la muestra representan los empleados que perciben de S/.
900 a menos de S/. 1200?

43
Gestión Curricular
Asignatura: Estadística general

Semana 6
DISTRIBUCIONES DE FRECUENCIAS
BIDIMENSIONALES
La estadística bivariada trata de ir más allá
elaborando índices y resultados estadísticos en
términos de relaciones entre dos variables de interés,
así como de establecer inferencias sobre una
población a partir de datos que provienen de una
muestra (como, por ejemplo, en los estudios mediante
encuesta).

Francis
Gaston

Correlación

R. H.
Hooker

A. Francis Gaston: ideó el método conocido por Correlación, que tenía por
objeto medir la influencia relativa de los factores sobre las variables.
B. H. Hooker, que efectuaron amplios estudios sobre la medida de las
relaciones.

44
Gestión Curricular
Asignatura: Estadística general

Definición de bidimensional
LECTURA

El adjetivo bidimensional se utiliza para calificar a aquello que tiene dos dimensiones (2D).
Un cuerpo que se proyecta a lo largo y a lo ancho, por ejemplo, cuenta con dos
dimensiones. En cambio, si también tiene profundidad, se trata de un objeto con tres
dimensiones (3D) y recibe el calificativo de tridimensional.

Por lo general las dimensiones se definen a partir de la cantidad mínima de coordenadas


que se necesitan para la especificación de un punto cualquiera en ella. De este modo,
podemos afirmar que una línea es unidimensional: alcanza una sola coordenada para
ubicar un punto.

En el caso de los elementos bidimensionales, se requieren dos coordenadas para lograr la


especificación de un punto. Los polígonos, como los cuadrados o los triángulos, son
bidimensionales debido a que, para situar un punto, es necesario establecer la longitud y
la latitud. Siguiendo con esta lógica, la localización de un punto en un cuerpo
tridimensional (como un cubo) exige conocer tres coordenadas.

Cabe destacar que, aún en una superficie bidimensional, es posible simular un efecto
tridimensional. Una hoja de papel es bidimensional: sin embargo, apelando a la perspectiva,
es posible dibujar un cubo, dando una sensación de tridimensionalidad.

Dentro del ámbito de la electricidad podemos establecer que también se utiliza el término
que ahora nos ocupa. En concreto, se emplea para referirse a la característica que puede
tener un elemento conductor. Así, se establece que si es bidimensional es porque en una de
las direcciones del espacio es aislante mientras que en las otras dos podemos determinar
que cuenta con una mayor conductividad.

Además de todo lo indicado es necesario determinar que existe lo que se conoce como
diseño gráico bidimensional. Este es una disciplina que se sustenta en diseñar y darle forma
a figuras de dos dimensiones para diversos tipos de áreas. En concreto, para fotografías,
dibujos, pinturas, imágenes de ordenador…

Fuente: Julián Pérez Porto y María Merino. Publicado: 2016. Actualizado: 2018.
Definición de: Definición de bidimensional (https://definicion.de/bidimensional/)

45
Gestión Curricular
Asignatura: Estadística general

DATOS
CUALITATIVOS
Y MIXTOS
Propósito:
 Organiza y compara dos variables cualitativas y mixtas; elaborando sus respectivas
graficas e interpretando los resultados.

SESIÓN 11: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS CUALITATIVOS Y


MIXTOS.
Se entiende por distribuciones bidimensionales a la elaboración de tablas de frecuencia en
función de dos variables pareadas.
1. DATOS BIVARIADOS:
Valores de dos diferentes variables que se obtienen a partir del mismo elemento de
población.
Cada una de las dos variables pueden ser o cualitativas o cuantitativas. Como resultado,
los datos bivariados pueden formar tres combinaciones de tipos de variable:
 Ambas variables son cualitativas (atributos): Es frecuente que los datos se ordenen en
una tabulación cruzada o tabla de contingencia. Los resultados se presentan en un
gráfico de barras agrupadas.
 Una variable es cualitativa (atributo) y la otra es cuantitativa (numérico): Los valores
cuantitativos se ven como muestras separadas, con cada conjunto identificado por
niveles de la variable cualitativa. Sus resultados pueden mostrarse en un diagrama de
puntos o en un diagrama de cajas y bigotes con una escala común.
 Ambas variables son cuantitativas (ambas numéricas): Se acostumbra expresar
matemáticamente los datos como pares ordenados (x,y), donde “x” es la variable de
entrada (variable independiente) y “y” es la variable de salida (variable dependiente).
Se llaman “emparejados” o “apareados” porque para cada valor de “x” siempre hay
un valor correspondiente de “y” de la misma fuente. Sus resultados se presentan en un
diagrama de dispersión.
2. DISTRIBUCIONES ABSOLUTAS MARGINALES:
Dada una distribución de frecuencias bidimensionales, podemos obtener dos distribuciones
de frecuencias absolutas marginales, una con respecto a la variable “x” y la otra respecto
a la variable “y”.
Ejemplo:
Un grupo de estudiantes de la facultad de Ingeniería de la Universidad Continental están a
punto de iniciar sus prácticas pre profesionales en diferentes regiones de nuestro país (costa,

46
Gestión Curricular
Asignatura: Estadística general

sierra, selva). Se ha encuestado a un grupo de ellos para conocer su género y la región


elegida para llevar a cabo dichas prácticas. Los datos se muestran a continuación:
GÉNERO REGIÓN GÉNERO REGIÓN GÉNERO REGIÓN
M Sierra F Selva F Selva
F Selva M Sierra M Selva
M Sierra M Sierra F Selva
M Costa M Costa F Selva
F Selva F Costa M Costa
M Selva M Selva M Sierra
F Costa M Selva F Selva
F Selva M Sierra M Sierra
Organiza los datos en una tabla de contingencia (tabla cruzada). Luego elabore la
distribución de frecuencias marginales y construya su gráfico de barras agrupadas.
Solución:
a) Construimos la tabla considerando la variable “Género” en las filas y “Región” en las
columnas:

b) Completamos cada celda de la tabla con el número de veces que aparece cada dato
bivariado. Para ello contamos la cantidad de estudiantes de género masculino que
viajarán a la costa, que viajarán a la sierra y a la selva. Hacemos lo propio con las
estudiantes de género femenino. Luego sumamos para calcular los totales de fila y
columna. (4 / 24) x 100 = 16,67%

c) Elaboramos las tablas de frecuencias marginales:

47
Gestión Curricular
Asignatura: Estadística general

d) Se elabora el gráfico de barras agrupadas.

Problemas Desarrollados

1. Determine la tabla cruzada y el gráfico apropiado a la variable del siguiente conjunto de


datos:
SEXO ESTADO CIVIL
VARON SOLTERO(A)
MUJER CASADO(A)
VARON SOLTERO(A)
VARON CASADO(A)
MUJER VIUDO(A)
MUJER SOLTERO(A)
VARON SOLTERO(A)
MUJER CASADO(A)
VARON CASADO(A)
VARON CASADO(A)
VARON SOLTERO(A)
MUJER VIUDO(A)
MUJER SOLTERO(A)
VARON VIUDO(A)
MUJER CASADO(A)
VARON VIUDO(A)
MUJER CASADO(A)
MUJER SOLTERO(A)

48
Gestión Curricular
Asignatura: Estadística general

Solución

Aplicando el programa IBM SPSS Statistics Editor para obtener la tabla cruzada:

TABULACIÓN CRUZADA
ESTADO CIVIL
Total
SOLTERO(A) CASADO(A) VIUDO(A)
Recuento 4 3 2 9
VARON

% del total 22,2% 16,7% 11,1% 50,0%


SEXO

Recuento 3 4 2 9
MUJER

% del total 16,7% 22,2% 11,1% 50,0%

Recuento 7 7 4 18
Total
% del total 38,9% 38,9% 22,2% 100,0%

Graficando:

49
Gestión Curricular
Asignatura: Estadística general

Problemas Propuestos

1. La empresa PLAZA VEA como parte de su política de prestaciones de salud a sus


colaboradores, ha iniciado una campaña de prevención del cáncer pulmonar entre
fumadores. Para ello aplicó una encuesta en la que se preguntó, entre otras cosas, el género
y si es fumador. Las respuestas se muestran a continuación:

GÉNERO FUMADOR GÉNERO FUMADOR GÉNERO FUMADOR


M SÍ F SÍ F SÍ
F NO M NO M SÍ
F NO M NO F NO
F SÍ F SÍ M NO
M SÍ M NO F NO

a) Elabore una tabla de contingencia para organizar los datos, considerando frecuencias
absolutas y relativas conjuntas.
b) Elabore la distribución de frecuencias marginales para las variables “Género” y “Fumador”.
c) Construya el gráfico de barras agrupadas para presentar dicha tabla de contingencia.

2. Treinta estudiantes de nuestra universidad se identificaron y clasificaron al azar según dos


variables: Género (M/F) y Especialidad: Ingeniería (I), Administración (A), Derecho (D).

GENERO ESPECIALIDAD GENERO ESPECIALIDAD GENERO ESPECIALIDAD

F I F A F I
F A F I F A
F A M D M I
F D M A M A
M I M I F I

Elabore una tabla con tabulación cruzada o tabla de contingencia expresándola en


porcentajes del gran total, y conteste las siguientes preguntas:
a) ¿Qué porcentajes de estudiantes estudian derecho?
b) ¿Cuántos estudiantes estudian administración?
c) ¿Cuántos estudiantes estudian ingeniería y son del género femenino?
d) ¿Qué porcentaje de estudiantes estudian administración y son del género masculino?

3. Se está estudiando la relación que existe entre el grado de instrucción y el número de hijos
que tienen las mujeres de Huancayo. Para ello se ha entrevistado a un grupo de pobladoras
y los resultados se muestran a continuación:

50
Gestión Curricular
Asignatura: Estadística general

GDO. INST. Nº HIJOS GDO. INST. Nº HIJOS GDO. INST. Nº HIJOS


SIN INSTRU. 6 SUPERIOR 1 PRIMARIA 3
SECUNDARIA 4 SECUNDARIA 2 SUPERIOR 1
SECUNDARIA 3 SECUNDARIA 2 PRIMARIA 2
SUPERIOR 2 SECUNDARIA 3 SUPERIOR 2
SIN INSTRU. 5 SUPERIOR 2 PRIMARIA 3
SUPERIOR 1 SUPERIOR 2 SECUNDARIA 3

a) Construya una tabla de contingencia para organizar dicha información, mostrando


frecuencias absolutas y relativas conjuntas.
b) Elabore la distribución de frecuencias marginales para cada variable.
c) Elabore el gráfico de barras agrupadas que represente a la tabla creada.
d) ¿Qué conclusión puede usted obtener al analizar la información ahora que está
organizada?
4. Se han aplicado 3 métodos diferentes (Métodos: A, B y C) para la enseñanza de Análisis
Matemático en la facultad de Ciencias de la Empresa, luego de lo cual se aplicó una prueba
para medir el tiempo (en minutos) que los alumnos empleaban en resolver un conjunto de 20
ejercicios, siendo los resultados los siguientes:
Método A B B A C B B A C B B C B A B
Tiempo 15 8 10 18 15 11 9 10 11 8 10 10 12 15 8

Método B A C C B C A A B C A B B A C
Tiempo 11 14 10 11 11 10 10 15 9 14 17 9 10 11 12

a) Construya una tabla de contingencia que organice los datos.


b) Elabore la distribución de frecuencias marginales para cada variable en estudio.
c) ¿Qué conclusión puede usted obtener al analizar la tabla, respecto a la eficacia de los
métodos aplicados?
5. Se ha observado detenidamente el número de horas que dedican al estudio un grupo de
estudiantes de Ingeniería de la Universidad Continental y sus calificaciones en el curso de
Matemática. Los datos se muestran a continuación. Ordenar la información proporcionada
en un cuadro de distribución de frecuencias e indique: Las frecuencias absolutas y relativas
conjuntas, las frecuencias marginales. Finalmente elabore el diagrama de dispersión
correspondiente.

51
Gestión Curricular
Asignatura: Estadística general

Video de Apoyo

Video 1: Tablas Bidimensionales o de doble entrada 1. Distribución de frecuencias


bidimensionales.
(https://www.youtube.com/watch?v=0HFOqZqNF_I)

Video 2: Distribuciones de frecuencias bidimensionales 2 Medias y medias condicionales


(https://www.youtube.com/watch?v=uYumtU1wajk)

52
Gestión Curricular
Asignatura: Estadística general

Semana 7
DISTRIBUCIONES DE FRECUENCIAS
BIDIMENSIONALES
A finales del siglo XIX, Sir Francis Gaston ideó el método
conocido por Correlación, que tenía por objeto medir la
influencia relativa de los factores sobre las variables. De aquí
partió el desarrollo del coeficiente de correlación creado por
Karl Pearson y otros cultivadores de la ciencia biométrica como
J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron
amplios estudios sobre la medida de las relaciones.

John Graunt:

Compilación
estadística de
los recursos
nacionales
Sebastián
Muster:

A. John Graunt: fue un estadístico inglés a quien se considera el primer


demógrafo, el fundador de la bioestadística y el precursor de la epidemiología.
B. Sebastián Muster: realizó una compilación estadística de los recursos
nacionales, comprensiva de datos sobre organización política, instrucciones
sociales, comercio y poderío militar.

53
Gestión Curricular
Asignatura: Estadística general

LA PALABRA "ESTADÍSTICA" NORMALMENTE SE UTILIZA REFIRIÉNDOSE A DOS


SIGNIFICADOS DISTINTOS, A SABER:
LECTURA

1.- Colección de datos numéricos.


Este es el significado más común de la palabra estadística. Está sobreentendido que dichos
datos numéricos deben estar presentados de manera ordenada y sistemática. Una
información numérica cualquiera puede no constituir una estadística, para poder darle
este apelativo, los datos han de constituir un conjunto coherente, establecido de forma
sistemática y siguiendo un criterio de ordenación.
Tenemos muchos ejemplos de este tipo de estadísticas. El Anuario Estadístico publicado por
el Instituto Nacional de Estadística, El Anuario de Estadísticas del Trabajo, etc.
2.-Como ciencia.
Aquí, se entiende que
La Estadística estudia el comportamiento de los fenómenos de masas. Como todas las
ciencias, busca las características generales de un colectivo y prescinde de las particulares
de cada elemento. Por ejemplo, al investigar el sexo de los nacimientos, se inicia el trabajo
tomando un grupo numeroso de nacimientos y se obtiene después la proporción de
varones. Frecuentemente, enfrentamos fenómenos en los que difícilmente se predice el
resultado; así, no podemos dar una lista, con las personas que van a morir con una cierta
edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo,
etc. El objetivo de la estadística es detectar las regularidades que se encuentran en los
fenómenos de masa.
Población, elementos y caracteres.
Obviamente que todo estudio estadístico debe estar referido a un conjunto o colección
de personas o cosas. Este conjunto de personas o cosas es lo que se denomina población.
Las personas o cosas que forman parte de la población se denominan elementos. En el
sentido estadístico un elemento puede ser algo con existencia real, como un automóvil o
una casa, o algo más abstracto como la temperatura, un voto, o un intervalo de tiempo.
De igual forma, cada elemento de la población tiene una serie de características que
pueden ser objeto del estudio estadístico. Así por ejemplo si consideramos como elemento
a una persona, podemos distinguir en ella las siguientes características: Sexo, Edad, Nivel
de estudios, Profesión, Peso, Estatura, Color de pelo, etc.
Por lo tanto, de cada elemento de la población es posible estudiar uno o más aspectos
cualidades o caracteres.
La población puede ser según su tamaño de dos tipos:
Población finita: cuando el número de elementos que la forman es contable, por ejemplo,
el número de alumnos de un centro de enseñanza.
Población infinita: cuando el número de elementos que la forman es infinito, o tan grande
que pudiesen considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los
productos que hay en el mercado. Hay tantos y de tantas calidades que esta población
podría considerarse infinita.

Fuente: BERMISON ORTEGA, Russell Frank. (2006). El Nuevo Marketing. México: Pearson
Prentice Hall.

54
Gestión Curricular
Asignatura: Estadística general

DATOS
CUALITATIVOS
Propósito:
 Elabora la tabla bidimensional de dos variables cuantitativas e interpreta la relación
positiva o negativa.

SESIÓN 13: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS CUANTITATIVOS.


1. VARIABLES BIDIMENSIONALES.

Ambas variables son cuantitativas (ambas numéricas): Se acostumbra expresar


matemáticamente los datos como pares ordenados (x,y), donde “x” es la variable de entrada
(variable independiente) y “y” es la variable de salida (variable dependiente). Se llaman
“emparejados” o “apareados” porque para cada valor de “x” siempre hay un valor
correspondiente de “y” de la misma fuente. Sus resultados se presentan en un diagrama de
dispersión.

2. DIAGRAMA DE DISPERSIÓN:

También conocido como gráfico de dispersión, gráfico de puntos, diagrama de XY o diagrama


de dispersión, consiste en la representación gráfica de dos variables para un conjunto de datos.
En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan
entre sí o qué tan independientes son una de la otra. En este sentido, ambas variables se
representan como un punto en el plano cartesiano y de acuerdo a la relación que exista entre
ellas, definimos su tipo de correlación.

55
Gestión Curricular
Asignatura: Estadística general

Ejemplo:
Correlación lineal positiva: Temperatura y volumen
Correlación lineal negativa: Volumen y presión
No existe Correlación: inteligencia y la belleza.

Problemas Desarrollados

1. Los datos obtenidos al estudiar las variables X = “número de goles anotados” e Y = “número
de goles recibidos”, en 40 partidos jugados por el equipo campeón de la liga de fútbol sala,
son:
(5;4) (4;2) (3;1) (3;2) (6;3)
(4;2) (5;3) (4;2) (4;3) (3;1)
(3;3) (5;3) (6;4) (3;2) (4;2)
(3;2) (6;4) (3;1) (4;2) (5;3)
(4;2) (6;4) (4;2) (6;4) (4;4)
(5;3) (4;2) (5;3) (3;1) (2;2)
(1;1) (2;1) (4;2) (5;3) (5;3)
(6;4) (5;3) (2;2) (3;3) (3;2)
Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el
diagrama de dispersión.
Solución:
Construimos una tabla con tantas columnas como valores tome X y con tantas filas como
valores tome Y en la distribución. Si observamos los datos, X toma los valores 1, 2, 3, 4, 5 y 6, e
Y toma los valores 1, 2, 3 y 4. En este caso, la tabla constará de 6 filas y 4 columnas. − Hallamos
la frecuencia absoluta de cada par de valores de la variable (X, Y). Para ello contamos el
número de veces que se repite ese par de valores en la distribución y lo anotamos en la casilla
correspondiente. Así, por ejemplo, observa que el par (5, 4) aparece una sola vez; el (4, 2)
aparece diez veces; y el (6, 1), ninguna.
Tabla bidimensional

Frecuencias marginales

56
Gestión Curricular
Asignatura: Estadística general

N° de goles N° de goles
Frecuencia Frecuencia
marcados recibidos
1 1 1 6
2 3 2 15
3 10 3 12
4 11 4 7
5 9
6 6
Total 40 Total 40

Diagrama de dispersión

2. ¿Qué tipo de relación se muestra en los siguientes diagramas de dispersión?


a. Gráfico 1

Relación lineal positiva. A


medida que la variable en X
aumenta en valor, también lo
hace la variable en Y.

57
Gestión Curricular
Asignatura: Estadística general

b. Gráfico 2

Relación lineal negativa. A


medida que la variable en X
aumenta en valor, la variable
en Y disminuye.

c. Gráfico 3

No presentan relación

Problemas Propuestos

1. En una clase compuesta por 30 alumnos, se ha hecho un estudio sobre el número de horas
diarias de estudio X y el número de suspensos Y, obteniéndose los siguientes resultados:
(2, 0), (2, 2), (0, 5), (2, 1), (1, 2), (2, 1), (3, 1) (4, 0), (0, 4), (2, 2) (2, 1), (2, 1), (4, 0), (3, 1), (2, 4),
(2, 1), (1, 2), (2, 1), (2, 0), (3, 0) (3, 2), (2, 2), (2, 2), (2, 1), (0, 5), (1, 3), (2, 2), (2, 1), (1, 3), (1, 4)
Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el
diagrama de dispersión. Luego señale el tipo de relación que existe entre ambas variables.
2. El número de horas dedicadas al estudio de una asignatura y la calificación final obtenida
en el correspondiente examen por ocho personas vienen dados en la tabla.
X: Horas de estudio 20 16 34 23 27 32 18 22
Y: Calificaciones del examen 6,5 6,0 8,5 7,0 9,0 9,5 7,5 8,0

58
Gestión Curricular
Asignatura: Estadística general

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el


diagrama de dispersión. Luego señale el tipo de relación que existe entre ambas variables.

3. Las personas hipertensas, conscientes de la salud consultan a menudo la información


relacionada con los nutrientes que aparecen en los envases de los alimentos con el fin de
evitar los que contengan grandes cantidades de grasa, sodio o colesterol. La siguiente
información se tomó de ocho marcas distintas de queso americano en rebanadas:
Grasa Grasas Colesterol Sodio
Marca Calorías
(g) saturadas (g) (mg) (mg)
Kraft Deluxe American 7 4,5 20 340 80
Kraft Velveela Slices 5 3,5 15 300 70
Private Selectión 8 5,0 25 520 100
Ralphs Singles 4 2,5 15 340 60
Kraft 2% Milk 3 2,0 10 320 50
Kratl Singles American 5 3,5 15 290 70
Borden Singles 5 3,0 15 260 60
Lake to Lake American 5 3,5 15 330 70

Construya el diagrama de dispersión para colesterol y calorías. Observando la gráfica


determine si existe algún tipo de correlación entre ambas variables.

4. Los siguientes datos representan los años de práctica profesional y el ingreso anual (en miles
de soles) para un conjunto de servidores públicos:
Años de Años de
Ingreso Ingreso
práctica práctica
5 4 3 2
15 4 6 3
24 9 12 3
16 7 27 7
19 6 13 5

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el


diagrama de dispersión. Observando la gráfica determine si existe algún tipo de correlación
entre ambas variables.

5. Un estadístico de una determinada línea aérea está estudiando la relación entre la distancia
de destino con la carga de mercancía para un tamaño estándar de embalaje. Se obtuvieron
los siguientes datos para una muestra aleatoria de diez facturaciones de carga:

59
Gestión Curricular
Asignatura: Estadística general

Distancia Carga
22,4 6,8
36,8 10,5
14,4 4,0
27,2 7,9
16,0 8,1
35,2 9,5
8,0 3,1
19,2 7,2
9,6 4,5
25,6 9,3

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el


diagrama de dispersión. Observando la gráfica determine si existe algún tipo de correlación
entre ambas variables.

Video de Apoyo

Video 1: Diagrama de Dispersión


(https://youtu.be/NSh7EX83VRQ)

Video 2: Diagrama de dispersión


(https://youtu.be/KwtuSe1JAVQ)

60
Gestión Curricular
Asignatura: Estadística general

Semana 8
EVALUACIÓN PARCIAL

61
Gestión Curricular
Asignatura: Estadística general

Unidad III

Resultado de Aprendizaje de la Unidad I:


Al finalizar la unidad, el estudiante será capaz de calcular las medidas de tendencia
central, variación, posición relativa y deformación para interpretar datos
relacionados a su carrera profesional.

ORGANIZACIÓN DE APRENDIZAJES
TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN
SEMANA N° 9 Actividad N° 17 Consolidado 2:
17. Medidas de tendencia Calcula las medidas de Evaluación individual de
central: Media, mediana, tendencia central e interpreta los desarrollo teórico-práctico
moda resultados. A partir de los datos
Conceptos básicos y de la encuesta.
propiedades de las medidas Actividad N° 18
de tendencia central. Aplica las funciones del SPSS
Estadística, división, objetivos, para calcular las medidas de
definiciones, tipos de datos. tendencia central, de la base de
Métodos y fuentes de datos de la encuesta realizada a
recolección de datos. sus compañeros e interpreta los
18. Medidas de tendencia resultados.
central: Media, mediana, Actividad N° 19
moda con spss. Calcula las medidas de
SEMANA N° 10
dispersión apoyándose de una
19. Medidas de variación o
calculadora e interpreta los
dispersión: Varianza,
resultados. A partir de los datos
desviación estándar y
de la encuesta.
coeficiente de variación.
Actividad N° 20
Medidas deformación:
Aplica las funciones del SPSS
asimetría, interpretación.
para calcular las medidas de
20. Medidas de variación o
dispersión: Varianza, variación, de la base de datos
desviación estándar, de la encuesta realizada a sus
coeficiente de variación y compañeros e interpreta los
asimetría con spss. resultados.
SEMANA N° 11 Actividad N° 21
21. Medidas de posición relativa: Calcula las medidas de posición
Cuartiles y percentiles. relativa e interpreta los
Medidas deformación: resultados. A partir de los datos
curtosis, Diagrama de Cajas y de la encuesta.
bigotes. Actividad N° 22
22. Medidas deformación: Calcula las medidas de
asimetría y curtosis deformación e interpreta los
Diagrama de Cajas y bigotes resultados. A partir de los datos
con spss. de la encuesta.
SEMANA N° 12 Actividad N° 23
23. Evaluación de la tercera Calcula las medidas de
unidad. deformación e interpreta los
24. Verificación de resultados de resultados. A partir de los datos
la evaluación de la primera de la encuesta.
unidad.
Actividad N° 24

62
Gestión Curricular
Asignatura: Estadística general

Semana 9
MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de diferentes observaciones, con


frecuencia es conveniente resumir la información con
un solo número. Este número que, para tal fin, suele
situarse hacia el centro de la distribución de datos se
denomina medida o parámetro de tendencia central o
de centralización.

Gustav
Theordor
Fechner:
Utilizo la
mediana
Francis
Galton

A. Gustav Theordor Fechner: usó la mediana (centralwerth) en fenómenos


sociológicos y sociológicos.14 Anteriormente había sido usado solamente en
astronomía y campos relacionados.
B. Francis Galton en 1907 entregó un artículo a la revista Nature acerca de la
utilidad de la mediana.16 El examinó la precisión de 787 intentos de adivinar el
peso de un buey en una feria de campo. El peso real era de 1208: la mediana
de todas las conjeturas fue 1198 libras. Las conjeturas fuern marcadamente no
normales en su distribución.

63
Gestión Curricular
Asignatura: Estadística general

MEDIDAS DE CENTRALIZACIÓN
LECTURA

Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática.


Este puntaje, por sí mismo tiene muy poco significado a menos que podamos conocer el
total de puntos que obtiene una persona promedio al participar en esa prueba, saber cuál
es la calificación menor y mayor que se obtiene, y cuán variadas son esas calificaciones.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de
referencia para interpretar las calificaciones que se obtienen en una prueba.
Volviendo a nuestro ejemplo, digamos que la calificación promedio en la prueba que hizo
el alumno fue de 20 puntos. Con este dato podemos decir que la calificación del alumno
se ubica notablemente sobre el promedio. Pero si la calificación promedio fue de 65
puntos, entonces la conclusión sería muy diferente, debido a que se ubicaría muy por
debajo del promedio de la clase.
En resumen, el propósito de las medidas de tendencia central es:
Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
Sirve como un método para comparar o interpretar cualquier puntaje en relación con el
puntaje central o típico.
Sirve como un método para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
Sirve como un método para comparar los resultados medios obtenidos por dos o más
grupos.
Las medidas de tendencia central más comunes son:
La media aritmética: comúnmente conocida como media o promedio. Se representa por
medio de una letra M o por una X con una línea en la parte superior.
La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se
representa como Md.
La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se
representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la mejor y más
útil. Sin embargo, cuando en una distribución se presentan casos cuyos puntajes son muy
bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la
moda. (Porque dadas las características de la media, esta es afectada por los valores
extremos).

Fuente: Fuente Internet:


http://tgrajales.net/tendencentral.pdf

64
Gestión Curricular
Asignatura: Estadística general

MEDIDAS DE
CENTRALIZACIÓN
Propósito:
 Calcular e interpretar las medidas de tendencia central (media, mediana y moda) de
datos no agrupados y agrupados.
 Calcula e Grafique e interpreta la asimetría haciendo uso de las medidas de tendencia
central.

SESIÓN 17: MEDIDAS DE TENDENCIA CENTRAL.

Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la


información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de
la distribución de datos se denomina medida o parámetro de tendencia central o de
centralización.
Entre las medidas de tendencia central tenemos:
 Media aritmética
 Mediana
 Moda
1. LA MEDIA ARITMÉTICA (𝒙; 𝒙
̅; 𝑴; 𝑴(𝒂)):
Es el resultado de dividir la suma de todas las observaciones entre el número de ellas.
a) M.A. para datos no agrupados:
Sean: x1, x2, x3,…………xn un conjunto de datos de la variable cualitativa X, observados en
una muestra.
Entonces su media aritmética es:
∑𝑛𝑖=1 𝑋𝑖 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛
𝑥̅ = =
𝑁 𝑁
Ejemplo:
Un estudiante rinde 4 evaluaciones obteniendo los siguientes puntajes.
x1 =10, x2 = 08, x3 =15, x4 =13
Hallar el promedio final (𝒙
̅):
∑4𝑖=1 𝑋𝑖 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 10 + 08 + 15 + 13
𝑥̅ = = = = 11.5
𝑁 4 4
b) M.A. para datos agrupados:
Sean: x1, x2, x3…………xk, las marcas de clase y n1, n2, n3, …………nm las frecuencias
absolutas o simples, k es el número de clase, entonces:
∑𝒌𝒊=𝟏 𝒏𝒊 𝑿𝒊
̅=
𝒙 𝑵

Donde hi = frecuencia relativa.

65
Gestión Curricular
Asignatura: Estadística general

a. De datos discretos:
Ejemplo:
Se tiene 50 familias y el número de sus hijos (X) que se distribuye en la siguiente forma,
determina la media aritmética.
X Frecuencias
0 3
1 9
2 12
3 10
4 8
5 5
6 2
7 1
N = 50

Se aumenta una columna donde se coloca el producto del valor de cada dato por su
respectiva frecuencia.
X Frecuencias 𝒏𝒊 𝑿𝒊
0 3 0
1 9 9
2 12 24
3 10 30
4 8 32
5 5 25
6 2 12
7 1 7
N = 50 139

∑𝒌
𝒊=𝟏 𝒏𝒊 𝑿𝒊 𝟏𝟑𝟗
Luego, se utiliza la formula 𝒙
̅= para hallar la M.A. 𝒙
̅= = 𝟐. 𝟕𝟖
𝑵 𝟓𝟎

b. De datos continuos:
Ejemplo:
Se han registrado el peso de 50 lingotes de acero producidos por una Empresa Minera,
la muestra fue obtenida de la producción semanal y las unidades están dadas en kg.
Hallar la M.A.
Li - Ls ni
91.5 – 92.5 4
92.5 – 93.5 11
93.5 – 94.5 20
94.5 – 95.5 9
95.5 – 96.5 6
N = 50

Solución
Aumentamos dos columnas, uno para la marca de clase y otro para el producto de
cada marca de clase con su respectiva frecuencia.

66
Gestión Curricular
Asignatura: Estadística general

Li - Ls Xi ni ni.Xi
91.5 – 92.5 92 4 368
92.5 – 93.5 93 11 1023
93.5 – 94.5 94 20 1880
94.5 – 95.5 95 9 855
95.5 – 96.5 96 6 576
N = 50 4702
Luego:
∑𝒌
𝒊=𝟏 𝒏𝒊 𝑿𝒊 𝟒𝟕𝟎𝟐
Se utiliza la formula 𝒙
̅= para hallar la M.A. 𝒙
̅= = 𝟗𝟒. 𝟎𝟒
𝑵 𝟓𝟎

Lo cual nos indica que semanalmente la producción promedio de 50 lingotes


de acero por la Minera es de 94.04 kg.

2. LA MODA (𝑴𝒐):
Es el valor que en una distribución de datos ocurre con mayor frecuencia, es decir, es el dato
que se repite mayor cantidad de veces que los demás. En algunas distribuciones de datos hay
más de una moda y se les denomina bimodal (dos modas) o multimodal (varias modas).
Cálculo de la moda:

a) Moda para datos no agrupados:


Ejemplo 1:
En la siguiente distribución de datos se tiene las puntuaciones:
14 16 16 17 18 19 19 19 21 22
Hallar la moda.
Se observa que la puntuación que más se repite es 19, por lo tanto, la moda es:
Mo = 19

Ejemplo 2:
En la siguiente distribución de datos se tiene las puntuaciones:
14 16 16 16 18 19 19 19 21 22
Hallar la moda:
Las puntuaciones que más se repite son: 16 y 19, por lo tanto, la distribución de los datos es
bimodal

b) Moda para datos agrupados:


i. Moda para datos de variables discretas:
La moda se determina observando el valor de las variables que tiene mayor frecuencia.

Ejemplo:
Determina la moda de la distribución siguiente:
N° de hijos por N° de
familia familias

67
Gestión Curricular
Asignatura: Estadística general

Xi ni
0 60
1 120
2 210
3 360
4 160
5 50
6 a más 30
Total 990

Se observa que la mayor frecuencia es 360, frecuencia que es la variable


n4 =360
Como la moda es el dato de mayor frecuencia, entonces la moda es: Mo = 3
Esto nos indica que la mayor cantidad de familias tiene 3 hijos.

ii. Moda para datos de variables continúas:


Cuando se tienen datos, de variables continuas, agrupados en distribuciones de
frecuencias, se usa la siguiente fórmula:
∆𝟏
𝑴𝒐 = 𝑳𝒊 + ( )𝒄
∆ 𝟏 + ∆𝟐
Donde:
Li = Es el límite inferior del intervalo de clase donde se encuentra la moda.
c = es la amplitud del intervalo de clase donde se encuentra la moda.
∆1 = ni – ni – 1: diferencia entre la frecuencia del intervalo modal con la frecuencia
del intervalo anterior.
∆2 = ni – ni + 1: diferencia entre la frecuencia del intervalo modal con la frecuencia
del intervalo posterior.
Ejemplo:
En la siguiente distribución de frecuencias se dan las edades de una muestra de
personas del anexo de Batanyacu. Hallar la moda de dicha distribución:
Intervalos N° de personas
Li - Ls ni
10 – 20 3
20 – 30 7
30 – 40 15
40 – 50 28
50 – 60 40
60 – 70 31
70 – 80 16
80 - 90 8

Observando la distribución que la mayor frecuencia es 40, que se ubica en el intervalo


(50 – 60), denominándolo intervalo modal.
Hallamos:

68
Gestión Curricular
Asignatura: Estadística general

El límite inferior: Li = 50
∆1 = ni – ni – 1 ∆ 2 = ni – ni + 1
∆1 = 40 – 28 ∆2 = 40 – 31
∆1 = 12 ∆2 = 9
Su amplitud (c): c = 10
Reemplazando en la fórmula:
∆1 12
𝑀𝑜 = 𝐿𝑖 + ( ) 𝑐 = 50 + ( ) 10 = 55.71
∆1 + ∆2 12 + 9

3. LA MEDIANA (𝑴𝒆):
La mediana es una medida de tendencia central, cuyo valor divide a un conjunto de datos,
ordenado con respecto a la magnitud de sus valores, de tal manera que el número de datos
por encima de la mediana es igual al número de datos por debajo de la misma.

3.1. Para datos no agrupados:


Si se tiene un conjunto de datos ordenados en forma creciente o decreciente, la mediana
se determina como el dato que está ubicado en la posición:
 si el número de datos es impar 𝑴𝒆 = 𝑿(𝒏+𝟏)
𝟐

𝑿 𝒏 +𝑿 𝒏
( ) ( +𝟏)
𝟐 𝟐
 si el número de datos es par 𝑴𝒆 = 𝟐
Ejemplo:
Sean los siguientes 11 datos obtenidos de la observación de una variable X:
0 8 1 2 9 1 3 8 4 7 6

Ordenando en forma creciente:


0 1 1 2 3 4 6 7 8 8 9
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11
Si: n = 11 (n es impar)
Me = 4
Entonces su mediana será:
𝑀𝑒 = 𝑋(𝑛+1) = 𝑋(11+1) = 𝑋6
2 2

Significa que el 50% de los datos de la distribución son mayores que 4 y los otros 50% son
menores que 4.

3.2. Para datos agrupados en distribución de frecuencias:


a) Para datos de variables discretas:
Ejemplo:
Sean los siguientes datos correspondientes al lanzamiento de seis monedas, doscientas
veces.

69
Gestión Curricular
Asignatura: Estadística general

N° de caras Frecuencias
(Xi) (ni)
0 2
1 19
2 46
3 62
4 47
5 20
6 4

Aumentamos una columna de las frecuencias acumuladas


N° de caras Frecuencias Frec. acumuladas
(Xi) (ni) (Ni)
0 2 2
1 19 21
2 46 67
3 62 129
4 47 176
5 20 196
6 4 200
N = 200
Luego se busca un Ni que sea mayor o igual que N/2 (N = n° total de datos)
N/2 = 200/2 = 100
Entonces: 𝑁𝑖 ≥ 100 el más cercano será Ni = 129
3 62 129
Por lo tanto, la mediana se ubica en X4:
𝑋4 = 3 → 𝑀𝑒 = 3
b) Para datos de variables continuas:
Para hallar la Me en estas variables, se utiliza el mismo procedimiento anterior, pero
utilizando la siguiente fórmula:
𝒏
− 𝑵𝒊−𝟏
𝑴𝒆 = 𝒍𝒊 + (𝟐 ).𝒄
𝒏𝒊
Donde:
li = límite inferior donde se encuentran la mediana.
c = amplitud del intervalo de clase.
n = tamaño de la muestra o total de datos de la distribución.
𝑁𝑖−1 = frecuencia acumulada del intervalo anterior donde se encuentra la mediana.
ni = frecuencia del intervalo donde se encuentra la mediana.

Ejemplo:
Sean datos correspondientes a la medición en centímetros de 200 varillas, determine
la Me:

70
Gestión Curricular
Asignatura: Estadística general

Li – Ls ni
29.5 – 30.5 4
30.5 – 31.5 8
31.5 – 32.5 23
32.5 – 33.5 35
33.5 – 34.5 62
34.5 – 35.5 44
35.5 – 36.5 18
36.5 – 37.5 4
37.5 – 38.5 1
38.5 – 39.5 1

Aumentamos una columna de las frecuencias acumuladas


Li – Ls ni Ni
29.5 – 30.5 4 4
30.5 – 31.5 8 12
31.5 – 32.5 23 35
32.5 – 33.5 35 70
33.5 – 34.5 62 132
34.5 – 35.5 44 176
35.5 – 36.5 18 194
36.5 – 37.5 4 198
37.5 – 38.5 1 199
38.5 – 39.5 1 200
N =200

Luego se busca un Ni que sea mayor o igual que N/2 (N = n° total de datos)
N/2 = 200/2 = 100
Entonces: 𝑁𝑖 ≥ 100 el más cercano será Ni = 132
33.5 – 34.5 62 132
li = 33,5
c=1
n = 200
𝑁𝑖−1 = 70
ni = 62
Reemplazando en la fórmula:
𝑛 200
−𝑁𝑖−1 −70 30
𝑀𝑒 = 𝑙𝑖 + (2 ) . 𝑐 = 33.5 + ( 2
) . 1 = 33.5 + = 33,98
𝑛𝑖 62 62

71
Gestión Curricular
Asignatura: Estadística general

4. RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA.

Si la distribución de Si la distribución es asimétrica Si la distribución es


frecuencias de los datos es de cola derecha, entonces, la asimétrica de cola a la
simétrica, entonces la moda es menor que la izquierda, entonces la media
media, la mediana y la mediana y esta a su vez es es menor que la mediana y
moda tienen el mismo menor que la media: esta a su vez menor que la
valor: moda:

Problemas Desarrollados

1. Una persona que trabaja en forma independiente gana en un mes s/. 200; otro mes
s/.600, un tercer mes s/.400 y un cuarto mes S/.440, ¿En promedio ménsula cuánto gana?
200 + 600 + 400 + 440 1640
𝑋̅ = = = 410
4 4
2. Se escogieron al azar 24 familias y se les pregunto por el número de hijos que tenía cada
una; las respuestas obtenidas fueron las siguiente: 2,4,6,6,2,3,0,0,4,5,3,3,4,3,5,2,1,2,0,3,4,5,1,1
Hallar el promedio del número de hijos de las 25 familias.
Solución
Realizamos la tabla de frecuencia:

Xi ni Xi.ni
0 3 0
1 3 3
2 4 8
3 5 15
4 4 16
5 3 15
6 2 12
n= 24 69
Remplazando en la fórmula para determinar la Ma:
69
̅
𝑋= = 2,875 = 2.88
24
3. Sea una distribución de frecuencias de puntuaciones obtenidas por 105 estudiantes en
una prueba de estadísticas. Hallar la media aritmética.

72
Gestión Curricular
Asignatura: Estadística general

Realizamos un cuadro más en la tabla de frecuencia:

Li - Ls xi ni xi.ni
2–4 3 3 9
4–6 5 2 10
6–8 7 5 35
8 - 10 9 9 81
10 - 12 11 12 132
12 - 14 13 10 130
14 - 16 15 2 30
16 - 18 17 5 85
N = 48 512
Remplazando en la fórmula para determinar la Ma:

512
̅
𝑋= = 10.67 = 10.7
48

Problemas Propuestos

1. Una empresa ha realizado un test físico entre todos sus empleados para comprobar la
capacidad de esfuerzo que posee cada uno de ellos. Una de las medidas que
componen el test es el número de pulsaciones después de una determinada actividad
física que está altamente relacionada con las que se realizan a lo largo de una jornada
laboral. Los datos conseguidos han sido distribuidos en la siguiente tabla:
Numero de Número de
pulsaciones empleados
[65-70> 12
[70-75> 15
[75-80> 10
[80-85> 28
[85-90] 30
[90-95] 5
a) ¿Qué porcentaje de empleados tuvo menos de 85 pulsaciones?
b) Calcula la media aritmética, la mediana y la moda. Interpreta los resultados.

2. Los ingresos en dólares de 18 hombres elegidos al azar del Banco BBVA CONTINENTAL
(entre un total de 1000) se muestran a continuación:
45,16 83,61 79,85 22,07 76,91 65,73
88,91 99,49 62,59 34,20 88,61 41,50
68,89 92,22 54,33 53,20 16,60 62,59
a) Calcula la media aritmética empleando la tabla de frecuencias.
b) Halla la mediana y moda e interpreta (en termino de dólares).

73
Gestión Curricular
Asignatura: Estadística general

c) ¿Se puede considerar que las poblaciones de 1000 personas tendrán la misma media
que la muestra de 18 personas? ¿Por qué?

3. El grafico tallo y hoja muestra los productos vendidos de la tienda “La Moderna” en un
día. Calcular las medidas de tendencia central y graficar el sesgo y, ¿la media aritmética
es significativa en los productos vendidos?
TALLO HOJAS
2 2
3 122
4 2333
5 228
6 7

4. De los 46 productos vendidos de la tienda “Casa Sueldo” un día domingo. Calcular las
medidas de tendencia central, asimetría e interpretar el sesgo. Elabora una tabla de
frecuencias a partir del histograma.

5. Se tiene el siguiente cuadro que corresponde quesos producidos por trabajador para la
empresa SERRANITA:
Litros de lácteos producidos 5-11> 11-17> 17-23> 23-29> 29-35>
Cantidad de trabajadores 12 18 13 9 10

Con los datos se pide:


a) Grafica el histograma
b) Determine media, mediana y moda e interpreta cada uno de ellos

74
Gestión Curricular
Asignatura: Estadística general

Video de Apoyo

Video 1: Media, Mediana y Moda - Ejemplos y Ejercicios Resueltos - Medidas de Tendencia


Central
(https://www.youtube.com/watch?v=jiceVfALmV0)

Video 2: Media, Mediana y Moda para Datos Agrupados en Intervalos


(https://www.youtube.com/watch?v=G3WYwknaVuc)

75
Gestión Curricular
Asignatura: Estadística general

Semana 10
MEDIDAS DE VARIACIÓN O DISPERSIÓN
La desviación típica cumple la llamada desigualdad
de Tchebychev: según la cual, los datos que se alejan
de la media una distancia igual o menor que s,
multiplicado por un coeficiente k suponen más de la
proporción 1-1/k2. Así, el 75% de los datos al menos, se
encuentra a menos de dos desviaciones típicas y el
89% a menos de tres.

Hiparco de
NIcea

Telescopio
para observar
el cielo

Galileo Galilei

A. Hiparco de Nicea: el primer catálogo de estrellas; la división del día en 24


horas de igual duración (hasta la invención del reloj mecánico en el siglo XIV
las divisiones del día variaban con las estaciones
B. Galileo Galilei: Fue el primer astrónomo que usó el telescopio para observar
el cielo. La Inquisición lo condenó a arresto domiciliario por sus
descubrimientos, el cual fue levantado 359 años después por el papa Juan
Pablo II.

76
Gestión Curricular
Asignatura: Estadística general

VARIABILIDAD Y DISPERSIÓN

Las ideas de variabilidad y dispersión revisten una gran importancia en la


LECTURA

estadística, pues dotan a esta ciencia de su razón de ser y pueden ser abordadas,
tanto desde la estadística descriptiva, como de la probabilidad y la inferencia.
Tanto Wild y Pfannkuch (1999), como Moore (1990) incluyen la percepción de la
variabilidad aleatoria como componentes esenciales del razonamiento
estadístico.
Las medidas de dispersión son, además, esenciales en una distribución de datos,
complementando a las de posición central, al caracterizar la variabilidad de los
datos respecto a las mismas. Como sugieren Batanero, González- Ruiz, López-
Martín y Contreras (2015), es importante que los estudiantes las comprendan y
diferencien las relacionadas con la distribución de datos, la distribución de
probabilidad y la distribución muestral.
A pesar de su importancia, la investigación didáctica sobre la comprensión de la
variabilidad y la dispersión es relativamente escasa, en comparación con la
existente respecto a las ideas de centro y medidas de posición central. Por este
motivo me interesé en comenzar una línea de investigación al respecto, que
desembocará en un estudio del tema en los libros de texto y otro estudio de
evaluación amplio de la comprensión de estas ideas en estudiantes de educación
secundaria y se concretará en una tesis doctoral.
La finalidad del este trabajo fin de Máster es realizar una síntesis de la investigación
didáctica relacionada con este tema, que sirva de fundamento para la futura tesis
doctoral, ya avanzada. Para llevarla a cabo se ha realizado una extensa consulta,
estudio, análisis y síntesis de dicha investigación, clasificándola y resumiéndola en
esta memoria, que se organiza en los siguientes capítulos:
En el primero de ellos se comienza justificando el interés de realizar este trabajo de
síntesis, se presenta una síntesis de la evolución histórica de estos conceptos, se
analizan los contenidos curriculares relacionados con las ideas de variabilidad y
dispersión y se presentan los objetivos del trabajo.
El segundo capítulo expone en forma resumida algunas ideas de nuestro marco
teórico que es el enfoque ontosemiótico que consideramos de interés para nuestro
trabajo actual y nuestra futura tesis doctoral.
En el tercer capítulo se presenta el trabajo de síntesis de la investigación previa
que se organiza a través de los significados de la dispersión, aportando a su vez
estudios 5 sobre la percepción y las concepciones de estudiantes y futuros
profesores de las medidas de dispersión.
Fuente: (Hald, 1998, p. 33) Los errores aleatorios de las observaciones nos llevan a errores
aleatorios de una función de las observaciones que pueden ser grandes, incluso si los
errores de observación son pequeños.

77
Gestión Curricular
Asignatura: Estadística general

MEDIDAS DE
VARIACIÓN O
DISPERSIÓN
Propósito:
 Calcular e interpretar medidas de variación o dispersión.
 Describir y comparar distribuciones de datos a partir de sus medidas de dispersión.
 Aplicar las medidas de dispersión para analizar la representatividad de la media
aritmética.

SESIÓN 19: MEDIDAS DE VARIACIÓN O DISPERSIÓN.

1. LA VARIANZA Y LA DESVIACIÓN ESTANDAR:


La varianza es la media aritmética de los cuadrados de las desviaciones de cada
observación o dato con respecto a la media aritmética y se simboliza por S2 ó σ2.
La desviación estándar o desviación típica es la raíz cuadrada de la varianza y se simboliza
por S ó σ.
Calculo de la varianza y la desviación estándar.
1.1. PARA DATOS NO AGRUPADOS:
Fórmula para la varianza:
∑(𝑿𝒊 − 𝑴𝒂)𝟐
𝑺𝟐 =
𝒏
Donde:
Xi = dato u observación.
Ma = media aritmética
n = número total de datos
(𝑿𝒊 − 𝑴𝒂)𝟐 = desviación al cuadrado de cada dato con respecto a la media.

Fórmula para la desviación estándar:

∑(𝑿𝒊 − 𝑴𝒂)𝟐
𝑺= √
𝒏
Ejemplo:
El tiempo que utilizan 6 niños de igual edad para desarrollar una misma tarea fue la
siguiente:
16; 12; 15; 18; 13; 14 minutos
Hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos:
Solución:
Hallamos la Ma:
16 + 12 + 15 + 18 + 13 + 14 88
𝑀𝑎 = = = 14.7
6 6

78
Gestión Curricular
Asignatura: Estadística general

Luego calculamos la suma de las desviaciones al cuadrado (varianza)


(16 − 14,7)2 + (12 − 14,7)2 + (15 − 14,7)2 + (18 − 14,7)2 + (13 − 14,7)2 + (14 − 14,7)2
𝑆2 =
6
23.34
𝑆2 =
6
𝑆 2 = 3.89 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
Calculando la desviación estándar:
𝑆 = ξ3.89 = 1.97
Por lo tanto: el tiempo utilizado por los seis niños para desarrollar la tarea, si dispersa en
promedio de 3,89 minutos al cuadrado con respecto a la media aritmética.

1.2. PARA DATOS AGRUPADOS:


a) Para datos de variables discretas:
Formula para la varianza:
∑(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊
𝑺𝟐 =
𝒏
Fórmula para la desviación estándar:

∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏𝒊
𝑺= √
𝒏

Ejemplo:
En la siguiente distribución de frecuencias del número de hijos de 50 familias, se pide
hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos:
N° de hijos N° de familias
Xi ni
0 3
1 9
2 12
3 10
4 8
5 5
6 2
7 1
Completando columnas:
Xi ni 𝒏𝒊 𝑿𝒊 (𝑿𝒊 − 𝑴𝒂)𝟐 (𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊
0 3 0 7,73 23,19
1 9 9 3,17 28,53
2 12 24 0,61 7,32
3 10 30 0,05 0,5
4 8 32 1,49 11,92
5 5 25 4,93 24,65
6 2 12 10,37 20,74
7 1 7 17,81 17,81
N = 50 139 134,66

79
Gestión Curricular
Asignatura: Estadística general

𝟏𝟑𝟗
Hallando la M.A: 𝑴𝒂 = = 𝟐. 𝟕𝟖
𝟓𝟎

Luego:
∑(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊 𝟏𝟑𝟒, 𝟔𝟔
𝑺𝟐 = = = 𝟐. 𝟔𝟗
𝒏 𝟓𝟎
Entonces: 𝑆 = ξ2,69 = 1.64
El número de hijos de las 50 familias tienen una dispersión promedio de 1.64 hijos con
respecto a la media aritmética.

b) Para datos de variables continuas:


Fórmula para la varianza:
∑(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊
𝑺𝟐 =
𝒏
Fórmula para la desviación estándar:

∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏𝒊
𝑺= √
𝒏
Donde:
Xi = marca de clase
Ma = media aritmética
n = número total de datos
(𝑿𝒊 − 𝑴𝒂)𝟐 = desviación al cuadrado de cada dato con respecto a la
media.
Ejemplo:
Se han registrado el peso de 50 lingotes de acero producidos por SIDERPERU, la
muestra fue obtenido de la producción semanal y las unidades están dadas en
kg. Hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos.
Li - Ls ni
91,5 – 92,5 4
92,5 – 93,5 11
93,5 – 94,5 20
94,5 – 95,5 9
95,5 – 96,5 6
N = 50

Solución
Hallando la Ma:
4702
𝑀𝑎 = = 94.04
50
Completando la columna cinco:
|𝑿𝒊 − 𝑴𝒂|𝟐 = |𝑿𝟏 − 𝑴𝒂|𝟐 = |𝟗𝟐 − 𝟗𝟒, 𝟎𝟒|𝟐 = 𝟒, 𝟏𝟔𝟏𝟔
Completando la columna seis:
|𝑿𝒊 − 𝑴𝒂|𝟐 . 𝒏𝒊 = |𝑿𝟏 − 𝟗𝟒, 𝟎𝟒|𝟐 . 𝒏𝟏 = |𝟗𝟐, 𝟎 − 𝟗𝟒, 𝟎𝟒|𝟐 . 𝟒 = 𝟒, 𝟏𝟔𝟏𝟔. 𝟒 = 𝟏𝟔, 𝟔𝟒𝟔𝟒

80
Gestión Curricular
Asignatura: Estadística general

Aumentamos cuatro columnas:


Li - Ls Xi ni ni.Xi (𝑿𝒊 − 𝑴𝒂)𝟐 (𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊
91.5 – 92.5 92 4 368 4,1616 16,6464
92.5 – 93.5 93 11 1023 1,0816 11,8976
93.5 – 94.5 94 20 1880 0,0016 0,32
94.5 – 95.5 95 9 855 0,9216 8,2944
95.5 – 96.5 96 6 576 3,8416 23,0496
N = 50 4702 60,2256
Hallando la varianza:
∑(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊 𝟔𝟎, 𝟐𝟐𝟓𝟔
𝑺𝟐 = = = 𝟏, 𝟐𝟎
𝒏 𝟓𝟎
Hallando su desviación estándar:

∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏𝒊
𝑺= √ = √𝟏, 𝟐𝟎 = 𝟏, 𝟎𝟗𝟓
𝒏
Por lo tanto, los lingotes de acero en la producción semanal de SIDER PERÚ se
dispersan en promedio de 1,095 kg con respecto a la media aritmética.

2. COEFICIENTE DE VARIACIÓN:

El coeficiente de variación (CV) es el cociente de la desviación estándar y la media


aritmética, expresado en porcentaje.
𝑺
𝑪𝑽 =𝒙𝟏𝟎𝟎%
𝑴𝒂
El coeficiente de variación es un indicador de la dispersión relativa de los datos y la unidad
de medida que esta expresada en porcentaje.

Ejemplo 1.
Hallar el coeficiente de variación (CV) del tiempo que utilizan 6 niños de igual edad para
desarrollar una misma tarea, los resultados son los siguientes: 16; 12; 15; 18; 13; 14 minutos.
Solución
Hallando la Ma:
16 + 12 + 15 + 18 + 13 + 14 88
𝑀𝑎 = = = 14.7
6 6
Determinando la varianza:
(16 − 14.7)2 + (12 − 14.7)2 + (15 − 14.7)2 + (18 − 14.7)2 + (13 − 14.7)2 + (14 − 14.7)2
𝑆2 =
6

𝑆 2 = 3.89
𝑆 = ξ3.89 = 1.97
Hallando el CV:
𝑺 𝟏. 𝟗𝟕
𝑪𝑽 = 𝒙𝟏𝟎𝟎% = 𝒙𝟏𝟎𝟎% = 𝟏𝟑. 𝟒𝟎%
𝑴𝒂 𝟏𝟒. 𝟕

81
Gestión Curricular
Asignatura: Estadística general

Ejemplo 2.
Sea la distribución de frecuencias de las notas de Estadística general de estudiantes de la
Universidad Continental. Hallar S2, S, CV.
Li - Ls ni
00 – 02 3
02 – 04 5
04 – 06 2
06 – 08 12
08 – 10 8
10 – 12 3
12 – 14 7
14 – 16 10
N=50

Solución:
Completando cuadrados con los pasos estudiados:
Li - Ls Xi ni Xi.ni (𝑿𝒊 − 𝑴𝒂)𝟐 (𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊
00 – 02 1 3 3 66.59 199.77
02 – 04 3 5 15 37.95 189.75
04 – 06 5 2 10 17.31 34.62
06 – 08 7 12 84 4.67 56.04
08 – 10 9 8 72 0.03 0.24
10 – 12 11 3 33 3.39 10.17
12 – 14 13 7 91 14.75 103.25
14 – 16 15 10 150 34.11 341.10
N=50 458 934.94

458
Hallando la Ma: 𝑀𝑎 = = 9.16
50

Hallando S2:
∑(𝑋𝑖 − 𝑀𝑎)2 . 𝑛𝑖 934.94
𝑆2 = = = 18.70
𝑛 50
Hallando S:
𝑆 = ξ18.70 = 4.32
Hallando CV:
𝑆 4.32
𝐶𝑉 = 𝑥100% = 𝑥100 = 47.16
𝑀𝑎 9.16

82
Gestión Curricular
Asignatura: Estadística general

Problemas Desarrollados

1. Las edades de 8 niños son las siguientes: 5, 6, 8, 7, 5, 6,9 y 10 años. Determine la varianza y
la desviación estándar.
Solución
Hallamos la Ma:
5 + 6 + 8 + 7 + 5 + 6 + 9 + 10 56
𝑀𝑎 = = =7
8 8
Halando la varianza y la desviación estándar:
(5 − 7)2 + (6 − 7)2 + (8 − 7)2 + (7 − 7)2 + (5 − 7)2 + (6 − 7)2 +(9 − 7)2 + (10 − 7)2
𝑆2 =
8
4+1+1+0+4+1+4+9
𝑆2 =
8
24
𝑆2 = =3
8
𝑆 = ξ3 = 1.73
2. Se han registrado la edad en una muestra de 53 niños que tienen problemas de salud. Hallar
la varianza y la desviación estándar.
Li - Ls ni
0-3 5
3-6 12
6-9 20
9 - 12 10
12 - 15 6

Solución
Completando la tabla de frecuencias:
Xi ni mi ni.xi (mi- Ma)2 (mi- Ma)2. ni
0-3 5 1.5 7.5 36 180
3-6 12 4.5 54.0 9 108
6-9 20 7.5 150.0 0 0
9-12 10 10.5 105.0 9 90
12-15 6 13.5 81.0 36 216
n =53 397.5 594

Determinamos la Ma:
397.5
𝑀𝑎 = = 7.5
53
Hallando la varianza y desviación estándar:
594
𝑆2 = = 11.21
53
𝑆 = ξ11.21 = 3.35

83
Gestión Curricular
Asignatura: Estadística general

3. Un docente de matemática aplico una evaluación a un grupo obteniendo los siguientes


resultados:
37 35 43 45 45 35 35
42 40 46 35 34 44 43
34 40 38 37 40 38 36

Hallar la varianza y la desviación estándar.


Solución
 Identificar el dato mayor dato menor
Dato mayor = 46 Dato menor = 34
 Hallamos el rango:
R= 46-34 =12
 Hallamos el número de intervalos (K)
Si: n ≥ 10 K = 1+3.322Log(n)
K=1+3.32 Log (21) K=1+3.322x(1.32) K=1+4.38 K= 5.38
Los posibles valores de: K=5,6 o 7
 Hallamos la amplitud del intervalo de clase (C):
𝑅 12
C= = = 2.4 = 2 entonces 5𝑥2 = 10
𝐾 5
𝑅 12
C= = = 2 entonces 6𝑥2 = 12
𝐾 6

Elaboramos la tabla con K = 6 y c = 2


 Determinamos los extremos de los intervalos
I1 = [34 – 34+2[ = [34 - 36[ I3 = [34+2x2 – 34+3x2[ I5 = [34+4x2 – 34+5x2[
I2 = [34+2 – 34+2x2[ = [38 - 40[ = [42 - 44[
= [36 - 38[ I4 = [34+3x2 – 34+4x2[ I6 = [34+5x2– 34+6x2[
=[40 - 42[ =[44 - 46[

Li - Ls ni Xi Ni ni.xi |𝑋𝑖 − 𝑀𝑎| |𝑋𝑖 − 𝑀𝑎|. 𝑛𝑖 (xi - Ma)2 (xi - Ma)2.ni


[34-36[ 6 35 6 210 4.57 27.42 20.88 125.28
[36-38[ 3 37 9 111 2.57 7.71 6.60 19.80
[38-40[ 2 39 11 78 0.57 1.14 0.32 0.64
[40-42[ 3 41 14 123 1.43 4.29 2.04 6.12
[42-44[ 3 43 17 129 3.43 10.29 11.76 35.28
[44-46] 4 45 21 180 5.43 21.72 29.48 117.92
N=21 831 72.57 305.04

 Hallando la media aritmética (Ma):


831
𝑋̅ = = 39.57
21
 Hallando la S2:
305.04
𝑆2 = = 14.53
21
𝑆 = ξ14.53 = 3.81

84
Gestión Curricular
Asignatura: Estadística general

Problemas Propuestos

1. Calcular todas las medidas de dispersión para la siguiente distribución:


Xi 5 10 15 20 25
ni 3 7 5 3 2

2. Calcular todas las medidas de dispersión para los datos de la siguiente distribución:
Xi 0-100 100-200 200-300 300-800
ni 90 140 150 120

3. Un artículo reportó los siguientes datos sobre consumo de oxígeno (ml/kg/min) para una
muestra de diez bomberos que realizaron un simulacro de supresión de incendio.
29,5 49,3 30,6 28,2 28,0
26,3 33,9 29,4 23,5 31,6
Calcule lo siguiente:
a) El rango muestral.
b) La varianza muestral (s2) a partir de la definición (es decir, calculando primero las
desviaciones y luego elevándolas al cuadrado, etcétera).
c) La desviación estándar muestral.
d) S2 utilizando el método más corto. (con ayuda de la formula)
4. Una compañía requiere los servicios de un técnico especializado. De los expedientes
presentados, se han seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos. Para
decidir cuál de los 2 se va a contratar se toman siete pruebas a cada uno de ellos. Los
resultados se dan a continuación:
Prueba
1 2 3 4 5 6 7
Puntaje obtenido por A 57 55 54 52 62 55 59
Puntaje obtenido por B 80 40 62 72 46 80 40

a) Halle e interprete todas las medidas de dispersión de los dos candidatos.


b) Estadísticamente, ¿Cuál de los candidatos debe ser contratado?, fundamente su
respuesta.
5. Se tiene dos muestras de obreros, cuyos ingresos diarios son:
Muestra 1: S/.138; S/.136; S/.146; S/.140 y S/.145,
Muestra 2: S/.134; S/.147; S/.147; S/.145 y S/.137
Compare el coeficiente de variabilidad de ambas muestras y determine que muestra de
obreros presenta ingresos diarios más homogéneos (Fundamente su respuesta).

85
Gestión Curricular
Asignatura: Estadística general

Video de Apoyo

Video 1: Varianza y desviación estándar | Introducción

(https://www.youtube.com/watch?v=oZRaDwnpXkY)

Video 2: Varianza, Desviación Estandar y Coeficiente de Variación | Datos agrupados


puntualmente
(https://www.youtube.com/watch?v=fzPBAp14R98)

86
Gestión Curricular
Asignatura: Estadística general

Semana 11
MEDIDAS DE POSICIÓN RELATIVA

Son indicadores usados para señalar que porcentaje de datos


dentro de una distribución de frecuencias superan estas
expresiones, cuyo valor representa el valor del dato que se
encuentra en el centro de la distribución de frecuencia

Ronald A.
Fisher

Biometría

Universidad
de
Cambridge

A. Ronald A. Fisher: Fisher expresó que las desviaciones que excedían dos veces
la desviación estándar eran consideradas significativas. Previamente a esto las
desviaciones que excedían tres veces el error probable eran consideradas
significativas. Previamente a esto las desviaciones que excedían tres veces el
error probable eran consideradas significativas. Para una distribución simétrica
el error probable la mitad del rango intercuantil. El cuantil superior de la
distribución normal estándar está entre 0.66 y 0.67, su error probable es
aproximadamente 2/3 de la desviación estándar. Parece que el criterio de
Fisher del 5% tenía sus raíces en la práctica previa.

87
Gestión Curricular
Asignatura: Estadística general

¿Qué es el percentil y para qué sirve?


Imaginemos una revisión en el pediatra de un bebé cualquiera. Todo bien, los remedios
estándar para la nueva temporada de mocos que todos conocemos; Mucha agua, si tiene
LECTURA

fiebre le das el antitérmico con sabor a fresa y si ves que la cosa no mejora se lo alternas
con el de sabor a naranja.
El peso bien, la altura genial y un percentil por encima de lo que a su edad le corresponde...
El padre o madre mira al médico, le devuelve la sonrisa que demuestra lo orgulloso que
está de su bebé y sale de la consulta contentísimo sabiendo que su hijo o hija, a pesar de
los mocos, tiene un percentil por encima de la media.
Los padres lo comentan con las abuelas cuando les llaman para preguntar por el niño y les
dejan claro que la cosa va bien porque el niño tiene un percentil por encima de la media.
Están tan contentos que incluso hablan con sus hermanos y les preguntan qué percentil
tenían sus hijos a la edad del suyo. Sin querer, durante la semana, el percentil se convierte
en el tema de conversación con amigos y otros padres y madres. Llegan por tanto a la
conclusión de que están haciendo la cosa bien porque tienen un hijo con un percentil por
encima de la media. ¡Felicidades!
Pero, ¿alguien se ha preguntado alguna vez qué es eso del percentil? Y todavía mejor,
¿para qué sirve? La cosa es sencilla, pero solo para los matemáticos, en mi caso lo he
tenido que preguntar varias veces y me ha sorprendido descubrir que es un término que
todos los padres y madres tenemos en cuenta, pero pocos sabemos qué es realmente.
Un percentil es una medida estadística para comparar resultados, nos permite saber cómo
está situado un valor en función de una muestra. Si hablamos de bebés, nos permitiría
comparar los datos de nuestro bebé con otros de sus mismas características. Estas
características son la edad y el sexo.
Los aspectos de su desarrollo que comparamos o los que más interés despiertan en los
padres son: El peso, La altura, La circunferencia de la cabeza
Si nos dice nuestro pediatra que nuestro bebé de 6kg está en el percentil 25, quiere decir
que hay un 25% de los bebés estudiados que están en el mismo peso o menos y un 75%
que están por encima.
Pongo el ejemplo, al contrario, a ver si consigo aclarar la cosa un poco más: si nuestro
bebé se encuentra en el percentil 75 de peso, quiere decir entonces que de toda la
muestra solo hay un 25% que pesen más que nuestro hijo. En España, los valores y las curvas
utilizados para medir los percentiles (las curvas son la representación gráfica de los valores,
esos papeles con líneas y puntitos que nos da siempre el pediatra al acabar la revisión) son
las proporcionadas por el Sistema Público de Salud que están realizadas por el Instituto de
Investigación sobre Crecimiento y Desarrollo de la Fundación Faustino Orbegozo Eizaguirre.
Estas tablas hacen dos diferencias por edad, niños de 0 a 2 años y de 2 a 14 años y son
diferentes para niños y para niñas. Existen 7 percentiles que agrupan las medidas que se
consideran normales, del percentil 3 al 97, pasando por el 19, 25, 50 -que sería la media-,
75 y 90. Por debajo del 3 y por encima del 97, nuestro pediatra, que al fin y al cabo es quien
revisa los datos, nos dirá qué pasos seguir. Los percentiles, al tratarse de una medida
estadística no son iguales en todos los países, es más o menos lógico pensar que la muestra
para extraer los datos no será igual aquí que en un país con grandes problemas para
alimentar a su población. Por esto, nuestro hijo puede estar en un percentil en España y en
otro muy diferente en otro país. El estudio de los datos y el método de elaboración de las
tablas para crear los percentiles, es preciso y, posiblemente, cada vez mejor, pero hasta
qué punto pueden ser concluyentes, lo vamos a determinar nosotros. Si nuestro hijo crece
y se desarrolla continuamente de forma controlada por un profesional, el número que
alcance en una gráfica es algo más.
Fuente: BERMISON ORTEGA, Russell Frank. (2006). El Nuevo Marketing. México: Pearson
Prentice Hall.

88
Gestión Curricular
Asignatura: Estadística general

MEDIDAS DE
POSICIÓN
Propósito:
 Calcular e interpretar medidas de posición relativa (cuartiles y percentiles).
 Efectuar análisis exploratorio de datos haciendo uso de diagramas de caja y bigote.

SESIÓN 21: CUARTILES Y PERCENTILES.

1. CUARTILES:
Son valores que dividen a un conjunto de datos ordenados en forma ascendente o
descendente en cuatro partes iguales del conjunto de datos.
Es decir:

Xmin Q1=25% Q2=50% Q3=75% Xmax

25% 25% 25% 25%

En este caso se tiene tres puntos de división a los que se llaman:


Primer cuartil (Q1)
Que viene a ser un valor que se supera a no más del 25% de las observaciones o datos, y que
es superado por no más del 75% de las observaciones.
Segundo cuartil (Q2)
Coincide con la mediana, es decir: Me = Q2
Tercer cuartil (Q3)
Que viene a ser un valor que se supera a no más del 75% de las observaciones o datos y es
superado por no más del 25% de las observaciones o datos.
Calculo de los cuartiles:
1.1. Para datos no agrupados.
¿Cómo se calculan los cuartiles de una muestra de n observaciones?
Pasos:
i. Ordenar los datos de menor a mayor.
ii. El cuartil inferior es el dato que ocupa la posición (n+1)/4 en la muestra ordenada.
iii. El cuartil superior es el dato que ocupa la posición 3(n+1)/4 en la muestra ordenada.
Si la posición resulta ser un número decimal, promediamos los datos que se
encuentran a izquierda y derecha de la posición obtenida.

89
Gestión Curricular
Asignatura: Estadística general

Ejemplo:
Consideremos los siguientes datos ordenados (n = 13).
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13
Datos 104 112 134 146 155 168 170 195 246 302 338 412 678

Solución.
134+146
Posición del cuartil inferior = (13 + 1)/4 = 3.5 𝑄1 = = 140
2

Posición de la mediana = (13 + 1)/2 = 7 𝑀𝑒 = 𝑄2 = 170


302+338
Posición del cuartil superior = 3.(13 + 1)/4 = 10.5 𝑄3 = = 320
2

Dentro de los cuartiles se puede observar:

CINCO NÚMEROS RESÚMENES


Un modo de resumir toda la distribución de los datos es informar los siguientes cinco
números resúmenes:
Mínimo, Cuartil inferior (Q1), Mediana (Q2), Cuartil superior (Q3), Máximo

En nuestro ejemplo:
Mínimo = 104 25%
Cuartil inferior(Q1) = 140 25%
Mediana(Q2) = 170 25%
Cuartil superior(Q3) = 320 25%
máximo = 678

1.2. Para datos agrupados


Formula general:
𝒋. 𝑵
− 𝑵𝒊−𝟏
𝑸𝒋 = 𝒍𝒊 + ( 𝟒 ).𝒄
𝒏𝒊
Donde:
j = 1,2,3
li = límite inferior donde se encuentra el primer cuartil
c = amplitud del intervalo de clase donde se encuentra el cuartil.
N = tamaño de la muestra o total de datos de la distribución.
𝑁𝑖−1 = frecuencia acumulada del intervalo anterior donde se encuentra el

90
Gestión Curricular
Asignatura: Estadística general

Ejemplo:
Sean los siguientes datos correspondientes a la medición en centímetros de 200 varillas.
Hallar el primer y el tercer cuartil.
Li - Ls ni
29,5 – 30,5 4
30,5 – 31,5 8
31,5 – 32,5 23
32,5 – 33,5 35
33,5 – 34,5 62
34,5 – 35,5 44
35,5 – 36,5 18
36,5 – 37,5 4
37,5 – 38,5 1
38,5 – 39,5 1
Realizamos el mismo procedimiento que en la mediana, se aumenta una columna para
la frecuencia acumulada (Ni)
Li - Ls ni Ni
29,5 – 30,5 4 4
30,5 – 31,5 8 12
31,5 – 32,5 23 35
32,5 – 33,5 35 70
33,5 – 34,5 62 132
34,5 – 35,5 44 176
35,5 – 36,5 18 194
36,5 – 37,5 4 198
37,5 – 38,5 1 199
38,5 – 39,5 1 200
N =200
 Hallando el Q1.
Luego se busca un Ni que sea mayor o igual que N/4 (N = n° total de datos)
N/4 = 200/4 = 50,
Entonces: 𝑁𝑖 ≥ 50 el más cercano será Ni = 70, esto nos indica que aquí esta Q1.
32,5 – 33,5 35 70
Donde:
Li = 32,5
c=1
N = 200
𝑁𝑖−1 = 35
𝑛𝑖 = 35
Reemplazando en la fórmula:
𝒏 𝟐𝟎𝟎
− 𝑵𝒊−𝟏 − 𝟑𝟓
𝑸𝟏 = 𝒍𝒊 + ( 𝟒 ) . 𝒄 = 𝟑𝟐. 𝟓 + ( 𝟒 ) . 𝟏 = 𝟑𝟐. 𝟗𝟑
𝒏𝒊 𝟑𝟓
 Hallando el Q3.
Luego se busca un Ni que sea mayor o igual que 3N/4 (N = n° total de datos)
3N/4 = 3(200)/4 = 150,

91
Gestión Curricular
Asignatura: Estadística general

Entonces: 𝑁𝑖 ≥ 150 el más cercano será Ni = 176, esto nos indica que aquí esta Q3.
34,5 – 35,5 44 176
Donde:
Li = 34,5
c=1
N = 200
𝑁𝑖−1 = 132
𝑛𝑖 = 44
Reemplazando en la fórmula:
𝟑𝒏 𝟑. 𝟐𝟎𝟎
− 𝑵𝒊−𝟏 − 𝟏𝟑𝟐
𝑸𝟑 = 𝒍𝒊 + ( 𝟒 ) . 𝒄 = 𝟑𝟒. 𝟓 + ( 𝟒 ) . 𝟏 = 𝟑𝟒. 𝟗𝟏
𝒏𝒊 𝟒𝟒

∴ 𝑸𝟏 = 𝟑𝟐. 𝟗𝟑 ∧ 𝑸𝟑 = 𝟑𝟒, 𝟗𝟏

2. PERCENTILES:
Los percentiles dividen al conjunto de observaciones en cien partes iguales. Hay 99
percentiles.
P1=1% P5=5% P50=50% P99=99%

1% 1% 1% 1% 1% 1%

2.1. PERCENTIL PARA DATOS NO AGRUPADOS.


Procedimiento:
 Ordenar los datos de menor a mayor.
 Calcular el percentil utilizando la fórmula:
𝒌
𝑳=( ) 𝒙𝒏
𝟏𝟎𝟎
n = Número de valores
k = Percentil buscado
 “L” es un número entero, si el valor de k-énesimo percentil está a la mitad entre
el L-énesimo valor y el siguiente valor en el conjunto ordenado de datos.
Obtenga Pk sumando el L-énesimo valor y el siguiente valor, luego dividiendo el
total entre 2.
 No modifique L redondeando al siguiente entero más grande.
 El valor de Pk es el L-énesimo valor, contando a partir del más bajo.

92
Gestión Curricular
Asignatura: Estadística general

Ejemplo:
Determine el cuartil 3 de los siguientes valores muestrales:
25 – 18 – 47 – 35 – 32 – 19 – 20 – 26 – 35 – 30 – 28 – 30
Solución
Ordene de menor a mayor los datos (n = 12)

18 – 19 – 20 – 25 – 26 – 28 – 30 – 30 – 32 – 35 – 35 – 47
Calcule el valor del localizador para el P75 = Q3
L = (75/100).12 = 9 (Se promedia el 9no y 10mo dato)
Calcule el valor del P75 = Q3
P75 = (32 + 35)/2 = 33,5
INTERPRETACIÓN: El 75% de los valores son menores o iguales a 33,5, mientras que el 25%
restante son mayores o iguales a 33,5

2.2. PERCENTIL PARA DATOS AGRUPADOS.


Ejemplo:
Se toman las pulsaciones de un equipo de atletas después de una competencia. Los
datos obtenidos son:
Pulsaciones 70 - 75 75 - 80 80 - 85 85 - 90 90 - 95
N° de atletas 3 3 7 10 12
Solución:
Hallando 𝑃10 𝑦 𝑃90
Completando la tabla:
Li - Ls ni Ni
70 – 75 3 3
75 – 80 3 6
80 – 85 7 13
85 – 90 10 23
90 - 95 12 35
35
 Hallando P10:
10𝑛 10(35)
Si: = = 3.5 ⟹ 𝑁𝑖 ≥ 3.5 ⟼ 𝑁𝑖 = 6
100 100

Considerando el intervalo:
75 – 80 3 6
Reemplazando en la fórmula:
10(35)
−3
𝑃10 = 𝐶10 = 75 + ( 100 ) . 5 = 75.83
3
 Hallando P90:
90𝑛 90(35)
Si: = = 31.5 ⟹ 𝑁𝑖 ≥ 31.5 ⟼ 𝑁𝑖 = 35
100 100

Considerando el intervalo:
90 – 95 12 35

93
Gestión Curricular
Asignatura: Estadística general

Reemplazando en la fórmula:
90(35)
− 23
𝑃90 = 𝐶90 = 90 + ( 100 ) . 5 = 93.54
12

3. EQUIVALENCIA ENTRE EL CUARTIL – PERCETIL.


a) Q1 = P25

25 75 25% 75%
% Q % P
1 25

b) Q2 = P50 = Mediana

50% 50% 50% 50%


Q P
2 50

50% 50%
M
c) Q3 = P75 e

75% 25% 75% 25%

Q P
3 75

4. RANGO INTERCUARTIL.
Es una medida de dispersión estadística, la cual indica la distancia a la que se encuentra el
50% central de datos. Mediante esta medida se eliminan los valores extremadamente
alejados. El rango intercuartílico es altamente recomendable cuando la medida de
tendencia central utilizada es la mediana (ya que la mediana es insensible a posibles valores
extremos)
R.I. = Q3 – Q1

50% central de los datos

Q Q Q
1 2 3

25% 25% 25% 25%


5. ANALISIS EXPLORATORIO DE DATOS.

Es el proceso que consiste en utilizar herramientas estadísticas (como gráficas, medidas de


tendencia central y medidas de variación) con la finalidad de investigar conjuntos de datos
para comprender sus características importantes.

94
Gestión Curricular
Asignatura: Estadística general

VALORES EXTREMOS O DATOS DISTANTES:

Se llama "valor extremo" o “dato distante” a aquel que está muy alejado de la mayor parte
de los demás valores. Los valores extremos se deben considerar ya que pueden revelar
información importante y afectar en gran medida el valor de la media y de la desviación
estándar.
Ejemplo:

Datos 1: 9 – 10 – 13 – 14 – 17 – 56

Datos 2: 3 – 34 – 36 – 40 – 42 – 47

6. GRÁFICA DE CAJA Y VIGOTE.

Una caja es un rectángulo que se construye sobre la base de los valores del primer
cuartil, la mediana y el tercer cuartil. Permite comparar diversos conjuntos de datos
simultáneamente respecto a simetría, variabilidad, centro, valores extremos y valores
atípicos.
95% de los datos

Muy lejanos Q Me Q Muy lejanos


1 3
(datos (datos
extremos) extremos)

Lejanos Cercanos Cercanos Lejanos


(datos atípicos) (datos atípicos)

1,5RIQ 1,5RIQ
RIC = Q3 – Q1

3RIQ 3RIQ

7. COEFICIENTE DE CURTOSIS.

Curtosis es la deformación vertical de una curva de frecuencias. Se define como el grado


de apuntamiento de la curva.
7.1. Clases de curtosis:
a) Leptocurtica, se denomina así cuando la curva de apuntamiento es muy
pronunciada.

b) Platicurtica, se denomina así cuando la curva de apuntamiento es muy achatada.

95
Gestión Curricular
Asignatura: Estadística general

c) Mesocurtica, se denomina así cuando la curva de apuntamiento está en el


intermedio de las dos anteriores.

7.2. Coeficiente de curtosis percentílico (K):


𝑸𝟑 − 𝑸𝟏
𝑲=
𝟐(𝑷𝟗𝟎 − 𝑷𝟏𝟎 )
Donde:
𝑄3 𝑦 𝑄1 : son cuartiles
𝑃90 𝑦 𝑃10 : son percentiles o centiles.
Si:
K=0 la curva de la distribución es mesocurtica
K>0 la curva de la distribución es leptocurtica
K<0 la curva de la distribución es platicurtica
Ejemplo:
Se toman las pulsaciones de un equipo de atletas después de una competencia. Los
datos obtenidos son:
Pulsaciones 70 - 75 75 - 80 80 - 85 85 - 90 90 - 95
N° de atletas 3 3 7 10 12

Solución:
Hallando 𝑄3 𝑦 𝑄1 , 𝑃90 𝑦 𝑃10
Completando la tabla:
Li - Ls ni Ni
70 – 75 3 3
75 – 80 3 6
80 – 85 7 13
85 – 90 10 23
90 - 95 12 35
35
 Hallando Q1:
𝑛
−𝑁𝑖−1
Recordando: 𝑄1 = 𝐿𝑖 + (4 ).𝑐
𝑛𝑖

𝑛 35
Si: = = 8.75 ⟹ 𝑁𝑖 ≥ 8.75 ↦ 𝑁𝑖 = 13
4 4

Considerando el intervalo:
80 – 85 7 13
Reemplazando datos:
𝑛
− 𝑁𝑖−1 8.75 − 6
𝑄1 = 𝐿𝑖 + (4 ) . 𝑐 = 80 + ( ) . 5 = 81.96
𝑛𝑖 7

96
Gestión Curricular
Asignatura: Estadística general

 Hallando Q3:
3𝑛
−𝑁𝑖−1
Recordando: 𝑄3 = 𝑙𝑖 + ( 4 ).𝑐
𝑛𝑖

3𝑛 3(35)
Si: = = 26.25 ⟹ 𝑁𝑖 ≥ 26.25 ⟼ 𝑁𝑖 = 35
4 4

Considerando el intervalo:
90 - 95 12 35
Reemplazando en la fórmula:
3𝑛 3(35)
− 𝑁𝑖−1 − 23
𝑄3 = 𝑙𝑖 + ( 4 ) . 𝑐 = 90 + ( 4 ) . 5 = 91.35
𝑛𝑖 12

 Hallando P10:
10𝑛 10(35)
Si: = = 3.5 ⟹ 𝑁𝑖 ≥ 3.5 ⟼ 𝑁𝑖 = 6
100 100

Considerando el intervalo:
75 – 80 3 6
Reemplazando en la fórmula:
10(35)
−3
𝑃10 = 𝐶10 = 75 + ( 100 ) . 5 = 75.83
3
 Hallando P90:
90𝑛 90(35)
Si: = = 31.5 ⟹ 𝑁𝑖 ≥ 31.5 ⟼ 𝑁𝑖 = 35
100 100

Considerando el intervalo:
90 – 95 12 35
Reemplazando en la fórmula:
90(35)
− 23
𝑃90 = 𝐶90 = 90 + ( 100 ) . 5 = 93.54
12
Por lo tanto:
𝑄3 − 𝑄1 91.35 − 81.96 9.39 9.39
𝐾= = = = = 0.2651 = 0.27
2(𝑃90 − 𝑃10 ) 2(93.54 − 75.83) 2(17.71) 35.42
Significa que viene a ser una curva de frecuencias suavemente leptocurtica

Problemas Desarrollados

1. Para los siguientes datos, calcular el cuartil 1.


265 120 91 115 185 255 233 190 160 170

Solución:
Primer paso: Ordenar los datos en forma ascendente:
91 – 115 – 120 – 160 – 170 – 185 – 190 – 233 – 255 – 265
Segundo paso: Se sabe que Q1 = P25, por lo tanto, calcularemos el percentil 25.

97
Gestión Curricular
Asignatura: Estadística general

25
Calcular el localizador L: (k = 25) 𝐿= × 10 = 2,5
100

Tercer paso: Redondeamos L con las reglas del redondeo que hemos aprendido
anteriormente, en este caso L=3
Cuarto paso: Calculamos el valor de P25 (el dato que ocupa la posición 3 empezando
del menor dato).
91 – 115 – 120 – 160 – 170 – 185 – 190 – 233 – 255 – 265
P25=120

Interpretación: El 25% de los datos son menores o iguales a 120 y el 75% restante son
mayores o iguales que este valor.

2. Sean los calificativos de una evaluación de estadística de 45 estudiantes, determina el


percentil 10 y 90.
[𝑳𝒊 − 𝑳𝑺 [ ni
[26 − 34[ 1
[34 − 42[ 2
[42 − 50[ 4
[50 − 58[ 10
[58 − 66[ 16
[66 − 74[ 8
[74 − 82[ 3
[82 − 90[ 1
N = 45
Solución
Completamos la tabla, aumentando una columna para la frecuencia absoluta acumulada
(Ni).
[𝑳𝒊 − 𝑳𝑺 [ ni Ni
[26 − 34[ 1 1
[34 − 42[ 2 3
[42 − 50[ 4 7
[50 − 58[ 10 17
[58 − 66[ 16 33
[66 − 74[ 8 41
[74 − 82[ 3 44
[82 − 90[ 1 45
N = 45
Hallando el:𝑃10
Si: 10N/100 =10(45)/100= 4.5
Se busca un Ni que sea mayor o igual que N/4 (N=n° Total de datos)
Entonces: Ni ≥ 4.5 el más cercano será Ni= 7
[42 − 50[ 4 7
Dónde:
Li = 42 𝑁𝑖−1 = 3 𝑛𝑖 = 4 c=8

98
Gestión Curricular
Asignatura: Estadística general

Remplazando en la fórmula:
10𝑛 10(45)
− 𝑁𝑖−1 −3
𝑃10 = 𝑙𝑖 + ( 100 ) . 𝑐 = 42 + ( 100 ) . 8 = 45
𝑛𝑖 4
Hallando el:𝑃90
Si: 90N/100 =90(45)/100= 40.50
Luego se busca un Ni que sea mayor o igual que N/4 (N=n° Total de datos)
Entonces: Ni ≥ 40.50 el más cercano será Ni = 41
[66 − 74[ 8 41
Dónde:
Li = 66 𝑁𝑖−1 = 33 𝑛𝑖 = 8 c=8
90𝑛 90(45)
− 𝑁𝑖−1 − 33
𝑃90 = 𝑙𝑖 + ( 100 ) . 𝑐 = 66 + ( 100 ) . 8 = 73.50
𝑛𝑖 8

Problemas Propuestos

1. Establezca el valor de verdad (V) o falsedad (F) de las siguientes proposiciones:

Q1= P50 ( ) Q3 =P75 ( )

Me = P5 ( ) Q2 =P50 =Me ( )

Q1 = P25 ( ) P75 =Me ( )


2. Los tiempos (en minutos) empleados por un grupo de mecánicos para armar un motor fueron
los siguientes:
11 18 15 13 14 16 10 9 14 17 18 20 25
a) ¿Cuánto tiempo le tomó como máximo al 35% de los mecánicos más experimentados?
b) ¿Cuánto tiempo como mínimo le tomó al 18% de los mecánicos con menos experiencia?
3. Los siguientes datos corresponden al peso de 15 estudiantes:
48 50 52 49 58
48 52 60 57 61
55 48 63 65 54
a) ¿Cuál es el peso máximo del 75% de los alumnos?
b) ¿Cuál es el peso mínimo del 63% de los alumnos?

99
Gestión Curricular
Asignatura: Estadística general

4. Los ingresos diarios (en Nuevos Soles) de un grupo de supervisores de la obra de construcción
del nuevo centro comercial se han resumido en la siguiente tabla de frecuencias:

Ingresos Xi ni
[48 − 52[50 12
[52 − 56[54 25
[56 − 60[58 58
[60 − 64[62 32
[64 − 68[66 10
a) ¿Cuánto tiene como ingreso máximo el 32% de los supervisores?
b) ¿Cuánto tiene como ingreso mínimo el 25% de los supervisores?
5. Dada la tabla siguiente, referente a los pesos de cierto número de pacientes de un hospital:
Pesos ni
[0 − 12[5
24
[12 − 24[
18
[24 − 36[
36
[36 − 48[
17
[48 − 60[
10
[60 − 72[
a) Calcule media, mediana y moda de los pesos.
b) Calcule: Cuartil 1, 2 y 3. (Compare el cuartil 2 con la mediana). Comente.
c) Calcule: Percentil 28 y 50. (Compare el percentil 50 con la mediana). Comente.
d) ¿Cuánto pesa como máximo el 19% de pacientes?
e) ¿Cuánto pesa como mínimo el 42% de pacientes?
f) Calcule el rango intercuartil (RIC). Interprete.

Video de Apoyo

Video 1: Cuartiles introducción | Qué son y como encontrarlos en datos sin agrupar
(https://www.youtube.com/watch?v=suSz9RXFNTs)

Video 2: Cuartiles, Deciles y Percentiles | Datos agrupados en intervalos | Ejemplo 1


(https://www.youtube.com/watch?v=Eju_9eM4PZg)

100
Gestión Curricular
Asignatura: Estadística general

Semana 12
EVALUACIÓN DE LA TERCERA UNIDAD
SESIÓN 23: PRUEBA DE DESARROLLO

Problemas de repaso

1. La tabla siguiente muestra los nombres de los 42 presidentes de Estados Unidos, junto con
el número de sus hijos.2
Washington 0 Hayes 8 F.D. Roosevelt 6
Van Buren 4 J.Q. Adams 4 Carter 4
Buchanan 0 Fillmore* 2 T. Roosevelt* 6
Adams 5 Garfi eld 7 Truman 1
W.H. Harrison 10 Jackson 0 Taft 3
Lincoln 4 Pierce 3 Eisenhower 2
Jefferson 6 Arthur 3 G.H Reagan* 4
Tyler* 15 Cleveland 5 .W. Bush 6
A. Johnson 5 Coolidge 2 Wilson* 3
Madison 0 Nixon 2 Kennedy 3
Polk 0 B. Harrison* 3 Clinton 1
Grant 4 Hoover 2 Harding 0
Monroe 2 Ford 4 L.B. Johnson 2
Taylor 6 McKinley 2 G.W. Bush 2
*Casado dos veces
Fuente: Time Almanac 2007

a) Construya un histograma de frecuencia relativa para describir los datos.


b) Calcule la media y la desviación estándar para el conjunto de datos.

2. El número de pases completados por Brett Favre, mariscal de campo de los Empacadores
de Green Bay, se registró en cada uno de los 16 juegos regulares de la temporada de
verano de 2006 (www.espn.com)9.

15 31 25 22 22 19 17 28 24 5 22 24 22
20 26 21

a) Trace una gráfica de tallo y hoja para describir los datos.


b) Calcule la media y desviación estándar para los pases completados por juego de Brett
Favre.

101
Gestión Curricular
Asignatura: Estadística general

3. Los científicos del medio ambiente están cada vez más preocupados por la acumulación
de elementos tóxicos en mamíferos marinos, así como en el paso de esos elementos a los
descendientes de esos animales. El delfín de franjas (Stenella coeruleoalba), considerado
el principal depredador en la cadena alimenticia marina, fue objeto de este estudio. Las
concentraciones de mercurio (microgramos/gramo) en los hígados de 28 delfi nes de
franjas machos fueron como sigue:

1.70 183.00 118.00 406.00 278.00 209.00

1.72 168.00 264.00 252.00 286.00 314.00

8.80 218.00 481.00 329.00 315.00 318.00

5.90 180.00 485.00 316.00 241.00

101.00 85.40 221.00 445.00 397.00

a) Calcule el resumen de cinco números para los datos.


b) Construya una gráfica de caja para los datos.
c) ¿Hay algún resultado atípico?
d) Si usted supiera que los primeros cuatro delfines tenían menos de tres años de edad,
en tanto que los otros tenían más de ocho años de edad, ¿esta información ayudaría
a explicar la diferencia en la magnitud de esas cuatro observaciones? Explique.

4. Los pesos (en libras) de los 27 paquetes de carne molida de res del ejercicio 2.24 (véase el
conjunto de datos EX0224) aparecen a continuación, en orden de menor a mayor:

0.75 0.83 0.87 0.89 0.89 0.89 0.92

0.93 0.96 0.96 0.97 0.98 0.99 1.06

1.08 1.08 1.12 1.12 1.14 1.14 1.17

1.18 1.18 1.24 1.28 1.38 1.41

a) Confirme los valores de la media y desviación estándar, calculados en el ejercicio


b) Construya una gráfica de caja para los pesos de paquetes. ¿Qué nos dice la posición
de la recta mediana y la longitud de los bigotes acerca de la forma de la distribución?

102
Gestión Curricular
Asignatura: Estadística general

Unidad IV

Resultado de Aprendizaje de la Unidad I:


Al finalizar la unidad, el estudiante será capaz de calcular e interpretar
probabilidades en distribuciones discretas y continuas en acontecimientos
cotidianos de su carrera profesional.

ORGANIZACIÓN DE APRENDIZAJES

TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN


SEMANA N° 13

25. Probabilidades fundamentos: Actividad N° 25 Consolidado 2:


Fundamentos: Definiciones, Elabora un organizador del Ejercicios para identificar
notación, evento, conocimiento, se apoya de su alternativas de solución.
propiedades, probabilidades guía. (individual) Evaluación final:
con técnicas de conteo y Responde las interrogantes de la Evaluación individual de
variable aleatoria. guía de aprendizaje. desarrollo teórico-práctico
26. Probabilidades fundamentos: Actividad N° 26
Probabilidades con técnicas Calcula ejercicios aplicando la
de conteo y variable técnica de conteo y variable
aleatoria – software aleatoria.
estadístico. Actividad N° 27
Calcula la distribución de
SEMANA N° 14 binomial y Poisson e interpreta los
resultados.
27. Distribución de probabilidad Desarrolla la guía de trabajo.
discreta: Distribución Actividad N° 28
Binomial, Poisson. Aplica las funciones del Excel,
28. Distribución de probabilidad para calcular la distribución de
discreta: Distribución binomial y Poisson.
Binomial, Poisson - software Desarrolla la guía de trabajo.
estadístico. Actividad N° 29
Estandariza, grafica, calcula el
SEMANA N° 15
área de la distribución normal e
29. Distribución de probabilidad interpreta los resultados.
normal: Distribuciones Desarrolla la guía de trabajo.
uniformes. Distribución normal Práctica calificada grupal
estándar. Actividad N° 30
30. Distribución de probabilidad Aplica las funciones del Excel,
normal: Distribuciones para calcular la distribución de la
uniformes. Distribución normal probabilidad normal interpola
estándar - software Actividad N° 31
estadístico. Prueba de desarrollo
Actividad N° 32
SEMANA N° 16 Entrega de notas y resolución de
la prueba de desarrollo.
31. Evaluación final.
32. Desarrollo de la evaluación
final.

103
Gestión Curricular
Asignatura: Estadística general

Semana 13
PROBABILIDADES FUNDAMENTOS

La teoría de la probabilidad es una de las ramas de las


matemáticas con varias aplicaciones en la actualidad. las
primas de los seguros, los riesgos nucleares, pronósticos
económicos, pronósticos políticos, pronósticos del tiempo.

Andréi
Nikoláyevich
Kolmogórov
B. efectos
psicologicos

C. Euclides

A. Andréi Nikoláyevich Kolmogórov: Fue un matemático ruso que realizó aportes


de primera línea en los contenidos de teoría de la probabilidad y de topología.
B. Mijaíl Alekséyevich Lavréntiev: En 1927, Lavréntiev pasó medio año en Francia,
colaborando con matemáticos franceses. Tras volver a la Unión Soviética, se
incorporó a la Universidad de Moscú. Posteriormente, hizo lo propio en el
Instituto Steklov de Matemáticas.

104
Gestión Curricular
Asignatura: Estadística general

TEORÍA DE LA PROBABILIDAD

El origen de las probabilidades se inicia en el año de 1654 cuando el matemático francés


LECTURA

Blaise Pascal hacia un viaje con el apasionado jugador de dados y cartas, conocido como
El Caballero de Mere, quien era noble e ilustrado. Este creía que había encontrado una
falsedad en los números al analizar el comportamiento de los dados, era diferente cuando
se utilizaba un dado, que cuando se utilizaban dos dados. Esta presunción era una
comparación errónea, entre las probabilidades de sacar un seis en un solo dado o de sacar
un seis con dos dados.

PROBLEMA PLANTEADO CON DIFERENTES JUEGOS DE AZAR Lo planteado por Mere a Pascal
dieron origen a una correspondencia entre pascal y algunos de sus amigos matemáticos
entre ellos PIERRE DE FERMAT abogado de profesión pero amantes de las matemáticas.

APORTES DE PASCAL En la Filosofía Teología (intentando argumentar la existencia de Dios


en términos probabilísticos y gananciales). Decía es MEJOR CREER QUE NO CREER, es decir,
mejor actuar como si existiera por si acaso existe.

ORIGEN DE LAS PROBABILIDADES Las probabilidades abarca un periodo de tiempo que se


pierde en las nieblas de la antigüedad y que llega hasta el siglo 16 con los cambios de
PACHOLI, TARTAGLIA, entre otros. En este periodo se usaron conceptos rudimentarios de
probabilidad, azar y aleatoriedad, que están relacionados con aspectos adivinatorios y
religiosos. Rabinovitch 1973 recoge ejemplos de usos de mecanismos aleatorios
mencionado en la literatura Talmúdica y Rabinica.

La talmúdica describe propiedades de ,mecanismos aleatorios tales como juegos de azar,


lanzamiento de una moneda, etc. La rabínica es usada para medir la opinión sobre la
ocurrencia de un seceso, parte de suponer unas probabilidades iniciales o aprioris. La
manera de pasar de una a otra probabilidad es mediante el concurso del teorema de
BAYES que en su versión continua dice: rc(8lx)=rc(8)f(xl8) Jrc(8)f(x l8)d8.

LA TEORIA DE LA PROBABILIDAD SIGLO XVIII Se aplica en los juegos en sentidos amplios y en


la jurisprudencia. También en la forma de análisis de datos y de la inferencia inductiva se
aplica a la teoría del seguro. En el siglo XIX se aplica en la física la biología y la psicología,
mas adelante en la agronomía, en las encuestas, en los contrastes médicos, en el deporte,
entre otros.

Fuente: P. Ibarrola, L. Pardo y V. Quesada (1997): Teoría de la Probabilidad, Ed. Síntesis,


ISBN 84-7738-516-5.
Spiegel, Murray. 1970. Estadística, McGraw-Hill, México.
Olav Kallenberg, Probabilistic Symmetries and Invariance Principles. Springer-Verlag, New
York (2005). 510 pp. ISBN 0-387-25115-4
Kallenberg, O., Foundations of Modern Probability, 2nd ed. Springer Series in Statistics.
(2002). 650 pp. ISBN 0-387-95313-2

105
Gestión Curricular
Asignatura: Estadística general

PROBABILIDADES
Propósito:
 Identificar los elementos de los experimentos aleatorios.
 Calcular e interpretar la probabilidad de la ocurrencia de eventos aleatorios.

SESIÓN 25: PROBABILIDADES FUNDAMENTOS.

1. FUNDAMENTOS.
Si el único propósito del investigador fuese describir los resultados de un experimento o fenómeno
concreto, los métodos analizados en Estadística Descriptiva pueden considerarse suficientes.
Pero si lo que se pretende es utilizar la información obtenida para extraer conclusiones generales
sobre todos aquellos objetos del tipo de los que han sido estudiados, entonces estos métodos
constituyen sólo el principio del análisis, y debe recurrirse a métodos de inferencia estadística, los
cuales implican el uso inteligente de la teoría de la probabilidad.
Utilizando la teoría de la probabilidad podremos sacar conclusiones precisas acerca de una
población en base a una muestra extraída de ella, y que muchos de los estudios estadísticos son
de hecho, estudio de las propiedades de una o más variables estadísticas.
En muchas oportunidades nos hemos encontrado con afirmaciones donde no existe 100% de
certeza sobre la aparición o realización de un hecho o fenómeno.
Por ejemplo, continuamente escuchamos situaciones como las siguientes:
 Dados los niveles de inflación en los últimos meses en el país, es probable que el próximo año
la economía alcance niveles de hiperinflación.
 Debido a la agresiva campaña publicitaria sobre el programa de vacunación para este
año, es probable que aumente sustancialmente el número de niños vacunados.
 Dada la reducción continua de los ingresos reales y el aumento del desempleo en la
población, es probable que en los próximos meses se desate una serie de conflictos sociales.
En estos ejemplos se puede apreciar que el resultado final no se conoce con exactitud o certeza,
existe por lo tanto Inseguridad.
Así “se vive en un mundo donde se está en incapacidad de predecir el futuro con completa
certeza. La necesidad de tener suficiente poder para manejar la inseguridad obliga a estudiar y
usar la teoría de la probabilidad”.
La probabilidad, por lo tanto, nos proporciona la base para el estudio de la inferencia estadística.
Aquí estudiaremos conceptos y técnicas de probabilidad, que nos permitan comprender el
análisis estadístico inferencial.

106
Gestión Curricular
Asignatura: Estadística general

2. EXPERIMENTOS ALEATORIOS Y ESPACIO MUESTRAL.


En la teoría de probabilidades se habla a menudo de experimentos aleatorios y de fenómenos
aleatorios.
La palabra aleatorio proviene del vocablo latino alea, el cual significa suerte o azar.
Un fenómeno aleatorio, es, por tanto, aquél cuyo resultado está fuera de control y que
depende del azar.
Experimentos o fenómenos aleatorios son los que pueden dar lugar a varios resultados, sin
que pueda ser previsible enunciar con certeza cuál de éstos va a ser observado en la
realización del experimento.
a. Es una experiencia determinista.
Son aquellos que, realizados de una misma forma y con las mismas condiciones iniciales,
ofrecen siempre el mismo resultado. Como ejemplo, tenemos que un objeto de cualquier
masa partiendo de un estado inicial de reposo, y dejado caer al vacío desde una torre,
llega siempre al suelo con la misma velocidad:
𝒗 = √𝟐𝒈𝒉
La velocidad del cuerpo al llegar al suelo es v, g es la aceleración de la gravedad y h es
la altura de la torre. Se supone que no existe rozamiento con el aire (vacío).
Ejemplo:
Si dejamos caer una piedra o la lanzamos, y conocemos las condiciones iniciales de
altura, velocidad, etc., sabremos con seguridad dónde caerá, cuánto tiempo tardará,
etc.
b. Es una experiencia aleatoria (EA).
Cuando en un experimento no se puede predecir el resultado final.
Es decir, un experimento o fenómeno aleatorio es aquel que en las mismas condiciones
iniciales produce resultados diferentes finales.
Un experimento es aleatorio si cumple con las siguientes condiciones:
 Se puede repetir indefinidamente siempre en las mismas condiciones.
 Antes de realizarlo, no se sabe el resultado que se ha de obtener.
 El resultado obtenido forma parte de un conjunto de posibles resultados ha
obtenerse, a este conjunto de resultados posibles se le denomina ESPACIO MUESTRAL
(Ω ó E), a cada uno de los elementos del espacio muestral se denominan SUCESOS
ELEMENTALES (a, b, c,….etc) ó (e1, e2, e3, …,etc)
Ejemplo:
Si echamos un dado sobre una mesa, ignoramos qué cara quedará arriba.
El resultado depende del azar.

107
Gestión Curricular
Asignatura: Estadística general

La vida cotidiana está plagada de sucesos aleatorios. Muchos de ellos, de tipo


sociológico (viajes, accidentes, número de personas que acudirán a un gran almacén o
que se matricularán en una carrera.......,etc) aunque son suma de muchas decisiones
individuales, pueden ser estudiados, muy ventajosamente, como aleatorios.
Por lo tanto:
Un experimento aleatorio, es un proceso de observación, donde el resultado exacto
no se conoce, predominando, por tanto, cierto margen de duda.
Ejemplos:
Sea el experimento: Resultado
 “Resultado del examen final  Antes del examen, el resultado no se
en el curso de Estadística conoce con exactitud; es decir, no Por lo
por parte de un estudiante. sabemos si el estudiante aprobará o tanto el
desaprobará el examen final. experim
 Resultado del lanzamiento  Existe margen de duda en el resultado ento es
de una moneda. exacto, pues, es posible que en éste aleatorio
aparezca cara o sello.

En general:
Todos los juegos al azar constituyen experimentos aleatorios: Rifas, dados, carreras de
caballos, loterías, barajas, etc.
Los trabajos de investigación constituyen también experimentos aleatorios, ya que antes
de ejecutarlos, no se sabe si las hipótesis planteadas serán probadas o desaprobadas.

c. ESPACIO MUESTRAL (Ω, E, S, EM)


Es el conjunto formado por todos los posibles resultados de un experimento aleatorio.
Ejemplo 1:
Sea el experimento aleatorio: “Resultado del examen final en la asignatura de Estadística
general por parte de un estudiante”
El espacio muestral es:
𝑬𝑴 = {𝑨𝑷𝑹𝑶𝑩𝑨𝑹, 𝑫𝑬𝑺𝑨𝑷𝑹𝑶𝑩𝑨𝑹}
Ejemplo 2:
Sea el experimento aleatorio: Resultado del lanzamiento de una moneda.
El espacio muestral es:
𝑬𝑴 = {𝑪𝑨𝑹𝑨, 𝑺𝑬𝑳𝑳𝑶}
Ejemplo 3:
En una empresa de lácteos hacen control de calidad al llenado de bolsas de leche de
1000 cc de volumen. Cada 20 minutos se verifica el volumen de llenado de la máquina.
La evaluación continua hasta encontrar una bolsa que no cumple las especificaciones.
Sea “s” el hecho de que la bolsa de leche cumple con las especificaciones de volumen,
y “n” las que no cumple con ellas. ¿Cuál es el espacio muestral de este experimento?

108
Gestión Curricular
Asignatura: Estadística general

El espacio muestral se representa como una secuencia de las letras s y n. Dado que el
experimento termina cuando una bolsa de leche no cumple con las especificaciones de
volumen, el espacio muestral estará formado por una secuencia de “s” seguida por una
“n”.
S = {n, sn, ssn, sssn, ssssn, sssssn,...}
d. SUCESOS O EVENTOS.
Suceso aleatorio es un acontecimiento que ocurrirá o no, dependiendo del azar.
Además, un suceso aleatorio es cualquier subconjunto del espacio muestral y se denota
con las letras mayúsculas A, B, C, etc.
Ejemplos 1:
Sea el experimento aleatorio:
“Selección de un alumno de acuerdo a su rendimiento académico
El espacio muestral será:
𝐸𝑀 = {𝑆𝑂𝐵𝑅𝐸𝑆𝐴𝐿𝐼𝐸𝑁𝑇𝐸, 𝐵𝑈𝐸𝑁𝑂, 𝑅𝐸𝐺𝑈𝐿𝐴𝑅, 𝑀𝐴𝐿𝑂}
Podemos observar que cada resultado es un subconjunto del espacio muestral, por lo
tanto, cada uno de ellos es un evento. Si denotamos por A, B, C, D los eventos; entonces
tendremos:
𝐸𝑣𝑒𝑛𝑡𝑜 𝐴 = {𝑆𝑂𝐵𝑅𝐸𝑆𝐴𝐿𝐼𝐸𝑁𝑇𝐸}
𝐸𝑣𝑒𝑛𝑡𝑜 𝐵 = {𝐵𝑈𝐸𝑁𝑂}
𝐸𝑣𝑒𝑛𝑡𝑜 𝐶 = {𝑅𝐸𝐺𝑈𝐿𝐴𝑅}
𝐸𝑣𝑒𝑛𝑡𝑜 𝐷 = {𝑀𝐴𝐿𝑂}
Ejemplos 2:
Un experimento aleatorio sería el lanzamiento de un dado, siendo su espacio muestral:
𝛀 = {𝟏; 𝟐; 𝟑; 𝟒; 𝟓; 𝟔}
Pudiéndose dar infinidad de procesos aleatorios, tales como:
𝐴: 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑢𝑛 𝑛ú𝑚𝑒𝑟𝑜 𝑝𝑎𝑟 𝑒𝑛 𝑒𝑙 𝑙𝑎𝑛𝑧𝑎𝑚𝑖𝑛𝑒𝑡𝑜 𝑑𝑒 𝑢𝑛 𝑑𝑎𝑑𝑜
𝐴 = {2; 4; 6} ⟹ 𝐴 ⊂ 𝛀
𝐵: 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑢𝑛 𝑛ú𝑚𝑒𝑟𝑜 𝑚𝑒𝑛𝑜𝑟 𝑞𝑢𝑒 3 𝑒𝑛 𝑒𝑙 𝑙𝑎𝑛𝑧𝑎𝑚𝑖𝑛𝑒𝑡𝑜 𝑑𝑒 𝑢𝑛 𝑑𝑎𝑑𝑜
𝐵 = {1; 2} ⟹ 𝐵 ⊂ 𝛀
Ejemplos 3:
Otro experimento aleatorio sería el lanzamiento de dos monedas, siendo su
espacio muestral:
𝐄 = {𝒄𝒄; 𝒄𝒔; 𝒔𝒄; 𝒔𝒔}
Siendo algunos de los procesos aleatorios:
𝐴: 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑜𝑠 𝑠𝑒𝑙𝑙𝑜𝑠 𝑒𝑛 𝑒𝑙 𝑙𝑎𝑛𝑧𝑎𝑚𝑖𝑛𝑒𝑡𝑜 𝑑𝑒 𝑑𝑜𝑠 𝑚𝑜𝑛𝑒𝑑𝑎𝑠
𝐴 = {𝑠𝑠} ⟹ 𝐴 ⊂ 𝐄
𝐵: 𝑜𝑏𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑒𝑥𝑎𝑐𝑡𝑎𝑚𝑒𝑛𝑡𝑒 𝑢𝑛 𝑠𝑒𝑙𝑙𝑜 𝑒𝑛 𝑒𝑙 𝑙𝑎𝑛𝑧𝑎𝑚𝑖𝑛𝑒𝑡𝑜 𝑑𝑒 𝑑𝑜𝑠 𝑚𝑜𝑛𝑒𝑑𝑎𝑠
𝐵 = {𝑠𝑐; 𝑐𝑠} ⟹ 𝐵 ⊂ 𝐄

109
Gestión Curricular
Asignatura: Estadística general

EVENTO SEGURO O SUCESO UNIVERSAL (U).


Se llama así al evento que de todas maneras debe ocurrir.
Ejemplo:
Sea el experimento:
“Selección de un propietario de inmueble con ingresos medio-alto, de la
Urbanización Las Casuarinas – Lima.
Se puede apreciar que el Evento es seguro o universal, ya que, al Seleccionar un
propietario de inmueble, éste de todas maneras tendrá ingresos medio - alto, ya que
se trata de una zona residencial de Lima.
EVENTO IMPOSIBLE (ɸ).
Es el evento que no va a ocurrir.
Ejemplo:
Sea el experimento:
“Selección de un propietario de inmueble con ingresos bajos, de la Urbanización Las
Casuarinas – Lima.
En este caso, el evento es imposible, ya que no se podrá seleccionar un propietario de
inmuebles con bajos ingresos en una zona residencial.
EVENTO COMPLEMENTARIO.
El complemento del Evento A, se denota por el símbolo 𝐴̅ (se lee: no A), y significa que
el Evento A no ocurre.
Ejemplo:
Sea el evento: 𝐴 = {𝑃𝑎𝑐𝑖𝑒𝑛𝑡𝑒 𝑐𝑜𝑛 𝑡𝑢𝑚𝑜𝑟 𝑐𝑎𝑛𝑐𝑒𝑟𝑜𝑠𝑜}
Entonces su complemento será:
𝐴̅ = {𝑃𝑎𝑐𝑖𝑒𝑛𝑡𝑒 𝑐𝑜𝑛 𝑡𝑢𝑚𝑜𝑟 𝑛𝑜 𝑐𝑎𝑛𝑐𝑒𝑟𝑜𝑠𝑜}
EVENTOS MUTUAMENTE EXCLUYENTES.
Dos o más eventos son mutuamente excluyentes, si la ocurrencia de uno de ellos, anula
la ocurrencia de los demás.
Ejemplo:
Sea el experimento aleatorio:
“Selección de un profesor de la Universidad X, según categoría docente”.
El espacio muestral es:
𝐸𝑀 = {𝑃𝑅𝐼𝑁𝐶𝐼𝑃𝐴𝐿, 𝐴𝑆𝑂𝐶𝐼𝐴𝐷𝑂, 𝐴𝑈𝑋𝐼𝐿𝐼𝐴𝑅, 𝐽𝐸𝐹𝐸 𝐷𝐸 𝑃𝑅Á𝐶𝑇𝐼𝐶𝐴}
Siendo los eventos:
𝐴 = 𝑃𝑟𝑜𝑓𝑒𝑠𝑜𝑟 𝑝𝑟𝑖𝑛𝑐𝑖𝑝𝑎𝑙
𝐵 = 𝑃𝑟𝑜𝑓𝑒𝑠𝑜𝑟 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑜
𝐶 = 𝑃𝑟𝑜𝑓𝑒𝑠𝑜𝑟 𝑎𝑢𝑥𝑖𝑙𝑖𝑎𝑟
𝐷 = 𝑃𝑟𝑜𝑓𝑒𝑠𝑜𝑟 𝑗𝑒𝑓𝑒 𝑑𝑒 𝑝𝑟á𝑐𝑡𝑖𝑐𝑎

110
Gestión Curricular
Asignatura: Estadística general

Los cuatro eventos son mutuamente excluyentes, porque al seleccionar un Docente,


este tendrá sólo una categoría; anulándose el resto de los eventos. No es posible
sostener, por ejemplo, que al seleccionar un Docente, éste tenga la categoría de
Principal y Jefe de Práctica a la vez.

EVENTOS INDEPENDIENTES.
Dos eventos son independientes si ambos no tienen ninguna relación entre sí; es decir,
si la ocurrencia de uno de ellos, no incluyen en la ocurrencia del otro.
Ejemplo:
Sean los eventos:
𝑋 = 𝑃𝑟𝑖𝑚𝑒𝑟 𝑎𝑙𝑢𝑚𝑛𝑜 𝑞𝑢𝑒 𝑎𝑝𝑟𝑢𝑒𝑏𝑒 𝑒𝑙 𝑒𝑥𝑎𝑚𝑒𝑛 𝑑𝑒 𝑒𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑎
𝑌 = 𝑆𝑒𝑔𝑢𝑛𝑑𝑜 𝑎𝑙𝑢𝑚𝑛𝑜 𝑞𝑢𝑒 𝑎𝑝𝑟𝑢𝑒𝑏𝑒 𝑒𝑙 𝑒𝑥𝑎𝑚𝑒𝑛 𝑑𝑒 𝑒𝑠𝑡𝑎𝑑𝑖𝑠𝑡𝑖𝑐𝑎
X e Y son independientes porque al ocurrir el evento X, éste no incluye para que el
evento Y ocurra.

3. CONCEPTO DE PROBABILIDAD.
La probabilidad es una disciplina abstracta que se usa como modelo para hacer
deducciones relativas a eventos que posiblemente pueden ocurrir.

4. TIPOS DE PROBABILIDAD.
Existen tres enfoques para el estudio de la probabilidad:
a. Probabilidad clásica.
Llamada también probabilidad a priori debido a que es posible conocer el resultado con
anterioridad, es decir, sin llevar acabo el experimento y sólo basado en un razonamiento
lógico.
Generalmente esta probabilidad se usa para experimentos simples.
Se calcula a través de:
𝑪𝒂𝒔𝒐𝒔 𝒇𝒂𝒗𝒐𝒓𝒂𝒃𝒍𝒆𝒔 𝒅𝒆 𝑶𝒄𝒖𝒓𝒓𝒆𝒏𝒄𝒊𝒂 𝒅𝒆𝒍 𝑬𝒗𝒆𝒏𝒕𝒐 𝑨
𝒑(𝑨) =
𝑻𝒐𝒕𝒂𝒍 𝒅𝒆 𝑪𝒂𝒔𝒐𝒔 𝑷𝒐𝒔𝒊𝒃𝒍𝒆𝒔
Ejemplo 1:
Hallar la probabilidad de obtener cara en el lanzamiento de una moneda.
Solución
Definimos el espacio muestral:
𝐸𝑀 = {𝑐𝑎𝑟𝑎, 𝑠𝑒𝑙𝑙𝑜}
Sea el evento:
𝐴 = 𝑂𝑏𝑡𝑒𝑛𝑒𝑟 𝑐𝑎𝑟𝑎
Luego:
𝐶𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑑𝑒 𝑂𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝐸𝑣𝑒𝑛𝑡𝑜 𝐴 1
𝑝(𝐴) = =
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 2

111
Gestión Curricular
Asignatura: Estadística general

𝑝(𝐴) = 0.5 = 50% (Para obtener el resultado multiplicamos por 100)

Ejemplo 2:
Hallar la probabilidad de obtener el número 2 en el lanzamiento de un dado.
Solución
Definimos el espacio muestral:
𝐸𝑀 = {1,2,3,4,5,6}
Sea el evento:
𝐵 = 𝑂𝑏𝑡𝑒𝑛𝑒𝑟 𝑒𝑙 𝑛ú𝑚𝑒𝑟𝑜 2
Luego:
𝐶𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 𝑑 𝑂𝑐𝑢𝑟𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒𝑙 𝐸𝑣𝑒𝑛𝑡𝑜 𝐴 1
𝑝(𝐵) = =
𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 6

𝑝(𝐵) = 0.17 = 17%

b. Probabilidad de Frecuencia Relativa de la Ocurrencia.


El cálculo de este tipo de probabilidad se basa en la repetición de la ocurrencia de un
evento, al realizar una gran cantidad de pruebas o experimentos.
Se halla a través de:
𝑵ú𝒎𝒆𝒓𝒐 𝒅𝒆 𝒗𝒆𝒄𝒆𝒔 𝒒𝒖𝒆 𝑶𝒄𝒖𝒓𝒓𝒊𝒐 𝒆𝒍 𝑬𝒗𝒆𝒏𝒕𝒐 𝑨
𝒑(𝑨) =
𝑵ú𝒎𝒆𝒓𝒐 𝑻𝒐𝒕𝒂𝒍 𝒅𝒆 𝒗𝒆𝒄𝒆𝒔 𝒒𝒖𝒆 𝒔𝒆 𝑹𝒆𝒑𝒊𝒕𝒊ó 𝒆𝒍 𝑬𝒙𝒑𝒆𝒓𝒊𝒎𝒆𝒏𝒕𝒐

La probabilidad de frecuencias relativas, es llamada también probabilidad empírica o a


posteriori, debido a que se obtiene el resultado después de llevar acabo el experimento
un gran número de veces.
Ejemplo:
En una encuesta realizada a 500 vendedores ambulantes de Lima, se encontró que 325
de ellos se dedicaban a esta actividad porque habían sido despedidos de empresas
fabriles. Hallar la probabilidad de que, al seleccionar aleatoriamente un vendedor
ambulante, éste haya sido despedido de una empresa fabril.
Solución
Sea el evento:
𝐵 = 𝑉𝑒𝑛𝑑𝑒𝑑𝑜𝑟 𝑎𝑚𝑏𝑢𝑙𝑎𝑛𝑡𝑒 𝑑𝑒𝑠𝑝𝑒𝑑𝑖𝑑𝑜
N° de veces que ocurrió 𝐵 = 325
N° total de veces que se repitió el experimento = 500
Luego:
325
𝑝(𝐵) = = 0.65 = 65%
500

c. Probabilidad Subjetiva.
Es la probabilidad asignada bajo un criterio “personal”; basándose en cualquier tipo de
evidencia disponible.

112
Gestión Curricular
Asignatura: Estadística general

Estas probabilidades se asignan a eventos que puedan suceder sólo una vez o muy pocas
veces.
Ejemplos:
 La probabilidad de que el hombre llegue a habitar la luna en los próximos 20 años.
 La probabilidad de que se encuentre una cura para el sida en los próximos 5 años.
Se puede decir que, dado un experimento determinado la probabilidad subjetiva de un
evento “A” es el grado de creencia asignado a la ocurrencia de este evento por un
individuo basado en toda la evidencia a su disposición con las siguientes exigencias:
a) 𝑃(𝐴) = 0 Representa que A no ocurrirá.
b) 𝑃(𝐴) = 1 Representa que A si ocurrirá.
c) 0 < 𝑃(𝐴) < 1 Representa el grado de certeza de que el evento “A” ocurrirá.

Es un enfoque menos usado, consiste en que la probabilidad es el juicio personal o grado


de creencia.
Ejemplo:
 Mirando al cielo: “es poco probable que hoy llueva”
 Calcular la probabilidad de que un tenista gane un campeonato.
 Calcular la probabilidad de que un club de futbol salga campeón.
 Calcular la probabilidad de que el precio de las acciones de una Compañía se
incremente en dos años.
5. LEYES O AXIOMAS DE LA PROBABILIDAD.
Para hacer una definición rigurosa de la probabilidad, necesitamos precisar ciertas leyes o
axiomas que se debe cumplir, tales como:
a) La probabilidad sólo debe tomar valores comprendidos entre 0 y 1
0 ≤ 𝑝(𝐴) ≤ 1
b) La probabilidad del suceso seguro es 1, es decir, el 100%
𝑝(𝐸𝑀) = 1
c) La probabilidad del suceso imposible debe ser 0
𝑝(𝜙) = 0
d) La probabilidad de la intersección de dos sucesos debe ser menor o igual que la
probabilidad de cada uno de los sucesos por separado, es decir:
𝑝(𝐴 ∩ 𝐵) ≤ 𝑝(𝐴)
𝑝(𝐴 ∩ 𝐵) ≤ 𝑝(𝐵)
e) La probabilidad de la unión de sucesos debe ser mayor que la de cada uno de los sucesos
por separado.
𝑝(𝐴 ∪ 𝐵) ≥ 𝑝(𝐴)
𝑝(𝐴 ∪ 𝐵) ≥ 𝑝(𝐵)
f) Más aún, si los sucesos son disjuntos (incompatibles) debe ocurrir que:
𝐴 ∩ 𝐵 = ∅ → 𝑝(𝐴 ∪ 𝐵) = 𝑝(𝐴) + 𝑝(𝐵)

113
Gestión Curricular
Asignatura: Estadística general

g) Si los sucesos no son disjuntos debe ocurrir que:


𝐴 ∩ 𝐵 ≠ ∅ → 𝑝(𝐴 ∪ 𝐵) = 𝑝(𝐴) + 𝑝(𝐵) − 𝑝(𝐴 ∩ 𝐵)

Problemas Desarrollados

1. Hallar el espacio muestral en los siguientes experimentos:


a) Nacimiento de un ser humano en relación al sexo.
b) Resultado de la evaluación nutricional de un menor de edad.
c) Resultado del partido de vóley entre Perú y Japón.
d) Tipo de elasticidad de la demanda del producto “x”.
Solución
Se sabe que el Espacio Muestral (EM) son todos los resultados posibles de un experimento
aleatorio.
Entonces:
a) 𝐸𝑀 = {𝑣𝑎𝑟𝑜𝑛, 𝑚𝑢𝑗𝑒𝑟}
b) 𝐸𝑀 = {𝑁𝑢𝑡𝑟𝑖𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙, 𝑑𝑒𝑠𝑛𝑢𝑡 𝑙𝑒𝑣𝑒, 𝑑𝑒𝑠𝑛𝑢𝑡 𝑚𝑜𝑑𝑒𝑟𝑎𝑑𝑎, 𝑑𝑒𝑠𝑛𝑢𝑡 𝑎𝑙𝑡𝑎}
c) 𝐸𝑀 = {𝐺𝑎𝑛𝑎 𝑃𝑒𝑟ú, 𝑝𝑖𝑒𝑟𝑑𝑒 𝑃𝑒𝑟ú}
d) 𝐸𝑀 = {𝐸𝑙𝑎𝑠𝑡𝑖𝑐𝑎, 𝑖𝑛𝑒𝑙𝑎𝑠𝑡𝑖𝑐𝑎, 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎, 𝑐𝑜𝑚𝑝𝑙𝑒𝑡 𝑒𝑙á𝑠𝑡𝑖𝑐𝑎, 𝑐𝑜𝑚𝑝𝑙𝑒𝑡 𝑖𝑛𝑒𝑙á𝑠𝑡𝑖𝑐𝑎}

2. Teniendo en cuenta los resultados del espacio muestral, en el ejercicio anterior, hallar las
siguientes probabilidades:
a) Que el nacimiento sea del sexo femenino.
b) Que un menor de edad padezca de desnutrición leve.
c) Que gane Perú en el partido de vóley.
d) Que el producto “x” tenga demanda elástica.
Solución
Utilizaremos para el cálculo de probabilidad de cada uno de ellos, la probabilidad clásica
cuya fórmula es:
𝑪𝒂𝒔𝒐𝒔 𝒇𝒂𝒗𝒐𝒓𝒂𝒃𝒍𝒆𝒔 𝒅𝒆 𝑶𝒄𝒖𝒓𝒓𝒆𝒏𝒄𝒊𝒂 𝒅𝒆𝒍 𝑬𝒗𝒆𝒏𝒕𝒐 𝑨
𝒑(𝑨) =
𝑻𝒐𝒕𝒂𝒍 𝒅𝒆 𝑪𝒂𝒔𝒐𝒔 𝑷𝒐𝒔𝒊𝒃𝒍𝒆𝒔
a) Sea el evento: 𝐹 = 𝑛𝑎𝑐𝑖𝑚𝑖𝑒𝑛𝑡𝑜 𝑑𝑒𝑙 𝑠𝑒𝑥𝑜 𝑓𝑒𝑚𝑒𝑛𝑖𝑛𝑜
1
Luego: 𝑝(𝐹) = = 0.5 = 50%
2

La probabilidad de que el nacimiento sea del sexo femenino es de 50%


b) Sea el evento: 𝐿 = 𝑚𝑒𝑛𝑜𝑟 𝑝𝑎𝑑𝑒𝑠𝑧𝑐𝑎 𝑑𝑒 𝑑𝑒𝑠𝑛𝑢𝑡𝑟𝑖𝑐𝑖ó𝑛 𝑙𝑒𝑣𝑒
1
Luego: 𝑝(𝐿) = = 0.25 = 25%
4

114
Gestión Curricular
Asignatura: Estadística general

La probabilidad de que un menor padezca de desnutrición leve es de 25%


c) Sea el evento: 𝐺 = 𝐺𝑎𝑛𝑒 𝑃𝑒𝑟ú 𝑒𝑛 𝑒𝑙 𝑝𝑎𝑟𝑡í𝑑𝑜 𝑑𝑒 𝑣ó𝑙𝑒𝑦
1
Luego: 𝑝(𝐺) = = 0.5 = 50%
2

La probabilidad de que gane


d) Sea el evento: 𝐸 = 𝑃𝑟𝑜𝑑𝑢𝑐𝑡𝑜 x 𝑡𝑒𝑛𝑔𝑎 𝑑𝑒𝑚𝑎𝑛𝑑𝑎 𝑒𝑙á𝑠𝑡𝑖𝑐𝑎
1
Luego: 𝑝(𝐸) = = 0.2 = 20%
5

3. Un experimento genera un espacio muestral que contiene ocho sucesos (E1, E2,……,E8) con
1
la 𝑝(𝐸1 ) = , i = 1,2,3,…..,8. Los sucesos A y B se definen así:
8

𝐴 = {𝐸1 , 𝐸4 , 𝐸6 }
𝐵 = {𝐸3 , 𝐸4 , 𝐸5 , 𝐸6 , 𝐸7 }
Encuentre: p(A), p(Al), p(AUB)
Solución
Graficando:

3
a) 𝑝(𝐴) = = 0.38 = 38%
8
5
b) 𝑝(𝐴𝑙 ) = = 0.63 = 63%
8
6
c) 𝑝(𝐴 ∪ 𝐵) = 𝑝(𝐴) + 𝑝(𝐵) − 𝑝(𝐴 ∩ 𝐵) = 𝑐 = = 0.75 = 75%
8

Problemas Propuestos

1. Calcular la probabilidad de obtener un número par en el lanzamiento de un dado.

2. Calcular la probabilidad de obtener 3 caras en el lanzamiento de 3 monedas.

3. En un salón de clases de 40 estudiantes, se tienen 8 desaprobados. Si se elige un estudiante al


azar, encontrar la probabilidad de que esté aprobado.

115
Gestión Curricular
Asignatura: Estadística general

4. En una muestra aleatoria de 120 pacientes, se encontró que 30 de ellos tienen cáncer. ¿cuál
es la probabilidad de que un paciente elegido al azar tenga cáncer?

5. En la empresa Scotiabank, se tiene una muestra de cuatro hipotecas para vivienda está
clasificada como de tasa Fija (F) o tasa Variable (V).
a) ¿Cuáles resultados están en el evento de que exactamente tres de las hipotecas
seleccionadas sea de tasa variable?
b) ¿Cuáles resultados están en el evento de que las cuatro hipotecas sean del mismo tipo?
c) ¿Cuáles resultados están en el evento de que a lo sumo una de las cuatro hipotecas
sea de tasa Variable?

Video de Apoyo

Video 1: Probabilidades - Ejercicios Resueltos - Nivel 1A


(https://www.youtube.com/watch?v=0lxZMaoeUno)

Video 2: Probabilidades - Ejercicios Resueltos - Nivel 1B


(https://www.youtube.com/watch?v=FBRAWqFgPqc)

116
Gestión Curricular
Asignatura: Estadística general

Semana 14
DISTRIBUCIÓN DE PROBABILIDAD DISCRETA
En teoría de la probabilidad y estadística, la distribución

binomial de Poisson es la distribución de probabilidad discreta

del número de éxitos en una secuencia de n ensayos de

Bernoulli independientes. Su denominación es en honor al físico

y matemático francés Siméon Denis Poisson.

Siméon
Denis
Poisson
Matemático
y científico
suizo
Johann
Bernoulli

A. Siméon Denis Poisson, ue un físico y matemático francés al que se le conoce


por sus diferentes trabajos en el campo de la electricidad y por sus
publicaciones acerca de la geometría diferencial y la teoría de
probabilidades.
B. Johann Bernoulli: Siendo joven, su padre Nikolaus Bernoulli lo envió a la
Universidad de Basilea para estudiar filosofía y teología, con el ánimo de que
se convirtiera en teólogo. Pero Jakob continuó, a escondidas, las que eran
sus auténticas aficiones: la física y las matemáticas.

117
Gestión Curricular
Asignatura: Estadística general

Siméon Denis Poisson

Poisson nació en Pithiviers, Loiret, hijo de Siméon Poisson. Su padre sirvió como
LECTURA

soldado raso en las guerras de Hanover, pero disgustado por el trato abusivo que
recibió de los oficiales nobles, desertó. Cuando nació su hijo, ocupaba diversos
cargos administrativos, y al parecer estuvo a la cabeza del gobierno local durante
el período revolucionario.

Siméon Denis fue enviado primero con su tío, un cirujano de Fontainebleau, y


comenzó a aprender el oficio, pero hizo pocos progresos. Tras mostrar los primeros
signos de su talento como matemático, fue enviado a la Escuela Central de
Fontainebleau, donde tuvo la oportunidad de tener una clase con un profesor
receptivo, M. Billy, que se dio cuenta rápidamente de que era superado por su
alumno, le alentó a aprender las ramas más difíciles de las matemáticas, y predijo
su futura fama recordando unas líneas del famoso fabulista Jean de La Fontaine,
jugando con el significado de su apellido en francés:

«Petit Poisson deviendra grand // Pourvu que Dieu lui prête vie.»

("El Pez pequeño se hace grande // Siempre y cuando Dios le dé vida.")

En 1798, ingresó en la École Polytechnique en Paris como primero de su promoción, y


de inmediato comenzó a atraer la atención de los profesores de la escuela, quienes
le dejaron libertad para tomar sus propias decisiones en cuanto a lo que iba a estudiar.
En 1800, menos de dos años después de su ingreso, publicó dos libros de memorias,
uno sobre el método de eliminación de Étienne Bézout, y el otro sobre el número de
integrales de una ecuación en diferencias finitas. Este último fue examinado por
Sylvestre François Lacroix y por Adrien-Marie Legendre, quien recomendó que se
publicará en el "Recueil des savants étrangers" (Informe de científicos extranjeros), un
honor sin precedentes para un joven de dieciocho años. Este éxito introdujo a Poisson
en los más distinguidos círculos científicos. Joseph Louis Lagrange, a cuyas
conferencias sobre la teoría de funciones asistió en la École Polytechnique, reconoció
su talento desde el principio, y se convirtió en su amigo (el Mathematics Genealogy
Project identifica a Lagrange como su asesor, pero esto puede ser una mera
simplificación); mientras que Pierre-Simon Laplace, que estaba atento a los pasos de
Poisson, lo consideraba casi como su hijo. El resto de su carrera, hasta su muerte en
Sceaux cerca de París, casi fue ocupado totalmente por la composición y publicación
de sus numerosas obras y en el cumplimiento de los deberes de los numerosos puestos
educativos para los que fue nombrado sucesivamente.
Fuente: BERMISON ORTEGA, Russell Frank. (2006). François Arago (1786–1853) attributed
to Poisson the quote: "La vie n'est bonne qu'à deux choses: à faire des mathématiques
et à les professer." (Life is good for only two things: to do mathematics and to teach it.)
See: J.-A. Barral, ed., Oeuvres complétes de François Arago ..., vol. II (Paris, France: Gide
et J. Baudry, 1854), page 662.

118
Gestión Curricular
Asignatura: Estadística general

DISTRIBUCIÓN
BINOMIAL, POISSON
Propósito:
 Explica y diferencia las principales distribuciones de probabilidad para variables
aleatorias discretas.
 Aplica e interpreta las distribuciones de probabilidades para variables aleatorias
discretas en el desarrollo de prácticas y ejercicios.

SESIÓN 27: DISTRIBUCIÓN BINOMIAL, POISSON.

1. DISTRIBUCIÓN BINOMIAL.

Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos
los siguientes requisitos:
 El procedimiento tiene un número fijo de ensayos.
 Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no
afecta las probabilidades de los demás ensayos).
 Todos los resultados de cada ensayo deben estar clasificados en dos categorías
(generalmente llamadas éxito y fracaso).
 La probabilidad de un éxito permanece igual en todos los ensayos.
El desarrollo de este tema, implica comprender previamente los siguientes conceptos:
a) Notación factorial.
Se utiliza para representar las operaciones de multiplicación secuencial.
Su desarrollo significa el producto ordenado de los números enteros positivos, desde el
que indica el signo factorial, hasta llegar a 1.
Ejemplo:
Tres factorial 3! = 3𝑥2𝑥1 = 6
Cinco factorial 5! = 5𝑥4𝑥3𝑥2𝑥1 = 120
. .
. .
N factorial 𝑁! = (𝑁)(𝑁 − 1)(𝑁 − 2) … . 𝑥2𝑥1
Por definición:
0! = 1
1! = 1
b) Combinaciones.
Es un método que nos permite agrupar un conjunto de elementos en diferentes
formas sin considerar el orden de colocación.
𝒏 𝒏!
𝑪 =
𝒙 𝒙! (𝒏 − 𝒙)!

119
Gestión Curricular
Asignatura: Estadística general

Ejemplo:
De un equipo multidisciplinario, formado por un economista, un sociólogo, un
antropólogo. ¿Cuántos comités de dos profesionales pueden formarse?
Solución
Según datos:
n = 3, x = 2
Luego la cantidad de comités a formarse, serían:
3 3! 3𝑥2𝑥1 6
𝐶 = = = =3
2 2! (3 − 2)! (2𝑥1)(1)! 2
Se pueden formar 3 comités, que serían:
Primer comité : Economista, Sociólogo.
Segundo comité : Sociólogo, Antropólogo.
Tercer comité : Economista, Antropólogo.
c) Cálculo de probabilidades mediante la distribución binomial.
La distribución binomial se utiliza para calcular probabilidades de variables discretas.
Se aplica en aquellos experimentos aleatorios que tienen sólo dos resultados mutuamente
excluyentes.
Ejemplos:
EXPERIMENTO ALEATORIO RESULTADOS POSIBLES
1) Lanzamiento de una moneda al aire. Cara o sello
2) Nacimiento de un ser humano con varón o mujer
respecto al sexo.
3) Estado de salud de una persona. Sano o enfermo
4) Situación ocupacional de una persona. Ocupado o desocupado

Estos experimentos con resultados Dicotómicos, se le conoce con el nombre de ensayo


de BERNOULLI, en honor al científico que lo descubrió.
d) Requisitos de una distribución de probabilidad binomial.
 El procedimiento tiene un número fijo de ensayos.
 Los ensayos deben ser independientes. (El resultado de cualquier ensayo
individual no afecta las probabilidades de los demás ensayos).
 Todos los resultados de cada ensayo deben clasificar en dos categorías
(generalmente llamadas éxito y fracaso)
 La probabilidad de un éxito permanece igual en todos los ensayos.
e) Notación para la distribución de probabilidad binomial.
Al llevar a cabo un experimento aleatorio, siempre estamos interesados en que suceda
uno de los dos resultados, si el resultado que esperábamos efectivamente sucede,
diremos que hubo ÉXITO. Si el resultado que esperábamos no sucede, entonces diremos
que hubo FRACASO. Estos dos resultados, se designan en términos de probabilidad,
como p y q.

120
Gestión Curricular
Asignatura: Estadística general

Es decir:
RESULTADOS PROBABILIDAD
ÉXITO p PROBABILIDAD DE ÉXITO

FRACASO q PROBABILIDAD DE
FRACASO
Dónde: p+q=1
Si E y F (éxito y fracaso) denotan las dos categorías posibles de todos los resultados.
Entonces:

Ejemplo:
Supongamos que en la comunidad “x”, hemos encontrado a través de una muestra, que
el 30% de la población en edad activa, se encuentran desempleados y el 70% tenía
empleo.
En este experimento esperamos como éxito que la población tenga empleo, y como
fracaso que la población esté desempleada, por lo tanto:
EVENTOS RESULTADOS PROBABILIDAD
Empleados Éxito p = 0.70
Desempleados Fracaso q = 0.30
Total p + q = 1.00
Podemos decir entonces: Si seleccionamos una persona al azar de esta población, la
probabilidad de que se encuentre con empleo es de 0.70, y de que se halle desempleado
es de 0.30.
Pero si seleccionamos dos personas al azar de esta población, una después de otra,
según el orden de extracción podemos obtener:
Personas seleccionadas:
PRIMERA SEGUNDA
Ocupada Ocupada
Ocupada Desocupada
Desocupada Ocupada
Desocupada Desocupada

Y podemos calcular las probabilidades de que:


 Las dos personas estén ocupadas.
 Una esté ocupada y la otra desocupada.
 Una esté desocupada y la otra ocupada.
 Las dos personas estén desocupadas

Estas probabilidades lo presentamos en el siguiente cuadro:

121
Gestión Curricular
Asignatura: Estadística general

APARICIÓN DEL
PROBABILIDAD DEL RESULTADO
RESULTADO
PRIMER SEGUNDA
LITERAL SIMBÓLICA NÚMERICA
SELECCIÓN SELECCIÓN
Ocupado Probabilidad que las
Ocupado dos personas estén 𝑝. 𝑝 = 𝑝2 (0.70)(0.70) = 0.49
ocupadas
Ocupado Probabilidad que la
1ª persona esté
Desocupado 𝑝. 𝑞 (0.70)(0.30) = 0.21
ocupada y la 2ª
desocupada
Desocupado Probabilidad que la
1ª persona este
Ocupado 𝑞. 𝑝 (0.30)(0.70) = 0.21
desocupada y la 2ª
ocupada
Desocupado Probabilidad de que
Desocupado las dos personas 𝑞. 𝑞 = 𝑞 2 (0.30)(0.30) = 0.09
estén desocupadas
Al sumar la probabilidad simbólica y numérica, observamos que se trata de una expansión
binomial, así:
SIMBÓLICA: 𝒑𝟐 + 𝒑𝒒 + 𝒒𝒑 + 𝒒𝟐 = 𝒑𝟐 + 𝟐𝒑𝒒 + 𝒒𝟐 = (𝒑 + 𝒒)𝟐
NÚMERICA: 0.49 + 0.21 + 0.21 + 0.09
= 0.49 + 2(0.21) + 0.09 = (0.70 + 0.30)2
Expansión binomial Binomio
El binomio esta elevado al exponente 2, porque se trata de 2 ensayos o 2 selecciones.
Esto quiere decir que, si el número de ensayos o selecciones se incrementan, el exponente
será mayor.
Por ejemplo, si seleccionamos 5 personas al azar, entonces tendríamos:
(𝑝 + 𝑞)5 = (0.70 + 0.30)5
Y si quisiéramos hallar la probabilidad de que las 5 personas estén ocupadas, sería sumamente
laborioso desarrollar la expansión binomial.
Para ello existe una fórmula que nos ayuda a simplificar cualquier valor específico de
probabilidad.

f) Fórmula General para calcular las Probabilidades Binomiales.


𝒏 𝒏!
𝒑(𝒙) = 𝑷(𝑿 = 𝒙) = 𝑪 𝒑𝒙 𝒒(𝒏−𝒙) = . 𝒑𝒙 𝒒(𝒏−𝒙)
𝒙 𝒙! (𝒏 − 𝒙)!
Donde:
𝑝(𝑥) = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑜𝑏𝑡𝑒𝑛𝑒𝑟 𝑥 é𝑥𝑖𝑡𝑜𝑠
𝑛 = 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑜 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑛𝑠𝑎𝑦𝑜𝑠
𝑥 = 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜 𝑑𝑒 𝑞𝑢𝑒 𝑠𝑒 𝑑𝑒𝑠𝑒𝑎 𝑜𝑏𝑡𝑒𝑛𝑒𝑟 𝑜 é𝑥𝑖𝑡𝑜𝑠
𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑞𝑢𝑒 𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝑑𝑒𝑠𝑒𝑎𝑑𝑜 𝑜𝑐𝑢𝑟𝑟𝑎, 𝑜 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒𝑠 𝑑𝑒 é𝑥𝑖𝑡𝑜
𝑞 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑞𝑢𝑒 𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝑑𝑒𝑠𝑒𝑎𝑑𝑜 𝑛𝑜 𝑜𝑐𝑢𝑟𝑟𝑎, 𝑜 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜

122
Gestión Curricular
Asignatura: Estadística general

Ejemplo:
Supongamos en la comunidad “x”, donde a través de una muestra se encontró que el
30% de la población en edad activa estaba desempleada. Calcular la probabilidad
de seleccionar dos personas ocupadas en esta población.
Solución
Según datos del problema:
n=2 entonces p = 0.70
x=2 personas ocupadas q = 0.30
Aplicando la fórmula:
𝒏!
𝒑(𝒙) = . 𝒑𝒙 𝒒(𝒏−𝒙)
𝒙! (𝒏 − 𝒙)!
𝟐!
𝒑(𝒙 = 𝟐) = . (𝟎. 𝟕𝟎)𝟐 (𝟎. 𝟑𝟎)(𝟐−𝟐) = (𝟎. 𝟒𝟗)(𝟎. 𝟑𝟎)𝟎
𝟐! (𝟐 − 𝟐)!
𝒑(𝒙 = 𝟐) = 𝟎. 𝟒𝟗
La probabilidad de seleccionar dos personas ocupadas de esta población, es de 49%.
(coincide con el resultado de la tabla anterior).

g) La media, varianza y desviación estándar:

La media, varianza y desviación estándar de la variable aleatoria binomial son,


respectivamente:

𝝁 = 𝒏. 𝒑 𝝈𝟐 = 𝒏. 𝒑. 𝒒 𝝈 = √𝒏. 𝒑. 𝒒

2. DISTRIBUCIÓN POISSON.
Una distribución de probabilidad Poisson resulta de un procedimiento que cumple con todos
los siguientes requisitos:
 El experimento consiste en contar el número “x” de veces que ocurre un evento en
particular durante una unidad de tiempo dada, o en un área o volumen dado.
 La probabilidad de que un evento ocurra en una unidad dada de tiempo, área o volumen
es la misma para todas las unidades.
 El número de eventos que ocurren en una unidad de tiempo, área o volumen es
independiente del número de los que ocurren en otras unidades.
 El número medio (o esperado) de eventos en cada unidad se denota por la letra griega
(“lambda”) (𝝀)
2.1. Introducción.
La distribución de Poisson se usa para modelar situaciones en la que el número de pruebas
es muy grande y el número de éxitos es muy pequeño, situaciones en las que hay
ocurrencias aleatorias de sucesos por unidad de espacio o tiempo, y en donde se desea
conocer la probabilidad de un número específico de éxitos.

123
Gestión Curricular
Asignatura: Estadística general

El intervalo de tiempo dado puede ser de cualquier duración, por ejemplo, un minuto, un
día, una semana, etc. Así la variable aleatoria x puede representar el número de llamadas
telefónicas por hora, el número de pacientes fallecidos en un día determinado. El espacio
podría ser un segmento de línea, un área o volumen, un pedazo de material. Así, x podría
representar el número de bacterias en un determinado campo de cultivo.
2.2. El proceso de Poisson.
Las siguientes proposiciones describen lo que se conoce como proceso de Poisson:
a) Las ocurrencias de los eventos son independientes.
b) Teóricamente, debe ser posible un número infinito de ocurrencias del evento en el
intervalo.
c) La probabilidad de una ocurrencia del evento en un intervalo dado es proporcional
a la longitud del intervalo.
La distribución de probabilidad de Poisson está dada por:
𝒆−𝝀 . 𝝀𝒙
𝒑(𝒙) =
𝒙!
𝒙 = 𝟎, 𝟏, 𝟐, …
Donde:
𝒙 = número de ocurrencias cuya probabilidad se desea conocer.
𝒆 =constante matemática = 2,71828.
𝝀 =número promedio de ocurrencias por unidad de tiempo o espacio.

2.3. La media y varianza:

La media y varianza de la variable aleatoria Poisson son respectivamente:

𝝁=𝝀 𝝈𝟐 = 𝝀

Ejemplo:
La oficina de estadística del hospital ESSALUD ha estudiado el número de muertes debido
a una cierta enfermedad y ha llegado a la conclusión de que éstas están distribuidas de
acuerdo con la ley de Poisson. Los registros del hospital revelan que, durante este período,
el número de muertes ha sido en promedio, de 3 por día. Si dicha oficina está en lo cierto,
al suponer una distribución de Poisson, hallar la probabilidad de que:
a) En un día dado, mueran exactamente 2 pacientes con esa enfermedad.
b) En un día particular, nadie muera de la enfermedad.
c) En un día particular, mueran 3 ó 4 pacientes.
Solución
Sea:
𝒙 = el número de pacientes fallecidos debido a la enfermedad
𝝀 = número promedio de muertes = 3 por día
a) En un día dado, mueran exactamente 2 pacientes con esa enfermedad.

124
Gestión Curricular
Asignatura: Estadística general

𝑒 −3 . 32 0,05𝑥9
𝑝(x = 2) = = = 0,225
2! 2𝑥1
La probabilidad de que mueran 2 pacientes es de 22,5%
b) En un día particular, nadie muera de la enfermedad.
𝑒 −3 . 30 0,05𝑥1
𝑝(x = 0) = = = 0,05
0! 1
La probabilidad de que nadie muera es del 5%
c) En un día particular, mueran 3 ó 4 pacientes.
𝑒 −3 .33 𝑒 −3 .34 0,05𝑥27 0,05𝑥81
𝑝(x = 3) + p(x = 4) = + = + = 0,225 + 0,16875 = 0,39
3! 4! 3𝑥2𝑥1 4𝑥3𝑥2𝑥1

La probabilidad de que mueran 3 ó 4 pacientes es de 39%

Problemas Desarrollados

Distribución binomial

1. Utilice la fórmula de probabilidad binomial para calcular la probabilidad de x éxitos, dada


la probabilidad p de éxito en un solo ensayo si:
3
𝑛 = 12, 𝑥 = 10, 𝑝 = = 0.75
4
Utilizando la fórmula, hallamos:
Si: 𝑛 = 12, 𝑥 = 10, 𝑝 = 3/4 = 0.75, 𝑞 = 0.25
Remplazando en la fórmula:
𝑛!
𝒑(𝒙) = . 𝑝 𝑥 𝑞 (𝑛−𝑥)
𝑥! (𝑛 − 𝑥)!
12! 12𝑥11𝑥10!
𝒑(𝟏𝟎) = . (0.75)10 (0.25)(12−10) = . (0.75)10 (0.25)2
10! (12 − 10)! 10! .2!
12𝑥11
𝒑(𝟏𝟎) = . (0.75)10 (0.25)2 = 66(0.06)(0.06) = 66(0.0036) = 0.24 = 24%
2!

2. La probabilidad de que un cliente potencial de la pastelería “PARIS”, elegido al azar,


realice una compra es de 0,20. Si su agente de ventas visita a 6 clientes, ¿cuál es la
probabilidad de que realice exactamente 4 ventas?

Éxito Cliente que realiza la compra

Probabilidad de éxito (p) 0,20

Probabilidad de fracaso (q) 0,80

Número de ensayos (n) 6

Número de éxitos en los “n” ensayos (x) 4

125
Gestión Curricular
Asignatura: Estadística general

Solución
Remplazando los datos en la fórmula
𝑛 𝑛!
𝑝(𝑥) = 𝐶 𝑝 𝑥 𝑞 (𝑛−𝑥) = . 𝑝 𝑥 𝑞 (𝑛−𝑥)
𝑥 𝑥! (𝑛 − 𝑥)!
6 6!
𝑝(4) = 𝐶 . (0,20)4 . (0,80)(6−4) = . (0,20)4 . (0,80)(6−4)
4 4! (6 − 4)!
𝑝(4) = 0,0154 = 1.54%
3. Suponiendo que la probabilidad de que un automovilista respete la luz verde es de 0.75,
utilice la fórmula de probabilidad binomial para calcular la probabilidad de obtener
exactamente 3 automovilistas que respeten la luz verde cuando va a cambiar de luz 5
segundos antes.
Solución
Calculamos, p(3) dado que n = 5
Si: x = 3 p = 0.75 q = 0.25
Remplazando en la fórmula:
𝑛!
𝒑(𝒙) = . 𝑝 𝑥 𝑞 (𝑛−𝑥)
𝑥! (𝑛 − 𝑥)!
5! 5𝑥4𝑥3!
𝑝(3) = . (0.75)3 (0.25)(5−3) = . (0.75)3 (0.25)(2) = 10. (0.42)(0.06)
3! (5 − 3)! 3! (2)!
𝑝(3) = (10)(0.025) = 0.25 = 25%
Los 3 automovilistas que respeten la luz verde cuando va a cambiar de luz 5 segundos
antes representa un 25%.

Distribución de Poisson.

1. En tiendas “EFE”, en la sección de electrodomésticos, unos promedios de 12 personas por


hora le hacen preguntas al encargado. ¿Cuál es la probabilidad de que exactamente 3
personas se acerquen al encargado a hacer preguntas en un periodo de 10 minutos?

Media () 12 personas en una hora 2 personas en 10 minutos

Número de eventos
3 personas en 10 minutos 3 personas en 10 minutos
esperados (x)
12 personas  60 minutos 
 n  2 personas
n  10 minutos 
Utilizando la fórmula:
𝒆−𝝀 . 𝝀𝒙
𝒑(𝒙) =
𝒙!

𝒆−𝟓 . 𝟓𝟑
𝒑(𝟑) = = 𝟎, 𝟏𝟒𝟎𝟒 = 𝟏𝟒. 𝟎𝟒%
𝟑!

126
Gestión Curricular
Asignatura: Estadística general

Problemas Propuestos

Distribución binomial
1. Utilice la fórmula de probabilidad binomial para calcular la probabilidad de x éxitos, dada la
probabilidad p de éxito en un solo ensayo.
a) 𝑛 = 20, 𝑥 = 4, 𝑝 = 0.15
b) 𝑛 = 9, 𝑥 = 2, 𝑝 = 0.35

2. Se tiene información que, en la comisaria de Huancayo, el 25% de los detenidos se encuentran


allí por delitos menores. Se selecciona una muestra aleatoria de 20. ¿Cuál es la probabilidad
de que el número de detenidos por delitos menores en esa muestra sea 4?
3. Se sabe que en el Centro de Huancayo el 70% de los establecimientos comerciales pequeños
no entregaban boleta al momento de efectuar una transacción económica. ¿Cuál es la
probabilidad de que, en una muestra de 15 negocios, a lo más la mitad entregue boleta?
4. La probabilidad de que una persona se muera por consumir bebidas alcohólicas es 0.4.
Después de un estudio realizado en un sector de Huancayo, se conoce que a la semana 30
personas consumen bebidas alcohólicas, cual es la probabilidad que:
a) Sobrevivan al menos 14 personas
b) Sobrevivan exactamente 5
c) Cuantos, en promedio, sobrevivirán
d) ¿Cuál es la varianza de la v.a. en cuestión?
5. La encargada de los préstamos del banco “BBVA CONTINENTAL” estima, con base en sus años
de experiencia, que la probabilidad de que un solicitante no sea capaz de pagar su préstamo
es 0.035. El mes pasado realizó 45 préstamos. ¿Cuál es la probabilidad de que 3 préstamos no
sean pagados oportunamente?

Distribución de Poisson

1. La central telefónica de una empresa recibe un promedio de 3,5 órdenes de pedido por hora.
Estas ocurrencias se producen al azar. ¿Cuál es la probabilidad de que se produzcan
exactamente 4 llamadas en una hora dada?

2. Se sabe que el número promedio de camiones-tanque de aceite que llegan por día al puerto
del Callao, es 10. las instalaciones del puerto pueden atender cuándo más a 15 camiones-
tanque en un día. ¿Cuál es la probabilidad de que en un determinado día se tengan que
regresar los camiones?

3. El número promedio de Buses que llegan cada día al Terminal Terrestre de Huancayo es 11.
Las facilidades que tiene el Terminal hace a que pueden manejar hasta 22 buses por día.

127
Gestión Curricular
Asignatura: Estadística general

¿Cuál es la probabilidad de que en un día dado se tenga que rechazar el ingreso de buses al
Terminal Terrestre de Huancayo?

4. En Caja Centro se analiza la cantidad de clientes que se atiende en las ventanillas, se obtuvo
que la cantidad de clientes promedio que se atiende en esta institución financiera en un lapso
de 30 minutos es de 10 clientes. ¿Cuál es la probabilidad de que se atiendan a 7 clientes en
20 minutos?

5. En una investigación realizada en Huancayo, se ha determinado que el número de muertes


debido a accidentes de tránsito ha sido en promedio 4 por en dos meses. Suponiendo que el
número de muertes sigue una distribución de Poisson, hallar la probabilidad de que en un
determinado mes mueran 3 personas.

Video de Apoyo

Video 1: Distribución binomial. Ejercicio resuelto paso a paso


(https://www.youtube.com/watch?v=EMRag5uvqBA)

Video 2: Distribución de Poisson


(https://www.youtube.com/watch?v=7syhMJhzNOc)

128
Gestión Curricular
Asignatura: Estadística general

Semana 15
DISTRIBUCIÓN NORMAL

La distribución normal o distribución gaussiana es una de las


distribuciones teóricas mejor estudiadas y más utilizadas en los
diferentes campos de la investigación. Carl Gauss formuló la
ecuación de la curva normal, de ahí que también se le conoce,
más comúnmente, como la "Campana de Gauss".

Abraham de
Moivre
Distribución
gaussiana
en música
Lannis
Xenakis

A. Abraham de Moivre
La distribución normal fue presentada por primera vez por Abraham de Moivre en un
artículo del año 1733,5 que fue reimpreso en la segunda edición de su The Doctrine of
Chances, de 1738, en el contexto de cierta aproximación de la distribución binomial
para grandes valores de n. Su resultado fue ampliado por Laplace en su libro Teoría
analítica de las probabilidades (1812), y en la actualidad se llama Teorema de De
Moivre-Laplace.

129
Gestión Curricular
Asignatura: Estadística general

DISTRIBUCIÓN NORMAL
LECTURA

La distribución normal fue presentada por primera vez por Abraham de Moivre en un artículo
del año 1733,5 que fue reimpreso en la segunda edición de su The Doctrine of Chances, de
1738, en el contexto de cierta aproximación de la distribución binomial para grandes valores
de n. Su resultado fue ampliado por Laplace en su libro Teoría analítica de las probabilidades
(1812), y en la actualidad se llama Teorema de De Moivre-Laplace.

Laplace usó la distribución normal en el análisis de errores de experimentos. El importante


método de mínimos cuadrados fue introducido por Legendre en 1805. Gauss, que afirmaba
haber usado el método desde 1794, lo justificó rigurosamente en 1809 asumiendo una
distribución normal de los errores. El nombre de Gauss se ha asociado a esta distribución
porque la usó con profusión cuando analizaba datos astronómicos 6 y algunos autores le
atribuyen un descubrimiento independiente del de De Moivre.7Esta atribución del nombre de
la distribución a una persona distinta de su primer descubridor es un claro ejemplo de la ley de
Stigler.

El nombre de "campana" viene de Esprit Jouffret que usó el término "bell surface" (superficie
campana) por primera vez en 1872 para una distribución normal bivariante de componentes
independientes. El nombre de "distribución normal" fue otorgado independientemente por
Charles S. Peirce, Francis Galton y Wilhelm Lexis hacia 1875.[cita requerida] A pesar de esta
terminología, otras distribuciones de probabilidad podrían ser más apropiadas en
determinados contextos; véase la discusión sobre incidencia,

Fuente: Estadística Básica. ITM. 2007. ISBN 9789589831410. Consultado el 12 de diciembre


de 2017.
Orrego, Juan José Manzano (2014). LOGISTICA DE APROVISIONAMIENTO. Ediciones
Paraninfo, S.A. ISBN 9788497329811. Consultado el 12 de diciembre de 2017.
Gómez-Chacón, Inés Ma; Català, Claudi Alsina; Raig, Núria Planas; Rodríguez, Joaquim
Giménez; Muñoz, Yuly Marsela Vanegas; Sirera, Marta Civil (4 de octubre de 2010).
Educación matemática y ciudadanía. Grao. ISBN 9788499801667. Consultado el 12 de
diciembre de 2017.

130
Gestión Curricular
Asignatura: Estadística general

DISTRIBUCIÓN
NORMAL

Propósito:
 Identifica el tipo de variable aleatoria y construye la distribución de la función de
probabilidad.

SESIÓN 1: DISTRIBUCIÓN NORMAL

1. Introducción.
Si se tiene una muestra grande de valores que corresponden a variables continuas, como por
ejemplo el peso en kg de 44 recién nacidos en un hospital, para el análisis de la información
se procedería a tabularlos a través de una distribución de frecuencias y su gráfico
correspondiente, el histograma, tal como se muestra a continuación:
HOSPITAL “X”
Distribución de frecuencias de recién nacidos por peso
Peso (en Frecuencia
kg) (cantidad)
1.00 – 1.99 4
2.00 – 2.99 10
3.00 – 3.99 20
4.00 – 4.99 8
5.00 – 5.99 2
Total 44
Histograma de la distribución de frecuencias de recién nacidos por peso.

Analizando los datos en el histograma, observamos que, con respecto al peso de los recién
nacidos, existen:
a) Pocos niños con bajo peso al nacer (4 niños tienen entre 1 y 2 kg de peso)
b) La mayoría de recién nacidos, tienen peso medio (20 niños tienen entre 3 y 4 kg de peso)
c) Pocos niños tienen sobrepeso al nacer (2 niños tienen entre 5 kg y 6 kg de peso)
Esta distribución de datos se llama “NORMAL” y se presenta en múltiples mediciones de la vida
real.

131
Gestión Curricular
Asignatura: Estadística general

Si unimos, mediante una curva los puntos medios de cada rectángulo en el histograma, se
obtiene el siguiente gráfico.

A esta curva se le conoce con el nombre de “CURVA NORMAL” o también “CAMPANA DE


GAUSS”.

Es importante por que posibilita el cálculo de probabilidades, a través de áreas comprendidas


bajo la curva normal.
Una distribución asume la forma de la curva normal conforme el tamaño de la muestra
aumenta (es decir, cuando se usa gran cantidad de datos)
La representación gráfica de la distribución normal, corresponde a la siguiente función:
𝟏 𝟏 𝒙−𝝁 𝟐
𝒇(𝒙) = . 𝒆−𝟐(𝝈
)
𝝈ξ𝟐𝝅
Donde:
𝑥 = 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒, 𝑐𝑢𝑦𝑜𝑠 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑎𝑠𝑢𝑚𝑖𝑑𝑜𝑠 𝑣𝑎𝑛 𝑑𝑒𝑠𝑑𝑒 − ∞ ℎ𝑎𝑠𝑡𝑎 + ∞
𝜇 = 𝑚𝑒𝑑𝑖𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑥 − 𝜇 = 𝑑𝑒𝑠𝑣𝑖𝑜
𝜎 = 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑡í𝑝𝑖𝑐𝑎
𝑓(𝑥) = 𝑑𝑒𝑛𝑠𝑖𝑑𝑎𝑑 𝑑𝑒 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑒 = 2.718
𝜋 = 3.1416
Por lo tanto, podemos sostener que:

2. Definición.
La distribución normal es una de las distribuciones más utilizadas, que permiten calcular
probabilidades para variables continuas.
Muchas poblaciones tienen distribución normal o pueden ajustarse muy bien a ella.

132
Gestión Curricular
Asignatura: Estadística general

Ejemplos:
 Estatura, peso y otras características físicas.
 Errores de medición en experimentos científicos
 Tiempos de reacción en experimentos psicológicos
 Mediciones de inteligencia y aptitud.
 Calificaciones en diversas pruebas.
 Muchas medidas e indicadores económicos.

Sin embargo, el cálculo de probabilidades, no es posible en cualquier curva normal, en


consideración a lo siguiente:
La distribución normal queda perfectamente determinada, conociendo dos parámetros:
a) La media o promedio de la población (𝜇), que fija la posición de la curva respecto al eje x.
b) La desviación estándar (𝜎), que determina la forma (dispersión) de la curva.
 A menos dispersión (𝜎), la curva será más estrecha y puntiaguda;
 A mayor dispersión (𝜎), la curva será más aplanada y desplazada.
De acuerdo a ello, se puede presentar los siguientes casos:

𝝁𝟏 𝝁𝟐 𝝁𝟑
Observamos en este gráfico que las 3 curvas normales tienen idéntica dispersión, pero distintas
medias.

𝝁𝟏
𝝁𝟐
𝝁𝟑

Observamos en este gráfico que las 3 curvas normales tienen distintas dispersión, pero igual
medias.
Esto significa que cada curva normal tiene su propia distribución, lo que hace imposible el
cálculo de probabilidades. Por lo tanto, se hace necesario que la curva normal así obtenida
se trasforme en una CURVA NORMAL TIPIFICADA.

133
Gestión Curricular
Asignatura: Estadística general

3. Curva Norma Tipificada (estándar, o reducida).


Con el fin de suprimir la individualidad de cada una de las distribuciones señaladas
gráficamente, se convierte a la curva normal, en un modelo matemático con características
fijas y definidas y así se hace posible el cálculo de probabilidades.
Este proceso se conoce con el nombre de TIPIFICACIÓN DE LA CURVA NORMAL, para lo cual
se supone:
La media o promedio de la población es cero : 𝝁 = 𝟎
La desviación standard es igual a uno: 𝝈 = 𝟏
La variable independiente x se transforma en un valor “z” que se calcula
mediante la fórmula:
𝒙−𝝁
𝒛=
𝝈
Gráficamente la tipificación de la curva normal, sería:

𝝈
𝝈=𝟏

𝝁
𝝁=0
CURVA NORMAL CURVA NORMAL TIFICADA

Observamos en el gráfico que la variable “x” se ha trasformado en z; la 𝝁 se ha igualado a


cero, por lo tanto los valores de z hacia la derecha son positivos y hacia la izquierda negativos;
la desviación standard se trasforma en valor de 1, lo que significa que la dispersión o todo el
área debajo de la curva normal tiene un valor de 1 (100%) que es el valor máximo que asume
la probabilidad.
3.1. Características de la curva normal tipificada.
 Es simétrica respecto a su media (50% a la derecha y 50% a la izquierda).
 Es asintótica respecto a z (es decir, no cruza la línea z)
 El área total encerrada es 1 ó 100%
 La media, mediana y moda son iguales.
3.2. Cálculo de áreas bajo la curva normal tipificada.
Para calcular probabilidades, es necesario calcular las áreas bajo la curva normal
tipificada. Esto se obtiene trasformando la variable x en variable tipificada z cuyo valor se
ubican en la primera fila superior y en la primera columna de la izquierda de la tabla
adjunta.
En el interior de la tabla se encuentran las áreas o probabilidades desde z = 0 hasta
cualquier valor de z.
Los diferentes casos que se pueden presentar sólo consisten en sumar o restar áreas.

134
Gestión Curricular
Asignatura: Estadística general

Es necesario que Ud. tenga en cuenta que toda el área bajo la curva normal tipificada
tiene un valor de 1 ó 100%, y cada mitad 0.50 ó 50%.

0.50 =50% 0.50 =50%

Ejemplo 1:
Determinar el área bajo la curva normal para valores de z entre:
𝑧 = 0 y 𝑧 = 1.8 (es decir 0 ≤ 𝑧 ≤ 1.8).
Solución
Construyendo el gráfico del área pedida.

Área pedida

En la tabla, ubicaremos el valor de z con un entero y un decimal (1.8) en la primera


columna de la izquierda; y el segundo decimal (0) lo ubicaremos en la primera fila
superior, de la siguiente manera.

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
. .
. .
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

Por lo tanto 0.4641 es el área pedida, o también podemos decir que la probabilidad de
que z esté comprendida entre 0 y 1.8, es:
𝑝(0 ≤ 𝑧 ≤ 1.8) = 0.4641 = 46.41%

135
Gestión Curricular
Asignatura: Estadística general

Ejemplo 2:
Los coeficientes de inteligencia (CI) de un grupo de estudiantes, tienen
aproximadamente una distribución normal, con una media de 100 y una
desviación típica de 10. Se pide:
a) Hallar la proporción de estudiantes con CI mayores que 125.
b) ¿Cuál es la probabilidad de que un estudiante elegido al azar entre los de esa
población, tenga una CI entre 105 y 115?
Solución
Sea: x = coeficiente de inteligencia.
Donde: 𝜇 = 100 𝜎 = 10
a) Se pide: 𝑝(𝑥 ≥ 125)
Graficando:

𝜎 = 10 𝜎=1
Área Pedida

Tipificando la curva 𝜎 = 10,𝜇 = 100, x se transforma en z, se tiene:


𝑥 − 𝜇 125 − 100
𝑧= = = 2.5
𝜎 10
Luego, el problema se reduce a calcular: 𝑝(𝑥 ≥ 125) = 𝑝(𝑧 ≥ 2.5)
ÁREA PEDIDA = ÁREA PARA (𝑧 ≥ 0) – ÁREA ENTRE (𝑧 = 0 𝑦 𝑧 = 2.5)

𝟎. 𝟓𝟎 𝟎. 𝟒𝟗𝟑𝟖

𝑝(𝑥 ≥ 125) = 𝑝(𝑧 ≥ 2.5) = 0.50 − 0.4938 = 0.0062


𝑝(𝑧 ≥ 2.5) = 0.62%
Entonces:
La población de pacientes con CI mayores que 125, es de 0.62%
b) Se pide: 𝑝(105 ≤ 𝑥 ≤ 115)
Graficando:
AREA PEDIDA

𝝈 =10

Tipificando la curva (𝝈 = 𝟏, 𝝁 = 𝟎, x se transforma en z), se tiene:


No pide hallar: 𝑝(105 ≤ 𝑥 ≤ 115)

136
Gestión Curricular
Asignatura: Estadística general

Se estandariza la variable x a través de:


𝑥−𝜇 105−100
Para x = 105, entonces: 𝑧1 = = = 0.5
𝜎 10
𝑥−𝜇 115−100
Para x = 115, entonces: 𝑧2 = = = 1.5
𝜎 10

Luego el problema se reduce a calcular:


𝑝(0.5 ≤ 𝑧 ≤ 1.5)

ÁREA PEDIDA = ÁREA ENTRE (z = 0 y z =1.5) - ÁREA ENTRE (z = 0 y z = 0.5)

0.4332 0.1915

Buscando los valores de 1.5 y 0.5 en la tabla se tiene:


ÁREA PEDIDAD = 0.4332 – 0.1915 = 0.2417
𝑝(0.5 ≤ 𝑥 ≤ 1.5) = 24.17%
Entonces:
La probabilidad de que un paciente tenga entre 105 y 115 de CI es de 24.17%

137
Gestión Curricular
Asignatura: Estadística general

Tabla de Distribución Normal Estandarizada

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.000 0.0040 0.0080 0.012 0.016 0.0199 0.023 0.027 0.031 0.0359
0 0 0 9 9 9
0.1 0.039 0.0438 0.0478 0.051 0.055 0.0596 0.063 0.067 0.071 0.0753
8 7 7 6 5 4
0.2 0.079 0.0832 0.0871 0.091 0.094 0.0987 0.102 0.106 0.110 0.1141
3 0 8 6 4 3
0.3 0.117 0.1217 0.1255 0.129 0.133 0.1368 0.140 0.144 0.148 0.1517
9 3 1 6 3 0
0.4 0.155 0.1591 0.1628 0.166 0.170 0.1736 0.177 0.180 0.184 0.1879
4 4 0 2 8 4
0.5 0.191 0.1950 0.1985 0.201 0.205 0.2088 0.212 0.215 0.219 0.2224
5 9 4 3 7 0
0.6 0.225 0.2291 0.2324 0.235 0.238 0.2422 0.245 0.248 0.251 0.2549
7 7 9 4 6 7
0.7 0.258 0.2611 0.2642 0.267 0.270 0.2734 0.276 0.279 0.282 0.2852
0 3 4 4 4 3
0.8 0.288 0.2910 0.2939 0.296 0.299 0.3023 0.305 0.307 0.310 0.3133
1 7 5 1 8 6
0.9 0.315 0.3186 0.3212 0.323 0.326 0.3289 0.331 0.334 0.336 0.3389
9 8 4 5 0 5
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.0 0.341 0.3438 0.3461 0.348 0.350 0.3531 0.355 0.357 0.359 0.3621
3 5 8 4 7 9
1.1 0.364 0.3665 0.3686 0.370 0.372 0.3749 0.377 0.379 0.381 0.3830
3 8 9 0 0 0
1.2 0.384 0.3869 0.3888 0.390 0.392 0.3944 0.396 0.398 0.399 0.4015
9 7 5 2 0 7
1.3 0.403 0.4049 0.4066 0.408 0.409 0.4115 0.413 0.414 0.416 0.4177
2 2 9 1 7 2
1.4 0.419 0.4207 0.4222 0.423 0.425 0.4265 0.427 0.429 0.430 0.4319
2 6 1 9 2 6
1.5 0.433 0.4345 0.4357 0.437 0.438 0.4394 0.440 0.441 0.442 0.4441
2 0 2 6 8 9
1.6 0.445 0.4463 0.4474 0.448 0.449 0.4505 0.451 0.452 0.453 0.4545
2 4 5 5 5 5
1.7 0.455 0.4564 0.4573 0.458 0.459 0.4599 0.460 0.461 0.462 0.4633
4 2 1 8 6 5
1.8 0.464 0.4649 0.4656 0.466 0.467 0.4678 0.468 0.469 0.469 0.4706
1 4 1 6 3 9
1.9 0.471 0.4719 0.4726 0.473 0.473 0.4744 0.475 0.475 0.476 0.4767
3 2 8 0 6 1
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0 0.477 0.4778 0.4783 0.478 0.479 0.4798 0.480 0.480 0.481 0.4817
2 8 3 3 8 2
2.1 0.482 0.4826 0.4830 0.483 0.483 0.4842 0.484 0.485 0.485 0.4857
1 4 8 6 0 4
2.2 0.486 0.4864 0.4868 0.487 0.487 0.4878 0.488 0.488 0.488 0.4890
1 1 5 1 4 7
2.3 0.489 0.4896 0.4898 0.490 0.490 0.4906 0.490 0.491 0.491 0.4916
3 1 4 9 1 3

138
Gestión Curricular
Asignatura: Estadística general

2.4 0.491 0.4920 0.4922 0.492 0.492 0.4929 0.493 0.493 0.493 0.4936
8 5 7 1 2 4
2.5 0.493 0.4940 0.4941 0.494 0.494 0.4946 0.494 0.494 0.495 0.4952
8 3 5 8 9 1
2.6 0.495 0.4955 0.4956 0.495 0.495 0.4960 0.496 0.496 0.496 0.4964
3 7 9 1 2 3
2.7 0.496 0.4966 0.4967 0.496 0.496 0.4970 0.497 0.497 0.497 0.4974
5 8 9 1 2 3
2.8 0.497 0.4975 0.4976 0.497 0.497 0.4978 0.497 0.497 0.498 0.4981
4 7 7 9 9 0
2.9 0.498 0.4982 0.4982 0.498 0.498 0.4984 0.498 0.498 0.498 0.4986
1 3 4 5 5 6
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
3.0 0.498 0.4987 0.4987 0.498 0.498 0.4989 0.498 0.498 0.499 0.4990
7 8 8 9 9 0
3.1 0.499 0.4991 0.4991 0.499 0.499 0.4992 0.499 0.499 0.499 0.4993
0 1 2 2 2 3
3.2 0.499 0.4993 0.4994 0.499 0.499 0.4994 0.499 0.499 0.499 0.4995
3 4 4 4 5 5
3.3 0.499 0.4995 0.4995 0.499 0.499 0.4996 0.499 0.499 0.499 0.4997
5 6 6 6 6 6
3.4 0.499 0.4997 0.4997 0.499 0.499 0.4997 0.499 0.499 0.499 0.4998
7 7 7 7 7 7
3.5 0.499 0.4998 0.4998 0.499 0.499 0.4998 0.499 0.499 0.499 0.4998
8 8 8 8 8 8
3.6 0.499 0.4998 0.4999 0.499 0.499 0.4999 0.499 0.499 0.499 0.4999
8 9 9 9 9 9
3.7 0.499 0.4999 0.4999 0.499 0.499 0.4999 0.499 0.499 0.499 0.4999
9 9 9 9 9 9
3.8 0.499 0.4999 0.4999 0.499 0.499 0.4999 0.499 0.499 0.499 0.4999
9 9 9 9 9 9
3.9 0.500 0.5000 0.5000 0.500 0.500 0.5000 0.500 0.500 0.500 0.5000
0 0 0 0 0 0
4.0 0.500 0.5000 0.5000 0.500 0.500 0.5000 0.500 0.500 0.500 0.5000
0 0 0 0 0 0

Problemas Desarrollados

1. Determinar el área bajo la curva normal para valores de z entre: z = 0 y z = -1.8 (es decir:
−1.8 ≤ 𝑧 ≤ 0
Solución
Construyendo el gráfico del área pedida.

Área pedida

139
Gestión Curricular
Asignatura: Estadística general

Como se puede observar, en la tabla no existen valores negativos de z, por lo tanto siempre
que aparezcan valores negativos de z, se obvia el signo para buscar su valor en la tabla.
El resultado en este caso es el mismo que el ejemplo anterior debido a que la curva normal
tipificada es simétrica.
𝑝(−1.8 ≤ 𝑧 ≤ 0) = 0.4641 = 46.41%
2. Determinar el área bajo la curva normal para valores a la derecha de
𝑧 = −1.15 (es decir: 𝑧 ≥ −1.15).
Solución
Construyendo el gráfico del área pedida.

Área pedida

Esto quiere decir:


ÁREA PEDIDA = ÁREA ENTRE: + ÁREA PARA
𝑧 = −1.15 𝑦 𝑧 = 0 𝑧≥0
Gráficamente:

En la tabla, ubicamos el número entero con un decimal


0.50 (1.1) en la primera columna de
𝑧 = −1.15 𝑦 𝑧 = 0
la izquierda, y el segundo decimal (5) lo ubicamos en la primera fila superior, de la
siguiente manera:

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
. .
. .
1.1 0.3643 0.3749
Luego:
ÁREA PEDIDA = 0.3749 + 0.50 = 0.8749
ÁREA PEDIDA = 𝑝(𝑧 ≥ −1.15) = 0.8749 = 87.49%
3. Determinar el área bajo la curva normal, para valores entre z = 0.92 y z = 2.84
(es decir: 0.92 ≤ 𝑧 ≤ 2.84)
Solución
Construyendo el gráfico del área pedida.

140
Gestión Curricular
Asignatura: Estadística general

Área pedida

Para obtener está área, es necesario hacer una diferencia:


ÁREA PEDIDA = ÁREA ENTRE: - ÁREA ENTRE:
. 𝑧 = 0 𝑦 𝑧 = 2.84 𝑧 = 0 𝑦 𝑧 = 0.92
Gráficamente sería:

Ubicamos los valores de z = 0.92 y z = 2.84 en la tabla, de la misma forma que en los
ejemplos anteriores.

Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
Luego:
ÁREA PEDIDA = 0.4977 – 0.3212 = 0.1765
También: 𝑝(0.92 ≤ 𝑧 ≤ 2.84) = 0.1765 = 17.65%

Problemas Propuestos

1. Hallar el área bajo la curva normal para los siguientes valores de z:


a) Entre: z = 0.5 y z = 1.5
b) A la derecha de z = -0.86
c) Entre z = -0.58 y z = -1.86
d) A la derecha de z = 1.84

141
Gestión Curricular
Asignatura: Estadística general

e) Entre z = 1.97 y z = 0.56


2. Calcule el valor de "z" para las probabilidades (área a la izquierda):
a) Probabilidad de 0.7734
b) Probabilidad de 0.9871
c) Probabilidad de 0.4013
d) Probabilidad de 0.9505
e) Probabilidad de 0.1251
3. Calcule la probabilidad acumulada a la izquierda de:
a) z1 ≤ 2,1564
b) z1 ≤ - 1,6851
4. Calcule el valor “z” que corresponde en cada caso y determine las probabilidades y grafique
en:
a) Áreas de construcción: μ = 150 m2 ; σ = 1,03 m2. ; x = 148,6 m2. P(x<148.6) = ?
b) Distancia recorrido por un auto: μ = 25 Km.; σ = 2,2 Km.; x = 22,8 Km. P(x>22,8) = ?
c) Tiempo de almorzar: μ = 38 min.; σ = 4,3 min.; x = 47,675 min. y x = 30,131 min.
P(30,131<x<47,675) = ?
d) Tiempo en llegar a la universidad desde su casa: μ = 45 min; σ = 3,8 min. ; x = 39,4 min. y
x = 51,4 min. ¿Cuál es la probabilidad entre esos dos tiempos?
e) Se tiene una probabilidad de 0.9842, μ = 37 litros; σ = 3,2 litros. ¿Cuánto vale x?
5. El promedio de talla de los estudiantes es de 1.58 m. con una desviación estándar de 3.25 m.
Si seleccionamos a un estudiante al azar, determine las siguientes probabilidades:
a) que mida a lo más 1.65 m
b) que mida entre 1.45 y 1.78 m
c) que mida al menos 1,48 m

Video de Apoyo

Video 1: Distribución Normal - Ejercicios Resueltos - Nivel 1


(https://www.youtube.com/watch?v=T7_ktqfVseU)

Video 2: Distribución Normal - Ejercicios Resueltos - Nivel 2


(https://www.youtube.com/watch?v=VES8qjbKnJs&list=PL3KGq8pH1bFQrSms9uTOpPk0euo
Hnx7mK&index=3&t=0s)

142
Gestión Curricular
Asignatura: Estadística general

Semana 16
EVALUACIÓN FINAL

143
Gestión Curricular
Asignatura: Estadística general

Referencias bibliográficas

Díaz, A. (2013). Estadística aplicada a la administración y la economía. México D. F.: McGraw Hill.

INEI. (Mayo de 2006). Índice temático. Recuperado de: goo.gl/B4142e

Triola, M. (2013). Estadística. (11.a ed.). México D. F.: Pearson Education.

Universidad de Valladolid. (13 de abril de 2012). Probabilidad y estadística orientada a la


economía y la empresa [página web]. Recuperado de: goo.gl/41Ck0B

144
Gestión Curricular
Asignatura: Estadística general

Pérez, C. (2012) Estadística Aplicada –IBM SPSS. España: Garceta grupo editorial.

Robert Johnson, Patricia Kuby. Estadística Elemental. Thomson Editorial. México 2002

Ross, S. (2011). Probabilidad y Estadística para Ingenieros. 3a. ed. México: Mc Graw Hill, 2001.

145

También podría gustarte