Está en la página 1de 145

Estadística general

Guía de Trabajo

1
Visión
Ser una de las 10 mejores universidades privadas del Perú al año 2020,
reconocidos por nuestra excelencia académica y vocación de servicio, líderes en
formación integral, con perspectiva global; promoviendo la competitividad del
país.

MISIÓN
Somos una universidad privada, innovadora y comprometida con el desarrollo del
Perú, que se dedica a formar personas competentes, íntegras y emprendedoras, con
visión internacional; para que se conviertan en ciudadanos responsables e
impulsen el desarrollo de sus comunidades, impartiendo experiencias de
aprendizaje vivificantes e inspiradoras; y generando una alta valoración mutua
entre todos los grupos de interés.

Universidad Continental
Material publicado con fines de estudio
Código: ASUC01275

2
Gestión Curricular
Asignatura: Estadística general

Presentación
RESULTADO DE APRENDIZAJE

Al finalizar la asignatura, el estudiante será capaz de analizar información utilizando los métodos y técnicas de
la estadística descriptiva y probabilidad, para brindar información que sirva para la toma de decisiones.

ORGANIZACIÓN DE LOS APRENDIZAJES

Unidad I Unidad II Unidad III Unidad IV

Distribuciones
Introducción, tipos de Medidas resumen o Distribuciones de
bidimensionales y
distribuciones y gráficos descriptivas probabilidad
gráficos comparativos
Resultado de
Resultado de Resultado de Resultado de
Aprendizaje:
Aprendizaje: Aprendizaje: Aprendizaje:
Al finalizar la unidad, el
Al finalizar la unidad, el Al finalizar la unidad, el Al finalizar la unidad, el
estudiante será capaz de
estudiante será capaz de estudiante será capaz de estudiante será capaz de
calcular e interpretar
utilizar distribuciones comparar e interpretar los calcular las medidas de
probabilidades en
unidimensionales y resultados de las tendencia central,
distribuciones discretas y
gráficos estadísticos para distribuciones variación, posición
continuas en
la interpretación de bidimensionales en relativa y deformación
acontecimientos
resultados estadísticos. acontecimientos de sus para interpretar datos
cotidianos de su carrera
actividades diarias. relacionados a su carrera
profesional.
profesional.

Semana 1 - 4 Semana 5 - 8 Semana 9 - 12


Semana 13 - 16

TIEMPO MINIMO DE ESTUDIO:

Unidad I: Unidad II: Unidad III: Unidad IV:

16 horas 16 horas 16 horas 16 horas

Introducción
La Asignatura de Estadística General pertenece al plan curricular de cursos generales, el cual se desarrolla
Gestión Curricular
Asignatura: Estadística general

dentro de la modalidad presencial, la presente guía - auto formativo material idóneo dentro de su formación
Universitaria.
La Estadística General está orientada a adquirir herramientas básicas para reforzar sus habilidades de inter
relación con la sociedad en todos sus ámbitos. Es así, a asignatura trata de aquellos temas que permite a los
estudiantes desarrollar sus habilidades lógicas y más importantes aún, aplicar lo aprendido en el ámbito
profesional y solucionar problemas del día a día.
De esta manera se desarrollará competencia general de aprendizaje autónomo, debidamente organizados y
sistematizados tomando en cuenta los principios pedagógicos, por ello en primer lugar se presenta la teoría
acompañados de ejemplos, de igual modo se muestran ejercicios desarrollados, ejercicios y problemas
plantados y finalmente la meta cognición de su aprendizaje.
Para el estudio la guía se sugiere la siguiente secuencia en cada resultado de aprendizaje:
Al finalizar la unidad I, el estudiante será capaz de utilizar distribuciones unidimensionales y
gráficos estadísticos para la interpretación de resultados estadísticos.
Al finalizar la unidad II, el estudiante será capaz de comparar e interpretar los resultados de las
distribuciones bidimensionales en acontecimientos de sus actividades diarias.
Al finalizar la unidad III, el estudiante será capaz de calcular las medidas de tendencia central,
variación, posición relativa y deformación para interpretar datos relacionados a su carrera
profesional.
Al finalizar la unidad IV, el estudiante será capaz de calcular e interpretar probabilidades en
distribuciones discretas y continuas en acontecimientos cotidianos de su carrera profesional.
Por tanto Ud. requiere de un conocimiento directo, práctico de la Estadística General que permita aplicar y
emprender nuevos retos, tomando casos prácticos de su entorno y logrando conocimientos de la Estadística
general a través de una aplicación objetiva, la motivación y nuevas metodologías para desarrollar y
consolidar su desarrollo universitario.

Los autores
Índice
Contenido
Unidad I....................................................................................................................................................1
Semana 1.....................................................................................................................................................2
INTRODUCCIÓN A LA ESTADÍSTICA..............................................................................................2
SESIÓN 1: INTRODUCCIÓN A LA ESTADÍSTICA...........................................................................4
1 DEFINICIÓN..............................................................................................................................4
2 UTILIDAD E IMPORTANCIA..................................................................................................4
3 CLASES DE ESTADISTICA......................................................................................................4
4 TERMINOS UTILIZADOS EN LA ESTADISTICA..................................................................5
 Variable cualitativa nominal:...................................................................................................6
 Variable cualitativa ordinal:.....................................................................................................6
4 REDONDEO DE DATOS:..............................................................................................................7
Semana 2...................................................................................................................................................12
SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUALITATIVAS.....14
1 ORGANIZACIÓN DE LOS DATOS........................................................................................14
2 DISTRIBUCIÓN DE FRECUENCIAS.....................................................................................14
3 CLASES DE FRECUENCIAS..................................................................................................14
1.1. FRECUENCIAS SIMPLES:......................................................................................................14
1.2. FRECUENCIAS ACUMULADAS:..........................................................................................16
2. TABLAS DE FRECUENCIAS – VARIABLES CUALITATIVA................................................17
3. TABLA DE FRECUENCIAS – VARIABLE CUALITATIVA DISCRETA................................18
Semana 3...................................................................................................................................................21
DISTRIBUCIÓN DE FRECUENCIAS UNIDIMENSIONALES.........................................................21
SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUANTITATIVAS. .23
1. RECOMENDACIONES:........................................................................................................23
 Los intervalos deben tener igual amplitud.................................................................................23
2. PASOS:.....................................................................................................................................23
Semana 4...................................................................................................................................................30
GRÁFICOS ESTADÍSTICOS...............................................................................................................30
SESIÓN 7: GRÁFICOS ESTADÍSTICOS ESPECIALES....................................................................32
Entre las gráficas más utilizadas tenemos:.................................................................................................32
1. GRÁFICA DE BARRAS.........................................................................................................32
2. HISTOGRAMA.......................................................................................................................32
Gestión Curricular
Asignatura: Estadística general

3. POLÍGONO DE FRECUENCIAS.........................................................................................33
4. OJIVA......................................................................................................................................33
5. GRÁFICA DE PUNTOS.........................................................................................................33
6. GRÁFICO DE PARETO........................................................................................................34
7. GRÁFICO DE TALLO Y HOJAS.........................................................................................34
3. PICTOGRAMA.......................................................................................................................34
4. GRÁFICA CIRCULAR..........................................................................................................35
5. DIAGRAMA DE DISPERSIÓN.............................................................................................35
6. PIRAMIDE DE POBLACIÓN...............................................................................................36
7. CAJA Y BIGOTES..................................................................................................................36
Unidad II................................................................................................................................................41
EVALUACIÓN DE LA PRIMERA UNIDAD.....................................................................................42
Semana 6...................................................................................................................................................44
SESIÓN 11: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS
CUALITATIVOS Y MIXTOS..............................................................................................................46
1. DATOS BIVARIADOS:..........................................................................................................46
2. DISTRIBUCIONES ABSOLUTAS MARGINALES:..........................................................46
Semana 7...................................................................................................................................................53
SESIÓN 13: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS
CUANTITATIVOS...............................................................................................................................55
1. VARIABLES BIDIMENSIONALES.....................................................................................55
2. DIAGRAMA DE DISPERSIÓN:...........................................................................................55
Semana 8...................................................................................................................................................61
EVALUACIÓN PARCIAL...................................................................................................................61
Unidad III..............................................................................................................................................62
Semana 9...................................................................................................................................................63
SESIÓN 17: MEDIDAS DE TENDENCIA CENTRAL.......................................................................65
1. LA MEDIA ARITMÉTICA ( x ; x ; M ; M (a)¿:....................................................................65
2. LA MODA ( Mo ¿ :....................................................................................................................67
3.........................................................................................................................................................69
LA MEDIANA ( Me ¿:......................................................................................................................69
4.........................................................................................................................................................72
RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA.............................................72
Semana 10.................................................................................................................................................76
SESIÓN 19: MEDIDAS DE VARIACIÓN O DISPERSIÓN...............................................................78
1. LA VARIANZA Y LA DESVIACIÓN ESTANDAR:...........................................................78

2
Gestión Curricular
Asignatura: Estadística general

2. COEFICIENTE DE VARIACIÓN:.......................................................................................81
Semana 11.................................................................................................................................................87
SESIÓN 21: CUARTILES Y PERCENTILES......................................................................................89
1. CUARTILES:..........................................................................................................................89
2. PERCENTILES:......................................................................................................................92
4. RANGO INTERCUARTIL.....................................................................................................94
5. ANALISIS EXPLORATORIO DE DATOS..........................................................................94
6. GRÁFICA DE CAJA Y VIGOTE..........................................................................................95
7. COEFICIENTE DE CURTOSIS............................................................................................95
Semana 12...............................................................................................................................................101
EVALUACIÓN DE LA TERCERA UNIDAD...................................................................................101
Unidad IV.............................................................................................................................................103
Semana 13...............................................................................................................................................104
SESIÓN 25: PROBABILIDADES FUNDAMENTOS.......................................................................106
1. FUNDAMENTOS..................................................................................................................106
2. EXPERIMENTOS ALEATORIOS Y ESPACIO MUESTRAL........................................107
3. CONCEPTO DE PROBABILIDAD....................................................................................111
4. TIPOS DE PROBABILIDAD...............................................................................................111
5. LEYES O AXIOMAS DE LA PROBABILIDAD...............................................................113
Semana 14...............................................................................................................................................117
SESIÓN 27: DISTRIBUCIÓN BINOMIAL, POISSON.....................................................................119
1. DISTRIBUCIÓN BINOMIAL..............................................................................................119
2. DISTRIBUCIÓN POISSON.................................................................................................123
Semana 15...............................................................................................................................................129
SESIÓN 1: DISTRIBUCIÓN NORMAL............................................................................................131
1. Introducción...........................................................................................................................131
2. Definición...............................................................................................................................132
3. Curva Norma Tipificada (estándar, o reducida).................................................................134
Semana 16...............................................................................................................................................143
EVALUACIÓN FINAL......................................................................................................................143

3
Unidad I

Resultado de Aprendizaje de la Unidad I:


Al finalizar la unidad, el estudiante será capaz de utilizar distribuciones unidimensionales y
gráficos estadísticos para la interpretación de resultados estadísticos

ORGANIZACIÓN DE APRENDIZAJES

TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN


SEMANA N° 1 Actividad N° 1 1 Prueba de entrada:

1. Introducción a la estadística Desarrolla la evaluación Diagnóstica. Evaluación individual de


2. Estadística, división, objetivos, desarrollo
definiciones, tipos de datos. Actividad N° 2
Métodos y fuentes de recolección 2 Consolidado 1:
de datos. Elabora un organizador del Evaluación individual de desarrollo
conocimiento haciendo uso de la guía. teórico-práctico
SEMANA N° 2 Responde las interrogantes de la guía.

3. Distribuciones de Frecuencias Actividad N° 3


Unidimensionales: Variables
cualitativas, grafico e Aplica una encuesta a sus compañeros
interpretación. Gráficos: sectores y de clase.
barras.
Elabora tabla de frecuencias utilizando
4. Base de datos e variables
la variable género y carrera profesional.
cualitativas y cuantitativas

SEMANA N° 3 Actividad N° 4

5. Distribuciones de Frecuencias Elabora una base de datos de la


Unidimensionales Variables encuesta aplicada a sus compañeros de
cuantitativas, grafico e clase, utilizando el programa del SPSS.
interpretación. Gráficos:
histograma, ojiva, polígono de
frecuencias.
6. Distribuciones de Frecuencias
Unidimensionales: Variables
cuantitativas aplicando spss..

SEMANA N° 4: ……….

7. Gráficos estadísticos especiales:


Pareto, tallo y hoja, pictograma,
Otras gráficas.
8. Gráficos estadísticos especiales:
Pareto, tallo y hoja, pictograma,
otras gráficas con spss - Excel.

1
Gestión Curricular
Asignatura: Estadística general

Semana 1
INTRODUCCIÓN A LA ESTADÍSTICA
La palabra Estadística procede del vocablo “Estado”, pues era función
principal de los Gobiernos de los Estados establecer registros de población,
nacimientos, defunciones, impuestos, cosechas... La necesidad de poseer
datos cifrados sobre la población y sus condiciones materiales de
existencia han debido hacerse sentir desde que se establecieron sociedades
humanas organizadas.

Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la civilización han existido formas
sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de
madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas.

La isla de Cerdeña, existen monumentos prehistóricos pertenecientes a los Nuragas, estos monumentos
constan de bloques de basalto superpuestos sin mortero y en cuyas paredes se encontraban grabados toscos,
signos que han sido interpretados con mucha verosimilizad como muescas que servían para llevar la cuenta
del ganado y la caza.
Los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción
agrícola y los géneros vendidos o cambiados mediante trueque.
En China existían los censos chinos ordenados por el emperador Tao hacia el año 2.200 a.C.

HISTORIA LA ESTADISTICA
758 Durante los mil años posteriores a la caída del Imperio Romano se hicieron muy pocas operaciones
URA

2
L Gestión Curricular
Asignatura: Estadística general

estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por
Pipino el Breve y por Carlomagno en los años 758 y 762, respectivamente. En Francia se realizaron algunos
censos parciales de siervos durante el siglo IX.

1532 Debido al temor que Enrique VII tenía de la peste, en el año 1532 empezaron a registrarse en Inglaterra
las defunciones causadas por esta enfermedad. En Francia, más o menos por la misma época, la ley exigía a
los clérigos registrar los bautismos, fallecimientos y matrimonios.

1540 Alrededor del año 1540, el alemán Sebastián Muster realizó una compilación estadística de los recursos
nacionales, que comprendía datos acerca de la organización política, instituciones sociales, comercio y
poderío militar.

1632 Durante un brote de peste que apareció a fines del siglo XVI, el gobierno inglés comenzó a publicar
estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en 1632 los llamados Bills of
Mortality (Cuentas de Mortalidad) ya contenían datos sobre los nacimientos y fallecimientos por sexo. En
1662, el capitán John Graunt compiló documentos que abarcaban treinta años, mediante los cuales efectuó
predicciones sobre el número de personas que morirían de diversas enfermedades, así como de las
proporciones de nacimientos de hombres y mujeres que cabía esperar. El trabajo de Graunt, condensado en su
obra Natural and political observations… made upon the Bills of Mortality (Observaciones políticas y
naturales…hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo de inferencia y teoría estadística.

1691 Gaspar Neumann, un profesor alemán que vivía en Breslau, se propuso destruir la antigua creencia
popular de que en los años terminados en 7 moría más gente que en los restantes, y para lograrlo hurgó
pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción,
pudo demostrar que en tales años no fallecían más personas que en los demás.

Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor del cometa
que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para las
tablas de mortalidad que hoy utilizan todas las compañías de seguros.

1760 Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que
extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia
serían el aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla en el término
latino s t a t u s, que significa “estado” o “situación”. Esta etimología aumenta el valor intrínseco de la
palabra por cuanto que la estadística revela el sentido cuantitativo de las más variadas situaciones.
FUENTE: Freedman, D. (1999). «From association to causation: Some remarks on the history of
statistics». Statistical Science 14 (3): 243-258. doi:10.1214/ss/1009212409. (Revised versión, 2002).
Hald, Anders (2003). A History of Probability and Statistics and Their Applications before 1750.
Hoboken, NJ: Wiley. ISBN 0-471-47129-1.

ESTADÍSTICA

Propósito:
 Define la estadística e identifica los tipos de datos en situaciones cotidianas.

SESIÓN 1: INTRODUCCIÓN A LA ESTADÍSTICA

3
Gestión Curricular
Asignatura: Estadística general

1 DEFINICIÓN.
La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos,
series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o
algunas previsiones para el futuro.
La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la
interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva.

2 UTILIDAD E IMPORTANCIA.

La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para interpretar la
información obtenida, que puede ser aprovechada para demostrar la evolución de un fenómeno a través de cierto
tiempo. En Perú, el Instituto Nacional de Estadística e Informática (INEI) se encarga de recabar información
estadística y geográfica de todo el país, en diferentes áreas y contextos. Los datos que publica sirven para dar a
conocer, a cualquier persona, la situación en la que se encuentra el área de donde se obtuvo la información. Los
métodos estadísticos se utilizan prácticamente en investigaciones de todas las áreas de conocimiento, tanto en el
ámbito académico, como en el profesional y laboral; en todos ellos la finalidad es poder resolver un problema,
entendiendo que un problema queda definido como la diferencia entre lo real y lo deseado, en donde la
estadística muestra la realidad para que el investigador pueda analizar sus deseos y con ello tomar una decisión.

3 CLASES DE ESTADISTICA.

a) Estadística descriptiva.
Se orienta en la presentación y clasificación de los datos obtenidos de la población que se analiza, es decir,
describe datos. Esta aplicación de la estadística busca plantear y resolver problemas específicos y/o hacer
previsiones a partir de los datos de una muestra, dado que es muy difícil estudiar a la población completa.
Esta rama de la estadística concluye a partir de los datos, como la estimación de un resultado.

b) Estadística inferencial.
Permite sacar conclusiones sobre una población a partir de una muestra, cuando es difícil estudiar la
población debido a su gran tamaño o que provenga de un proceso que no se detiene, utilizando a la
probabilidad cuando no se está seguro de la verdad.

4 TERMINOS UTILIZADOS EN LA ESTADISTICA.


a) Población:
Conjunto universal de elementos (personas, objetos, cosas, etc.) que contienen uno o más características
observables medibles de naturaleza cualitativa o cuantitativa.
A cada elemento de la población se denomina unidad elemental de observación o unidad estadística
(UE)
Ejemplo:
La población de estudiantes de la Universidad Continental.
En la que cada estudiante (UE) tiene características observables (cualitativas y cuantitativas) tales como:
Estado civil, lugar de procedencia, preferencias, peso, talla, rendimiento académico, etc.

4
Gestión Curricular
Asignatura: Estadística general

b) Muestra:
Es una parte o un subconjunto representativo de la población seleccionada mediante técnicas de muestreo,
con el fin de obtener información acerca de la población de la cual proviene.
Ejemplo:
La muestra de estudiantes del III ciclo de la facultad de Arquitectura de la Universidad “Continental”.
c) Datos estadísticos:
Son números o medidas que han sido recogidos como resultado de observaciones, los que se pueden ser
comparados, analizados e interpretados.
Ejemplo:
Notas vigesimales: 00, 04, 08, 10, 15 20
Peso: 2kg, 15kgf, 45,6kg, 80N, etc.
d) Variable estadística:
Es cada una de las características definida en la población por el investigador, que pueden tomar dos o más
valores (cualidades o números). Se representan con una letra del alfabeto: X, Y, Z, etc.
Ejemplo:
En la población formada por los empleados de la Universidad “Continental”, algunas variables estadísticas
definidas son:

VARIABLES (características) VALORES (cualitativo o cuantitativo)

X: genero Masculino, femenino


Y: estado civil Soltero, casado, viudo, divorciado
Z: peso en kg 0, 1, 2, 3, 4,……………..
W. número de hijos 0, 1, 2, etc
P: ingresos mensuales Números reales positivos

Clases de variables:
Variable cualitativa:
Son las cualidades, aquí no se pueden realizar operaciones matemáticas.
Ejemplo:
Género: masculino, femenino.
Profesión: docente, abogado, ingeniero, etc.
Estado civil: soltero, casado, viudo, etc.
Es decir, las variables cualitativas se refieren a características o cualidades que no pueden ser medidas
con números. Podemos distinguir dos tipos:
Variable cualitativa nominal:
Presenta modalidades no numéricas que no admiten un criterio de orden.
Ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal:

5
Gestión Curricular
Asignatura: Estadística general

Presenta modalidades no numéricas, en las que si admite un orden.


Ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ...
Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa:
Son valores que se obtienen por medición o conteos, aquí se pueden realizar operaciones matemáticas.
Ejemplo:
N° de estudiantes.
Temperatura,
N° de hijos,
Ingresos mensuales, etc.
Dentro de las variables cuantitativas se encuentran las variables: discretas y continuas.

Variable cuantitativa discreta:


Estas variables no admiten ningún valor entre dos valores consecutivos fijos.
Ejemplo:
N° de hijos: una familia puede tener 0, 1, 2, 3…..hijos,
No puede tener 1.5 o 3.7 hijos.

Variable cuantitativa continua:


Admite cualquier valor de un intervalo considerado o entre dos valores dados, en la práctica los
valores numéricos de las variables continuas siempre son valores aproximados.
Ejemplo:
Estatura o talla en metros, puede ser: 1.20; 1.45; 1.75; etc
Peso en kilogramos, puede ser: 50; 50.12; 50.20; 51; etc.
Aproximados y redondeados.

e) Escalas de medición:

ESCALA DEFINICIÓN EJEMPLOS

Son aquellas variables cualitativas que establecen la Color de ojos,


NOMINAL distinción de los elementos en diversas categorías género, etc.
(nombres, etiquetas), sin implicar algún orden entre
ellas
Aquellas variables cualitativas que implican orden Grado de
entre sus categorías, pero no grados de distancia Instrucción,
ORDINAL igual entre ellas, están referidas a un orden de grado de
jerarquía, donde las categorías expresan una posición satisfacción de
de orden. los clientes, etc.
INTERVALO Son aquellas variables cuantitativas que suponen a la Temperatura
vez orden y grados de distancia iguales entre las Coeficiente de
diversas categorías, pero no tienen origen natural,

6
Gestión Curricular
Asignatura: Estadística general

sino convencional, tiene un cero relativo. inteligencia

Estas variables comprenden a la vez todos los casos Edad, peso,


RAZÓN anteriores, distinción, orden, distancia y origen único ingresos,
natural; el valor se expresa con un número real tiene producción, etc.
un cero absoluto.

4 REDONDEO DE DATOS:
Consiste en aproximar un número a su valor cercano.
Casos:
a) Cuando la primera cifra eliminada sea menor de 5, la última cifra a redondear debe mantenerse igual.

Ejemplos:
12.743 redondeando a dos decimales, queda 12.74
85.613 redondeando a un decimal, queda 85.6
b) Cuando la primera cifra eliminada es mayor de 5, la última cifra a redondear debe aumentar en uno.
Ejemplos:
1.658 redondeando a dos decimales, queda 1.66
124.869 redondeando a un decimal, queda 124.9
Según ITINTEC (Instituto de Investigación Tecnológica Industrial y de Normas Técnicas) considera un
caso especial (c), cuando la cifra a eliminar es cinco.
c) Cuando la primera cifra eliminada sea 5, la última cifra retenida debe incrementarse en una unidad si este
es impar, debe mantenerse igual si la última cifra retenida es par o cero.
Ejemplos:
12.475 redondeando a dos decimales, queda 12.48
14.425 redondeando a dos decimales, queda 14.42
24.205 redondeando a dos decimales, queda 24.20

Problemas Desarrollados

En los ejercicios 1 al 4 determine si el valor dado es un estadístico o un parámetro.


1) Tamaño de la familia. Se selecciona una muestra de hogares y el número promedio (media) de personas por
familia es de 2,58 (según datos de la Oficina censal peruana).
2) Política. En la actualidad, el 42% de los gobernadores regionales del Perú son de izquierda.
3) Titanic. En un estudio de los 2223 pasajeros del “Titanic”, se encontró que 706 sobrevivieron cuando se
hundió.
4) Audiencia televisiva. Se selecciona una muestra de ciudadanos peruanos y se descubre que la cantidad de
tiempo promedio (media) que ven la televisión es de 4,6 horas al día

Respuestas:
1. Estadístico 2. Parámetro 3. Parámetro 4. Estadístico

7
Gestión Curricular
Asignatura: Estadística general

5) Determine si la variable es cualitativa o cuantitativa y señale si son discretas o continuas.


a) Lugar de residencia
b) Número de vecinos de un edificio.
c) Profesiones de empleados.
d) Número de llamadas telefónicas.
e) Consumo de gasolina cada 200 km.
Respuestas:
a. Cualitativo b. Cuantitativo c. Cualitativo d. Cuantitativo e. Cuantitativo
discreto discreto continuo

Problemas Propuestos

1. Identificar si cada una de las siguientes situaciones que se presenta a continuación representa a una población
(P) o a una muestra (M). Luego señale cuántas corresponden a muestras.
a) Alumnas egresadas del Colegio Estatal “Nuestra Señora del Rosario” durante el año
2018………………………………………………………………………………………… ( )
b) Habitantes del distrito del Tambo…………………………………………………………. ( )
c) Habitantes de la primera cuadra de la Av. San Carlos………………………………. ( )
d) 50% de los alumnos del Curso de Estadística General de la UCCI…………………. ( )
e) 60 mujeres embarazadas atendidas en el Hospital “D.A. Carrión” ………………… ( )
f) 30 hojas de papel bond……………………………………………………………………... ( )
g) 15 reos del penal de Huamancaca Chico, inculpados por narcotráfico………… ( )
h) Niños nacidos en la Clínica “Ortega” durante los primeros cinco días del mes… ( )
i) 60% de las raciones atendidas en un negocio de comida…………………………. ( )
j) El CI de los estudiantes del 5to. Año de Secundaria de todos los colegios estatales de
Junín……………………………………………………………………………... ( )
k) Edad de 25 pacientes con VIH atendidos en Es Salud Junín………………………… ( )
l) Precio del pollo en 10 puestos de venta del Mercado Mayorista de Huancayo… ( )

2. Señale cuántas son variables cuantitativas continuas de la siguiente lista:


a) Número de cursos que usted está cursando este semestre.
b) Número de penales atajados por el arquero de la selección nacional durante todo el campeonato Copa
Libertadores.
c) Peso de sus compañeros de estudio con los que está llevando el curso de Estadística General
d) Volumen de una botella de gaseosa comprada en el cafetín de la universidad.
e) Número de libros que usted leyó el año pasado.

3. Identificar la clasificación (variable cualitativa, cuantitativa discreta, cuantitativa continua) a la que pertenecen
las siguientes variables. Luego señale cuántas son variables cualitativas.
a) Número de estudiantes matriculados en la UCCI durante el período 2018 – 10

8
Gestión Curricular
Asignatura: Estadística general

Variable: ______________________________
b) Color de cabello.
Variable: ______________________________
c) Distancia que recorren dos personas caminando durante 5 minutos.
Variable: ______________________________
d) Número de cursos desaprobados por un grupo de alumnos.
Variable: ______________________________
e) Talla de recién nacidos.
Variable: ______________________________
f) Temperatura corporal.
Variable: ______________________________
g) Peso de los alumnos del Primer Semestre de la EAP de Psicología.
Variable: ______________________________

4. Identificar el nivel de medición que se utilizará para medir las siguientes variables. Luego señale cuántas son de
nivel de razón.
a) Número de personas que vive en el distrito de Orcotuna.
________________________________________

b) Temperatura medida en la escala de Fahrenheit


________________________________________

c) Edad en años cumplidos de un grupo de personas


________________________________________

d) Ingreso familiar (bajo, medio, alto)


________________________________________

e) Peso de recién nacidos.


________________________________________

f) Perímetro del cráneo de un cadáver


________________________________________

g) Estado civil de una persona


________________________________________

h) Clase social (baja, media, alta)


________________________________________

i) Simpatía política de un estudiante


________________________________________

j) Marcas de cerveza

9
Gestión Curricular
Asignatura: Estadística general

________________________________________

k) Velocidad de un vehículo (en Km/h)


________________________________________

l) Signo del zodiaco de una persona


________________________________________

m) Presión de aire de una llanta (en Nw/cm2)


________________________________________

5. Una marca de cloro líquido se vende en botellas cuya etiqueta dice contener 128 onzas (un galón). Debido a
múltiples quejas recibidas de consumidores, INDECOPI decide investigar si la cantidad promedio en las
botellas es realmente 128 onzas. En su puesto de inspector de INDECOPI decide visitar algunos comercios y
compra 100 botellas de esta marca de cloro para corroborar las quejas de los consumidores. El resultado indica
que la cantidad promedio en las botellas es de 126 onzas.
Indique en términos del problema cuánto vale el parámetro.
_________________________________________________________________________________________
_________________________________________________________________________________________

Video de Apoyo

Video 1: Introducción a la Estadística.


https://youtu.be/njgYCEOdb6k

Video 2: Tipos de variables, escala de medición según tipo de variable, ejemplos


https://youtu.be/GOtwu5xiXnw

Semana 2
DISTRIBUCIONES DE FRECUENCIAS
UNIDIMENSIONALES

10
Gestión Curricular
Asignatura: Estadística general

Fisher, Ronald Aylmer, Científico, matemático, estadístico, biólogo


evolutivo y genetista inglés (1890-1962).
Realizó muchos avances en la estadística, una de las contribuciones más
importante fue la inferencia estadística que descubrió en 1920.

John Graunt, A John Graunt se le atribuye haber iniciado la demografía formal. Sentó las bases de la
“regularidad estadística” al encontrar una “ley” para la mortalidad.
Edmund Halley, En 1693 retomó las tablas sobre la expectativa de vida de la población diseñadas por John
Graunt y las perfeccionó proponiendo algunas fórmulas para calcular la «población estacionaria» y la manera
como la edad está distribuida dentro de esa población, lo cual fue un gran adelanto no sólo para los futuros
estudios sobre demografía sino para el cálculo actuarial aplicable en el negocio de los seguros de vida
Fisher, Ronald Aylmer, Científico, matemático, estadístico, biólogo evolutivo y genetista inglés (1890-
1962).
Realizó muchos avances en la estadística, una de las contribuciones más importante fue la inferencia
estadística que descubrió en 1920.

JOHN GRAUNT Y LA PRIMERA TABLA DE MORTALIDAD

Comerciante bien relacionado en Londres, tuvo acceso a los boletines parroquiales de mortalidad desde
finales del siglo XVI, su base documental. En 1662 depositaba cincuenta ejemplares de su Natural and
Political Observations on the Bills of Mortality en la Royal Sciety, que creó un comité para examinar la obra
y emitió un informe favorable. El propio rey Carlos II se interesó por la obra y le propuso como miembro.

En un momento en que el continente europeo era devastado por las epidemias, esta obra resume análisis de
las décadas anteriores, y aporta estadísticas vitales sobre los ciudadanos de Londres, incluyendo las causas de

11
Gestión Curricular
Asignatura: Estadística general

mortalidad, la población total de Londres y la monogamia, entre otros. Es pionero en calcular la razón de
masculinidad al nacer, la tasa bruta de mortalidad y detecta la estacionalidad de algunos fenómenos
demográficos. Añadió así profundidad al análisis, y la información numérica empezó a tener uso más allá de
los fines políticos y militares.

Pero su contribución más relevante aquí es la elaboración de la primera tabla de mortalidad. Los registros de
que disponía (Bills of mortality de la ciudad de Londres) sólo especificaban la causa de muerte y el sexo de
los fallecidos, pero no su edad. Graunt dedujo la proporción de muertes anteriores a los 6 años sumando las
muertes causadas por enfermedades infantiles y la mitad de las causadas por sarampión y viruela. Esto
sumaba el 36% de todas las muertes, de manera que podía suponer una supervivencia del 64% a esa edad.
Pero el libro no explica cómo estimó el resto de filas de la tabla, lo que ha supuesto un motivo de debate
constante en la historiografía demográfica. Algunos creen que simplemente inventó los números, pero otros
piensan que Graunt ya estaba dando por supuesta una ley constante de crecimiento exponencial (µ = .047)
que, interpolada, proporciona los valores intermedios de la tabla. Este supuesto de una fuerza de mortalidad
constante será el manejado poco después por Jan de Witt y Jan Hudde en sus tablas de mortalidad).

Fuente: Camúñez Ruiz, José Antonio y Basulto Santos, Jesús. (2012) En el alumbramiento de la
estadística moderna: John Graunt. Septem Ediciones.
García González, Juan Manuel. 2011, Observaciones políticas y naturales hechas a partir de los
boletines de mortalidad. EMPIRIA. Revista de Metodología de Ciencias Sociales. N.o 21, enero-junio,
pp. 185-199. ISSN: 1139-5737.
Vilquin Éric (1978). Une édition critique en français de l’œuvre de John Graunt (1620-1674).
Présentation d’un ouvrage hors collection de l’INED. Population, 33e année, n°2, pp. 413-423.

VARIABLES
CUALITATIV
AS
Propósito:
 Define las variables estadísticas e identifica los tipos de frecuencias en situaciones cotidianas.

SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUALITATIVAS

1 ORGANIZACIÓN DE LOS DATOS.


Se entiende por organización de datos a la técnica de resumir y presentar datos, donde determinado la técnica de
agrupamiento de las observaciones, procedemos a su cálculo, construyendo la tabla de frecuencias.
Posteriormente podremos visualizar tales frecuencias (características) de forma gráfica con el diagrama o gráfico
estadístico apropiado.

12
Gestión Curricular
Asignatura: Estadística general

2 DISTRIBUCIÓN DE FRECUENCIAS.
Se denomina distribución de frecuencias a los cuadros o tablas numéricos de las variables recopiladas para su
fácil comprensión, interpretación y análisis.
En general una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los
datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Aquí se encuentran las diferentes frecuencias tales como:
La frecuencia absoluta.
Frecuencia relativa.
Frecuencia porcentual.
Frecuencias acumuladas

Estos datos organizados también pueden representarse en gráficos estadísticos.


Los datos ordenados y presentados en una tabla para su mejor interpretación y análisis, es necesario procesarlos
en los siguientes casos:
a) Tabla de frecuencias para datos no agrupados en intervalos de clase (variable discreta)
b) Tabla de frecuencias para datos agrupados en intervalos de clase (variable continua)

3 CLASES DE FRECUENCIAS.
1.1. FRECUENCIAS SIMPLES:

a) Frecuencia absoluta o simple (ni o fi)


Es representado como el número de veces que se repite el dato.
La suma de todas las frecuencias absolutas es igual al total (N) de datos observados

Ejemplo:
En la siguiente tabla se representa las calificaciones obtenidas por los estudiantes del III ciclo de
Administración de la Universidad Continental, en la asignatura de Estadística.

Xi ni

X 1 =00 n1=6
X 2 =05 n2 =4
X 3 =10 n3 =12
X 4=15 n 4=13
X 5 =20 n5 =5
N=40

Si n2 =4, se lee: hay 4 alumnos que tienen la nota de 05

b) Frecuencia relativa (hi)


Es el cociente de la frecuencia absoluta (ni) entre el número de observaciones realizadas(N).

13
Gestión Curricular
Asignatura: Estadística general

ni
hi =
N
La suma de todas las frecuencias relativas es igual a uno (1).
Ejemplo:
De el ejemplo anterior.

Xi ni hi

X 1 =00 n1=60.150 n 3 12
h3 = = =0.3
X 2 =05 n2 =40.100 N 40

X 3 =10 n3 =12
0.300

X 4=15 n 4=13
0.325

X 5 =20 n5 =50.125
N=40
1.000

c) Frecuencia relativa simple porcentaje o porcentual (hi%)

hi %=hix 100 %

La suma total de las frecuencias porcentuales es igual a cien (100%)

Ejemplo:
Utilizando el ejemplo anterior.
Xi ni hi hi%

X 1 =00 n1=60.150 15.0%

X 2 =05 n2 =40.100 10.0%

X 3 =10 n3 =12
0.300 30.0%

X 4=15 n 4=13
0.325 32.5%

X 5 =20 n5 =50.125 12.5%

N=40
1.000 100.0%

Esta frecuencia, nos permite responder preguntas como:


¿Qué porcentaje de estudiantes tienen notas de…….?
1.2. FRECUENCIAS ACUMULADAS:

a. Frecuencia absoluta acumulada (Ni o Fi)


Es la suma de las frecuencias absolutas simples y la dada en cada categoría o fila.
Es decir:

14
Gestión Curricular
Asignatura: Estadística general

N 1 = n1
N 2 = n1 + n2
N 3 = n2 + n3
N 4 = n3 + n4
………………………. etc.
b. Frecuencia relativa acumulada (Hi)
Es la suma sucesiva de las frecuencias relativas o simples anteriores y la dada.
Se define en cada fila como el cociente de la frecuencia absoluta acumulada (Ni) y el número total de
observaciones.

Hi= ¿
N
H 1 = h1
H 2 = h1 + h2
H 3 = h2 + h3
H 4 = h3 + h4
…………………….. etc.
c. Frecuencia relativa acumulada porcentual (Hi% ó Pi%)
Es la suma sucesiva de las frecuencias relativas o simples porcentuales (hi%) anteriores y la dada.
Se define en cada fila como:
Hi %=Hi x 100 %

d. Marca de clase (Xi ó mi)


Es el punto medio del intervalo:
Li + Ls
mi=
2

Problemas Desarrollados

2. TABLAS DE FRECUENCIAS – VARIABLES CUALITATIVA.

Ejemplo:
En una encuesta de opinión sobre preferencias de bebidas gaseosas por su marca: coca cola (K), inca cola (I),
sprite (S). 30 consumidores dieron las siguientes respuestas.
S S K I I I S K K S I K I S S

I I S K K S S K I K I K S I I

a) Construir la distribución de frecuencias.


b) Graficar la distribución circular y en barras.
Solución

15
Gestión Curricular
Asignatura: Estadística general

 Construimos la tabla de frecuencias:


CATEGORI FRECUENCI FRECUENCI FRECUENCIA ÁNGULO PARA
A DE A A RELATIVA GRÁFICO
VARIABLE ABSOLUTA RELATIVA PORCENTUAL CIRCULAR
0
Xi ni hi hi% ∝=hix 360
I 11 0.367 36.7 1320
S 10 0.333 33.3 120°
K 9 0.300 30.0 108°
TOTAL N =30 1.000 100.0 3600

 Determinando los ángulos para el gráfico circular.


Utilizamos: ∝=hix 360 0
Para la categoría “I”
0
∝=hix 360 = 0.367 x 3600 = 1320.
Para la categoría “S”
0
∝=hix 360 = 0.333 x 3600 = 119.88 = 1200
Para la categoría “K”
0
∝=hix 360 = 0.300 x 3600 = 1080

ENCUESTA SOBRE LAS BEBIDAS GASEOSAS

K
30% I
37%

S
33%

Representando la distribución en el gráfico de barras.

16
Gestión Curricular
Asignatura: Estadística general

B eb id a s g a s eo s a s
40
35 36.7
30 33.3
25 30
20

ni%
15
10
5
0
I S K
Xi

3. TABLA DE FRECUENCIAS – VARIABLE CUALITATIVA DISCRETA.

Para realizar el cuadro de distribución de frecuencias de una variable discreta, primero ordenamos los “n” datos
recopilados en forma ascendente.
Podemos representar los datos en tres gráficos: diagrama de barras, polígono de frecuencias y gráfico de
sectores circulares.

Ejemplo:
En una encuesta a 28 hogares, para saber sobre el número de hijos por familia (X), se obtuvieron las siguientes
respuestas.
4 3 2 0 2 1 6 9 4 3 1 2 0 2

3 2 1 4 3 2 3 4 3 2 4 2 9 6

Construir la distribución de frecuencias de la variable X.


Realizar la gráfica de barras.
Solución
 Construimos la tabla de distribución de frecuencias del número de hijos por familia(X):
Xi ni hi hi%
0 2 0.07 7
1 3 0.11 11
2 8 0.29 29
3 6 0.21 21
4 5 0.18 18
6 2 0.07 7
9 2 0.07 7
TOTAL N = 28 1.00 100.00

 Realizamos el gráfico de barras (Xi y ni)

17
Gestión Curricular
Asignatura: Estadística general

N úme ro de hi j os

9
6
4
3
Xi

2
1
0
0 1 2 3 4 5 6 7 8 9
ni

Problemas Propuestos

1) En la Universidad Continental se ha realizado una encuesta 200 alumnos sobre el tipo de atención de esta
institución. El 32% afirma que está muy contento, el 40% está contento, el 23% no está contento, y el resto
muy descontento. Elabore la tabla de frecuencias e interprete.
2) Se ha llevado a cabo una encuesta a 27 empresas sobre el número de microcomputadoras que tienen,
encontrando los siguientes resultados:

5 7 9 7 8 5 2 4 3
6 8 7 6 9 8 4 6 4
8 5 9 6 7 9 4 7 5
3) Los directivos de “Real Plaza” realizan una prueba de mercado respecto a la facilidad de navegación en su
nuevo sitio web. Selecciona al azar 18 usuarios frecuentes y les solicita que califique la relativa facilidad para
navegar como mala (M), buena (B), excelente (E) o sobresaliente (S)”. Los resultados son los siguientes,
elabore la tabla de frecuencias e interprete.

B E S B M S
M S E S B E
M M B M E S
4) Para un estudio de accesibilidad, durante 30 días anotamos el número de plazas libres de aparcamiento a las 5
de la tarde. Elabore la tabla de frecuencias e interprete.
1 1 5 0 5 3 0 3 3 2
2 3 1 1 2 1 2 0 1 3
2 1 5 0 2 2 1 3 3 2

5) Se realizó una encuesta a los trabajadores de la casa de préstamos “Perú Cash”, sobre el número de hijos.
Elabore la tabla de frecuencias e interprete.

18
Gestión Curricular
Asignatura: Estadística general

2 1 2 4 1 3 2
3 2 3 2 0 3 4
3 2 1 3 2 1 2

Video de Apoyo

Video 1: Tipos de variables estadísticas | Cuantitativas Cualitativas


(https://www.youtube.com/watch?v=nCszHELuwxk)
Video 2: Tabla de frecuencias para variable cualitativa, diagrama de sectores
(https://www.youtube.com/watch?v=rsYCe73_q-I)

19
Gestión Curricular
Asignatura: Estadística general

Semana 3
DISTRIBUCIÓN DE FRECUENCIAS
UNIDIMENSIONALES
En el siglo XIX, la estadística entra en una nueva fase de su desarrollo con la
generalización del método para estudiar fenómenos de las ciencias naturales y
sociales. Galton (1.822-1.911) y Pearson (1.857-1936) se pueden considerar
como los padres de la estadística moderna, pues a ellos se debe el paso de la
estadística deductiva a la estadística inductiva.

David Huntsberger: Utilizo la palabra estadística con números apilados en grandes arreglos y tablas, de
volúmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, créditos y
así sucesivamente.
Sebastián Muster, durante el siglo XVII aportó indicaciones más concretas de métodos de observación y
análisis cuantitativo y amplió los campos de la inferencia y la teoría Estadística.
Gaspar Neumann, Sionista, teólogo y filólogo alemán, nacido en 1648 y muerto en 1715. Sus principales
obras son: Génesis linguae sanctae, Exodus linguae sanctae y Formulario de todas las oraciones.

ETAPAS DE DESARROLLO DE LA ESTADÍSTICA

La historia de la estadística está resumida en tres grandes etapas o fases.

20
LECTURA Gestión Curricular
Asignatura: Estadística general

1. Primera Fase: Los Censos:


Desde el momento en que se constituye una autoridad política, la idea de inventariar de una forma más o
menos regular la población y las riquezas existentes en el territorio está ligada a la conciencia de soberanía
y a los primeros esfuerzos administrativos.
2. Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política:
Las ideas mercantilistas extrañan una intensificación de este tipo de investigación. Colbert multiplica las
encuestas sobre artículos manufacturados, el comercio y la población: los intendentes del Reino envían a
París sus memorias. Vauban, más conocido por sus fortificaciones o su Dime Royale, que es la primera
propuesta de un impuesto sobre los ingresos, se señala como el verdadero precursor de los sondeos. Más
tarde, Bufón se preocupa de esos problemas antes de dedicarse a la historia natural.
La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus tres
principales representantes son Graunt, Petty y Halley. El penúltimo es autor de la famosa Aritmética
Política.
Chaptal, ministro del interior francés, publica en 1801 el primer censo general de población, desarrolla los
estudios industriales, de las producciones y los cambios, haciéndose sistemáticos durante las dos terceras
partes del siglo XIX.
3. Tercera Fase: Estadística y Cálculo de Probabilidades:
El cálculo de probabilidades se incorpora rápidamente como un instrumento de análisis extremadamente
poderoso para el estudio de los fenómenos económicos y sociales y en general para el estudio de
fenómenos “cuyas causas son demasiados complejas para conocerlos totalmente y hacer posible su
análisis”.

Fuente: Pearson, Egon (1978). The History of Statistics in the 17th and 18th Centuries against the
changing background of intellectual, scientific and religious thought (Lectures by Karl Pearson given at
University College London during the academic sessions 1921-1933). Nueva York: MacMillanPublishng
Co., Inc. p. 744. ISBN 0-02-850120-9.

Salsburg, David (2001). The Lady Tasting Tea: How Statistics Revolutionized Science in the
Twentieth Century. ISBN 0-7167-4106-7.
Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty before 1900.
Belknap Press/Harvard University Press. ISBN 0-674-40341-X.

VARIABLES
CUANTITATIVA
S
Propósito:
 Organizar datos en una tabla de distribución de frecuencias para variables cuantitativas continuas.

21
Gestión Curricular
Asignatura: Estadística general

SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUANTITATIVAS

Este cuadro se usa cuando la variable cuantitativa es continua o cuando el número de valores distintos de una
variable discreta es muy grande (N > 20).

1. RECOMENDACIONES:
 Agrupar los datos en no más de 20 intervalos ni menos de 5
 Los intervalos deben tener igual amplitud.
2. PASOS:
1° Identifique el dato mayor y dato menor.
Dato mayor = Xmax
Dato menor = Xmin
2° Hallamos el rango o recorrido (R).
R = Xmax – Xmin
3° Hallamos el número de intervalos (K).
 Si: n ≥ 10, por la Regla de Sturges

K = 1 + 3.322 log(n)
 Por la Ley de Portugal:
 Si: 25 ≤ n ≤ 400

K = √n

 Si: 50 < n ≤ 100


K = 1. 8914 + 3.991 log(n)

 Si: n ≤ 50

K = 1 + 3.322 log(n)
 Si: n > 100

K = 2.7560 + 5.8154
l

4° Hallamos la amplitud o la longitud del intervalo de clase (C):


R
C=
K
El producto R = K.C debe ser el mínimo y que cubra el recorrido de la variable (K.C ≥ R), es decir
primero se considera el producto igual al rango, si no hay este número se considera el mayor más
cercano al rango.
Si los datos de la muestra (n) son enteros, entonces C debe ser entero
Si los datos de la muestra (n) tienen uno o dos decimales, entonces C debe tener uno o dos
decimales.

22
Gestión Curricular
Asignatura: Estadística general

5° Hallamos los intervalos:


Si ya se conoce el Xmin, K y C

[
Utilizamos la siguiente fórmula: I k = X min + ( k −1 ) .C− X min + k . C ]
Ejemplo:
Las calificaciones obtenidas por un grupo de 45 estudiantes en una prueba escrita de estadística son:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60

Construya la tabla de distribución de frecuencias.


Solución
Realizando los pasos estudiados:
1° Identifiquemos el dato mayor y dato menor
Dato mayor = Xmax = 89
Dato menor = Xmin = 26
2° Hallamos el rango (R)
R = Xmax – Xmin = 89 – 26 = 63
3° Hallamos el número de intervalos (K)
Si: n = 45
Utilizamos la Ley de Portugal
Si: n ≤ 50 K = 1 + 3.322 log(n)
K = 1 + 3.322 log(45)
K = 1 + 3.322(1.6532)
K = 6.4919

Entonces los posibles valores de K = 6, 7 ó 8

4° Hallamos la amplitud o la longitud del intervalo de clase (C):


Utilizamos la siguiente fórmula:
R
C=
K
Como “K” tiene tres posibles valores: (6, 7 ó 8), hallamos tres posibles “C”
R 63
 C 1= = =10.5=11 aplicando R = K.C =6.11 = 66
K 6
R 63
 C 2= = =9 aplicando R = K.C =7.9 = 63 cumple
K 7
(K.C ≥ R)
R 63
 C 3= = =7.875=8 aplicando R = K.C = 8.8 = 64
K 8

23
Gestión Curricular
Asignatura: Estadística general

Entonces:
Organizamos una tabla de 7 intervalos (K = 7)
Con amplitud de 9 (C = 9)

5° Determinando los extremos de los intervalos [ Li−LS ]

Si: X min=26 C=9 K=7

I 1=¿
I 2=¿
I 3=¿
..……….=…………………
………………..=………………………...
Entonces el último intervalo será:
I 7=¿

6° Construimos la tabla de distribución de frecuencias:

Frecuencias simples
Intervalos
absolutas relativas porcentaje
¿ ni hi hi%
¿ 1 0.023 2.3
¿ 4 0.089 8.9
¿ 5 0.111 11.1
¿ 14 0.311 31.1
¿ 14 0.311 31.1
¿ 5 0.111 11.1
[80−89 ] 2 0.044 4.4
Total N = 45 1.000 100.0

HISTOGRAMA

16
14
14 14
12
10
8
ni

6
4 5 5
4
2
2
0 1
26 - 35 35 - 44 44 - 53 53 - 62 62 - 71 71 - 80 80 - 89
INTERVALOS

24
Gestión Curricular
Asignatura: Estadística general

POLÍGONO DE FRECUENCIAS
16
14 14 14
12
10
8
ni

6
5 5
4 4
2 2
1
0
26 - 35 35 - 44 44 - 53 53 - 62 62 - 71 71 - 80 80 - 89
INTERVALOS

Problemas Desarrollados

1. Los siguientes datos son los pesos en kg de 30 estudiantes del Programa BECA 18, atendidos en el mes de
diciembre del 2017, en el consultorio de nutrición del Hospital ESSALUD - HUANCAYO:

75.8 69.3 96.2 86.3 99.8 59.4 65.5 76.4


84.6 72.2 74.1 76.0 86.5 65.0 86.2 68.3
70.2 61.8 58.4 69.2 68.4 76.5 81.0 65.9
68.3 75.0 67.3 82.2 72.1 69.0

Determine el cuadro de distribución de frecuencias.

Solución
 Identifique el dato mayor y dato menor
Dato mayor = Xmax = 99.8
Dato menor = Xmin = 58.4
 Hallamos el rango o recorrido (R)
R = Xmax – Xmin = 99.8 – 58.4 = 41.4
 Hallamos el número de intervalos (K)
Si: n = 30
 Utilizamos la Ley de Portugal
Si: n ≤ 50 K = 1 + 3,322 log(n)
K = 1 + 3,322 log (30)
K = 5.90
Los posibles valores de: K = 5, 6 ó 7
 Hallamos la amplitud o la longitud del intervalo de clase (C):
R
C=
K
R 41.4
 C 1= = =8.28=8.3 aplicando R = K.C = 5 x 8.3 = 41.5
K 5

25
Gestión Curricular
Asignatura: Estadística general

R 41.4
 C 2= = =6.9 aplicando R = K.C =6 x 6.9 = 41.4
K 6
R 41.4
 C 3= = =5.91=5.9 aplicando R = K.C = 7 x 5.9 = 41.3
K 7
Organizamos una tabla de 8 intervalos (K = 6)
Con amplitud (C = 6.9)
 Determinemos los extremos de los intervalos [ Li−LS ]
Si: X min=58.4 C = 6.9 K=6
I 1=¿ ¿
I 2=¿
I 3=¿
I 4=¿
I 5=¿
I 6=¿
Li - Ls ni hi hi% Ni Hi Hi%
¿ 4 0.13 13 4 0.13 13
¿ 11 0.37 37 15 0.50 50
¿ 7 0.23 23 22 0.73 73
¿ 3 0.10 10 25 0.83 83
¿ 3 0.10 10 28 0.93 93
¿ 2 0.07 7 30 1.00 100
N = 30 1.00 100

Problemas Propuestos

1. Se ha llevado a cabo un estudio para evaluar los volúmenes de venta (miles de soles por día) de 24
establecimientos comerciales de Huancayo y se encontraron los siguientes resultados. Elabore la tabla de
frecuencias e interprete.

11,7 5,7 10,1 8,5 6,4 2,1

9,1 3,7 5,3 7,8 4,4 9,8

7,4 12,1 5,4 7,4 3,2 1,5

8,4 6,1 5,7 4,7 5,2 4,6

2. En la fábrica de SAZON LOPESA se hizo un estudio sobre el peso (kg) de los trabajadores con el fin de
establecer una orientación sobre nutrición y buena salud. Los resultados fueron los siguientes: Elabore la tabla de
frecuencias e interprete.
60 84 112 120 72 61

70 74 68 90,5 81 75

26
Gestión Curricular
Asignatura: Estadística general

84 64,2 118 84 96,4 65

84 65 97,5 82 98 62

3. Las calificaciones finales del curso de ESTADISTICA donde las notas están sobre 10 son los siguientes. Elabore
la tabla de frecuencias e interprete.
4,5 8,0 8,5 7,5 6,5 3,5 6,0
4,5 4,5 8,5 8,5 10,0 7,0 6,5
9,5 7,0 6,0 8,5 6,5 6,5 8,5
4. Elabore la tabla de frecuencias e intérprete del registró de tiempo en minutos que demoran 30 estudiantes para
ejecutar una tarea, resulto los siguientes datos:

21.3 15.8 18.4 22.1 19.4 15.8 26.4 17.3 11.2 23.4

26.8 22.7 18.0 20.5 11.0 18.2 23.6 24.6 20.5 16.6

8.3 21.9 12.3 23.3 13.4 17.9 12.3 13.4 15.8 19.5

5. La puntuación final en la asignatura de Estadística de 80 estudiantes en la UC, se registra en la siguiente tabla:

68 84 75 82 68 90 62 88 76 93

73 79 88 73 60 93 71 59 85 75

61 65 75 87 74 62 95 78 63 72

66 78 82 75 94 77 69 74 68 60

96 78 89 61 75 95 60 79 83 71

79 62 67 97 78 85 76 65 71 75

65 80 73 57 88 78 62 76 53 74

86 67 73 81 72 63 76 75 85 77

Construya el cuadro de distribución de frecuencias según los pasos estudiados.

Video de Apoyo

Video 1: Variables Estadísticas Cualitativas y Cuantitativas, Nominales y Ordinales, Discretas y Continuas


(https://www.youtube.com/watch?v=Tb3sgUSd2SQ)

Video 2: Variables Discretas y Continuas - Ejemplos y Ejercicios Resueltos


(https://www.youtube.com/watch?
v=fMW5S6JdMzg&list=PL3KGq8pH1bFSLAzS3dccWo7Lgucaj09Km&index=3&t=0s)

27
Gestión Curricular
Asignatura: Estadística general

Semana 4
GRÁFICOS ESTADÍSTICOS
Los gráficos son medios popularizados y a menudo los más
convenientes para presentar datos, se emplean para tener una
representación visual de la totalidad de la información. Los
gráficos estadísticos presentan los datos en forma de dibujo de
tal modo que se pueda percibir fácilmente los hechos
esenciales y compararlos con otros.

28
Gestión Curricular
Asignatura: Estadística general

William Playfair, Ingeniero mecánico y economista político escocés. Trabajó más de 36 años en el diseño de
gráficos estadísticos. Se le considera pionero en el uso del gráfico lineal para representar series temporales, y fue
el creador del gráfico circular, de sectores y de barras.
Michael Van Langren: recogió las distintas estimaciones que se habían hecho de la distancia que separa
Toledo de Roma (12 en total).
C. Joseph Priestley: Utilizo gráficos estadísticos, principalmente mapas destacados en los años 1700 – 1799.

GRÁFICOS ESTADISTICA
Cuando se hace un estudio estadístico se obtiene una gran cantidad de datos numéricos. Para tener una
información clara y rápida de lo obtenido en el estudio se han creado las gráficas estadísticas.
LECTURA

Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio para informar
basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de información dependerá
de la presentación de los datos, siendo la forma gráfica uno de los más rápidos y eficientes, aunque también
uno de los que más pueden ser manipulados o ser malinterpretados si no se tienen algunas precauciones
básicas al realizar las gráficas.

Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno de ellos de
acuerdo al tipo de información que se está usando y los objetivos que se persiguen al presentar la información.

Entonces, algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier gráfica a
fin de que la información sea transmitida de la manera más eficaz posible y sin distorsiones son:

El eje que represente a las frecuencias de las observaciones (comúnmente el vertical o de las ordenadas) debe
comenzar en cero (0), de otra manera podría dar impresiones erróneas al comparar la altura, longitud o

29
Gestión Curricular
Asignatura: Estadística general

posición de las columnas, barras o líneas que representan las frecuencias.


La longitud de los espacios que representan a cada dato o intervalo (clase) en la gráfica deben ser iguales.
El tipo de gráfico debe coincidir por sus características con el tipo de información o el objetivo que se
persigue al representarla, de otra manera la representación gráfica se convierte en un instrumento ineficaz,
que produce más confusión que otra cosa, innecesario o productor de malinterpretaciones.
Por ejemplo, si se desea representar la proporción de población masculina en un país conviene más usar una
gráfica de pastel o circular que una gráfica de barras al compararla contra la población femenina; por un lado
se puede apreciar dicha proporción, por el otro se aprecia cuál de las dos poblaciones es mayor.

Hay un punto que conviene remarcar: existe software que permite la construcción rápida y eficiente de
gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán bonita, bien delineada, bien
coloreada o bien presentada esté una gráfica, si no se han tomado en cuenta consideraciones de este tipo que
tienen que ver más sobre el objetivo de estas herramientas y la Estadística: la transmisión eficiente de la
información.

Hay muchos tipos de gráficas estadísticas. Cada una de ellas es adecuada para un estudio determinado, ya que
no siempre se puede utilizar la misma para todos los casos. Tienen una estructura distinta, lo cual les permite
ser utilizados para diferentes objetivos, y es que la mayoría de las veces utilizan datos o variables distintos.
G
FUENTE: Stigler, Stephen M. (1999) Statistics on the Table: The History of Statistical Concepts
and Methods. Harvard University Press. ISBN 0-674-83601-4

GRÁFICOS
ESTADÍSTIC
OS
Propósito:
 Construye gráficos estadísticos, analiza e interpreta los resultados.

SESIÓN 7: GRÁFICOS ESTADÍSTICOS ESPECIALES.


Un gráfico estadístico es una representación visual de una serie de datos estadísticos, además es una herramienta
muy eficaz, ya que un buen gráfico:

 Capta la atención del lector, ilustrando el mensaje o tema que acompaña.


 Presenta la información de forma rápida, sencilla, clara y precisa.
 Facilita la comparación de datos.
 Destaca las tendencias y el comportamiento de los datos.
Entre las gráficas más utilizadas tenemos:

1. GRÁFICA DE BARRAS.
Cada barra rectangular corresponde a una modalidad, tiene una base constante, y su altura puede ser medida en
unidades de frecuencia relativa, absoluta o porcentual.

30
Gestión Curricular
Asignatura: Estadística general

2. HISTOGRAMA.
Es una gráfica de barras donde la escala horizontal representa clases de valores de datos y la escala vertical
representa frecuencias. Las alturas de las barras corresponden a los valores de frecuencia y no existe separación
entre las barras.

3. POLÍGONO DE FRECUENCIAS.
Utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de los valores de las
marcas de clase. Las alturas de los puntos corresponden a las frecuencias de clase; en tanto que los segmentos
lineales se extienden hacia la derecha y hacia la izquierda, de manera que la gráfica inicia y termina sobre el eje
horizontal.

4. OJIVA.
Es una gráfica lineal que representa frecuencias acumulativas. La ojiva utiliza fronteras de clase a lo largo de la
escala horizontal, y que la gráfica comienza con la frontera inferior de la primera clase y termina con la frontera
superior de la última clase. Las ojivas son útiles para determinar el número de valores que se encuentran por
debajo de un valor específico.

31
Gestión Curricular
Asignatura: Estadística general

5. GRÁFICA DE PUNTOS.
Es aquella donde se marca cada valor de un dato como un punto a lo largo de una escala de valores. Los puntos
que representan valores iguales se apilan.

6. GRÁFICO DE PARETO.
Con el Diagrama de Pareto se pueden detectar los problemas que tienen más relevancia mediante la aplicación
del principio de Pareto (pocos vitales, muchos triviales) que dice que hay muchos problemas sin importancia
frente a solo unos graves. Ya que, por lo general, el 80% de los resultados totales se originan en el 20% de los
elementos.

7. GRÁFICO DE TALLO Y HOJAS.


Representa datos que separan cada valor en dos partes: el tallo (el dígito ubicado en el extremo izquierdo) y la
hoja (el dígito del extremo derecho). Las hojas se ordenan de forma creciente y no en el orden en que aparecen
en la lista original. Una gran ventaja de la gráfica de tallo y hojas radica en que nos permite ver la distribución de
los datos y, al mismo tiempo, retener toda la información de la lista original. Otra ventaja es que la construcción
de una gráfica de tallo y hojas implica una forma fácil y rápida de ordenar datos (acomodarlos en orden), y
algunos procedimientos estadísticos requieren de un ordenamiento (como el cálculo de la mediana o de los
percentiles).

32
Gestión Curricular
Asignatura: Estadística general

3. PICTOGRAMA.
También llamada gráfica de imágenes o pictografía. Es un diagrama que utiliza imágenes o símbolos para
mostrar datos para una rápida comprensión. En un pictograma, se utiliza una imagen o un símbolo para
representar una cantidad específica.

4. GRÁFICA CIRCULAR.
También se utilizan para visualizar datos cualitativos. Presenta datos cualitativos como si fueran rebanadas de un
pastel. Para construir una gráfica circular, se divide el círculo en las proporciones adecuadas. Cada sector
corresponde a una modalidad y su correspondiente ángulo en el centro.

5. DIAGRAMA DE DISPERSIÓN.
Es una gráfica de datos apareados (x, y), con un eje x horizontal y un eje y vertical. Los datos se aparean de tal
forma que cada valor de un conjunto de datos corresponde a un valor de un segundo conjunto de datos. Para
elaborar manualmente un diagrama de dispersión, construya un eje horizontal para los valores de la primera
variable, construya un eje vertical para los valores de la segunda variable y después grafique los puntos. El
patrón de los puntos graficados suele ser útil para determinar si existe alguna relación entre las dos variables.

33
Gestión Curricular
Asignatura: Estadística general

6. PIRAMIDE DE POBLACIÓN.
Es una representación gráfica de la distribución por edad y sexo de una población en un momento determinado.
Nos pueden brindar información sobre migración de la población, mortalidad, guerras, epidemias y muchas otras
situaciones que se presentan en una población. Además, que nos ayuda a comparar los resultados de diversos
fenómenos.

7. CAJA Y BIGOTES.
Son una representación visual que describe varias características importantes, al mismo tiempo, tales como la
dispersión y simetría. Para su realización se representan los tres cuartiles y los valores mínimo y máximo de
los datos, sobre un rectángulo, alineado horizontal o verticalmente.

Problemas Desarrollados

1. La empresa “La Grande” registra las horas extras de los colaboradores en un año determinado, obteniendo la
siguiente tabla:

Intervalos Xi fi Fi hi Hi pi Pi
[38-44> 41 7 7 0.0795 0.0795 7.95% 7.95%
[44-50> 47 8 15 0.0909 0.1705 9.09% 17.05%

34
Gestión Curricular
Asignatura: Estadística general

[50-56> 53 15 30 0.1705 0.3409 17.05% 34.09%


[56-62> 59 25 55 0.2841 0.6250 28.41% 62.50%
[62-68> 65 18 73 0.2045 0.8295 20.45% 82.95%
[68-74> 71 9 82 0.1023 0.9318 10.23% 93.18%
[74-80] 77 6 88 0.0632 1 6.82% 100.00%
TOTAL 88 1 100.00%
Elaborar el polígono de frecuencia y ojiva, e interpreta
Solución:

Interpretación:
De los 88 colaboradores de la empresa “La Grande”,25 trabajan de 56 a menos de 62 horas haciendo el
porcentaje en un 28,41%.

2. Determine la tabla de distribución de frecuencia del histograma que se muestra, donde se observa la cantidad de
columnas que tienen 21 construcciones:

Solución:

Intervalos Xi fi Fi hi Hi pi% Pi%


[10-15> 12.5 3 3 0.1429 0.1429 14.29 14.29
[15-20> 17.5 5 8 0.2381 0.3810 23.81 38.10
[20-25> 22.5 7 15 0.3333 0.7143 33.33 71.43
[25-30> 27.5 4 19 0.1905 0.9048 19.05 90.48
[30-35] 32.5 2 21 0.0952 1 9.52 100.00
TOTAL 21 1 100.00

3. A partir del grafico que se muestra elabore su tabla de distribución de frecuencia, donde se muestran el
consumo de 300 comensales de “Rustica”:

35
Gestión Curricular
Asignatura: Estadística general

Solución:

Ventas de pi Pi
fi Fi hi Hi ángulo
comida % %
sándwiches 120 120 0.4 0.4 40 40 144
ensalada 63 183 0.21 0.61 21 61 76
sopa 45 228 0.15 0.76 15 76 54
bebidas 27 255 0.09 0.85 9 85 32
postres 45 300 0.15 1 15 100 54
TOTAL 300 1 100 360

Problemas Propuestos

1. El siguiente cuadro muestra el total de inasistencia de los alumnos del mes, de tres facultades distintas. Elabora
un gráfico de barras. (elige otro gráfico que te parezca conveniente)
FACULTADES
MESES
Ingeniería Derecho Medicina
Julio 30 24 20
Agosto 35 30 38
Septiembre 19 25 25
Octubre 20 19 27
Noviembre 15 20 32
Diciembre 18 22 38

2. La Cámara de Comercio de Huancayo está interesada en conocer de qué manera vienen desarrollando sus
actividades los restaurantes y las Número pollerías del centro de la ciudad. Para
fi
ello han tomado una muestra de 50 de quejas Fi de estos establecimientos y ha
revisado el libro de reclamaciones de cada uno para contabilizar el
1 2 2
número de quejas que presentaron 2 4 6 los clientes. Los datos se muestran a
continuación: 3 21 27
4 15 42
5 6 48
6 1 49
7 1 50
36
TOTAL 50
Gestión Curricular
Asignatura: Estadística general

Construya el gráfico estadístico correspondiente tanto para las frecuencias absolutas (diagrama de bastones) y las
acumuladas (diagrama de escalones).

3. La empresa ELECTROCENTRO S.A. está llevando a cabo un estudio minucioso acerca de los salarios que
perciben los obreros de esta institución, con la finalidad de realizar mejoras económicas entre su personal. La
siguiente tabla muestra los salarios que perciben una muestra de 26 de estos obreros:
Salarios Cantidad de obreros
2 ¿
4 ¿
6 ¿
7 ¿
3 ¿
3 ¿
1 [1650−1800]

Grafique el histograma, polígono de frecuencia y ojiva “Menor que” de dicha tabla.

4. El peso en gramos de 30 objetos de un mismo tipo fue como sigue:


21,3 15,8 18,4 22,7 19,6 15,8 26,4 17,3 11,2 23,9
26,8 22,7 18,0 20,5 11,0 18,5 23,0 24,6 20,1 16,2
08,3 21,9 12,3 22,3 13,4 17,9 12,2 13,4 15,1 19,1

Construir un diagrama de tallo y hojas para los datos indicados, indicar las características de la distribución.
5. En la siguiente tabla se muestran los resultados después de las evaluaciones a un grupo de estudiantes de la
carrera profesional de contabilidad. (utilizar dos tipos de gráficos)

ESTUDIANTES
CONDICIÓN (GENERO)
Varones Mujeres
Aprobado 65 96
Desaprobado 25 32
Retirado 10 8

Video de Apoyo

Video 1: Diagrama de Barras, Polígono de Frecuencias y Gráfica Circular - Ejemplos y Ejercicios

37
Gestión Curricular
Asignatura: Estadística general

(https://youtu.be/L2F2VkzsZwU)
Video 2: Tabla de frecuencias para variable cualitativa, diagrama de sectores
(https://www.youtube.com/watch?v=rsYCe73_q-I)

Unidad II

Resultado de Aprendizaje de la Unidad II:


Al finalizar la unidad, el estudiante será capaz de comparar e interpretar los resultados de las

38
Gestión Curricular
Asignatura: Estadística general

distribuciones bidimensionales en acontecimientos de sus actividades diarias.

ORGANIZACIÓN DE APRENDIZAJES

TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN


SEMANA N° 5 Actividad N° 5 Consolidado 1:
9. Evaluación de la primera unidad Resuelven ejercicios de la primera - Ejercicios para identificar alternativas
10. Distribuciones de Frecuencias evaluación de Consolidado I relacionados de solución.
Bidimensionales. Datos cualitativos y con los temas de la unidad I.
mixtos. Actividad N° 6 Evaluación parcial:
Elabora tabla bidimensional de dos - Evaluación individual de desarrollo
Gráfico de barras agrupadas.
variables cualitativas y mixtas e interpreta teórico-práctico
SEMANA N° 6
los resultados, a partir de la encuesta
11. Distribuciones de Frecuencias
realizada a sus compañeros de clase.
Unidimensionales: Variables
Actividad N° 7
cualitativas, grafico e interpretación.
Elabora tabla bidimensional de dos
Gráficos: sectores y barras.
variables cuantitativas, interpreta la
12. Base de datos e variables cualitativas
relación positiva o negativa, utilizando la
y cuantitativas guía de trabajo.
SEMANA N° 7
Práctica calificada grupal Actividad N°
13. Distribuciones de Frecuencias
8
Unidimensionales Variables Realizan las interrogantes de la
cuantitativas, grafico e interpretación. evaluación parcial.
Gráficos: histograma, ojiva, polígono
de frecuencias.
14. Distribuciones de Frecuencias
Unidimensionales: Variables
cuantitativas aplicando spss.
SEMANA N° 8
15. Gráficos estadísticos especiales:
Pareto, tallo y hoja, pictograma, Otras
gráficas.
16. Gráficos estadísticos especiales:
Pareto, tallo y hoja, pictograma, otras
gráficas con spss - Excel.

Semana 5

EVALUACIÓN DE LA PRIMERA UNIDAD


SESIÓN 9: EVALUACIÓN DE LA PRIMERA UNIDAD

Problemas de repaso

39
Gestión Curricular
Asignatura: Estadística general

1. Coca-Cola. Coca-Cola Company tiene 366,000 accionistas y efectúa una encuesta mediante la selección aleatoria
de 30 accionistas de cada una de las 50 entidades de Estados Unidos. Se registra el número de acciones de cada
accionista de la muestra. a. ¿Los valores obtenidos son discretos o continuos? b. Identifique el nivel de medición
(nominal, ordinal, de intervalo, de razón) de los datos muestrales. c. ¿Qué tipo de muestreo (aleatorio,
sistemático, de conveniencia, estratificado, por conglomerados) se usa? d. Si se calcula el número promedio (la
media) de acciones, ¿el resultado es un estadístico o un parámetro? e. Si usted fuera el ejecutivo en jefe de Coca-
Cola Company, ¿qué característica del conjunto de datos consideraría usted que es extremadamente importante?
f. ¿Qué es lo que está incorrecto al evaluar la opinión de los accionistas enviando un cuestionario por correo, que
éstos podrían llenar y regresar por el mismo medio?

2. El Directorio y la Gerencia de la Universidad Continental han realizado un estudio para conocer la opinión de los
padres de familia de los estudiantes en general, respecto a las nuevas carreras que se vienen ofertando. Para ello,
durante la semana de matrículas se aplicó una encuesta a 860 padres de familia elegidos aleatoriamente, dentro
de las instalaciones del campus universitario, donde se obtuvo como resultado que el 87% de los encuestados se
manifestaron en total acuerdo por la innovación en carreras profesionales que se viene impulsando (las
respuestas iban de “Totalmente en desacuerdo” a “Totalmente de acuerdo”). De estudios anteriores se sabía que
sólo el 55% de los padres de familia de los estudiantes de esta casa superior de estudios apoyaban la iniciativa de
fomentar nuevas carreras en años pasados.
Del enunciado anterior, indique:
a) Población y parámetro: ________________________________________________________________
b) Muestra y estadístico: __________________________________________________________________
c) Variable: ______________________________________________________________________________
d) Tipo de variable: _______________________________________________________________________
e) Nivel de medición: _____________________________________________________________________
f) Unidad estadística: _____________________________________________________________________
3. Las calificaciones finales del curso de ESTADISTICA GENERAL donde las notas están sobre 10 y son los
siguientes. Elabore la tabla de frecuencias e interprete.
4,5 8,0 8,5 7,5 6,5 3,5 6,0
4,5 4,5 8,5 8,5 10,0 7,0 6,5
9,5 7,0 6,0 8,5 6,5 6,5 8,5
4. Los sistemas de cómputo fallan por muchas razones, entre ellas las fallas de hardware o software, errores del
operador, sobrecargas del sistema mismo y a otras causas. La tabla siguiente muestra los resultados obtenidos en
un estudio acerca de las causas de fallas en una muestra de 98 sistemas de cómputo. Usted debe priorizar entre
las dos principales causas de falla de los sistemas de cómputo. Elabore el gráfico apropiado que permita
visualizar dicho propósito.

TIPO DE FALLA FRECUENCIA


Hardware 9
Operador 20
Sobrecarga 55
Software 8
Otras 6

40
Gestión Curricular
Asignatura: Estadística general

5. Como parte de un informe que deberán presentar al Ministerio de Trabajo, se ha tomado los datos referentes a
los sueldos mensuales de una muestra de empleados de la Municipalidad Distrital de Huancayo. Los datos se
muestran en la siguiente ojiva. Se pide reconstruir la tabla y contestar: ¿Qué porcentaje de la muestra representan
los empleados que perciben de S/. 900 a menos de S/. 1200?

Semana 6
DISTRIBUCIONES DE FRECUENCIAS
BIDIMENSIONALES
La estadística bivariada trata de ir más allá elaborando índices y
resultados estadísticos en términos de relaciones entre dos
variables de interés, así como de establecer inferencias sobre una
población a partir de datos que provienen de una muestra (como,
por ejemplo, en los estudios mediante encuesta).

41
Gestión Curricular
Asignatura: Estadística general

Francis
Gaston

Correlación

R. H.
Hooker

A. Francis Gaston: ideó el método conocido por Correlación, que tenía por objeto medir la
influencia relativa de los factores sobre las variables.
B. H. Hooker, que efectuaron amplios estudios sobre la medida de las relaciones.

Definición de bidimensional
LECTURA

El adjetivo bidimensional se utiliza para calificar a aquello que tiene dos dimensiones (2D). Un cuerpo que
se proyecta a lo largo y a lo ancho, por ejemplo, cuenta con dos dimensiones. En cambio, si también tiene
profundidad, se trata de un objeto con tres dimensiones (3D) y recibe el calificativo de tridimensional.

Por lo general las dimensiones se definen a partir de la cantidad mínima de coordenadas que se necesitan
para la especificación de un punto cualquiera en ella. De este modo, podemos afirmar que una línea es
unidimensional: alcanza una sola coordenada para ubicar un punto.

En el caso de los elementos bidimensionales, se requieren dos coordenadas para lograr la especificación de
un punto. Los polígonos, como los cuadrados o los triángulos, son bidimensionales debido a que, para situar
un punto, es necesario establecer la longitud y la latitud. Siguiendo con esta lógica, la localización de un

42
Gestión Curricular
Asignatura: Estadística general

punto en un cuerpo tridimensional (como un cubo) exige conocer tres coordenadas.

Cabe destacar que, aún en una superficie bidimensional, es posible simular un efecto tridimensional. Una hoja
de papel es bidimensional: sin embargo, apelando a la perspectiva, es posible dibujar un cubo, dando una
sensación de tridimensionalidad.

Dentro del ámbito de la electricidad podemos establecer que también se utiliza el término que ahora nos ocupa.
En concreto, se emplea para referirse a la característica que puede tener un elemento conductor. Así, se
establece que si es bidimensional es porque en una de las direcciones del espacio es aislante mientras que en las
otras dos podemos determinar que cuenta con una mayor conductividad.

Además de todo lo indicado es necesario determinar que existe lo que se conoce como diseño gráico
bidimensional. Este es una disciplina que se sustenta en diseñar y darle forma a figuras de dos dimensiones para
diversos tipos de áreas. En concreto, para fotografías, dibujos, pinturas, imágenes de ordenador…

Fuente: Julián Pérez Porto y María Merino. Publicado: 2016. Actualizado: 2018.
Definición de: Definición de bidimensional (https://definicion.de/bidimensional/)

DATOS
CUALITATIV
OS Y MIXTOS
Propósito:
 Organiza y compara dos variables cualitativas y mixtas; elaborando sus respectivas graficas e
interpretando los resultados.

SESIÓN 11: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS CUALITATIVOS


Y MIXTOS.
Se entiende por distribuciones bidimensionales a la elaboración de tablas de frecuencia en función de dos variables
pareadas.
1. DATOS BIVARIADOS:
Valores de dos diferentes variables que se obtienen a partir del mismo elemento de población.
Cada una de las dos variables pueden ser o cualitativas o cuantitativas. Como resultado, los datos bivariados
pueden formar tres combinaciones de tipos de variable:
 Ambas variables son cualitativas (atributos): Es frecuente que los datos se ordenen en una tabulación
cruzada o tabla de contingencia. Los resultados se presentan en un gráfico de barras agrupadas.
 Una variable es cualitativa (atributo) y la otra es cuantitativa (numérico): Los valores cuantitativos se ven
como muestras separadas, con cada conjunto identificado por niveles de la variable cualitativa. Sus

43
Gestión Curricular
Asignatura: Estadística general

resultados pueden mostrarse en un diagrama de puntos o en un diagrama de cajas y bigotes con una escala
común.
 Ambas variables son cuantitativas (ambas numéricas): Se acostumbra expresar matemáticamente los
datos como pares ordenados (x,y), donde “x” es la variable de entrada (variable independiente) y “y” es la
variable de salida (variable dependiente). Se llaman “emparejados” o “apareados” porque para cada valor
de “x” siempre hay un valor correspondiente de “y” de la misma fuente. Sus resultados se presentan en un
diagrama de dispersión.
2. DISTRIBUCIONES ABSOLUTAS MARGINALES:
Dada una distribución de frecuencias bidimensionales, podemos obtener dos distribuciones de frecuencias
absolutas marginales, una con respecto a la variable “x” y la otra respecto a la variable “y”.
Ejemplo:
Un grupo de estudiantes de la facultad de Ingeniería de la Universidad Continental están a punto de iniciar sus
prácticas pre profesionales en diferentes regiones de nuestro país (costa, sierra, selva). Se ha encuestado a un
grupo de ellos para conocer su género y la región elegida para llevar a cabo dichas prácticas. Los datos se
muestran a continuación:
GÉNERO REGIÓN GÉNERO REGIÓN GÉNERO REGIÓN
M Sierra F Selva F Selva
F Selva M Sierra M Selva
M Sierra M Sierra F Selva
M Costa M Costa F Selva
F Selva F Costa M Costa
M Selva M Selva M Sierra
F Costa M Selva F Selva
F Selva M Sierra M Sierra
Organiza los datos en una tabla de contingencia (tabla cruzada). Luego elabore la distribución de frecuencias
marginales y construya su gráfico de barras agrupadas.
Solución:
a) Construimos la tabla considerando la variable “Género” en las filas y “Región” en las columnas:

b) Completamos cada celda de la tabla con el número de veces que aparece cada dato bivariado. Para ello
contamos la cantidad de estudiantes de género masculino que viajarán a la costa, que viajarán a la sierra y a
la selva. Hacemos lo propio con las estudiantes de género femenino. Luego sumamos para calcular los
totales de fila y columna.

(4 / 24) x 100 = 16,67%

44
Gestión Curricular
Asignatura: Estadística general

c) Elaboramos las tablas de frecuencias marginales:

d) Se elabora el gráfico de barras agrupadas.

Problemas Desarrollados

1. Determine la tabla cruzada y el gráfico apropiado a la variable del siguiente conjunto de datos:
SEXO ESTADO CIVIL
VARON SOLTERO(A)
MUJER CASADO(A)

45
Gestión Curricular
Asignatura: Estadística general

VARON SOLTERO(A)
VARON CASADO(A)
MUJER VIUDO(A)
MUJER SOLTERO(A)
VARON SOLTERO(A)
MUJER CASADO(A)
VARON CASADO(A)
VARON CASADO(A)
VARON SOLTERO(A)
MUJER VIUDO(A)
MUJER SOLTERO(A)
VARON VIUDO(A)
MUJER CASADO(A)
VARON VIUDO(A)
MUJER CASADO(A)
MUJER SOLTERO(A)
Solución

Aplicando el programa IBM SPSS Statistics Editor para obtener la tabla cruzada:

TABULACIÓN CRUZADA
ESTADO CIVIL
SOLTERO(A Total
CASADO(A) VIUDO(A)
)
VARON

Recuento 4 3 2 9

% del total 22,2% 16,7% 11,1% 50,0%


SEXO

MUJER

Recuento 3 4 2 9

% del total 16,7% 22,2% 11,1% 50,0%

Recuento 7 7 4 18
Total
% del total 38,9% 38,9% 22,2% 100,0%

Graficando:

46
Gestión Curricular
Asignatura: Estadística general

Problemas Propuestos

1. La empresa PLAZA VEA como parte de su política de prestaciones de salud a sus colaboradores, ha iniciado
una campaña de prevención del cáncer pulmonar entre fumadores. Para ello aplicó una encuesta en la que se
preguntó, entre otras cosas, el género y si es fumador. Las respuestas se muestran a continuación:

GÉNERO FUMADOR GÉNERO FUMADOR GÉNERO FUMADOR


M SÍ F SÍ F SÍ
F NO M NO M SÍ
F NO M NO F NO
F SÍ F SÍ M NO
M SÍ M NO F NO
a) Elabore una tabla de contingencia para organizar los datos, considerando frecuencias absolutas y relativas
conjuntas.
b) Elabore la distribución de frecuencias marginales para las variables “Género” y “Fumador”.

47
Gestión Curricular
Asignatura: Estadística general

c) Construya el gráfico de barras agrupadas para presentar dicha tabla de contingencia.

2. Treinta estudiantes de nuestra universidad se identificaron y clasificaron al azar según dos variables: Género
(M/F) y Especialidad: Ingeniería (I), Administración (A), Derecho (D).

GENERO ESPECIALIDAD GENERO ESPECIALIDAD GENERO ESPECIALIDAD

F I F A F I
F A F I F A
F A M D M I
F D M A M A
M I M I F I

Elabore una tabla con tabulación cruzada o tabla de contingencia expresándola en porcentajes del gran total, y
conteste las siguientes preguntas:
a) ¿Qué porcentajes de estudiantes estudian derecho?
b) ¿Cuántos estudiantes estudian administración?
c) ¿Cuántos estudiantes estudian ingeniería y son del género femenino?
d) ¿Qué porcentaje de estudiantes estudian administración y son del género masculino?

3. Se está estudiando la relación que existe entre el grado de instrucción y el número de hijos que tienen las mujeres
de Huancayo. Para ello se ha entrevistado a un grupo de pobladoras y los resultados se muestran a continuación:
Nº Nº Nº
GDO. INST. HIJOS GDO. INST. HIJOS GDO. INST. HIJOS
SIN INSTRU. 6 SUPERIOR 1 PRIMARIA 3
SECUNDARI SECUNDARI
A 4 A 2 SUPERIOR 1
SECUNDARI SECUNDARI
A 3 A 2 PRIMARIA 2
SECUNDARI
SUPERIOR 2 A 3 SUPERIOR 2
SIN INSTRU. 5 SUPERIOR 2 PRIMARIA 3
SECUNDARI
SUPERIOR 1 SUPERIOR 2 A 3

a) Construya una tabla de contingencia para organizar dicha información, mostrando frecuencias absolutas y
relativas conjuntas.
b) Elabore la distribución de frecuencias marginales para cada variable.
c) Elabore el gráfico de barras agrupadas que represente a la tabla creada.
d) ¿Qué conclusión puede usted obtener al analizar la información ahora que está organizada?
4. Se han aplicado 3 métodos diferentes (Métodos: A, B y C) para la enseñanza de Análisis Matemático en la
facultad de Ciencias de la Empresa, luego de lo cual se aplicó una prueba para medir el tiempo (en minutos) que
los alumnos empleaban en resolver un conjunto de 20 ejercicios, siendo los resultados los siguientes:
Método A B B A C B B A C B B C B A B
Tiempo 15 8 10 18 15 11 9 10 11 8 10 10 12 15 8

Método B A C C B C A A B C A B B A C

48
Gestión Curricular
Asignatura: Estadística general

Tiempo 11 14 10 11 11 10 10 15 9 14 17 9 10 11 12

a) Construya una tabla de contingencia que organice los datos.


b) Elabore la distribución de frecuencias marginales para cada variable en estudio.
c) ¿Qué conclusión puede usted obtener al analizar la tabla, respecto a la eficacia de los métodos aplicados?
5. Se ha observado detenidamente el número de horas que dedican al estudio un grupo de estudiantes de Ingeniería
de la Universidad Continental y sus calificaciones en el curso de Matemática. Los datos se muestran a
continuación. Ordenar la información proporcionada en un cuadro de distribución de frecuencias e indique: Las
frecuencias absolutas y relativas conjuntas, las frecuencias marginales. Finalmente elabore el diagrama de
dispersión correspondiente.

Video de Apoyo

Video 1: Tablas Bidimensionales o de doble entrada 1. Distribución de frecuencias bidimensionales.


(https://www.youtube.com/watch?v=0HFOqZqNF_I)

Video 2: Distribuciones de frecuencias bidimensionales 2 Medias y medias condicionales


(https://www.youtube.com/watch?v=uYumtU1wajk)

49
Gestión Curricular
Asignatura: Estadística general

Semana 7
DISTRIBUCIONES DE FRECUENCIAS
BIDIMENSIONALES
A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por
Correlación, que tenía por objeto medir la influencia relativa de los factores
sobre las variables. De aquí partió el desarrollo del coeficiente de
correlación creado por Karl Pearson y otros cultivadores de la ciencia
biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que
efectuaron amplios estudios sobre la medida de las relaciones.

John Graunt:
Compilación
estadística
de los
recursos
nacionales
Sebastián
Muster:

A. John Graunt: fue un estadístico inglés a quien se considera el primer demógrafo, el fundador de
la bioestadística y el precursor de la epidemiología.
B. Sebastián Muster: realizó una compilación estadística de los recursos nacionales, comprensiva
de datos sobre organización política, instrucciones sociales, comercio y poderío militar.
RA

50
LE Gestión Curricular
Asignatura: Estadística general

LA PALABRA "ESTADÍSTICA" NORMALMENTE SE UTILIZA REFIRIÉNDOSE A


DOS SIGNIFICADOS DISTINTOS, A SABER:
1.- Colección de datos numéricos.
Este es el significado más común de la palabra estadística. Está sobreentendido que dichos datos numéricos
deben estar presentados de manera ordenada y sistemática. Una información numérica cualquiera puede no
constituir una estadística, para poder darle este apelativo, los datos han de constituir un conjunto coherente,
establecido de forma sistemática y siguiendo un criterio de ordenación.
Tenemos muchos ejemplos de este tipo de estadísticas. El Anuario Estadístico publicado por el Instituto
Nacional de Estadística, El Anuario de Estadísticas del Trabajo, etc.
2.-Como ciencia.
Aquí, se entiende que
La Estadística estudia el comportamiento de los fenómenos de masas. Como todas las ciencias, busca las
características generales de un colectivo y prescinde de las particulares de cada elemento. Por ejemplo, al
investigar el sexo de los nacimientos, se inicia el trabajo tomando un grupo numeroso de nacimientos y se
obtiene después la proporción de varones. Frecuentemente, enfrentamos fenómenos en los que difícilmente
se predice el resultado; así, no podemos dar una lista, con las personas que van a morir con una cierta edad, o
el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo, etc. El objetivo de la
estadística es detectar las regularidades que se encuentran en los fenómenos de masa.
Población, elementos y caracteres.
Obviamente que todo estudio estadístico debe estar referido a un conjunto o colección de personas o cosas.
Este conjunto de personas o cosas es lo que se denomina población.
Las personas o cosas que forman parte de la población se denominan elementos. En el sentido estadístico un
elemento puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la
temperatura, un voto, o un intervalo de tiempo.
De igual forma, cada elemento de la población tiene una serie de características que pueden ser objeto del
estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en
ella las siguientes características: Sexo, Edad, Nivel de estudios, Profesión, Peso, Estatura, Color de pelo, etc.
Por lo tanto, de cada elemento de la población es posible estudiar uno o más aspectos cualidades o caracteres.
La población puede ser según su tamaño de dos tipos:
Población finita: cuando el número de elementos que la forman es contable, por ejemplo, el número de
alumnos de un centro de enseñanza.
Población infinita: cuando el número de elementos que la forman es infinito, o tan grande que pudiesen
considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los productos que hay en el
mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.
Fuente: BERMISON ORTEGA, Russell Frank. (2006). El Nuevo Marketing. México: Pearson Prentice
Hall.

DATOS
CUALITATIVO
S
Propósito:
 Elabora la tabla bidimensional de dos variables cuantitativas e interpreta la relación positiva o
negativa.

51
Gestión Curricular
Asignatura: Estadística general

SESIÓN 13: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS


CUANTITATIVOS.
1. VARIABLES BIDIMENSIONALES.

Ambas variables son cuantitativas (ambas numéricas): Se acostumbra expresar matemáticamente los datos como
pares ordenados (x,y), donde “x” es la variable de entrada (variable independiente) y “y” es la variable de salida
(variable dependiente). Se llaman “emparejados” o “apareados” porque para cada valor de “x” siempre hay un valor
correspondiente de “y” de la misma fuente. Sus resultados se presentan en un diagrama de dispersión.

2. DIAGRAMA DE DISPERSIÓN:

También conocido como gráfico de dispersión, gráfico de puntos, diagrama de XY o diagrama de dispersión,
consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la
relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra. En
este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la relación que
exista entre ellas, definimos su tipo de correlación.

Ejemplo:
Correlación lineal positiva: Temperatura y volumen
Correlación lineal negativa: Volumen y presión
No existe Correlación: inteligencia y la belleza.

Problemas Desarrollados

1. Los datos obtenidos al estudiar las variables X = “número de goles anotados” e Y = “número de goles
recibidos”, en 40 partidos jugados por el equipo campeón de la liga de fútbol sala, son:
(5;4) (4;2) (3;1) (3;2) (6;3)
(4;2) (5;3) (4;2) (4;3) (3;1)

52
Gestión Curricular
Asignatura: Estadística general

(3;3) (5;3) (6;4) (3;2) (4;2)


(3;2) (6;4) (3;1) (4;2) (5;3)
(4;2) (6;4) (4;2) (6;4) (4;4)
(5;3) (4;2) (5;3) (3;1) (2;2)
(1;1) (2;1) (4;2) (5;3) (5;3)
(6;4) (5;3) (2;2) (3;3) (3;2)
Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de
dispersión.
Solución:
Construimos una tabla con tantas columnas como valores tome X y con tantas filas como valores tome Y en la
distribución. Si observamos los datos, X toma los valores 1, 2, 3, 4, 5 y 6, e Y toma los valores 1, 2, 3 y 4. En
este caso, la tabla constará de 6 filas y 4 columnas. − Hallamos la frecuencia absoluta de cada par de valores de
la variable (X, Y). Para ello contamos el número de veces que se repite ese par de valores en la distribución y lo
anotamos en la casilla correspondiente. Así, por ejemplo, observa que el par (5, 4) aparece una sola vez; el (4,
2) aparece diez veces; y el (6, 1), ninguna.
Tabla bidimensional

Frecuencias marginales
N° de goles N° de goles
Frecuencia Frecuencia
marcados recibidos
1 1 1 6
2 3 2 15
3 10 3 12
4 11 4 7
5 9
6 6

Total 40 Total 40

Diagrama de dispersión

53
Gestión Curricular
Asignatura: Estadística general

2. ¿Qué tipo de relación se muestra en los siguientes diagramas de dispersión?


a. Gráfico 1

Relación lineal positiva. A medida


que la variable en X aumenta en
valor, también lo hace la variable
en Y.

b. Gráfico 2

54
Gestión Curricular
Asignatura: Estadística general

Relación lineal negativa. A medida


que la variable en X aumenta en
valor, la variable en Y disminuye.

c. Gráfico 3

No presentan relación

Problemas Propuestos

1. En una clase compuesta por 30 alumnos, se ha hecho un estudio sobre el número de horas diarias de estudio X y
el número de suspensos Y, obteniéndose los siguientes resultados:
(2, 0), (2, 2), (0, 5), (2, 1), (1, 2), (2, 1), (3, 1) (4, 0), (0, 4), (2, 2) (2, 1), (2, 1), (4, 0), (3, 1), (2, 4),
(2, 1), (1, 2), (2, 1), (2, 0), (3, 0) (3, 2), (2, 2), (2, 2), (2, 1), (0, 5), (1, 3), (2, 2), (2, 1), (1, 3), (1, 4)
Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de
dispersión. Luego señale el tipo de relación que existe entre ambas variables.
2. El número de horas dedicadas al estudio de una asignatura y la calificación final obtenida en el correspondiente
examen por ocho personas vienen dados en la tabla.

X: Horas de estudio 20 16 34 23 27 32 18 22
Y: Calificaciones del examen 6,5 6,0 8,5 7,0 9,0 9,5 7,5 8,0

55
Gestión Curricular
Asignatura: Estadística general

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de


dispersión. Luego señale el tipo de relación que existe entre ambas variables.

3. Las personas hipertensas, conscientes de la salud consultan a menudo la información relacionada con los
nutrientes que aparecen en los envases de los alimentos con el fin de evitar los que contengan grandes
cantidades de grasa, sodio o colesterol. La siguiente información se tomó de ocho marcas distintas de queso
americano en rebanadas:

Grasas Colesterol
Marca Grasa (g) Sodio (mg) Calorías
saturadas (g) (mg)
Kraft Deluxe American 7 4,5 20 340 80
Kraft Velveela Slices 5 3,5 15 300 70
Private Selectión 8 5,0 25 520 100
Ralphs Singles 4 2,5 15 340 60
Kraft 2% Milk 3 2,0 10 320 50
Kratl Singles American 5 3,5 15 290 70
Borden Singles 5 3,0 15 260 60
Lake to Lake American 5 3,5 15 330 70

Construya el diagrama de dispersión para colesterol y calorías. Observando la gráfica determine si existe algún
tipo de correlación entre ambas variables.

4. Los siguientes datos representan los años de práctica profesional y el ingreso anual (en miles de soles) para un
conjunto de servidores públicos:

Años de Años de
Ingreso Ingreso
práctica práctica
5 4 3 2
15 4 6 3
24 9 12 3
16 7 27 7
19 6 13 5

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de


dispersión. Observando la gráfica determine si existe algún tipo de correlación entre ambas variables.

5. Un estadístico de una determinada línea aérea está estudiando la relación entre la distancia de destino con la
carga de mercancía para un tamaño estándar de embalaje. Se obtuvieron los siguientes datos para una muestra
aleatoria de diez facturaciones de carga:

Distancia Carga
22,4 6,8

56
Gestión Curricular
Asignatura: Estadística general

36,8 10,5
14,4 4,0
27,2 7,9
16,0 8,1
35,2 9,5
8,0 3,1
19,2 7,2
9,6 4,5
25,6 9,3

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de


dispersión. Observando la gráfica determine si existe algún tipo de correlación entre ambas variables.

Video de Apoyo

Video 1: Diagrama de Dispersión


(https://youtu.be/NSh7EX83VRQ)

Video 2: Diagrama de dispersión


(https://youtu.be/KwtuSe1JAVQ)

Semana 8
EVALUACIÓN PARCIAL

57
Gestión Curricular
Asignatura: Estadística general

Unidad III
Resultado de Aprendizaje de la Unidad I:
Al finalizar la unidad, el estudiante será capaz de calcular las medidas de tendencia central,
variación, posición relativa y deformación para interpretar datos relacionados a su carrera
profesional.

ORGANIZACIÓN DE APRENDIZAJES
TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN
SEMANA N° 9 Actividad N° 17 Consolidado 2:
17. Medidas de tendencia central: Calcula las medidas de tendencia Evaluación individual de desarrollo
teórico-práctico

58
Gestión Curricular
Asignatura: Estadística general

Media, mediana, moda central e interpreta los resultados. A


Conceptos básicos y propiedades partir de los datos de la encuesta.
de las medidas de tendencia central. Actividad N° 18
Estadística, división, objetivos, Aplica las funciones del SPSS para
definiciones, tipos de datos. calcular las medidas de tendencia
Métodos y fuentes de recolección central, de la base de datos de la
de datos. encuesta realizada a sus compañeros e
18. Medidas de tendencia central: interpreta los resultados.
Media, mediana, moda con spss. Actividad N° 19
SEMANA N° 10 Calcula las medidas de dispersión
19. Medidas de variación o apoyándose de una calculadora e
dispersión: Varianza, desviación interpreta los resultados. A partir de los
estándar y coeficiente de variación. datos de la encuesta.
Medidas deformación: asimetría, Actividad N° 20
interpretación. Aplica las funciones del SPSS para
20. Medidas de variación o calcular las medidas de variación, de la
dispersión: Varianza, desviación
base de datos de la encuesta realizada a
estándar, coeficiente de variación y
sus compañeros e interpreta los
asimetría con spss.
SEMANA N° 11 resultados.
21. Medidas de posición relativa: Actividad N° 21
Cuartiles y percentiles. Calcula las medidas de posición relativa
Medidas deformación: curtosis, e interpreta los resultados. A partir de
Diagrama de Cajas y bigotes. los datos de la encuesta.
22. Medidas deformación: asimetría Actividad N° 22
y curtosis Calcula las medidas de deformación e
Diagrama de Cajas y bigotes con interpreta los resultados. A partir de los
spss. datos de la encuesta.
SEMANA N° 12 Actividad N° 23
23. Evaluación de la tercera unidad. Calcula las medidas de deformación e
24. Verificación de resultados de la interpreta los resultados. A partir de los
evaluación de la primera unidad. datos de la encuesta.
Actividad N° 24

Semana 9
MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de diferentes observaciones, con frecuencia es


conveniente resumir la información con un solo número. Este
número que, para tal fin, suele situarse hacia el centro de la
distribución de datos se denomina medida o parámetro de tendencia
central o de centralización.

59
Gestión Curricular
Asignatura: Estadística general

Gustav
Theordor
Fechner:
Utilizo la
mediana
Francis
Galton

A. Gustav Theordor Fechner: usó la mediana (centralwerth) en fenómenos sociológicos y


sociológicos.14 Anteriormente había sido usado solamente en astronomía y campos
relacionados.
B. Francis Galton en 1907 entregó un artículo a la revista Nature acerca de la utilidad de la
mediana.16 El examinó la precisión de 787 intentos de adivinar el peso de un buey en una
feria de campo. El peso real era de 1208: la mediana de todas las conjeturas fue 1198 libras.
Las conjeturas fuern marcadamente no normales en su distribución.

MEDIDAS DE CENTRALIZACIÓN
LECTURA

Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje, por sí
mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona
promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán
variadas son esas calificaciones.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar
las calificaciones que se obtienen en una prueba.
Volviendo a nuestro ejemplo, digamos que la calificación promedio en la prueba que hizo el alumno fue de
20 puntos. Con este dato podemos decir que la calificación del alumno se ubica notablemente sobre el
promedio. Pero si la calificación promedio fue de 65 puntos, entonces la conclusión sería muy diferente,

60
Gestión Curricular
Asignatura: Estadística general

debido a que se ubicaría muy por debajo del promedio de la clase.


En resumen, el propósito de las medidas de tendencia central es:
Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o
típico.
Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes
ocasiones.
Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos.
Las medidas de tendencia central más comunes son:
La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M
o por una X con una línea en la parte superior.
La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se representa como Md.
La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo.
De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo,
cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del
grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las características de la media, esta es
afectada por los valores extremos).

Fuente: Fuente Internet:


http://tgrajales.net/tendencentral.pdf

MEDIDAS DE
CENTRALIZACI
ÓN
Propósito:
 Calcular e interpretar las medidas de tendencia central (media, mediana y moda) de datos no agrupados y
agrupados.
 Calcula e Grafique e interpreta la asimetría haciendo uso de las medidas de tendencia central.

SESIÓN 17: MEDIDAS DE TENDENCIA CENTRAL.

Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la información con un solo
número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida
o parámetro de tendencia central o de centralización.
Entre las medidas de tendencia central tenemos:
 Media aritmética
 Mediana
 Moda
1. LA MEDIA ARITMÉTICA ( x ; x ; M ; M (a)¿:
Es el resultado de dividir la suma de todas las observaciones entre el número de ellas.
a) M.A. para datos no agrupados:

61
Gestión Curricular
Asignatura: Estadística general

Sean: x1, x2, x3,…………xn un conjunto de datos de la variable cualitativa X, observados en una muestra.
Entonces su media aritmética es:
n

∑ Xi x1 + x 2 + x 3+ …+ x n
x= i=1 =
N N
Ejemplo:
Un estudiante rinde 4 evaluaciones obteniendo los siguientes puntajes.
x1 =10, x2 = 08, x3 =15, x4 =13
Hallar el promedio final ( x ):
4

∑ Xi x1 + x 2 + x 3+ x 4 10+ 08+15+13
x= i=1 = = =11.5
N 4 4
b) M.A. para datos agrupados:
Sean: x1, x2, x3…………xk, las marcas de clase y n 1, n2, n3, …………nm las frecuencias absolutas o simples,
k es el número de clase, entonces:
k

∑ ni X i
x= i=1
N

Donde hi = frecuencia relativa.


a. De datos discretos:
Ejemplo:
Se tiene 50 familias y el número de sus hijos (X) que se distribuye en la siguiente forma, determina la
media aritmética.
X Frecuencias
0 3
1 9
2 12
3 10
4 8
5 5
6 2
7 1
N = 50

Se aumenta una columna donde se coloca el producto del valor de cada dato por su respectiva
frecuencia.
X Frecuencias ni X i
0 3 0
1 9 9
2 12 24
3 10 30
4 8 32
5 5 25
6 2 12

62
Gestión Curricular
Asignatura: Estadística general

7 1 7
N = 50 139

Luego, se utiliza la formula


∑ ni X i para hallar la M.A. x=
139
=2.78
i=1
x= 50
N
b. De datos continuos:
Ejemplo:
Se han registrado el peso de 50 lingotes de acero producidos por una Empresa Minera, la muestra fue
obtenida de la producción semanal y las unidades están dadas en kg. Hallar la M.A.
Li - Ls ni
91.5 – 92.5 4
92.5 – 93.5 11
93.5 – 94.5 20
94.5 – 95.5 9
95.5 – 96.5 6
N = 50

Solución
Aumentamos dos columnas, uno para la marca de clase y otro para el producto de cada marca de clase
con su respectiva frecuencia.
Li - Ls Xi ni ni.Xi
91.5 – 92.5 92 4 368
92.5 – 93.5 93 11 1023
93.5 – 94.5 94 20 1880
94.5 – 95.5 95 9 855
95.5 – 96.5 96 6 576
N = 50 4702
Luego:
k

Se utiliza la formula
∑ ni X i para hallar la M.A. x=
4702
=94.04
i=1
x= 50
N
Lo cual nos indica que semanalmente la producción promedio de 50 lingotes de acero por la
Minera es de 94.04 kg.

2. LA MODA ( Mo ¿ :
Es el valor que en una distribución de datos ocurre con mayor frecuencia, es decir, es el dato que se repite mayor
cantidad de veces que los demás. En algunas distribuciones de datos hay más de una moda y se les denomina
bimodal (dos modas) o multimodal (varias modas).
Cálculo de la moda:

a) Moda para datos no agrupados:


Ejemplo 1:
En la siguiente distribución de datos se tiene las puntuaciones:
14 16 16 17 18 19 19 19 21 22

63
Gestión Curricular
Asignatura: Estadística general

Hallar la moda.
Se observa que la puntuación que más se repite es 19, por lo tanto, la moda es:
Mo = 19

Ejemplo 2:
En la siguiente distribución de datos se tiene las puntuaciones:
14 16 16 16 18 19 19 19 21 22

Hallar la moda:
Las puntuaciones que más se repite son: 16 y 19, por lo tanto, la distribución de los datos es bimodal

b) Moda para datos agrupados:


i. Moda para datos de variables discretas:
La moda se determina observando el valor de las variables que tiene mayor frecuencia.

Ejemplo:
Determina la moda de la distribución siguiente:

N° de hijos por N° de familias


familia ni
Xi
0 60
1 120
2 210
3 360
4 160
5 50
6 a más 30
Total 990

Se observa que la mayor frecuencia es 360, frecuencia que es la variable


n4 =360
Como la moda es el dato de mayor frecuencia, entonces la moda es: Mo = 3
Esto nos indica que la mayor cantidad de familias tiene 3 hijos.

ii. Moda para datos de variables continúas:


Cuando se tienen datos, de variables continuas, agrupados en distribuciones de frecuencias, se usa la
siguiente fórmula:

Mo=Li+
( ∆1
)
∆ 1+ ∆ 2
c
Donde:
Li = Es el límite inferior del intervalo de clase donde se encuentra la moda.
c = es la amplitud del intervalo de clase donde se encuentra la moda.

64
Gestión Curricular
Asignatura: Estadística general

∆ 1 = ni – ni – 1: diferencia entre la frecuencia del intervalo modal con la frecuencia del intervalo
anterior.
∆ 2 = ni – ni + 1: diferencia entre la frecuencia del intervalo modal con la frecuencia del intervalo
posterior.
Ejemplo:
En la siguiente distribución de frecuencias se dan las edades de una muestra de personas del anexo de
Batanyacu. Hallar la moda de dicha distribución:
Intervalos N° de personas
Li - Ls ni
10 – 20 3
20 – 30 7
30 – 40 15
40 – 50 28
50 – 60 40
60 – 70 31
70 – 80 16
80 - 90 8

Observando la distribución que la mayor frecuencia es 40, que se ubica en el intervalo (50 – 60),
denominándolo intervalo modal.
Hallamos:
El límite inferior: Li = 50
∆ 1 = ni – ni – 1 ∆ 2 = ni – ni + 1
∆ 1 = 40 – 28 ∆ 2 = 40 – 31
∆ 1 = 12 ∆2 = 9
Su amplitud (c): c = 10
Reemplazando en la fórmula:

Mo=Li+
( ∆1
∆ 1+ ∆2)c=50+
12
12+ 9
10=55.71( )
3. LA MEDIANA ( Me ¿:
La mediana es una medida de tendencia central, cuyo valor divide a un conjunto de datos, ordenado con respecto
a la magnitud de sus valores, de tal manera que el número de datos por encima de la mediana es igual al número
de datos por debajo de la misma.

3.1. Para datos no agrupados:


Si se tiene un conjunto de datos ordenados en forma creciente o decreciente, la mediana se determina como
el dato que está ubicado en la posición:
Me= X
 si el número de datos es impar
( n+2 1 )
X +X
 si el número de datos es par ( n2 ) ( n2 +1)
Me=
2

65
Gestión Curricular
Asignatura: Estadística general

Ejemplo:
Sean los siguientes 11 datos obtenidos de la observación de una variable X:
0 8 1 2 9 1 3 8 4 7 6

Ordenando en forma creciente:


0 1 1 2 3 4 6 7 8 8 9
X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11
Si: n = 11 (n es impar)
Me = 4
Entonces su mediana será:
Me= X ¿X =X 6
( n+2 1 ) ( 11+1
2 )

Significa que el 50% de los datos de la distribución son mayores que 4 y los otros 50% son menores que
4.

3.2. Para datos agrupados en distribución de frecuencias:


a) Para datos de variables discretas:
Ejemplo:
Sean los siguientes datos correspondientes al lanzamiento de seis monedas, doscientas veces.

N° de caras Frecuencias
(Xi) (ni)
0 2
1 19
2 46
3 62
4 47
5 20
6 4

Aumentamos una columna de las frecuencias acumuladas


N° de caras
Frecuencias Frec. acumuladas
(Xi) (ni) (Ni)
0 2 2
1 19 21
2 46 67
3 62 129
4 47 176
5 20 196
6 4 200
N = 200
Luego se busca un Ni que sea mayor o igual que N/2 (N = n° total de datos)
N/2 = 200/2 = 100
Entonces: ¿ ≥ 100 el más cercano será Ni = 129
3 62 129
Por lo tanto, la mediana se ubica en X4:
X 4=3 → M e=3
b) Para datos de variables continuas:

66
Gestión Curricular
Asignatura: Estadística general

Para hallar la Me en estas variables, se utiliza el mismo procedimiento anterior, pero utilizando la
siguiente fórmula:

( )
n
−N i−1
2
Me=l i + .c
ni
Donde:
li = límite inferior donde se encuentran la mediana.
c = amplitud del intervalo de clase.
n = tamaño de la muestra o total de datos de la distribución.
N i−1 = frecuencia acumulada del intervalo anterior donde se encuentra la mediana.
ni = frecuencia del intervalo donde se encuentra la mediana.

Ejemplo:
Sean datos correspondientes a la medición en centímetros de 200 varillas, determine la Me:
Li – Ls ni
29.5 – 30.5 4
30.5 – 31.5 8
31.5 – 32.5 23
32.5 – 33.5 35
33.5 – 34.5 62
34.5 – 35.5 44
35.5 – 36.5 18
36.5 – 37.5 4
37.5 – 38.5 1
38.5 – 39.5 1

Aumentamos una columna de las frecuencias acumuladas


Li – Ls ni Ni
29.5 – 30.5 4 4
30.5 – 31.5 8 12
31.5 – 32.5 23 35
32.5 – 33.5 35 70
33.5 – 34.5 62 132
34.5 – 35.5 44 176
35.5 – 36.5 18 194
36.5 – 37.5 4 198
37.5 – 38.5 1 199
38.5 – 39.5 1 200
N =200

Luego se busca un Ni que sea mayor o igual que N/2 (N = n° total de datos)
N/2 = 200/2 = 100
Entonces: ¿ ≥ 100 el más cercano será Ni = 132
33.5 – 34.5 62 132
li = 33,5
c=1

67
Gestión Curricular
Asignatura: Estadística general

n = 200
N i−1 = 70
ni = 62
Reemplazando en la fórmula:

( ) ( )
n 200
−N i−1 −70
2 2 30
Me=l i + . c=33.5+ .1=33.5+ =33 ,98
ni 62 62

4. RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA.

Si la distribución de frecuencias Si la distribución es asimétrica de Si la distribución es asimétrica de


de los datos es simétrica, cola derecha, entonces, la moda es cola a la izquierda, entonces la
entonces la media, la mediana y menor que la mediana y esta a su media es menor que la mediana y
la moda tienen el mismo valor: vez es menor que la media: esta a su vez menor que la moda:

Problemas Desarrollados

1. Una persona que trabaja en forma independiente gana en un mes s/. 200; otro mes s/.600, un tercer mes s/.400
y un cuarto mes S/.440, ¿En promedio ménsula cuánto gana?
200+ 600+400+ 440 1640
X= = =410
4 4
2. Se escogieron al azar 24 familias y se les pregunto por el número de hijos que tenía cada una; las respuestas
obtenidas fueron las siguiente: 2,4,6,6,2,3,0,0,4,5,3,3,4,3,5,2,1,2,0,3,4,5,1,1
Hallar el promedio del número de hijos de las 25 familias.
Solución

68
Gestión Curricular
Asignatura: Estadística general

Realizamos la tabla de frecuencia:

Xi ni Xi.ni
0 3 0
1 3 3
2 4 8
3 5 15
4 4 16
5 3 15
6 2 12
n= 24 69

Remplazando en la fórmula para determinar la Ma:


69
X= =2,875=2.88
24
3. Sea una distribución de frecuencias de puntuaciones obtenidas por 105 estudiantes en una prueba de
estadísticas. Hallar la media aritmética.
Realizamos un cuadro más en la tabla de frecuencia:
Li - Ls xi ni xi.ni

2–4 3 3 9

4–6 5 2 10

6–8 7 5 35

8 - 10 9 9 81

10 - 12 11 12 132

Remplazando en la 12 - 14 13 10 130 fórmula para determinar la Ma:

512 14 - 16 15 2 30
X= =10.67=10.7
48
16 - 18 17 5 85

N = 48 512
Problemas Propuestos

1. Una empresa ha realizado un test físico entre todos sus empleados para comprobar la capacidad de esfuerzo
que posee cada uno de ellos. Una de las medidas que componen el test es el número de pulsaciones después

69
Gestión Curricular
Asignatura: Estadística general

de una determinada actividad física que está altamente relacionada con las que se realizan a lo largo de una
jornada laboral. Los datos conseguidos han sido distribuidos en la siguiente tabla:
Numero de Número de
pulsaciones empleados
[65-70> 12
[70-75> 15
[75-80> 10
[80-85> 28
[85-90] 30
[90-95] 5
a) ¿Qué porcentaje de empleados tuvo menos de 85 pulsaciones?
b) Calcula la media aritmética, la mediana y la moda. Interpreta los resultados.

2. Los ingresos en dólares de 18 hombres elegidos al azar del Banco BBVA CONTINENTAL (entre un total
de 1000) se muestran a continuación:
45,16 83,61 79,85 22,07 76,91 65,73
88,91 99,49 62,59 34,20 88,61 41,50
68,89 92,22 54,33 53,20 16,60 62,59
a) Calcula la media aritmética empleando la tabla de frecuencias.
b) Halla la mediana y moda e interpreta (en termino de dólares).
c) ¿Se puede considerar que las poblaciones de 1000 personas tendrán la misma media que la muestra de
18 personas? ¿Por qué?

3. El grafico tallo y hoja muestra los productos vendidos de la tienda “La Moderna” en un día. Calcular las
medidas de tendencia central y graficar el sesgo y, ¿la media aritmética es significativa en los productos
vendidos?
TALL HOJAS
O
2 2
3 122
4 2333
5 228
6 7

4. De los 46 productos vendidos de la tienda “Casa Sueldo” un día domingo. Calcular las medidas de
tendencia central, asimetría e interpretar el sesgo. Elabora una tabla de frecuencias a partir del histograma.

70
Gestión Curricular
Asignatura: Estadística general

5. Se tiene el siguiente cuadro que corresponde quesos producidos por trabajador para la empresa
SERRANITA:
Litros de lácteos producidos 5-11> 11-17> 17-23> 23-29> 29-35>
Cantidad de trabajadores 12 18 13 9 10

Con los datos se pide:


a) Grafica el histograma
b) Determine media, mediana y moda e interpreta cada uno de ellos

Video de Apoyo

Video 1: Media, Mediana y Moda - Ejemplos y Ejercicios Resueltos - Medidas de Tendencia Central
(https://www.youtube.com/watch?v=jiceVfALmV0)

Video 2: Media, Mediana y Moda para Datos Agrupados en Intervalos


(https://www.youtube.com/watch?v=G3WYwknaVuc)

71
Gestión Curricular
Asignatura: Estadística general

Semana 10
MEDIDAS DE VARIACIÓN O DISPERSIÓN
La desviación típica cumple la llamada desigualdad de
Tchebychev: según la cual, los datos que se alejan de la media
una distancia igual o menor que s, multiplicado por un
coeficiente k suponen más de la proporción 1-1/k2. Así, el 75%
de los datos al menos, se encuentra a menos de dos desviaciones
típicas y el 89% a menos de tres.

72
Gestión Curricular
Asignatura: Estadística general

Hiparco de
NIcea

Telescopio
para observar
el cielo

Galileo Galilei

A. Hiparco de Nicea: el primer catálogo de estrellas; la división del día en 24 horas de igual
duración (hasta la invención del reloj mecánico en el siglo XIV las divisiones del día variaban
con las estaciones
B. Galileo Galilei: Fue el primer astrónomo que usó el telescopio para observar el cielo. La
Inquisición lo condenó a arresto domiciliario por sus descubrimientos, el cual fue levantado
359 años después por el papa Juan Pablo II.

VARIABILIDAD Y DISPERSIÓN

Las ideas de variabilidad y dispersión revisten una gran importancia en la estadística, pues dotan a
esta ciencia de su razón de ser y pueden ser abordadas, tanto desde la estadística descriptiva, como
LECTURA

de la probabilidad y la inferencia. Tanto Wild y Pfannkuch (1999), como Moore (1990) incluyen la
percepción de la variabilidad aleatoria como componentes esenciales del razonamiento estadístico.
Las medidas de dispersión son, además, esenciales en una distribución de datos,
complementando a las de posición central, al caracterizar la variabilidad de los datos respecto a las
mismas. Como sugieren Batanero, González- Ruiz, López-Martín y Contreras (2015), es
importante que los estudiantes las comprendan y diferencien las relacionadas con la distribución de
datos, la distribución de probabilidad y la distribución muestral.
A pesar de su importancia, la investigación didáctica sobre la comprensión de la
variabilidad y la dispersión es relativamente escasa, en comparación con la existente respecto a las
ideas de centro y medidas de posición central. Por este motivo me interesé en comenzar una línea
de investigación al respecto, que desembocará en un estudio del tema en los libros de texto y otro
estudio de evaluación amplio de la comprensión de estas ideas en estudiantes de educación
secundaria y se concretará en una tesis doctoral.

73
Gestión Curricular
Asignatura: Estadística general

La finalidad del este trabajo fin de Máster es realizar una síntesis de la investigación didáctica
relacionada con este tema, que sirva de fundamento para la futura tesis doctoral, ya avanzada. Para
llevarla a cabo se ha realizado una extensa consulta, estudio, análisis y síntesis de dicha
investigación, clasificándola y resumiéndola en esta memoria, que se organiza en los siguientes
capítulos:
En el primero de ellos se comienza justificando el interés de realizar este trabajo de síntesis, se
presenta una síntesis de la evolución histórica de estos conceptos, se analizan los contenidos
curriculares relacionados con las ideas de variabilidad y dispersión y se presentan los objetivos del
trabajo.
El segundo capítulo expone en forma resumida algunas ideas de nuestro marco teórico que es el
enfoque ontosemiótico que consideramos de interés para nuestro
trabajo actual y nuestra futura tesis doctoral.
En el tercer capítulo se presenta el trabajo de síntesis de la investigación previa
que se organiza a través de los significados de la dispersión, aportando a su vez estudios 5 sobre la
percepción y las concepciones de estudiantes y futuros profesores de las medidas de dispersión.
Fuente: (Hald, 1998, p. 33) Los errores aleatorios de las observaciones nos llevan a errores aleatorios
de una función de las observaciones que pueden ser grandes, incluso si los errores de observación son
pequeños.

MEDIDAS DE
VARIACIÓN O
DISPERSIÓN

Propósito:
 Calcular e interpretar medidas de variación o dispersión.
 Describir y comparar distribuciones de datos a partir de sus medidas de dispersión.
 Aplicar las medidas de dispersión para analizar la representatividad de la media aritmética.

SESIÓN 19: MEDIDAS DE VARIACIÓN O DISPERSIÓN.

1. LA VARIANZA Y LA DESVIACIÓN ESTANDAR:


La varianza es la media aritmética de los cuadrados de las desviaciones de cada observación o dato con
respecto a la media aritmética y se simboliza por S2 ó σ2.
La desviación estándar o desviación típica es la raíz cuadrada de la varianza y se simboliza por S ó σ.
Calculo de la varianza y la desviación estándar.
1.1. PARA DATOS NO AGRUPADOS:
Fórmula para la varianza:

S=2∑ ( X i−Ma )
2

n
Donde:
Xi = dato u observación.
Ma = media aritmética

74
Gestión Curricular
Asignatura: Estadística general

n = número total de datos


2
( X i−Ma ) = desviación al cuadrado de cada dato con respecto a la media.

Fórmula para la desviación estándar:

Ejemplo:
S=
√ ∑ ( X i−Ma) 2
n

El tiempo que utilizan 6 niños de igual edad para desarrollar una misma tarea fue la siguiente:
16; 12; 15; 18; 13; 14 minutos
Hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos:
Solución:
Hallamos la Ma:
16 +12+15+18+13+14 88
Ma= = =14.7
6 6
Luego calculamos la suma de las desviaciones al cuadrado (varianza)

( 16−14 , 7 )2 + ( 12−14 ,7 )2+ (15−14 , 7 )2+ ( 18−14 , 7 )2 + ( 13−14 , 7 )2 + ( 14−14 , 7 )2


S2 =
6
2 23.34
S=
6
2
S =3.89 minutos
Calculando la desviación estándar:
S= √3.89=1.97
Por lo tanto: el tiempo utilizado por los seis niños para desarrollar la tarea, si dispersa en promedio de
3,89 minutos al cuadrado con respecto a la media aritmética.

1.2. PARA DATOS AGRUPADOS:


a) Para datos de variables discretas:
Formula para la varianza:

2
S=
∑ 2
( X i−Ma ) . ni
n
Fórmula para la desviación estándar:

S=
√ ∑ ( X i−Ma) 2 ni
n

Ejemplo:
En la siguiente distribución de frecuencias del número de hijos de 50 familias, se pide hallar la
varianza (S2) y la desviación estándar (S) del conjunto de datos:
N° de hijos N° de familias
Xi ni

75
Gestión Curricular
Asignatura: Estadística general

0 3
1 9
2 12
3 10
4 8
5 5
6 2
7 1
Completando columnas:
Xi ni ni X i ( X i−Ma ) 2 2
( X i−Ma ) .∋¿
0 3 0 7,73 23,19
1 9 9 3,17 28,53
2 12 24 0,61 7,32
3 10 30 0,05 0,5
4 8 32 1,49 11,92
5 5 25 4,93 24,65
6 2 12 10,37 20,74
7 1 7 17,81 17,81
N = 50 139 134,66

139
Hallando la M.A: Ma= =2.78
50

Luego: 2
S=
∑ 2
( X i−Ma ) . ni 134 , 66
= =2.69
n 50
Entonces: S= √ 2 , 69=1.64
El número de hijos de las 50 familias tienen una dispersión promedio de 1.64 hijos con respecto a la
media aritmética.

b) Para datos de variables continuas:


Fórmula para la varianza:

2
S=
∑ 2
( X i−Ma ) . ni
n
Fórmula para la desviación estándar:

Donde:
S=
√ ∑ ( X i−Ma) 2 ni
n

Xi = marca de clase
Ma = media aritmética
n = número total de datos
2
( X i−Ma ) = desviación al cuadrado de cada dato con respecto a la media.

Ejemplo:
Se han registrado el peso de 50 lingotes de acero producidos por SIDERPERU, la muestra fue
obtenido de la producción semanal y las unidades están dadas en kg. Hallar la varianza (S 2) y la
desviación estándar (S) del conjunto de datos.

76
Gestión Curricular
Asignatura: Estadística general

Li - Ls ni
91,5 – 92,5 4
92,5 – 93,5 11
93,5 – 94,5 20
94,5 – 95,5 9
95,5 – 96,5 6
N = 50

Solución
Hallando la Ma:
4702
Ma= =94.04
50
Completando la columna cinco:
2 2 2
| X i−Ma| =|X 1 −Ma| =|92−94 , 04| =4,1616
Completando la columna seis:
2 2 2
| X i−Ma| .∋¿|X 1 −94 , 04| . n1 =|92 , 0−94 , 04| .4=4,1616.4=16,6464
Aumentamos cuatro columnas:
2 2
Li - Ls Xi ni ni.Xi ( X i−Ma ) ( X i−Ma ) .∋¿
91.5 – 92.5 92 4 368 4,1616 16,6464
92.5 – 93.5 93 11 1023 1,0816 11,8976
93.5 – 94.5 94 20 1880 0,0016 0,32
94.5 – 95.5 95 9 855 0,9216 8,2944
95.5 – 96.5 96 6 576 3,8416 23,0496
N = 50 4702 60,2256
Hallando la varianza:

2
S=
∑ 2
( X i−Ma ) . ni 60,2256
= =1 ,20
n 50
Hallando su desviación estándar:

S=
√ ∑ ( X i−Ma) 2 ni =√ 1 ,20=1,095
n
Por lo tanto, los lingotes de acero en la producción semanal de SIDER PERÚ se dispersan en
promedio de 1,095 kg con respecto a la media aritmética.

2. COEFICIENTE DE VARIACIÓN:

El coeficiente de variación (CV) es el cociente de la desviación estándar y la media aritmética, expresado en


porcentaje.
S
CV = x 100 %
Ma
El coeficiente de variación es un indicador de la dispersión relativa de los datos y la unidad de medida que esta
expresada en porcentaje.

Ejemplo 1.

77
Gestión Curricular
Asignatura: Estadística general

Hallar el coeficiente de variación (CV) del tiempo que utilizan 6 niños de igual edad para desarrollar una
misma tarea, los resultados son los siguientes: 16; 12; 15; 18; 13; 14 minutos.
Solución
Hallando la Ma:
16 +12+15+18+13+14 88
Ma= = =14.7
6 6
Determinando la varianza:

2 ( 16−14.7 )2 + ( 12−14.7 )2+ (15−14.7 )2 + ( 18−14.7 )2 + ( 13−14.7 )2+ ( 14−14.7 )2


S=
6

2
S =3.89
S= √3.89=1.97
Hallando el CV:
S 1.97
CV = x 100 %= x 100 %=13.40 %
Ma 14.7

Ejemplo 2.
Sea la distribución de frecuencias de las notas de Estadística general de estudiantes de la Universidad
Continental. Hallar S2, S, CV.
Li - Ls ni
00 – 02 3
02 – 04 5
04 – 06 2
06 – 08 12
08 – 10 8
10 – 12 3
12 – 14 7
14 – 16 10
N=50

Solución:
Completando cuadrados con los pasos estudiados:
2 2
Li - Ls Xi ni Xi.ni ( X i−Ma ) ( X i−Ma ) .∋¿
00 – 02 1 3 3 66.59 199.77
02 – 04 3 5 15 37.95 189.75
04 – 06 5 2 10 17.31 34.62
06 – 08 7 12 84 4.67 56.04
08 – 10 9 8 72 0.03 0.24
10 – 12 11 3 33 3.39 10.17
12 – 14 13 7 91 14.75 103.25
14 – 16 15 10 150 34.11 341.10
N=50 458 934.94

78
Gestión Curricular
Asignatura: Estadística general

458
Hallando la Ma: Ma= =9.16
50
Hallando S2:

S=2∑ 2
( X i−Ma ) . ni 934.94
= =18.70
n 50
Hallando S: S= √ 18.70=4.32
Hallando CV:
S 4.32
CV = x 100 %= x 100=47.16
Ma 9.16

Problemas Desarrollados

1. Las edades de 8 niños son las siguientes: 5, 6, 8, 7, 5, 6,9 y 10 años. Determine la varianza y la desviación
estándar.
Solución
Hallamos la Ma:
5+ 6+8+7 +5+6+ 9+10 56
Ma= = =7
8 8
Halando la varianza y la desviación estándar:

( 5−7 )2 + ( 6−7 )2 + ( 8−7 )2+ ( 7−7 )2+ ( 5−7 )2+ ( 6−7 )2 + ( 9−7 )2 + ( 10−7 )2
2
S=
8
2 4 +1+1+0+ 4+1+ 4+ 9
S=
8
2 24
S= =3
8
S= √3=1.73
2. Se han registrado la edad en una muestra de 53 niños que tienen problemas de salud. Hallar la varianza y la
desviación estándar.
Li - Ls ni
0-3 5
3-6 12
6-9 20
9 - 12 10
12 - 15 6

79
Gestión Curricular
Asignatura: Estadística general

Solución
Completando la tabla de frecuencias:

Xi ni mi ni.xi (mi- Ma)2 (mi- Ma)2. ni


0-3 5 1.5 7.5 36 180
3-6 12 4.5 54.0 9 108
6-9 20 7.5 150.0 0 0
9-12 10 10.5 105.0 9 90
12-15 6 13.5 81.0 36 216
n =53 397.5 594

Determinamos la Ma:
397.5
Ma= =7.5
53
Hallando la varianza y desviación estándar:
2 594
S= =11.21
53
S= √11.21=3.35

3. Un docente de matemática aplico una evaluación a un grupo obteniendo los siguientes resultados:
37 35 43 45 45 35 35
42 40 46 35 34 44 43
34 40 38 37 40 38 36

Hallar la varianza y la desviación estándar.


Solución
 Identificar el dato mayor dato menor
Dato mayor = 46 Dato menor = 34
 Hallamos el rango:
R= 46-34 =12
 Hallamos el número de intervalos (K)
Si: n ≥ 10 K = 1+3.322Log(n)
K=1+3.32 Log (21) K=1+3.322x(1.32) K=1+4.38 K= 5.38
Los posibles valores de: K=5,6 o 7
 Hallamos la amplitud del intervalo de clase (C):
R 12
C= = =2.4=2 entonces5 x 2=10
K 5
R 12
C= = =2 entonces6 x 2=12
K 6
Elaboramos la tabla con K = 6 y c = 2
 Determinamos los extremos de los intervalos

I1 = [34 – 34+2[ = [34 - 36[ I3 = [34+2x2 – 34+3x2[ I5 = [34+4x2 – 34+5x2[


I2 = [34+2 – 34+2x2[ = [38 - 40[ = [42 - 44[

80
Gestión Curricular
Asignatura: Estadística general

= [36 - 38[ I4 = [34+3x2 – 34+4x2[ I6 = [34+5x2– 34+6x2[


=[40 - 42[ =[44 - 46[

Li - Ls ni Xi Ni
 Hallando la media aritmética (Ma):
ni.xi | X i−Ma| | X i−Ma|.∋¿ (xi - Ma)2 (xi - Ma)2.ni
[34-36[ 6 35 6 210 4.57 27.42 20.88 125.28
[36-38[ 3 37 9 111 2.57 7.71 6.60 19.80
[38-40[ 2 39 11 78 0.57 1.14 0.32 0.64
[40-42[ 3 41 14 123 1.43 4.29 2.04 6.12
[42-44[ 3 43 17 129 3.43 10.29 11.76 35.28
[44-46] 4 45 21 180 5.43 21.72 29.48 117.92
N=21 831 72.57 305.04
831
X= =39.57
21
 Hallando la S2:
2 305.04
S= =14.53
21
S= √ 14.53=3.81

Problemas Propuestos

1. Calcular todas las medidas de dispersión para la siguiente distribución:


Xi 5 10 15 20 25
ni 3 7 5 3 2

2. Calcular todas las medidas de dispersión para los datos de la siguiente distribución:
Xi 0-100 100-200 200-300 300-800
ni 90 140 150 120

3. Un artículo reportó los siguientes datos sobre consumo de oxígeno (ml/kg/min) para una muestra de diez
bomberos que realizaron un simulacro de supresión de incendio.
29,5 49,3 30,6 28,2 28,0
26,3 33,9 29,4 23,5 31,6
Calcule lo siguiente:
a) El rango muestral.
b) La varianza muestral (s2) a partir de la definición (es decir, calculando primero las desviaciones y luego
elevándolas al cuadrado, etcétera).
c) La desviación estándar muestral.
d) S2 utilizando el método más corto. (con ayuda de la formula)
4. Una compañía requiere los servicios de un técnico especializado. De los expedientes presentados, se han
seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos. Para decidir cuál de los 2 se va a contratar se
toman siete pruebas a cada uno de ellos. Los resultados se dan a continuación:

Prueba

1 2 3 4 5 6 7

81
Gestión Curricular
Asignatura: Estadística general

Puntaje obtenido por A 57 55 54 52 62 55 59


Puntaje obtenido por B 80 40 62 72 46 80 40

a) Halle e interprete todas las medidas de dispersión de los dos candidatos.


b) Estadísticamente, ¿Cuál de los candidatos debe ser contratado?, fundamente su respuesta.
5. Se tiene dos muestras de obreros, cuyos ingresos diarios son:
Muestra 1: S/.138; S/.136; S/.146; S/.140 y S/.145,
Muestra 2: S/.134; S/.147; S/.147; S/.145 y S/.137
Compare el coeficiente de variabilidad de ambas muestras y determine que muestra de obreros presenta ingresos
diarios más homogéneos (Fundamente su respuesta).

Video de Apoyo

Video 1: Varianza y desviación estándar | Introducción

(https://www.youtube.com/watch?v=oZRaDwnpXkY)

Video 2: Varianza, Desviación Estandar y Coeficiente de Variación | Datos agrupados puntualmente


(https://www.youtube.com/watch?v=fzPBAp14R98)

82
Gestión Curricular
Asignatura: Estadística general

Semana 11
MEDIDAS DE POSICIÓN RELATIVA

Son indicadores usados para señalar que porcentaje de datos dentro de una
distribución de frecuencias superan estas expresiones, cuyo valor representa el
valor del dato que se encuentra en el centro de la distribución de frecuencia

Ronald A.
Fisher

Biometría

Universidad
de
Cambridge

A. Ronald A. Fisher: Fisher expresó que las desviaciones que excedían dos veces la desviación
estándar eran consideradas significativas. Previamente a esto las desviaciones que excedían
tres veces el error probable eran consideradas significativas. Previamente a esto las
desviaciones que excedían tres veces el error probable eran consideradas significativas. Para
una distribución simétrica el error probable la mitad del rango intercuantil. El cuantil superior

83
Gestión Curricular
Asignatura: Estadística general

de la distribución normal estándar está entre 0.66 y 0.67, su error probable es


aproximadamente 2/3 de la desviación estándar. Parece que el criterio de Fisher del 5% tenía
sus raíces en la práctica previa.
LECTURA

¿Qué es el percentil y para qué sirve?


Imaginemos una revisión en el pediatra de un bebé cualquiera. Todo bien, los remedios estándar para la
nueva temporada de mocos que todos conocemos; Mucha agua, si tiene fiebre le das el antitérmico con sabor
a fresa y si ves que la cosa no mejora se lo alternas con el de sabor a naranja.
El peso bien, la altura genial y un percentil por encima de lo que a su edad le corresponde... El padre o madre
mira al médico, le devuelve la sonrisa que demuestra lo orgulloso que está de su bebé y sale de la consulta
contentísimo sabiendo que su hijo o hija, a pesar de los mocos, tiene un percentil por encima de la media.
Los padres lo comentan con las abuelas cuando les llaman para preguntar por el niño y les dejan claro que la
cosa va bien porque el niño tiene un percentil por encima de la media. Están tan contentos que incluso hablan
con sus hermanos y les preguntan qué percentil tenían sus hijos a la edad del suyo. Sin querer, durante la
semana, el percentil se convierte en el tema de conversación con amigos y otros padres y madres. Llegan por
tanto a la conclusión de que están haciendo la cosa bien porque tienen un hijo con un percentil por encima de
la media. ¡Felicidades!
Pero, ¿alguien se ha preguntado alguna vez qué es eso del percentil? Y todavía mejor, ¿para qué sirve? La
cosa es sencilla, pero solo para los matemáticos, en mi caso lo he tenido que preguntar varias veces y me ha
sorprendido descubrir que es un término que todos los padres y madres tenemos en cuenta, pero pocos
sabemos qué es realmente.
Un percentil es una medida estadística para comparar resultados, nos permite saber cómo está situado un
valor en función de una muestra. Si hablamos de bebés, nos permitiría comparar los datos de nuestro bebé
con otros de sus mismas características. Estas características son la edad y el sexo.
Los aspectos de su desarrollo que comparamos o los que más interés despiertan en los padres son: El peso, La
altura, La circunferencia de la cabeza
Si nos dice nuestro pediatra que nuestro bebé de 6kg está en el percentil 25, quiere decir que hay un 25% de
los bebés estudiados que están en el mismo peso o menos y un 75% que están por encima.
Pongo el ejemplo, al contrario, a ver si consigo aclarar la cosa un poco más: si nuestro bebé se encuentra en
el percentil 75 de peso, quiere decir entonces que de toda la muestra solo hay un 25% que pesen más que
nuestro hijo. En España, los valores y las curvas utilizados para medir los percentiles (las curvas son la
representación gráfica de los valores, esos papeles con líneas y puntitos que nos da siempre el pediatra al
acabar la revisión) son las proporcionadas por el Sistema Público de Salud que están realizadas por el
Instituto de Investigación sobre Crecimiento y Desarrollo de la Fundación Faustino Orbegozo Eizaguirre.
Estas tablas hacen dos diferencias por edad, niños de 0 a 2 años y de 2 a 14 años y son diferentes para niños
y para niñas. Existen 7 percentiles que agrupan las medidas que se consideran normales, del percentil 3 al 97,
pasando por el 19, 25, 50 -que sería la media-, 75 y 90. Por debajo del 3 y por encima del 97, nuestro
pediatra, que al fin y al cabo es quien revisa los datos, nos dirá qué pasos seguir. Los percentiles, al tratarse
de una medida estadística no son iguales en todos los países, es más o menos lógico pensar que la muestra
para extraer los datos no será igual aquí que en un país con grandes problemas para alimentar a su población.
Por esto, nuestro hijo puede estar en un percentil en España y en otro muy diferente en otro país. El estudio
de los datos y el método de elaboración de las tablas para crear los percentiles, es preciso y, posiblemente,
cada vez mejor, pero hasta qué punto pueden ser concluyentes, lo vamos a determinar nosotros. Si nuestro
hijo crece y se desarrolla continuamente de forma controlada por un profesional, el número que alcance en
una gráfica es algo más.
Fuente: BERMISON ORTEGA, Russell Frank. (2006). El Nuevo Marketing. México: Pearson Prentice
Hall.

84
Gestión Curricular
Asignatura: Estadística general

MEDIDAS DE
POSICIÓN
Propósito:
 Calcular e interpretar medidas de posición relativa (cuartiles y percentiles).
 Efectuar análisis exploratorio de datos haciendo uso de diagramas de caja y bigote.

SESIÓN 21: CUARTILES Y PERCENTILES.

1. CUARTILES:
Son valores que dividen a un conjunto de datos ordenados en forma ascendente o descendente en cuatro partes
iguales del conjunto de datos.
Es decir:

Xmin Q1=25% Q2=50% Q3=75% Xmax

25% 25% 25% 25%

En este caso se tiene tres puntos de división a los que se llaman:


Primer cuartil (Q1)
Que viene a ser un valor que se supera a no más del 25% de las observaciones o datos, y que es superado por no
más del 75% de las observaciones.
Segundo cuartil (Q2)
Coincide con la mediana, es decir: Me = Q2
Tercer cuartil (Q3)
Que viene a ser un valor que se supera a no más del 75% de las observaciones o datos y es superado por no más
del 25% de las observaciones o datos.
Calculo de los cuartiles:
1.1. Para datos no agrupados.
¿Cómo se calculan los cuartiles de una muestra de n observaciones?
Pasos:
i. Ordenar los datos de menor a mayor.
ii. El cuartil inferior es el dato que ocupa la posición (n+1)/4 en la muestra ordenada.
iii. El cuartil superior es el dato que ocupa la posición 3(n+1)/4 en la muestra ordenada.
Si la posición resulta ser un número decimal, promediamos los datos que se encuentran a izquierda y
derecha de la posición obtenida.

Ejemplo:
Consideremos los siguientes datos ordenados (n = 13).
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13
Datos 104 112 134 146 155 168 170 195 246 302 338 412 678
85
Gestión Curricular
Asignatura: Estadística general

Solución.
134+146
Posición del cuartil inferior = (13 + 1)/4 = 3.5 Q 1= =140
2
Posición de la mediana = (13 + 1)/2 = 7 Me=Q2=170
302+338
Posición del cuartil superior = 3.(13 + 1)/4 = 10.5 Q 3= =320
2
Dentro de los cuartiles se puede observar:

CINCO NÚMEROS RESÚMENES


Un modo de resumir toda la distribución de los datos es informar los siguientes cinco números
resúmenes:
Mínimo, Cuartil inferior (Q1), Mediana (Q2), Cuartil superior (Q3), Máximo

En nuestro ejemplo:
Mínimo = 104 25%
Cuartil inferior(Q1) = 140 25%
Mediana(Q2) = 170 25%
Cuartil superior(Q3) = 320 25%
máximo = 678

1.2. Para datos agrupados


Formula general:

( )
j.N
−N i−1
4
Q j=li+ .c
ni
Donde:
j = 1,2,3
li = límite inferior donde se encuentra el primer cuartil
c = amplitud del intervalo de clase donde se encuentra el cuartil.
N = tamaño de la muestra o total de datos de la distribución.
N i−1= frecuencia acumulada del intervalo anterior donde se encuentra el

Ejemplo:

86
Gestión Curricular
Asignatura: Estadística general

Sean los siguientes datos correspondientes a la medición en centímetros de 200 varillas. Hallar el primer
y el tercer cuartil.
Li - Ls ni
29,5 – 30,5 4
30,5 – 31,5 8
31,5 – 32,5 23
32,5 – 33,5 35
33,5 – 34,5 62
34,5 – 35,5 44
35,5 – 36,5 18
36,5 – 37,5 4
37,5 – 38,5 1
38,5 – 39,5 1
Realizamos el mismo procedimiento que en la mediana, se aumenta una columna para la frecuencia
acumulada (Ni)
Li - Ls ni Ni
29,5 – 30,5 4 4
30,5 – 31,5 8 12
31,5 – 32,5 23 35
32,5 – 33,5 35 70
33,5 – 34,5 62 132
34,5 – 35,5 44 176
35,5 – 36,5 18 194
36,5 – 37,5 4 198
37,5 – 38,5 1 199
38,5 – 39,5 1 200
N =200
 Hallando el Q1.
Luego se busca un Ni que sea mayor o igual que N/4 (N = n° total de datos)
N/4 = 200/4 = 50,
Entonces: ¿ ≥ 50 el más cercano será Ni = 70, esto nos indica que aquí esta Q1.
32,5 – 33,5 35 70
Donde:
Li = 32,5
c=1
N = 200
N i−1=35
ni =35
Reemplazando en la fórmula:

( ) ( )
n 200
−N i−1 −35
4 4
Q1=li+ . c=32.5+ .1=32.93
ni 35
 Hallando el Q3.
Luego se busca un Ni que sea mayor o igual que 3N/4 (N = n° total de datos)
3N/4 = 3(200)/4 = 150,
Entonces: ¿ ≥ 150 el más cercano será Ni = 176, esto nos indica que aquí esta Q3.
34,5 – 35,5 44 176

87
Gestión Curricular
Asignatura: Estadística general

Donde:
Li = 34,5
c=1
N = 200
N i−1=132
ni =44
Reemplazando en la fórmula:

( ) ( )
3n 3.200
−N i−1 −132
4 4
Q3=li+ . c=34.5+ .1=34.91
ni 44

∴ Q1=32.93 ∧Q3=34 , 91

2. PERCENTILES:
Los percentiles dividen al conjunto de observaciones en cien partes iguales. Hay 99 percentiles.
P1=1% P5=5% P50=50% P99=99

1% 1% 1% 1% 1% 1%

2.1. PERCENTIL PARA DATOS NO AGRUPADOS.


Procedimiento:
 Ordenar los datos de menor a mayor.
 Calcular el percentil utilizando la fórmula:

L= ( 100k ) xn
n = Número de valores
k = Percentil buscado
 “L” es un número entero, si el valor de k-énesimo percentil está a la mitad entre el L-énesimo
valor y el siguiente valor en el conjunto ordenado de datos. Obtenga Pk sumando el L-énesimo
valor y el siguiente valor, luego dividiendo el total entre 2.
 No modifique L redondeando al siguiente entero más grande.
 El valor de Pk es el L-énesimo valor, contando a partir del más bajo.

Ejemplo:
Determine el cuartil 3 de los siguientes valores muestrales:
25 – 18 – 47 – 35 – 32 – 19 – 20 – 26 – 35 – 30 – 28 – 30
Solución

88
Gestión Curricular
Asignatura: Estadística general

Ordene de menor a mayor los datos (n = 12)

18 – 19 – 20 – 25 – 26 – 28 – 30 – 30 – 32 – 35 – 35 – 47
Calcule el valor del localizador para el P75 = Q3
L = (75/100).12 = 9 (Se promedia el 9no y 10mo dato)
Calcule el valor del P75 = Q3
P75 = (32 + 35)/2 = 33,5
INTERPRETACIÓN: El 75% de los valores son menores o iguales a 33,5, mientras que el 25% restante
son mayores o iguales a 33,5

2.2. PERCENTIL PARA DATOS AGRUPADOS.


Ejemplo:
Se toman las pulsaciones de un equipo de atletas después de una competencia. Los datos obtenidos son:
Pulsaciones 70 - 75 75 - 80 80 - 85 85 - 90 90 - 95
N° de atletas 3 3 7 10 12
Solución:
Hallando P10 y P90
Completando la tabla:
Li - Ls ni Ni
70 – 75 3 3
75 – 80 3 6
80 – 85 7 13
85 – 90 10 23
90 - 95 12 35
35
 Hallando P10:
10 n 10 (35)
Si: = =3.5 ⟹ N i ≥3.5 ⟼ N i=6
100 100
Considerando el intervalo:
75 – 80 3 6

( )
10(35)
−3
Reemplazando en la fórmula: 100
P10=C 10=75+ .5=75.83
3
 Hallando P90:
90 n 90(35)
Si: = =31.5 ⟹ N i ≥ 31.5 ⟼ N i=35
100 100
Considerando el intervalo:
90 – 95 12 35

( )
90(35)
−23
Reemplazando en la fórmula: 100
P90=C 90=90+ .5=93.54
12

3. EQUIVALENCIA ENTRE EL CUARTIL – PERCETIL.

89
Gestión Curricular
Asignatura: Estadística general

a) Q1 = P25

b) Q2 = P50 = Mediana

50% 50% 50% 50%


Q P
2 50

50% 50%
Me
c) Q3 = P75

75% 25% 75% 25%

Q P
3 75
4. RANGO INTERCUARTIL.
Es una medida de dispersión estadística, la cual indica la distancia a la que se encuentra el 50% central de datos.
Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico es altamente
recomendable cuando la medida de tendencia central utilizada es la mediana (ya que la mediana es insensible a
posibles valores extremos)
R.I. = Q3 – Q1

50% central de los datos

Q Q Q
1 2 3

25% 25% 25% 25%


5. ANALISIS EXPLORATORIO DE DATOS.

Es el proceso que consiste en utilizar herramientas estadísticas (como gráficas, medidas de tendencia central y
medidas de variación) con la finalidad de investigar conjuntos de datos para comprender sus características
importantes.

VALORES EXTREMOS O DATOS DISTANTES:

Se llama "valor extremo" o “dato distante” a aquel que está muy alejado de la mayor parte de los demás
valores. Los valores extremos se deben considerar ya que pueden revelar información importante y afectar en
gran medida el valor de la media y de la desviación estándar.
Ejemplo:

Datos 1: 9 – 10 – 13 – 14 – 17 – 56

90
Gestión Curricular
Asignatura: Estadística general

Datos 2: 3 – 34 – 36 – 40 – 42 – 47

6. GRÁFICA DE CAJA Y VIGOTE.

Una caja es un rectángulo que se construye sobre la base de los valores del primer cuartil, la mediana y el
tercer cuartil. Permite comparar diversos conjuntos de datos simultáneamente respecto a simetría,
variabilidad, centro, valores extremos y valores atípicos.

95% de los datos

Muy lejanos Q Me Q Muy lejanos


1 3
(datos extremos) (datos extremos)

Lejanos Cercanos Cercanos Lejanos


(datos atípicos) (datos atípicos)

1,5RIQ 1,5RIQ
RIC = Q3 – Q1
7. COEFICIENTE DE CURTOSIS.
3RIQ 3RIQ
Curtosis es la deformación vertical de una curva de frecuencias. Se define como el grado de apuntamiento de
la curva.
7.1. Clases de curtosis:
a) Leptocurtica, se denomina así cuando la curva de apuntamiento es muy pronunciada.

b) Platicurtica, se denomina así cuando la curva de apuntamiento es muy achatada.

c) Mesocurtica, se denomina así cuando la curva de apuntamiento está en el intermedio de las dos
anteriores.

7.2. Coeficiente de curtosis percentílico (K):


Q 3−Q1
K=
2(P 90 −P 10)
Donde:
Q3 y Q1 : son cuartiles
P90 y P10: son percentiles o centiles.

91
Gestión Curricular
Asignatura: Estadística general

Si:
K=0 la curva de la distribución es mesocurtica
K>0 la curva de la distribución es leptocurtica
K<0 la curva de la distribución es platicurtica
Ejemplo:
Se toman las pulsaciones de un equipo de atletas después de una competencia. Los datos obtenidos son:
Pulsaciones 70 - 75 75 - 80 80 - 85 85 - 90 90 - 95
N° de atletas 3 3 7 10 12

Solución:
Hallando Q 3 y Q 1 , P90 y P10
Completando la tabla:
Li - Ls ni Ni
70 – 75 3 3
75 – 80 3 6
80 – 85 7 13
85 – 90 10 23
90 - 95 12 35
35
 Hallando Q1:

( )
n
−N i−1
Recordando: 4
Q1=Li + .c
ni
n 35
Si: = =8.75⟹ N i ≥ 8.75↦ N i=13
4 4
Considerando el intervalo:
80 – 85 7 13
Reemplazando datos:

( )
n
−N i−1
Q1=Li +
4
ni
. c=80+
8.75−6
7
.5=81.96 ( )
 Hallando Q3:

( )
3n
−N i−1
Recordando: 4
Q3=li+ .c
ni

3 n 3 (35)
Si: = =26.25⟹ N i ≥26.25 ⟼ N i=35
4 4
Considerando el intervalo:
90 - 95 12 35
Reemplazando en la fórmula:

92
Gestión Curricular
Asignatura: Estadística general

( ) ( )
3n 3(35)
−N i−1 −23
4 4
Q3=li+ . c=90+ .5=91.35
ni 12
 Hallando P10:
10 n 10 (35)
Si: = =3.5 ⟹ N i ≥3.5 ⟼ N i=6
100 100
Considerando el intervalo:
75 – 80 3 6

( )
10(35)
−3
Reemplazando en la fórmula: 100
P10=C 10=75+ .5=75.83
3
 Hallando P90:
90 n 90(35)
Si: = =31.5 ⟹ N i ≥ 31.5 ⟼ N i=35
100 100
Considerando el intervalo:
90 – 95 12 35

( )
90(35)
−23
Reemplazando en la fórmula: 100
P90=C 90=90+ .5=93.54
12
Por lo tanto:
Q 3−Q1 91.35−81.96 9.39 9.39
K= = = = =0.2651=0.27
2(P 90−P 10) 2(93.54−75.83) 2(17.71) 35.42
Significa que viene a ser una curva de frecuencias suavemente leptocurtica

Problemas Desarrollados

1. Para los siguientes datos, calcular el cuartil 1.


265 120 91 115 185 255 233 190 160 170

Solución:
Primer paso:Ordenar los datos en forma ascendente:
91 – 115 – 120 – 160 – 170 – 185 – 190 – 233 – 255 – 265
Segundo paso: Se sabe que Q1 = P25, por lo tanto, calcularemos el percentil 25.
25
Calcular el localizador L: (k = 25) L= × 10=2 , 5
100
Tercer paso: Redondeamos L con las reglas del redondeo que hemos aprendido anteriormente, en este
caso L=3
Cuarto paso: Calculamos el valor de P25 (el dato que ocupa la posición 3 empezando del menor dato).
91 – 115 – 120 – 160 – 170 – 185 – 190 – 233 – 255 – 265

93
Gestión Curricular
Asignatura: Estadística general

P25=120

Interpretación: El 25% de los datos son menores o iguales a 120 y el 75% restante son mayores o iguales
que este valor.

2. Sean los calificativos de una evaluación de estadística de 45 estudiantes, determina el percentil 10 y 90.
¿ ni
¿ 1
¿ 2
¿ 4
¿ 10
¿ 16
¿ 8
¿ 3
¿ 1
N = 45
Solución
Completamos la tabla, aumentando una columna para la frecuencia absoluta acumulada (Ni).
¿ ni Ni
¿ 1 1
¿ 2 3
¿ 4 7
¿ 10 17
¿ 16 33
¿ 8 41
¿ 3 44
¿ 1 45
N = 45
Hallando el: P10
Si: 10N/100 =10(45)/100= 4.5
Se busca un Ni que sea mayor o igual que N/4 (N=n° Total de datos)
Entonces: Ni ≥ 4.5 el más cercano será Ni= 7

¿ 4 7
Dónde:
Li = 42 N i−1=3 ni =4 c=8
Remplazando en la fórmula:

( ) ( )
10 n 10 ( 45 )
−N i−1 −3
100 100
P10=l i + .c =42+ .8=45
ni 4
Hallando el: P90
Si: 90N/100 =90(45)/100= 40.50
Luego se busca un Ni que sea mayor o igual que N/4 (N=n° Total de datos)

94
Gestión Curricular
Asignatura: Estadística general

Entonces: Ni ≥ 40.50 el más cercano será Ni = 41

¿ 8 41
Dónde:
Li = 66 N i−1=33 ni =8 c=8

( ) ( )
90 n 90 ( 45 )
−N i−1 −33
100 100
P90=l i + . c=66+ .8=73.50
ni 8

Problemas Propuestos

1. Establezca el valor de verdad (V) o falsedad (F) de las siguientes proposiciones:

Q1= P50 ( ) Q3 =P75 ( )

Me = P5 ( ) Q2 =P50 =Me ( )

Q1 = P25 ( ) P75 =Me ( )


2. Los tiempos (en minutos) empleados por un grupo de mecánicos para armar un motor fueron los siguientes:
11 18 15 13 14 16 10 9 14 17 18 20 25
a) ¿Cuánto tiempo le tomó como máximo al 35% de los mecánicos más experimentados?
b) ¿Cuánto tiempo como mínimo le tomó al 18% de los mecánicos con menos experiencia?
3. Los siguientes datos corresponden al peso de 15 estudiantes:
48 50 52 49 58
48 52 60 57 61
55 48 63 65 54
a) ¿Cuál es el peso máximo del 75% de los alumnos?
b) ¿Cuál es el peso mínimo del 63% de los alumnos?
4. Los ingresos diarios (en Nuevos Soles) de un grupo de supervisores de la obra de construcción del nuevo centro
comercial se han resumido en la siguiente tabla de frecuencias:
Ingresos Xi ni
¿ 50 12
¿ 54 25
¿ 58 58
¿ 62 32
¿ 66 10
a) ¿Cuánto tiene como ingreso máximo el 32% de los supervisores?

95
Gestión Curricular
Asignatura: Estadística general

b) ¿Cuánto tiene como ingreso mínimo el 25% de los supervisores?


5. Dada la tabla siguiente, referente a los pesos de cierto número de pacientes de un hospital:
Pesos ni
¿ 5
¿ 24
¿ 18
¿ 36
¿ 17
¿ 10
a) Calcule media, mediana y moda de los pesos.
b) Calcule: Cuartil 1, 2 y 3. (Compare el cuartil 2 con la mediana). Comente.
c) Calcule: Percentil 28 y 50. (Compare el percentil 50 con la mediana). Comente.
d) ¿Cuánto pesa como máximo el 19% de pacientes?
e) ¿Cuánto pesa como mínimo el 42% de pacientes?
f) Calcule el rango intercuartil (RIC). Interprete.

Video de Apoyo

Video 1: Cuartiles introducción | Qué son y como encontrarlos en datos sin agrupar
(https://www.youtube.com/watch?v=suSz9RXFNTs)

Video 2: Cuartiles, Deciles y Percentiles | Datos agrupados en intervalos | Ejemplo 1


(https://www.youtube.com/watch?v=Eju_9eM4PZg)

Semana 12
EVALUACIÓN DE LA TERCERA UNIDAD
SESIÓN 23: PRUEBA DE DESARROLLO

Problemas de repaso

96
Gestión Curricular
Asignatura: Estadística general

1. La tabla siguiente muestra los nombres de los 42 presidentes de Estados Unidos, junto con el número de sus
hijos.2
Washington 0 Hayes 8 F.D. Roosevelt 6
Van Buren 4 J.Q. Adams 4 Carter 4
Buchanan 0 Fillmore* 2 T. Roosevelt* 6
Adams 5 Garfi eld 7 Truman 1
W.H. Harrison 10 Jackson 0 Taft 3
Lincoln 4 Pierce 3 Eisenhower 2
Jefferson 6 Arthur 3 G.H Reagan* 4
Tyler* 15 Cleveland 5 .W. Bush 6
A. Johnson 5 Coolidge 2 Wilson* 3
Madison 0 Nixon 2 Kennedy 3
Polk 0 B. Harrison* 3 Clinton 1
Grant 4 Hoover 2 Harding 0
Monroe 2 Ford 4 L.B. Johnson 2
Taylor 6 McKinley 2 G.W. Bush 2
*Casado dos veces
Fuente: Time Almanac 2007

a) Construya un histograma de frecuencia relativa para describir los datos.


b) Calcule la media y la desviación estándar para el conjunto de datos.

2. El número de pases completados por Brett Favre, mariscal de campo de los Empacadores de Green Bay, se
registró en cada uno de los 16 juegos regulares de la temporada de verano de 2006 (www.espn.com) 9.

15 31 25 22 22 19 17 28 24 5 22 24 22
20 26 21

a) Trace una gráfica de tallo y hoja para describir los datos.


b) Calcule la media y desviación estándar para los pases completados por juego de Brett Favre.

3. Los científicos del medio ambiente están cada vez más preocupados por la acumulación de elementos
tóxicos en mamíferos marinos, así como en el paso de esos elementos a los descendientes de esos animales.
El delfín de franjas (Stenella coeruleoalba), considerado el principal depredador en la cadena alimenticia
marina, fue objeto de este estudio. Las concentraciones de mercurio (microgramos/gramo) en los hígados de
28 delfi nes de franjas machos fueron como sigue:

1.70 183.00 118.00 406.00 278.00 209.00

1.72 168.00 264.00 252.00 286.00 314.00

8.80 218.00 481.00 329.00 315.00 318.00

5.90 180.00 485.00 316.00 241.00

101.00 85.40 221.00 445.00 397.00

97
Gestión Curricular
Asignatura: Estadística general

a) Calcule el resumen de cinco números para los datos.


b) Construya una gráfica de caja para los datos.
c) ¿Hay algún resultado atípico?
d) Si usted supiera que los primeros cuatro delfines tenían menos de tres años de edad, en tanto que los
otros tenían más de ocho años de edad, ¿esta información ayudaría a explicar la diferencia en la
magnitud de esas cuatro observaciones? Explique.

4. Los pesos (en libras) de los 27 paquetes de carne molida de res del ejercicio 2.24 (véase el conjunto de datos
EX0224) aparecen a continuación, en orden de menor a mayor:

0.75 0.83 0.87 0.89 0.89 0.89 0.92

0.93 0.96 0.96 0.97 0.98 0.99 1.06

1.08 1.08 1.12 1.12 1.14 1.14 1.17

1.18 1.18 1.24 1.28 1.38 1.41

a) Confirme los valores de la media y desviación estándar, calculados en el ejercicio


b) Construya una gráfica de caja para los pesos de paquetes. ¿Qué nos dice la posición de la recta mediana y
la longitud de los bigotes acerca de la forma de la distribución?

Unidad IV

Resultado de Aprendizaje de la Unidad I:


Al finalizar la unidad, el estudiante será capaz de calcular e interpretar probabilidades en
distribuciones discretas y continuas en acontecimientos cotidianos de su carrera profesional.

ORGANIZACIÓN DE APRENDIZAJES

TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN


SEMANA N° 13

25. Probabilidades fundamentos: Actividad N° 25 Consolidado 2:


Fundamentos: Definiciones, Elabora un organizador del Ejercicios para identificar alternativas
notación, evento, propiedades, conocimiento, se apoya de su guía. de solución. Evaluación final:
probabilidades con técnicas de (individual) Evaluación individual de desarrollo
conteo y variable aleatoria. Responde las interrogantes de la guía teórico-práctico
de aprendizaje.

98
Gestión Curricular
Asignatura: Estadística general

26. Probabilidades fundamentos: Actividad N° 26


Probabilidades con técnicas de Calcula ejercicios aplicando la técnica
conteo y variable aleatoria – de conteo y variable aleatoria.
software estadístico. Actividad N° 27
Calcula la distribución de binomial y
SEMANA N° 14 Poisson e interpreta los resultados.
Desarrolla la guía de trabajo.
27. Distribución de probabilidad Actividad N° 28
discreta: Distribución Binomial, Aplica las funciones del Excel, para
Poisson. calcular la distribución de binomial y
28. Distribución de probabilidad Poisson.
discreta: Distribución Binomial, Desarrolla la guía de trabajo.
Poisson - software estadístico. Actividad N° 29
Estandariza, grafica, calcula el área de
SEMANA N° 15 la distribución normal e interpreta los
resultados.
29. Distribución de probabilidad Desarrolla la guía de trabajo.
normal: Distribuciones uniformes. Práctica calificada grupal
Distribución normal estándar. Actividad N° 30
30. Distribución de probabilidad Aplica las funciones del Excel, para
normal: Distribuciones uniformes. calcular la distribución de la
Distribución normal estándar - probabilidad normal interpola
software estadístico. Actividad N° 31
Prueba de desarrollo
SEMANA N° 16
Actividad N° 32
31. Evaluación final. Entrega de notas y resolución de la
32. Desarrollo de la evaluación final. prueba de desarrollo.

Semana 13
PROBABILIDADES FUNDAMENTOS

La teoría de la probabilidad es una de las ramas de las matemáticas con


varias aplicaciones en la actualidad. las primas de los seguros, los riesgos
nucleares, pronósticos económicos, pronósticos políticos, pronósticos del
tiempo.

99
Gestión Curricular
Asignatura: Estadística general

Andréi
Nikoláyevic
h
Kolmogórov
B. efectos
psicologicos

C. Euclides

A. Andréi Nikoláyevich Kolmogórov: Fue un matemático ruso que realizó aportes de primera
línea en los contenidos de teoría de la probabilidad y de topología.
B. Mijaíl Alekséyevich Lavréntiev: En 1927, Lavréntiev pasó medio año en Francia,
colaborando con matemáticos franceses. Tras volver a la Unión Soviética, se incorporó a la
Universidad de Moscú. Posteriormente, hizo lo propio en el Instituto Steklov de Matemáticas.

TEORÍA DE LA PROBABILIDAD

El origen de las probabilidades se inicia en el año de 1654 cuando el matemático francés Blaise Pascal hacia
un viaje con el apasionado jugador de dados y cartas, conocido como El Caballero de Mere, quien era noble e
LECTURA

ilustrado. Este creía que había encontrado una falsedad en los números al analizar el comportamiento de los
dados, era diferente cuando se utilizaba un dado, que cuando se utilizaban dos dados. Esta presunción era una
comparación errónea, entre las probabilidades de sacar un seis en un solo dado o de sacar un seis con dos
dados.

PROBLEMA PLANTEADO CON DIFERENTES JUEGOS DE AZAR Lo planteado por Mere a Pascal
dieron origen a una correspondencia entre pascal y algunos de sus amigos matemáticos entre ellos PIERRE
DE FERMAT abogado de profesión pero amantes de las matemáticas.

APORTES DE PASCAL En la Filosofía Teología (intentando argumentar la existencia de Dios en términos


probabilísticos y gananciales). Decía es MEJOR CREER QUE NO CREER, es decir, mejor actuar como si
existiera por si acaso existe.

ORIGEN DE LAS PROBABILIDADES Las probabilidades abarca un periodo de tiempo que se pierde en las
nieblas de la antigüedad y que llega hasta el siglo 16 con los cambios de PACHOLI, TARTAGLIA, entre

100
Gestión Curricular
Asignatura: Estadística general

otros. En este periodo se usaron conceptos rudimentarios de probabilidad, azar y aleatoriedad, que están
relacionados con aspectos adivinatorios y religiosos. Rabinovitch 1973 recoge ejemplos de usos de
mecanismos aleatorios mencionado en la literatura Talmúdica y Rabinica.

La talmúdica describe propiedades de ,mecanismos aleatorios tales como juegos de azar, lanzamiento de una
moneda, etc. La rabínica es usada para medir la opinión sobre la ocurrencia de un seceso, parte de suponer
unas probabilidades iniciales o aprioris. La manera de pasar de una a otra probabilidad es mediante el
concurso del teorema de BAYES que en su versión continua dice: rc(8lx)=rc(8)f(xl8) Jrc(8)f(x l8)d8.

LA TEORIA DE LA PROBABILIDAD SIGLO XVIII Se aplica en los juegos en sentidos amplios y en la


jurisprudencia. También en la forma de análisis de datos y de la inferencia inductiva se aplica a la teoría del
seguro. En el siglo XIX se aplica en la física la biología y la psicología, mas adelante en la agronomía, en las
encuestas, en los contrastes médicos, en el deporte, entre otros.

Fuente: P. Ibarrola, L. Pardo y V. Quesada (1997): Teoría de la Probabilidad, Ed. Síntesis, ISBN 84-
7738-516-5.
Spiegel, Murray. 1970. Estadística, McGraw-Hill, México.
Olav Kallenberg, Probabilistic Symmetries and Invariance Principles. Springer-Verlag, New York
(2005). 510 pp. ISBN 0-387-25115-4
Kallenberg, O., Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. (2002). 650 pp.
ISBN 0-387-95313-2

PROBABILIDAD
ES
Propósito:
 Identificar los elementos de los experimentos aleatorios.
 Calcular e interpretar la probabilidad de la ocurrencia de eventos aleatorios.

SESIÓN 25: PROBABILIDADES FUNDAMENTOS.

1. FUNDAMENTOS.
Si el único propósito del investigador fuese describir los resultados de un experimento o fenómeno concreto, los
métodos analizados en Estadística Descriptiva pueden considerarse suficientes. Pero si lo que se pretende es utilizar
la información obtenida para extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido
estudiados, entonces estos métodos constituyen sólo el principio del análisis, y debe recurrirse a métodos de
inferencia estadística, los cuales implican el uso inteligente de la teoría de la probabilidad.
Utilizando la teoría de la probabilidad podremos sacar conclusiones precisas acerca de una población en base a una
muestra extraída de ella, y que muchos de los estudios estadísticos son de hecho, estudio de las propiedades de una o
más variables estadísticas.
En muchas oportunidades nos hemos encontrado con afirmaciones donde no existe 100% de certeza sobre la
aparición o realización de un hecho o fenómeno.

101
Gestión Curricular
Asignatura: Estadística general

Por ejemplo, continuamente escuchamos situaciones como las siguientes:


 Dados los niveles de inflación en los últimos meses en el país, es probable que el próximo año la economía
alcance niveles de hiperinflación.
 Debido a la agresiva campaña publicitaria sobre el programa de vacunación para este año, es probable que
aumente sustancialmente el número de niños vacunados.
 Dada la reducción continua de los ingresos reales y el aumento del desempleo en la población, es probable que
en los próximos meses se desate una serie de conflictos sociales.
En estos ejemplos se puede apreciar que el resultado final no se conoce con exactitud o certeza, existe por lo tanto
Inseguridad.
Así “se vive en un mundo donde se está en incapacidad de predecir el futuro con completa certeza. La necesidad de
tener suficiente poder para manejar la inseguridad obliga a estudiar y usar la teoría de la probabilidad”.
La probabilidad, por lo tanto, nos proporciona la base para el estudio de la inferencia estadística. Aquí estudiaremos
conceptos y técnicas de probabilidad, que nos permitan comprender el análisis estadístico inferencial.

2. EXPERIMENTOS ALEATORIOS Y ESPACIO MUESTRAL.


En la teoría de probabilidades se habla a menudo de experimentos aleatorios y de fenómenos aleatorios.
La palabra aleatorio proviene del vocablo latino alea, el cual significa suerte o azar.
Un fenómeno aleatorio, es, por tanto, aquél cuyo resultado está fuera de control y que depende del azar.
Experimentos o fenómenos aleatorios son los que pueden dar lugar a varios resultados, sin que pueda ser
previsible enunciar con certeza cuál de éstos va a ser observado en la realización del experimento.
a. Es una experiencia determinista.
Son aquellos que, realizados de una misma forma y con las mismas condiciones iniciales, ofrecen siempre
el mismo resultado. Como ejemplo, tenemos que un objeto de cualquier masa partiendo de un estado inicial
de reposo, y dejado caer al vacío desde una torre, llega siempre al suelo con la misma velocidad:
v=√ 2 gh
La velocidad del cuerpo al llegar al suelo es v, g es la aceleración de la gravedad y h es la altura de la torre.
Se supone que no existe rozamiento con el aire (vacío).
Ejemplo:
Si dejamos caer una piedra o la lanzamos, y conocemos las condiciones iniciales de altura, velocidad, etc.,
sabremos con seguridad dónde caerá, cuánto tiempo tardará, etc.
b. Es una experiencia aleatoria (EA).
Cuando en un experimento no se puede predecir el resultado final.
Es decir, un experimento o fenómeno aleatorio es aquel que en las mismas condiciones iniciales produce
resultados diferentes finales.
Un experimento es aleatorio si cumple con las siguientes condiciones:
 Se puede repetir indefinidamente siempre en las mismas condiciones.
 Antes de realizarlo, no se sabe el resultado que se ha de obtener.

102
Gestión Curricular
Asignatura: Estadística general

 El resultado obtenido forma parte de un conjunto de posibles resultados ha obtenerse, a este conjunto
de resultados posibles se le denomina ESPACIO MUESTRAL (Ω ó E), a cada uno de los elementos
del espacio muestral se denominan SUCESOS ELEMENTALES (a, b, c,….etc) ó (e1, e2, e3, …,etc)
Ejemplo:
Si echamos un dado sobre una mesa, ignoramos qué cara quedará arriba.
El resultado depende del azar.

La vida cotidiana está plagada de sucesos aleatorios. Muchos de ellos, de tipo sociológico (viajes,
accidentes, número de personas que acudirán a un gran almacén o que se matricularán en una
carrera.......,etc) aunque son suma de muchas decisiones individuales, pueden ser estudiados, muy
ventajosamente, como aleatorios.
Por lo tanto:
Un experimento aleatorio, es un proceso de observación, donde el resultado exacto no se conoce,
predominando, por tanto, cierto margen de duda.
Ejemplos:
Sea el experimento: Resultado
 “Resultado del examen final en el  Antes del examen, el resultado no se conoce con
Por lo
curso de Estadística por parte de exactitud; es decir, no sabemos si el estudiante
tanto el
un estudiante. aprobará o desaprobará el examen final.
experimen
 Resultado del lanzamiento de una  Existe margen de duda en el resultado exacto,
to es
moneda. pues, es posible que en éste aparezca cara o
aleatorio
sello.

En general:
Todos los juegos al azar constituyen experimentos aleatorios: Rifas, dados, carreras de caballos,
loterías, barajas, etc.
Los trabajos de investigación constituyen también experimentos aleatorios, ya que antes de
ejecutarlos, no se sabe si las hipótesis planteadas serán probadas o desaprobadas.

c. ESPACIO MUESTRAL (Ω, E, S, EM)


Es el conjunto formado por todos los posibles resultados de un experimento aleatorio.
Ejemplo 1:
Sea el experimento aleatorio: “Resultado del examen final en la asignatura de Estadística general por parte
de un estudiante”
El espacio muestral es:
EM ={ APROBAR , DESAPROBAR }
Ejemplo 2:
Sea el experimento aleatorio: Resultado del lanzamiento de una moneda.
El espacio muestral es:
EM ={ CARA , SELLO }
Ejemplo 3:

103
Gestión Curricular
Asignatura: Estadística general

En una empresa de lácteos hacen control de calidad al llenado de bolsas de leche de 1000 cc de volumen.
Cada 20 minutos se verifica el volumen de llenado de la máquina. La evaluación continua hasta encontrar
una bolsa que no cumple las especificaciones.
Sea “s” el hecho de que la bolsa de leche cumple con las especificaciones de volumen, y “n” las que no
cumple con ellas. ¿Cuál es el espacio muestral de este experimento?
El espacio muestral se representa como una secuencia de las letras s y n. Dado que el experimento
termina cuando una bolsa de leche no cumple con las especificaciones de volumen, el espacio muestral
estará formado por una secuencia de “s” seguida por una “n”.
S = {n, sn, ssn, sssn, ssssn, sssssn,...}
d. SUCESOS O EVENTOS.
Suceso aleatorio es un acontecimiento que ocurrirá o no, dependiendo del azar.
Además, un suceso aleatorio es cualquier subconjunto del espacio muestral y se denota con las letras
mayúsculas A, B, C, etc.
Ejemplos 1:
Sea el experimento aleatorio:
“Selección de un alumno de acuerdo a su rendimiento académico
El espacio muestral será:
EM ={ SOBRESALIENTE , BUENO , REGULAR , MALO }
Podemos observar que cada resultado es un subconjunto del espacio muestral, por lo tanto, cada uno de
ellos es un evento. Si denotamos por A, B, C, D los eventos; entonces tendremos:
Evento A={ SOBRESALIENTE }
Evento B={ BUENO }
Evento C= { REGULAR }
Evento D={ MALO }
Ejemplos 2:
Un experimento aleatorio sería el lanzamiento de un dado, siendo su espacio muestral:
Ω={ 1; 2 ; 3 ; 4 ; 5 ; 6 }
Pudiéndose dar infinidad de procesos aleatorios, tales como:
A :obtención de un número par en ellanzamineto de un dado
A={ 2; 4 ; 6 } ⟹ A ⊂ Ω
B: obtención de un número menor que 3 en ellanzamineto de un dado
B= {1 ; 2 } ⟹ B ⊂ Ω
Ejemplos 3:
Otro experimento aleatorio sería el lanzamiento de dos monedas, siendo su espacio
muestral:
E={ cc ; cs ; sc ; ss }
Siendo algunos de los procesos aleatorios:
A :obtención dos sellos en el lanzamineto de dos monedas

104
Gestión Curricular
Asignatura: Estadística general

A={ ss } ⟹ A ⊂ E
B: obtención de exactamente un sello en el lanzamineto de dos monedas
B= { sc ; cs } ⟹ B ⊂ E
EVENTO SEGURO O SUCESO UNIVERSAL (U).
Se llama así al evento que de todas maneras debe ocurrir.
Ejemplo:
Sea el experimento:
“Selección de un propietario de inmueble con ingresos medio-alto, de la Urbanización Las
Casuarinas – Lima.
Se puede apreciar que el Evento es seguro o universal, ya que, al Seleccionar un propietario de
inmueble, éste de todas maneras tendrá ingresos medio - alto, ya que se trata de una zona residencial de
Lima.
EVENTO IMPOSIBLE (ɸ).
Es el evento que no va a ocurrir.
Ejemplo:
Sea el experimento:
“Selección de un propietario de inmueble con ingresos bajos, de la Urbanización Las Casuarinas –
Lima.
En este caso, el evento es imposible, ya que no se podrá seleccionar un propietario de inmuebles con
bajos ingresos en una zona residencial.
EVENTO COMPLEMENTARIO.
El complemento del Evento A, se denota por el símbolo A (se lee: no A), y significa que el Evento A
no ocurre.
Ejemplo:
Sea el evento: A={ Paciente con tumor canceroso }
Entonces su complemento será:
A={ Paciente con tumor no canceroso }
EVENTOS MUTUAMENTE EXCLUYENTES.
Dos o más eventos son mutuamente excluyentes, si la ocurrencia de uno de ellos, anula la ocurrencia de
los demás.
Ejemplo:
Sea el experimento aleatorio:
“Selección de un profesor de la Universidad X, según categoría docente”.
El espacio muestral es:

EM ={ PRINCIPAL , ASOCIADO , AUXILIAR , JEFE DE PRÁCTICA }


Siendo los eventos:
A=Profesor principal

105
Gestión Curricular
Asignatura: Estadística general

B=Profesor asociado
C=Profesor auxiliar
D=Profesor jefe de práctica
Los cuatro eventos son mutuamente excluyentes, porque al seleccionar un Docente, este tendrá sólo una
categoría; anulándose el resto de los eventos. No es posible sostener, por ejemplo, que al seleccionar un
Docente, éste tenga la categoría de Principal y Jefe de Práctica a la vez.

EVENTOS INDEPENDIENTES.
Dos eventos son independientes si ambos no tienen ninguna relación entre sí; es decir, si la ocurrencia
de uno de ellos, no incluyen en la ocurrencia del otro.
Ejemplo:
Sean los eventos:
X =Primer alumno que apruebe el examen de estadistica
Y =Segundo alumno que apruebe el examen de estadistica
X e Y son independientes porque al ocurrir el evento X, éste no incluye para que el evento Y ocurra.

3. CONCEPTO DE PROBABILIDAD.
La probabilidad es una disciplina abstracta que se usa como modelo para hacer deducciones relativas a eventos
que posiblemente pueden ocurrir.

4. TIPOS DE PROBABILIDAD.
Existen tres enfoques para el estudio de la probabilidad:
a. Probabilidad clásica.
Llamada también probabilidad a priori debido a que es posible conocer el resultado con anterioridad, es
decir, sin llevar acabo el experimento y sólo basado en un razonamiento lógico.
Generalmente esta probabilidad se usa para experimentos simples.
Se calcula a través de:
Casos favorablesde Ocurrencia del Evento A
p ( A )=
Total de Casos Posibles
Ejemplo 1:
Hallar la probabilidad de obtener cara en el lanzamiento de una moneda.
Solución
Definimos el espacio muestral:
EM ={ cara , sello }
Sea el evento:
A=Obtener cara
Luego:
Casos favorablesde Ocurrencia del Evento A 1
p ( A )= =
Total de casos posibles 2

106
Gestión Curricular
Asignatura: Estadística general

p ( A )=0.5=50 % (Para obtener el resultado multiplicamos por 100)

Ejemplo 2:
Hallar la probabilidad de obtener el número 2 en el lanzamiento de un dado.
Solución
Definimos el espacio muestral:
EM ={ 1 , 2, 3 , 4 ,5 , 6 }
Sea el evento:
B=Obtener el número 2
Luego:
Casos favorables d Ocurrencia del Evento A 1
p ( B )= =
Total de casos posibles 6

p ( B )=0.17=17 %

b. Probabilidad de Frecuencia Relativa de la Ocurrencia.


El cálculo de este tipo de probabilidad se basa en la repetición de la ocurrencia de un evento, al realizar una
gran cantidad de pruebas o experimentos.
Se halla a través de:
Número de vecesque Ocurrioel Evento A
p ( A )=
Número Total de veces que se Repitió el Experimento

La probabilidad de frecuencias relativas, es llamada también probabilidad empírica o a posteriori, debido


a que se obtiene el resultado después de llevar acabo el experimento un gran número de veces.
Ejemplo:
En una encuesta realizada a 500 vendedores ambulantes de Lima, se encontró que 325 de ellos se
dedicaban a esta actividad porque habían sido despedidos de empresas fabriles. Hallar la probabilidad
de que, al seleccionar aleatoriamente un vendedor ambulante, éste haya sido despedido de una empresa
fabril.
Solución
Sea el evento:
B=Vendedor ambulante despedido
N° de veces que ocurrió B=325
N° total de veces que se repitió el experimento = 500
Luego:
325
p ( B )= =0.65=65 %
500

c. Probabilidad Subjetiva.
Es la probabilidad asignada bajo un criterio “personal”; basándose en cualquier tipo de evidencia
disponible.

107
Gestión Curricular
Asignatura: Estadística general

Estas probabilidades se asignan a eventos que puedan suceder sólo una vez o muy pocas veces.
Ejemplos:
 La probabilidad de que el hombre llegue a habitar la luna en los próximos 20 años.
 La probabilidad de que se encuentre una cura para el sida en los próximos 5 años.
Se puede decir que, dado un experimento determinado la probabilidad subjetiva de un evento “A” es el
grado de creencia asignado a la ocurrencia de este evento por un individuo basado en toda la evidencia a su
disposición con las siguientes exigencias:
a) P(A )=0 Representa que A no ocurrirá.

b) P(A )=1 Representa que A si ocurrirá.

c) 0< P( A) <1 Representa el grado de certeza de que el evento “A” ocurrirá.


Es un enfoque menos usado, consiste en que la probabilidad es el juicio personal o grado de creencia.
Ejemplo:
 Mirando al cielo: “es poco probable que hoy llueva”
 Calcular la probabilidad de que un tenista gane un campeonato.
 Calcular la probabilidad de que un club de futbol salga campeón.
 Calcular la probabilidad de que el precio de las acciones de una Compañía se incremente en dos
años.
5. LEYES O AXIOMAS DE LA PROBABILIDAD.
Para hacer una definición rigurosa de la probabilidad, necesitamos precisar ciertas leyes o axiomas que se debe
cumplir, tales como:
a) La probabilidad sólo debe tomar valores comprendidos entre 0 y 1
0 ≤ p ( A)≤ 1
b) La probabilidad del suceso seguro es 1, es decir, el 100%
p ( EM ) =1
c) La probabilidad del suceso imposible debe ser 0
p ( ϕ )=0
d) La probabilidad de la intersección de dos sucesos debe ser menor o igual que la probabilidad de cada uno
de los sucesos por separado, es decir:
p( A ∩ B)≤ p( A)
p( A ∩ B)≤ p(B)
e) La probabilidad de la unión de sucesos debe ser mayor que la de cada uno de los sucesos por separado.
p( A ∪ B)≥ p( A)
p( A ∪ B)≥ p( B)
f) Más aún, si los sucesos son disjuntos (incompatibles) debe ocurrir que:
A ∩ B= ∅ → p ( A ∪ B )= p ( A ) + p( B)
g) Si los sucesos no son disjuntos debe ocurrir que:
A ∩ B≠ ∅ → p ( A ∪ B )= p ( A ) + p ( B )− p( A ∩ B)

108
Gestión Curricular
Asignatura: Estadística general

Problemas Desarrollados

1. Hallar el espacio muestral en los siguientes experimentos:


a) Nacimiento de un ser humano en relación al sexo.
b) Resultado de la evaluación nutricional de un menor de edad.
c) Resultado del partido de vóley entre Perú y Japón.
d) Tipo de elasticidad de la demanda del producto “x”.
Solución
Se sabe que el Espacio Muestral (EM) son todos los resultados posibles de un experimento aleatorio.
Entonces:
a) EM ={ varon, mujer }

b) EM ={ Nutrición normal , desnut leve , desnut moderada , desnut alta }

c) EM ={ Gana Perú , pierde Perú }

d) EM ={ Elastica , inelastica , unitaria ,complet elástica , complet inelástica }

2. Teniendo en cuenta los resultados del espacio muestral, en el ejercicio anterior, hallar las siguientes
probabilidades:
a) Que el nacimiento sea del sexo femenino.
b) Que un menor de edad padezca de desnutrición leve.
c) Que gane Perú en el partido de vóley.
d) Que el producto “x” tenga demanda elástica.
Solución
Utilizaremos para el cálculo de probabilidad de cada uno de ellos, la probabilidad clásica cuya fórmula es:
Casos favorablesde Ocurrencia del Evento A
p ( A )=
Total de Casos Posibles
a) Sea el evento: F=nacimiento del sexo femenino
1
Luego: p ( F ) = =0.5=50 %
2
La probabilidad de que el nacimiento sea del sexo femenino es de 50%
b) Sea el evento: L=menor padeszcade desnutrición leve
1
Luego: p ( L )= =0.25=25 %
4
La probabilidad de que un menor padezca de desnutrición leve es de 25%
c) Sea el evento: G=Gane Perú en el partído de vóley

109
Gestión Curricular
Asignatura: Estadística general

1
Luego: p ( G )= =0.5=50 %
2
La probabilidad de que gane
d) Sea el evento: E=Producto x tengademanda elástica
1
Luego: p ( E )= =0.2=20 %
5

1
3. Un experimento genera un espacio muestral que contiene ocho sucesos (E 1, E2,……,E8) con la p ( E1 )= , i =
8
1,2,3,…..,8. Los sucesos A y B se definen así:
A={ E1 , E 4 , E6 }
B= { E 3 , E 4 , E 5 , E6 , E7 }
Encuentre: p(A), p(Al), p(AUB)
Solución
Graficando:

3
a) p ( A )= =0.38=38 %
8
5
p ( A ) = =0.63=63 %
l
b)
8
6
c) p ( A ∪ B )= p ( A ) + p ( B )−p ( A ∩ B ) =c= =0.75=75 %
8

Problemas Propuestos

1. Calcular la probabilidad de obtener un número par en el lanzamiento de un dado.

2. Calcular la probabilidad de obtener 3 caras en el lanzamiento de 3 monedas.

3. En un salón de clases de 40 estudiantes, se tienen 8 desaprobados. Si se elige un estudiante al azar, encontrar la


probabilidad de que esté aprobado.

110
Gestión Curricular
Asignatura: Estadística general

4. En una muestra aleatoria de 120 pacientes, se encontró que 30 de ellos tienen cáncer. ¿cuál es la probabilidad de
que un paciente elegido al azar tenga cáncer?

5. En la empresa Scotiabank, se tiene una muestra de cuatro hipotecas para vivienda está clasificada como de tasa
Fija (F) o tasa Variable (V).
a) ¿Cuáles resultados están en el evento de que exactamente tres de las hipotecas seleccionadas sea de tasa
variable?
b) ¿Cuáles resultados están en el evento de que las cuatro hipotecas sean del mismo tipo?
c) ¿Cuáles resultados están en el evento de que a lo sumo una de las cuatro hipotecas sea de tasa Variable?

Video de Apoyo

Video 1: Probabilidades - Ejercicios Resueltos - Nivel 1A


(https://www.youtube.com/watch?v=0lxZMaoeUno)

Video 2: Probabilidades - Ejercicios Resueltos - Nivel 1B


(https://www.youtube.com/watch?v=FBRAWqFgPqc)

Semana 14
DISTRIBUCIÓN DE PROBABILIDAD DISCRETA

111
Gestión Curricular
Asignatura: Estadística general

En teoría de la probabilidad y estadística, la distribución binomial de

Poisson es la distribución de probabilidad discreta del número de éxitos en

una secuencia de n ensayos de Bernoulli independientes. Su denominación

es en honor al físico y matemático francés Siméon Denis Poisson.

Siméon
Denis
Poisson
Matemático
y científico
suizo
Johann
Bernoulli

A. Siméon Denis Poisson, ue un físico y matemático francés al que se le conoce por sus
diferentes trabajos en el campo de la electricidad y por sus publicaciones acerca de la
geometría diferencial y la teoría de probabilidades.
B. Johann Bernoulli: Siendo joven, su padre Nikolaus Bernoulli lo envió a la Universidad de
Basilea para estudiar filosofía y teología, con el ánimo de que se convirtiera en teólogo. Pero
Jakob continuó, a escondidas, las que eran sus auténticas aficiones: la física y las matemáticas.

Siméon Denis Poisson

Poisson nació en Pithiviers, Loiret, hijo de Siméon Poisson. Su padre sirvió como soldado raso en
las guerras de Hanover, pero disgustado por el trato abusivo que recibió de los oficiales nobles,
LECTURA

desertó. Cuando nació su hijo, ocupaba diversos cargos administrativos, y al parecer estuvo a la
cabeza del gobierno local durante el período revolucionario.

Siméon Denis fue enviado primero con su tío, un cirujano de Fontainebleau, y comenzó a aprender
el oficio, pero hizo pocos progresos. Tras mostrar los primeros signos de su talento como

112
Gestión Curricular
Asignatura: Estadística general

matemático, fue enviado a la Escuela Central de Fontainebleau, donde tuvo la oportunidad de tener
una clase con un profesor receptivo, M. Billy, que se dio cuenta rápidamente de que era superado
por su alumno, le alentó a aprender las ramas más difíciles de las matemáticas, y predijo su futura
fama recordando unas líneas del famoso fabulista Jean de La Fontaine, jugando con el significado
de su apellido en francés:

«Petit Poisson deviendra grand // Pourvu que Dieu lui prête vie.»

("El Pez pequeño se hace grande // Siempre y cuando Dios le dé vida.")

En 1798, ingresó en la École Polytechnique en Paris como primero de su promoción, y de inmediato


comenzó a atraer la atención de los profesores de la escuela, quienes le dejaron libertad para tomar sus
propias decisiones en cuanto a lo que iba a estudiar. En 1800, menos de dos años después de su
ingreso, publicó dos libros de memorias, uno sobre el método de eliminación de Étienne Bézout, y el
otro sobre el número de integrales de una ecuación en diferencias finitas. Este último fue examinado
por Sylvestre François Lacroix y por Adrien-Marie Legendre, quien recomendó que se publicará en el
"Recueil des savants étrangers" (Informe de científicos extranjeros), un honor sin precedentes para un
joven de dieciocho años. Este éxito introdujo a Poisson en los más distinguidos círculos científicos.
Joseph Louis Lagrange, a cuyas conferencias sobre la teoría de funciones asistió en la École
Polytechnique, reconoció su talento desde el principio, y se convirtió en su amigo (el Mathematics
Genealogy Project identifica a Lagrange como su asesor, pero esto puede ser una mera simplificación);
mientras que Pierre-Simon Laplace, que estaba atento a los pasos de Poisson, lo consideraba casi como
su hijo. El resto de su carrera, hasta su muerte en Sceaux cerca de París, casi fue ocupado totalmente
por la composición y publicación de sus numerosas obras y en el cumplimiento de los deberes de los
numerosos puestos educativos para los que fue nombrado sucesivamente.
Fuente: BERMISON ORTEGA, Russell Frank. (2006). François Arago (1786–1853) attributed to
Poisson the quote: "La vie n'est bonne qu'à deux choses: à faire des mathématiques et à les professer."
(Life is good for only two things: to do mathematics and to teach it.) See: J.-A. Barral, ed., Oeuvres
complétes de François Arago ..., vol. II (Paris, France: Gide et J. Baudry, 1854), page 662.

DISTRIBUCIÓN
BINOMIAL, POISSON

Propósito:
 Explica y diferencia las principales distribuciones de probabilidad para variables aleatorias discretas.
 Aplica e interpreta las distribuciones de probabilidades para variables aleatorias discretas en el
desarrollo de prácticas y ejercicios.

SESIÓN 27: DISTRIBUCIÓN BINOMIAL, POISSON.

1. DISTRIBUCIÓN BINOMIAL.

Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los siguientes
requisitos:
 El procedimiento tiene un número fijo de ensayos.

113
Gestión Curricular
Asignatura: Estadística general

 Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las
probabilidades de los demás ensayos).
 Todos los resultados de cada ensayo deben estar clasificados en dos categorías (generalmente llamadas éxito
y fracaso).
 La probabilidad de un éxito permanece igual en todos los ensayos.
El desarrollo de este tema, implica comprender previamente los siguientes conceptos:
a) Notación factorial.
Se utiliza para representar las operaciones de multiplicación secuencial.
Su desarrollo significa el producto ordenado de los números enteros positivos, desde el que indica el signo
factorial, hasta llegar a 1.
Ejemplo:
Tres factorial 3 !=3 x 2 x 1=6
Cinco factorial 5 !=5 x 4 x 3 x 2 x 1=120
. .
. .
N factorial N != ( N )( N −1 ) ( N −2 ) … . x 2 x 1
Por definición:
0 !=1
1 !=1
b) Combinaciones.
Es un método que nos permite agrupar un conjunto de elementos en diferentes formas sin considerar el
orden de colocación.
n!
C n=
x x ! ( n−x ) !

Ejemplo:
De un equipo multidisciplinario, formado por un economista, un sociólogo, un antropólogo. ¿Cuántos
comités de dos profesionales pueden formarse?
Solución
Según datos:
n = 3, x = 2
Luego la cantidad de comités a formarse, serían:
3! 3x 2x 1 6
C 3= = = =3
2 2 ! ( 3−2 ) ! ( 2 x 1 )( 1 ) ! 2
Se pueden formar 3 comités, que serían:
Primer comité : Economista, Sociólogo.
Segundo comité : Sociólogo, Antropólogo.
Tercer comité : Economista, Antropólogo.
c) Cálculo de probabilidades mediante la distribución binomial.
La distribución binomial se utiliza para calcular probabilidades de variables discretas.

114
Gestión Curricular
Asignatura: Estadística general

Se aplica en aquellos experimentos aleatorios que tienen sólo dos resultados mutuamente excluyentes.
Ejemplos:
EXPERIMENTO ALEATORIO RESULTADOS POSIBLES
1) Lanzamiento de una moneda al aire. Cara o sello
2) Nacimiento de un ser humano con respecto al varón o mujer
sexo.
3) Estado de salud de una persona. Sano o enfermo
4) Situación ocupacional de una persona. Ocupado o desocupado

Estos experimentos con resultados Dicotómicos, se le conoce con el nombre de ensayo de BERNOULLI,
en honor al científico que lo descubrió.
d) Requisitos de una distribución de probabilidad binomial.
 El procedimiento tiene un número fijo de ensayos.
 Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las
probabilidades de los demás ensayos).
 Todos los resultados de cada ensayo deben clasificar en dos categorías (generalmente llamadas
éxito y fracaso)
 La probabilidad de un éxito permanece igual en todos los ensayos.
e) Notación para la distribución de probabilidad binomial.
Al llevar a cabo un experimento aleatorio, siempre estamos interesados en que suceda uno de los dos
resultados, si el resultado que esperábamos efectivamente sucede, diremos que hubo ÉXITO. Si el
resultado que esperábamos no sucede, entonces diremos que hubo FRACASO. Estos dos resultados, se
designan en términos de probabilidad, como p y q.
Es decir:
RESULTADOS PROBABILIDA
D
ÉXITO p PROBABILIDAD DE
ÉXITO

FRACASO q PROBABILIDAD DE
FRACASO
Dónde: p+q=1
Si E y F (éxito y fracaso) denotan las dos categorías posibles de todos los resultados.
Entonces:

Ejemplo:
Supongamos que en la comunidad “x”, hemos encontrado a través de una muestra, que el 30% de la
población en edad activa, se encuentran desempleados y el 70% tenía empleo.
En este experimento esperamos como éxito que la población tenga empleo, y como fracaso que la
población esté desempleada, por lo tanto:
EVENTOS RESULTADO PROBABILIDAD
S
Empleados Éxito p = 0.70
Desempleados Fracaso q = 0.30
Total p + q = 1.00

115
Gestión Curricular
Asignatura: Estadística general

Podemos decir entonces: Si seleccionamos una persona al azar de esta población, la probabilidad de que se
encuentre con empleo es de 0.70, y de que se halle desempleado es de 0.30.
Pero si seleccionamos dos personas al azar de esta población, una después de otra, según el orden de
extracción podemos obtener:
Personas seleccionadas:
PRIMERA SEGUNDA
Ocupada Ocupada
Ocupada Desocupada
Desocupada Ocupada
Desocupada Desocupada

Y podemos calcular las probabilidades de que:


 Las dos personas estén ocupadas.
 Una esté ocupada y la otra desocupada.
 Una esté desocupada y la otra ocupada.
 Las dos personas estén desocupadas

Estas probabilidades lo presentamos en el siguiente cuadro:

APARICIÓN DEL
PROBABILIDAD DEL RESULTADO
RESULTADO
PRIMER
SEGUNDA SIMBÓLIC
SELECCIÓ LITERAL NÚMERICA
SELECCIÓN A
N
Ocupado Probabilidad que las dos 2
Ocupado
personas estén ocupadas p . p= p (0.70)(0.70)=0.49
Ocupado Probabilidad que la 1ª
Desocupado persona esté ocupada y la p.q (0.70)(0.30)=0.21
2ª desocupada
Desocupado Probabilidad que la 1ª
Ocupado persona este desocupada y q. p (0.30)(0.70)=0.21
la 2ª ocupada
Desocupado Probabilidad de que las
2
Desocupado dos personas estén q . q=q (0.30)(0.30)=0.09
desocupadas
Al sumar la probabilidad simbólica y numérica, observamos que se trata de una expansión binomial, así:
SIMBÓLIC 2 2 2 2 2
p + pq+qp+ q ¿ p +2 pq+ q ¿ ( p+q )
A:
NÚMERICA 0.49+0.21+ 0.21+ 0.09 ¿ 0.49+2 ( 0.21 ) +0.09 ¿(0.70+0.30)
2
:
Expansión binomial Binomio
El binomio esta elevado al exponente 2, porque se trata de 2 ensayos o 2 selecciones.
Esto quiere decir que, si el número de ensayos o selecciones se incrementan, el exponente será mayor.
Por ejemplo, si seleccionamos 5 personas al azar, entonces tendríamos:

( p+q )5=( 0.70+ 0.30 )5

116
Gestión Curricular
Asignatura: Estadística general

Y si quisiéramos hallar la probabilidad de que las 5 personas estén ocupadas, sería sumamente laborioso
desarrollar la expansión binomial.
Para ello existe una fórmula que nos ayuda a simplificar cualquier valor específico de probabilidad.

f) Fórmula General para calcular las Probabilidades Binomiales.


n x n! x
p ( x )=P ( X=x )=C p q (n− x )= . p q( n−x )
x x ! ( n−x ) !
Donde:
p ( x )= probabilidad de obtener x éxitos
n=amplitud de la muestra o número de ensayos
x=resultado de que se desea obtener o éxitos
p= probabilidad de que el evento deseado ocurra , o probabilidades de éxito
q= probabilidad de que el evento deseado no ocurra , o probabilidad de fracaso

Ejemplo:
Supongamos en la comunidad “x”, donde a través de una muestra se encontró que el 30% de la población
en edad activa estaba desempleada. Calcular la probabilidad de seleccionar dos personas ocupadas en
esta población.
Solución
Según datos del problema:
n=2 entonces p = 0.70
x=2 personas ocupadas q = 0.30
Aplicando la fórmula:
n! x
p ( x )= . p q(n −x )
x ! ( n−x ) !
2! 2 0
p ( x=2 )= . (0.70) (0.30)(2−2)=(0.49)(0.30)
2 ! ( 2−2 ) !
p ( x=2 )=0.49
La probabilidad de seleccionar dos personas ocupadas de esta población, es de 49%. (coincide con el
resultado de la tabla anterior).

g) La media, varianza y desviación estándar:

La media, varianza y desviación estándar de la variable aleatoria binomial son, respectivamente:

μ=n . p 2
σ =n . p . q σ =√ n . p . q

2. DISTRIBUCIÓN POISSON.

117
Gestión Curricular
Asignatura: Estadística general

Una distribución de probabilidad Poisson resulta de un procedimiento que cumple con todos los siguientes
requisitos:
 El experimento consiste en contar el número “x” de veces que ocurre un evento en particular durante una
unidad de tiempo dada, o en un área o volumen dado.
 La probabilidad de que un evento ocurra en una unidad dada de tiempo, área o volumen es la misma para
todas las unidades.
 El número de eventos que ocurren en una unidad de tiempo, área o volumen es independiente del número de
los que ocurren en otras unidades.
 El número medio (o esperado) de eventos en cada unidad se denota por la letra griega (“lambda”) ( λ )
2.1. Introducción.
La distribución de Poisson se usa para modelar situaciones en la que el número de pruebas es muy grande y
el número de éxitos es muy pequeño, situaciones en las que hay ocurrencias aleatorias de sucesos por
unidad de espacio o tiempo, y en donde se desea conocer la probabilidad de un número específico de éxitos.
El intervalo de tiempo dado puede ser de cualquier duración, por ejemplo, un minuto, un día, una semana,
etc. Así la variable aleatoria x puede representar el número de llamadas telefónicas por hora, el número de
pacientes fallecidos en un día determinado. El espacio podría ser un segmento de línea, un área o volumen,
un pedazo de material. Así, x podría representar el número de bacterias en un determinado campo de
cultivo.
2.2. El proceso de Poisson.
Las siguientes proposiciones describen lo que se conoce como proceso de Poisson:
a) Las ocurrencias de los eventos son independientes.
b) Teóricamente, debe ser posible un número infinito de ocurrencias del evento en el intervalo.
c) La probabilidad de una ocurrencia del evento en un intervalo dado es proporcional a la longitud del
intervalo.
La distribución de probabilidad de Poisson está dada por:
−λ x
( ) e .λ
p x=
x!
x=0 , 1 , 2, …
Donde:
x=¿ número de ocurrencias cuya probabilidad se desea conocer.
e=¿ constante matemática = 2,71828.
λ=¿número promedio de ocurrencias por unidad de tiempo o espacio.
2.3. La media y varianza:

La media y varianza de la variable aleatoria Poisson son respectivamente:


2
μ= λ σ =λ
Ejemplo:
La oficina de estadística del hospital ESSALUD ha estudiado el número de muertes debido a una cierta
enfermedad y ha llegado a la conclusión de que éstas están distribuidas de acuerdo con la ley de Poisson.
Los registros del hospital revelan que, durante este período, el número de muertes ha sido en promedio, de

118
Gestión Curricular
Asignatura: Estadística general

3 por día. Si dicha oficina está en lo cierto, al suponer una distribución de Poisson, hallar la probabilidad de
que:
a) En un día dado, mueran exactamente 2 pacientes con esa enfermedad.
b) En un día particular, nadie muera de la enfermedad.
c) En un día particular, mueran 3 ó 4 pacientes.
Solución
Sea:
x=¿ el número de pacientes fallecidos debido a la enfermedad
λ=¿ número promedio de muertes = 3 por día
a) En un día dado, mueran exactamente 2 pacientes con esa enfermedad.
−3 2
e .3 0 , 05 x 9
p ( x=2 )= = =0,225
2! 2 x1
La probabilidad de que mueran 2 pacientes es de 22,5%
b) En un día particular, nadie muera de la enfermedad.
−3 0
e . 3 0 ,05 x 1
p ( x=0 ) = = =0 ,05
0! 1
La probabilidad de que nadie muera es del 5%
c) En un día particular, mueran 3 ó 4 pacientes.
−3 3 −3 4
e .3 e . 3 0 , 05 x 27 0 , 05 x 81 =0,225+0,16875=0 , 39
p ( x=3 ) + p ( x=4 )= + = +
3! 4! 3 x 2x 1 4 x 3x 2 x1
La probabilidad de que mueran 3 ó 4 pacientes es de 39%

Problemas Desarrollados

Distribución binomial

1. Utilice la fórmula de probabilidad binomial para calcular la probabilidad de x éxitos, dada la probabilidad p
de éxito en un solo ensayo si:
3
n=12 , x=10 , p= =0.75
4
Utilizando la fórmula, hallamos:
Si: n=12 , x=10 , p=3 /4=0.75 , q=0.25
Remplazando en la fórmula:
n! x
p ( x )= . p q(n −x )
x ! ( n−x ) !
12 ! 10 12 x 11 x 10 ! 10 2
p ( 10 )= .(0.75) ( 0.25)(12−10 )= .(0.75) (0.25)
10 ! ( 12−10 ) ! 10 ! .2!
12 x 11 10 2
p ( 10 )= .(0.75) (0.25) =66 ( 0.06 ) ( 0.06 ) =66 ( 0.0036 ) =0.24=24 %
2!

119
Gestión Curricular
Asignatura: Estadística general

2. La probabilidad de que un cliente potencial de la pastelería “PARIS”, elegido al azar, realice una compra es
de 0,20. Si su agente de ventas visita a 6 clientes, ¿cuál es la probabilidad de que realice exactamente 4
ventas?

Éxito Cliente que realiza la compra


Probabilidad de éxito (p) 0,20
Probabilidad de fracaso (q) 0,80
Número de ensayos (n) 6
Número de éxitos en los “n” ensayos (x) 4

Solución
n x ( n−x ) n! x
Remplazando los datos en la fórmula p ( x )=C p q = . p q (n−x )
x x ! ( n−x ) !
6 4 6! 4
p ( 4 )=C . ( 0 , 20 ) .(0 , 80)(6 −4)= . ( 0 , 20 ) .(0 , 80)(6−4 )
4 4 ! ( 6−4 ) !
p ( 4 )=0,0154=1.54 %
3. Suponiendo que la probabilidad de que un automovilista respete la luz verde es de 0.75, utilice la fórmula
de probabilidad binomial para calcular la probabilidad de obtener exactamente 3 automovilistas que
respeten la luz verde cuando va a cambiar de luz 5 segundos antes.
Solución
Calculamos, p(3) dado que n = 5
Si: x = 3 p = 0.75 q = 0.25
Remplazando en la fórmula:
n! x
p ( x )= . p q(n −x )
x ! ( n−x ) !
5! 3 5 x 4 x 3! 3
p ( 3 )= .(0.75) (0.25)(5−3 )= .(0.75) (0.25)( 2)=10.(0.42)(0.06)
3 ! ( 5−3 ) ! 3 ! ( 2) !
p ( 3 )=( 10 )( 0.025 )=0.25=25 %
Los 3 automovilistas que respeten la luz verde cuando va a cambiar de luz 5 segundos antes representa un
25%.

Distribución de Poisson.

1. En tiendas “EFE”, en la sección de electrodomésticos, unos promedios de 12 personas por hora le hacen
preguntas al encargado. ¿Cuál es la probabilidad de que exactamente 3 personas se acerquen al encargado a
hacer preguntas en un periodo de 10 minutos?

Media () 12 personas en una hora 2 personas en 10 minutos

Número de eventos esperados 3 personas en 10 minutos 3 personas en 10 minutos

120
Gestión Curricular
Asignatura: Estadística general

(x)

Utilizando la fórmula:
−λ x
e .λ
p ( x )=
x!

−5 3
e .5
p ( 3 )= =0,1404=14.04 %
3!

Problemas Propuestos

Distribución binomial
1. Utilice la fórmula de probabilidad binomial para calcular la probabilidad de x éxitos, dada la probabilidad p de
éxito en un solo ensayo.
a) n=20 , x =4 , p=0.15
b) n=9 , x=2 , p=0.35

2. Se tiene información que, en la comisaria de Huancayo, el 25% de los detenidos se encuentran allí por delitos
menores. Se selecciona una muestra aleatoria de 20. ¿Cuál es la probabilidad de que el número de detenidos por
delitos menores en esa muestra sea 4?
3. Se sabe que en el Centro de Huancayo el 70% de los establecimientos comerciales pequeños no entregaban
boleta al momento de efectuar una transacción económica. ¿Cuál es la probabilidad de que, en una muestra de 15
negocios, a lo más la mitad entregue boleta?
4. La probabilidad de que una persona se muera por consumir bebidas alcohólicas es 0.4. Después de un estudio
realizado en un sector de Huancayo, se conoce que a la semana 30 personas consumen bebidas alcohólicas, cual
es la probabilidad que:
a) Sobrevivan al menos 14 personas
b) Sobrevivan exactamente 5
c) Cuantos, en promedio, sobrevivirán
d) ¿Cuál es la varianza de la v.a. en cuestión?
5. La encargada de los préstamos del banco “BBVA CONTINENTAL” estima, con base en sus años de
experiencia, que la probabilidad de que un solicitante no sea capaz de pagar su préstamo es 0.035. El mes pasado
realizó 45 préstamos. ¿Cuál es la probabilidad de que 3 préstamos no sean pagados oportunamente?

Distribución de Poisson

121
Gestión Curricular
Asignatura: Estadística general

1. La central telefónica de una empresa recibe un promedio de 3,5 órdenes de pedido por hora. Estas ocurrencias se
producen al azar. ¿Cuál es la probabilidad de que se produzcan exactamente 4 llamadas en una hora dada?

2. Se sabe que el número promedio de camiones-tanque de aceite que llegan por día al puerto del Callao, es 10. las
instalaciones del puerto pueden atender cuándo más a 15 camiones-tanque en un día. ¿Cuál es la probabilidad de
que en un determinado día se tengan que regresar los camiones?

3. El número promedio de Buses que llegan cada día al Terminal Terrestre de Huancayo es 11. Las facilidades que
tiene el Terminal hace a que pueden manejar hasta 22 buses por día. ¿Cuál es la probabilidad de que en un día
dado se tenga que rechazar el ingreso de buses al Terminal Terrestre de Huancayo?

4. En Caja Centro se analiza la cantidad de clientes que se atiende en las ventanillas, se obtuvo que la cantidad de
clientes promedio que se atiende en esta institución financiera en un lapso de 30 minutos es de 10 clientes. ¿Cuál
es la probabilidad de que se atiendan a 7 clientes en 20 minutos?

5. En una investigación realizada en Huancayo, se ha determinado que el número de muertes debido a accidentes
de tránsito ha sido en promedio 4 por en dos meses. Suponiendo que el número de muertes sigue una
distribución de Poisson, hallar la probabilidad de que en un determinado mes mueran 3 personas.

Video de Apoyo

Video 1: Distribución binomial. Ejercicio resuelto paso a paso


(https://www.youtube.com/watch?v=EMRag5uvqBA)

Video 2: Distribución de Poisson


(https://www.youtube.com/watch?v=7syhMJhzNOc)

122
Gestión Curricular
Asignatura: Estadística general

Semana 15
DISTRIBUCIÓN NORMAL

La distribución normal o distribución gaussiana es una de las distribuciones


teóricas mejor estudiadas y más utilizadas en los diferentes campos de la
investigación. Carl Gauss formuló la ecuación de la curva normal, de ahí que
también se le conoce, más comúnmente, como la "Campana de Gauss".

Abraham
de Moivre
Distribución
gaussiana
en música
Lannis
Xenakis

A. Abraham de Moivre
La distribución normal fue presentada por primera vez por Abraham de Moivre en un artículo del año
1733,5 que fue reimpreso en la segunda edición de su The Doctrine of Chances, de 1738, en el contexto
de cierta aproximación de la distribución binomial para grandes valores de n. Su resultado fue ampliado
por Laplace en su libro Teoría analítica de las probabilidades (1812), y en la actualidad se llama
Teorema de De Moivre-Laplace.

123
Gestión Curricular
Asignatura: Estadística general

DISTRIBUCIÓN NORMAL
LECTURA

La distribución normal fue presentada por primera vez por Abraham de Moivre en un artículo del año 1733, 5 que
fue reimpreso en la segunda edición de su The Doctrine of Chances, de 1738, en el contexto de cierta
aproximación de la distribución binomial para grandes valores de n. Su resultado fue ampliado por Laplace en su
libro Teoría analítica de las probabilidades (1812), y en la actualidad se llama Teorema de De Moivre-Laplace.

Laplace usó la distribución normal en el análisis de errores de experimentos. El importante método de mínimos
cuadrados fue introducido por Legendre en 1805. Gauss, que afirmaba haber usado el método desde 1794, lo
justificó rigurosamente en 1809 asumiendo una distribución normal de los errores. El nombre de Gauss se ha
asociado a esta distribución porque la usó con profusión cuando analizaba datos astronómicos 6 y algunos autores
le atribuyen un descubrimiento independiente del de De Moivre. 7Esta atribución del nombre de la distribución a
una persona distinta de su primer descubridor es un claro ejemplo de la ley de Stigler.

El nombre de "campana" viene de Esprit Jouffret que usó el término "bell surface" (superficie campana) por
primera vez en 1872 para una distribución normal bivariante de componentes independientes. El nombre de
"distribución normal" fue otorgado independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis
hacia 1875.[cita requerida] A pesar de esta terminología, otras distribuciones de probabilidad podrían ser más
apropiadas en determinados contextos; véase la discusión sobre incidencia,

Fuente: Estadística Básica. ITM. 2007. ISBN 9789589831410. Consultado el 12 de diciembre de 2017.
Orrego, Juan José Manzano (2014). LOGISTICA DE APROVISIONAMIENTO. Ediciones Paraninfo,
S.A. ISBN 9788497329811. Consultado el 12 de diciembre de 2017.
Gómez-Chacón, Inés Ma; Català, Claudi Alsina; Raig, Núria Planas; Rodríguez, Joaquim Giménez;
Muñoz, Yuly Marsela Vanegas; Sirera, Marta Civil (4 de octubre de 2010). Educación matemática y
ciudadanía. Grao. ISBN 9788499801667. Consultado el 12 de diciembre de 2017.

DISTRIBUCIÓ
N NORMAL

Propósito:
 Identifica el tipo de variable aleatoria y construye la distribución de la función de probabilidad.

124
Gestión Curricular
Asignatura: Estadística general

SESIÓN 1: DISTRIBUCIÓN NORMAL

1. Introducción.
Si se tiene una muestra grande de valores que corresponden a variables continuas, como por ejemplo el peso en
kg de 44 recién nacidos en un hospital, para el análisis de la información se procedería a tabularlos a través de
una distribución de frecuencias y su gráfico correspondiente, el histograma, tal como se muestra a continuación:
HOSPITAL “X”
Distribución de frecuencias de recién nacidos por peso
Peso (en kg) Frecuencia
(cantidad)
1.00 – 1.99 4
2.00 – 2.99 10
3.00 – 3.99 20
4.00 – 4.99 8
5.00 – 5.99 2
Total 44
Histograma de la distribución de frecuencias de recién nacidos por peso.

Analizando los datos en el histograma, observamos que, con respecto al peso de los recién nacidos, existen:
a) Pocos niños con bajo peso al nacer (4 niños tienen entre 1 y 2 kg de peso)
b) La mayoría de recién nacidos, tienen peso medio (20 niños tienen entre 3 y 4 kg de peso)
c) Pocos niños tienen sobrepeso al nacer (2 niños tienen entre 5 kg y 6 kg de peso)
Esta distribución de datos se llama “NORMAL” y se presenta en múltiples mediciones de la vida real.
Si unimos, mediante una curva los puntos medios de cada rectángulo en el histograma, se obtiene el siguiente
gráfico.

A esta curva se le conoce con el nombre de “CURVA NORMAL” o también “CAMPANA DE GAUSS”.

125
Gestión Curricular
Asignatura: Estadística general

Es importante por que posibilita el cálculo de probabilidades, a través de áreas comprendidas bajo la curva
normal.
Una distribución asume la forma de la curva normal conforme el tamaño de la muestra aumenta (es decir, cuando
se usa gran cantidad de datos)
La representación gráfica de la distribución normal, corresponde a la siguiente función:

( )
2
−1 x−μ
1 2 σ
f ( x )= .e
σ √2 π
Donde:
x=variable independiente , cuyos valores asumidos van desde−∞ hasta+∞
μ=media poblacional
x−μ=desvio
σ =desviación típica
f ( x )=densidad de probabilidad
e=2.718
π=3.1416
Por lo tanto, podemos sostener que:

2. Definición.
La distribución normal es una de las distribuciones más utilizadas, que permiten calcular probabilidades para
variables continuas.
Muchas poblaciones tienen distribución normal o pueden ajustarse muy bien a ella.
Ejemplos:
 Estatura, peso y otras características físicas.
 Errores de medición en experimentos científicos
 Tiempos de reacción en experimentos psicológicos
 Mediciones de inteligencia y aptitud.
 Calificaciones en diversas pruebas.
 Muchas medidas e indicadores económicos.

Sin embargo, el cálculo de probabilidades, no es posible en cualquier curva normal, en consideración a lo


siguiente:
La distribución normal queda perfectamente determinada, conociendo dos parámetros:

126
Gestión Curricular
Asignatura: Estadística general

a) La media o promedio de la población ( μ), que fija la posición de la curva respecto al eje x.
b) La desviación estándar (σ ), que determina la forma (dispersión) de la curva.
 A menos dispersión (σ ), la curva será más estrecha y puntiaguda;
 A mayor dispersión (σ ), la curva será más aplanada y desplazada.
De acuerdo a ello, se puede presentar los siguientes casos:

μ1 μ 2 μ3
Observamos en este gráfico que las 3 curvas normales tienen idéntica dispersión, pero distintas medias.

μ1
μ2
μ3

Observamos en este gráfico que las 3 curvas normales tienen distintas dispersión, pero igual medias.
Esto significa que cada curva normal tiene su propia distribución, lo que hace imposible el cálculo de
probabilidades. Por lo tanto, se hace necesario que la curva normal así obtenida se trasforme en una CURVA
NORMAL TIPIFICADA.

3. Curva Norma Tipificada (estándar, o reducida).


Con el fin de suprimir la individualidad de cada una de las distribuciones señaladas gráficamente, se convierte a
la curva normal, en un modelo matemático con características fijas y definidas y así se hace posible el cálculo de
probabilidades.
Este proceso se conoce con el nombre de TIPIFICACIÓN DE LA CURVA NORMAL, para lo cual se supone:
La media o promedio de la población es cero : μ=0
La desviación standard es igual a uno: σ =1
La variable independiente x se transforma en un valor “z” que se calcula mediante la fórmula:
x−μ
z=
σ
Gráficamente la tipificación de la curva normal, sería:

127
Gestión Curricular
Asignatura: Estadística general

σ
σ =1
μ
μ=0
CURVA NORMAL CURVA NORMAL TIFICADA

Observamos en el gráfico que la variable “x” se ha trasformado en z; la μ se ha igualado a cero, por lo tanto los
valores de z hacia la derecha son positivos y hacia la izquierda negativos; la desviación standard se trasforma en
valor de 1, lo que significa que la dispersión o todo el área debajo de la curva normal tiene un valor de 1 (100%)
que es el valor máximo que asume la probabilidad.
3.1. Características de la curva normal tipificada.
 Es simétrica respecto a su media (50% a la derecha y 50% a la izquierda).
 Es asintótica respecto a z (es decir, no cruza la línea z)
 El área total encerrada es 1 ó 100%
 La media, mediana y moda son iguales.
3.2. Cálculo de áreas bajo la curva normal tipificada.
Para calcular probabilidades, es necesario calcular las áreas bajo la curva normal tipificada. Esto se obtiene
trasformando la variable x en variable tipificada z cuyo valor se ubican en la primera fila superior y en la
primera columna de la izquierda de la tabla adjunta.
En el interior de la tabla se encuentran las áreas o probabilidades desde z = 0 hasta cualquier valor de z.
Los diferentes casos que se pueden presentar sólo consisten en sumar o restar áreas.
Es necesario que Ud. tenga en cuenta que toda el área bajo la curva normal tipificada tiene un valor de 1 ó
100%, y cada mitad 0.50 ó 50%.

0.50 =50% 0.50 =50%

Ejemplo 1:
Determinar el área bajo la curva normal para valores de z entre:
z=0 y z=1.8 (es decir 0 ≤ z ≤ 1.8).
Solución
Construyendo el gráfico del área pedida.

Área pedida

128
Gestión Curricular
Asignatura: Estadística general

En la tabla, ubicaremos el valor de z con un entero y un decimal (1.8) en la primera columna de la


izquierda; y el segundo decimal (0) lo ubicaremos en la primera fila superior, de la siguiente manera.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.000 0.004 0.008 0.012 0.016 0.019 0.023 0.027 0.031
0.0 0.0359
0 0 0 0 0 9 9 9 9
0.039 0.043 0.047 0.051 0.055 0.059 0.063 0.067 0.071
0.1 0.0753
8 8 8 7 7 6 6 5 4
. .
. .
0.455 0.456 0.457 0.458 0.459 0.459 0.460 0.461 0.462
1.7 0.4633
4 4 3 2 1 9 8 6 5
0.464 0.464 0.465 0.466 0.467 0.467 0.468 0.469 0.469
1.8 0.4706
1 9 6 4 1 8 6 3 9

Por lo tanto 0.4641 es el área pedida, o también podemos decir que la probabilidad de que z esté
comprendida entre 0 y 1.8, es:
p ( 0 ≤ z ≤1.8 )=0.4641=46.41 %

Ejemplo 2:
Los coeficientes de inteligencia (CI) de un grupo de estudiantes, tienen aproximadamente una
distribución normal, con una media de 100 y una desviación típica de 10. Se pide:
a) Hallar la proporción de estudiantes con CI mayores que 125.
b) ¿Cuál es la probabilidad de que un estudiante elegido al azar entre los de esa población, tenga una CI
entre 105 y 115?
Solución
Sea: x = coeficiente de inteligencia.
Donde: μ=100 σ =10
a) Se pide: p ( x ≥ 125 )
Graficando:

129
Gestión Curricular
Asignatura: Estadística general

σ =10 σ =1
Área Pedida

Tipificando la curva σ =10, μ=100 , x se transforma en z, se tiene:


x−μ 125−100
z= = =2.5
σ 10
Luego, el problema se reduce a calcular: p ( x ≥ 125 )= p( z ≥ 2.5)

ÁREA PEDIDA = ÁREA PARA (z ≥0) – ÁREA ENTRE (z=0 y z=2.5)


0.50 0.4938

p ( x ≥ 125 )= p( z ≥ 2.5)=0.50−0.4938=0.0062
p ( z ≥ 2.5 )=0.62%
Entonces:
La población de pacientes con CI mayores que 125, es de 0.62%
b) Se pide: p(105 ≤ x ≤ 115)
Graficando:
AREA PEDIDA

σ =10

Tipificando la curva (σ =1 , μ=0 , x se transforma en z), se tiene:


No pide hallar: p(105 ≤ x ≤ 115)

Se estandariza la variable x a través de:


x−μ 105−100
Para x = 105, entonces: z 1= = =0.5
σ 10
x−μ 115−100
Para x = 115, entonces: z 2= = =1.5
σ 10
Luego el problema se reduce a calcular:
p(0.5 ≤ z ≤ 1.5)

130
Gestión Curricular
Asignatura: Estadística general

ÁREA PEDIDA = ÁREA ENTRE (z = 0 y z =1.5) - ÁREA ENTRE (z = 0 y z = 0.5)

0.4332 0.1915

Buscando los valores de 1.5 y 0.5 en la tabla se tiene:


ÁREA PEDIDAD = 0.4332 – 0.1915 = 0.2417
p ( 0.5 ≤ x ≤1.5 )=24.17 %
Entonces:
La probabilidad de que un paciente tenga entre 105 y 115 de CI es de 24.17%

Tabla de Distribución Normal Estandarizada

131
Gestión Curricular
Asignatura: Estadística general

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
4.0 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000

Problemas Desarrollados

1. Determinar el área bajo la curva normal para valores de z entre: z = 0 y z = -1.8 (es decir: −1.8 ≤ z ≤ 0
Solución
Construyendo el gráfico del área pedida.

132
Gestión Curricular
Asignatura: Estadística general

Área pedida

Como se puede observar, en la tabla no existen valores negativos de z, por lo tanto siempre que aparezcan
valores negativos de z, se obvia el signo para buscar su valor en la tabla.
El resultado en este caso es el mismo que el ejemplo anterior debido a que la curva normal tipificada es
simétrica.
p (−1.8 ≤ z ≤ 0 )=0.4641=46.41 %
2. Determinar el área bajo la curva normal para valores a la derecha de
z=−1.15 (es decir: z ≥−1.15).
Solución
Construyendo el gráfico del área pedida.

Área pedida

Esto quiere decir:


ÁREA PEDIDA = ÁREA ENTRE: + ÁREA PARA
z=−1.15 y z=0 z≥0
Gráficamente:

En la tabla, ubicamos el número entero con un decimal (1.1) en la primera columna de la izquierda, y el
segundo decimal (5)z=−1.15
lo ubicamos
y en
z=0la primera fila superior,0.50
de la siguiente manera:
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.000 0.004 0.008 0.012 0.016 0.019 0.023 0.027 0.031
0.0 0.0359
0 0 0 0 0 9 9 9 9
. .
. .
0.364 0.374
1.1
3 9
Luego:
ÁREA PEDIDA = 0.3749 + 0.50 = 0.8749
ÁREA PEDIDA = p ( z ≥−1.15 )=0.8749=87.49 %

133
Gestión Curricular
Asignatura: Estadística general

3. Determinar el área bajo la curva normal, para valores entre z = 0.92 y z = 2.84
(es decir: 0.92 ≤ z ≤ 2.84)
Solución
Construyendo el gráfico del área pedida.

Área pedida

Para obtener está área, es necesario hacer una diferencia:


ÁREA PEDIDA = ÁREA ENTRE: - ÁREA ENTRE:
. z=0 y z=2.84 z=0 y z=0.92
Gráficamente sería:

Ubicamos los valores de z = 0.92 y z = 2.84 en la tabla, de la misma forma que en los ejemplos anteriores.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
Luego:
ÁREA PEDIDA = 0.4977 – 0.3212 = 0.1765
También: p ( 0.92 ≤ z ≤2.84 )=0.1765=17.65 %

Problemas Propuestos

1. Hallar el área bajo la curva normal para los siguientes valores de z:


a) Entre: z = 0.5 y z = 1.5
b) A la derecha de z = -0.86
c) Entre z = -0.58 y z = -1.86

134
Gestión Curricular
Asignatura: Estadística general

d) A la derecha de z = 1.84
e) Entre z = 1.97 y z = 0.56
2. Calcule el valor de "z" para las probabilidades (área a la izquierda):
a) Probabilidad de 0.7734
b) Probabilidad de 0.9871
c) Probabilidad de 0.4013
d) Probabilidad de 0.9505
e) Probabilidad de 0.1251
3. Calcule la probabilidad acumulada a la izquierda de:
a) z1 ≤ 2,1564
b) z1 ≤ - 1,6851
4. Calcule el valor “z” que corresponde en cada caso y determine las probabilidades y grafique en:
a) Áreas de construcción: μ = 150 m2 ; σ = 1,03 m2. ; x = 148,6 m2. P(x<148.6) = ?
b) Distancia recorrido por un auto: μ = 25 Km.; σ = 2,2 Km.; x = 22,8 Km. P(x>22,8) = ?
c) Tiempo de almorzar: μ = 38 min.; σ = 4,3 min.; x = 47,675 min. y x = 30,131 min. P(30,131<x<47,675) = ?
d) Tiempo en llegar a la universidad desde su casa: μ = 45 min; σ = 3,8 min. ; x = 39,4 min. y
x = 51,4 min. ¿Cuál es la probabilidad entre esos dos tiempos?
e) Se tiene una probabilidad de 0.9842, μ = 37 litros; σ = 3,2 litros. ¿Cuánto vale x?
5. El promedio de talla de los estudiantes es de 1.58 m. con una desviación estándar de 3.25 m. Si seleccionamos a
un estudiante al azar, determine las siguientes probabilidades:
a) que mida a lo más 1.65 m
b) que mida entre 1.45 y 1.78 m
c) que mida al menos 1,48 m

Video de Apoyo

Video 1: Distribución Normal - Ejercicios Resueltos - Nivel 1


(https://www.youtube.com/watch?v=T7_ktqfVseU)

Video 2: Distribución Normal - Ejercicios Resueltos - Nivel 2


(https://www.youtube.com/watch?
v=VES8qjbKnJs&list=PL3KGq8pH1bFQrSms9uTOpPk0euoHnx7mK&index=3&t=0s)

135
Gestión Curricular
Asignatura: Estadística general

Semana 16
EVALUACIÓN FINAL

136
Gestión Curricular
Asignatura: Estadística general

Referencias bibliográficas

Díaz, A. (2013). Estadística aplicada a la administración y la economía. México D. F.: McGraw Hill.

INEI. (Mayo de 2006). Índice temático. Recuperado de: goo.gl/B4142e

Triola, M. (2013). Estadística. (11.a ed.). México D. F.: Pearson Education.

Universidad de Valladolid. (13 de abril de 2012). Probabilidad y estadística orientada a la economía y la empresa
[página web]. Recuperado de: goo.gl/41Ck0B

Pérez, C. (2012) Estadística Aplicada –IBM SPSS. España: Garceta grupo editorial.

Robert Johnson, Patricia Kuby. Estadística Elemental. Thomson Editorial. México 2002

137
Gestión Curricular
Asignatura: Estadística general

Ross, S. (2011). Probabilidad y Estadística para Ingenieros. 3a. ed. México: Mc Graw Hill, 2001.

138

También podría gustarte