Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Guía de Trabajo
1
Visión
Ser una de las 10 mejores universidades privadas del Perú al año 2020,
reconocidos por nuestra excelencia académica y vocación de servicio, líderes en
formación integral, con perspectiva global; promoviendo la competitividad del
país.
MISIÓN
Somos una universidad privada, innovadora y comprometida con el desarrollo del
Perú, que se dedica a formar personas competentes, íntegras y emprendedoras, con
visión internacional; para que se conviertan en ciudadanos responsables e
impulsen el desarrollo de sus comunidades, impartiendo experiencias de
aprendizaje vivificantes e inspiradoras; y generando una alta valoración mutua
entre todos los grupos de interés.
Universidad Continental
Material publicado con fines de estudio
Código: ASUC01275
2
Gestión Curricular
Asignatura: Estadística general
Presentación
RESULTADO DE APRENDIZAJE
Al finalizar la asignatura, el estudiante será capaz de analizar información utilizando los métodos y técnicas de
la estadística descriptiva y probabilidad, para brindar información que sirva para la toma de decisiones.
Distribuciones
Introducción, tipos de Medidas resumen o Distribuciones de
bidimensionales y
distribuciones y gráficos descriptivas probabilidad
gráficos comparativos
Resultado de
Resultado de Resultado de Resultado de
Aprendizaje:
Aprendizaje: Aprendizaje: Aprendizaje:
Al finalizar la unidad, el
Al finalizar la unidad, el Al finalizar la unidad, el Al finalizar la unidad, el
estudiante será capaz de
estudiante será capaz de estudiante será capaz de estudiante será capaz de
calcular e interpretar
utilizar distribuciones comparar e interpretar los calcular las medidas de
probabilidades en
unidimensionales y resultados de las tendencia central,
distribuciones discretas y
gráficos estadísticos para distribuciones variación, posición
continuas en
la interpretación de bidimensionales en relativa y deformación
acontecimientos
resultados estadísticos. acontecimientos de sus para interpretar datos
cotidianos de su carrera
actividades diarias. relacionados a su carrera
profesional.
profesional.
Introducción
La Asignatura de Estadística General pertenece al plan curricular de cursos generales, el cual se desarrolla
Gestión Curricular
Asignatura: Estadística general
dentro de la modalidad presencial, la presente guía - auto formativo material idóneo dentro de su formación
Universitaria.
La Estadística General está orientada a adquirir herramientas básicas para reforzar sus habilidades de inter
relación con la sociedad en todos sus ámbitos. Es así, a asignatura trata de aquellos temas que permite a los
estudiantes desarrollar sus habilidades lógicas y más importantes aún, aplicar lo aprendido en el ámbito
profesional y solucionar problemas del día a día.
De esta manera se desarrollará competencia general de aprendizaje autónomo, debidamente organizados y
sistematizados tomando en cuenta los principios pedagógicos, por ello en primer lugar se presenta la teoría
acompañados de ejemplos, de igual modo se muestran ejercicios desarrollados, ejercicios y problemas
plantados y finalmente la meta cognición de su aprendizaje.
Para el estudio la guía se sugiere la siguiente secuencia en cada resultado de aprendizaje:
Al finalizar la unidad I, el estudiante será capaz de utilizar distribuciones unidimensionales y
gráficos estadísticos para la interpretación de resultados estadísticos.
Al finalizar la unidad II, el estudiante será capaz de comparar e interpretar los resultados de las
distribuciones bidimensionales en acontecimientos de sus actividades diarias.
Al finalizar la unidad III, el estudiante será capaz de calcular las medidas de tendencia central,
variación, posición relativa y deformación para interpretar datos relacionados a su carrera
profesional.
Al finalizar la unidad IV, el estudiante será capaz de calcular e interpretar probabilidades en
distribuciones discretas y continuas en acontecimientos cotidianos de su carrera profesional.
Por tanto Ud. requiere de un conocimiento directo, práctico de la Estadística General que permita aplicar y
emprender nuevos retos, tomando casos prácticos de su entorno y logrando conocimientos de la Estadística
general a través de una aplicación objetiva, la motivación y nuevas metodologías para desarrollar y
consolidar su desarrollo universitario.
Los autores
Índice
Contenido
Unidad I....................................................................................................................................................1
Semana 1.....................................................................................................................................................2
INTRODUCCIÓN A LA ESTADÍSTICA..............................................................................................2
SESIÓN 1: INTRODUCCIÓN A LA ESTADÍSTICA...........................................................................4
1 DEFINICIÓN..............................................................................................................................4
2 UTILIDAD E IMPORTANCIA..................................................................................................4
3 CLASES DE ESTADISTICA......................................................................................................4
4 TERMINOS UTILIZADOS EN LA ESTADISTICA..................................................................5
Variable cualitativa nominal:...................................................................................................6
Variable cualitativa ordinal:.....................................................................................................6
4 REDONDEO DE DATOS:..............................................................................................................7
Semana 2...................................................................................................................................................12
SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUALITATIVAS.....14
1 ORGANIZACIÓN DE LOS DATOS........................................................................................14
2 DISTRIBUCIÓN DE FRECUENCIAS.....................................................................................14
3 CLASES DE FRECUENCIAS..................................................................................................14
1.1. FRECUENCIAS SIMPLES:......................................................................................................14
1.2. FRECUENCIAS ACUMULADAS:..........................................................................................16
2. TABLAS DE FRECUENCIAS – VARIABLES CUALITATIVA................................................17
3. TABLA DE FRECUENCIAS – VARIABLE CUALITATIVA DISCRETA................................18
Semana 3...................................................................................................................................................21
DISTRIBUCIÓN DE FRECUENCIAS UNIDIMENSIONALES.........................................................21
SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUANTITATIVAS. .23
1. RECOMENDACIONES:........................................................................................................23
Los intervalos deben tener igual amplitud.................................................................................23
2. PASOS:.....................................................................................................................................23
Semana 4...................................................................................................................................................30
GRÁFICOS ESTADÍSTICOS...............................................................................................................30
SESIÓN 7: GRÁFICOS ESTADÍSTICOS ESPECIALES....................................................................32
Entre las gráficas más utilizadas tenemos:.................................................................................................32
1. GRÁFICA DE BARRAS.........................................................................................................32
2. HISTOGRAMA.......................................................................................................................32
Gestión Curricular
Asignatura: Estadística general
3. POLÍGONO DE FRECUENCIAS.........................................................................................33
4. OJIVA......................................................................................................................................33
5. GRÁFICA DE PUNTOS.........................................................................................................33
6. GRÁFICO DE PARETO........................................................................................................34
7. GRÁFICO DE TALLO Y HOJAS.........................................................................................34
3. PICTOGRAMA.......................................................................................................................34
4. GRÁFICA CIRCULAR..........................................................................................................35
5. DIAGRAMA DE DISPERSIÓN.............................................................................................35
6. PIRAMIDE DE POBLACIÓN...............................................................................................36
7. CAJA Y BIGOTES..................................................................................................................36
Unidad II................................................................................................................................................41
EVALUACIÓN DE LA PRIMERA UNIDAD.....................................................................................42
Semana 6...................................................................................................................................................44
SESIÓN 11: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS
CUALITATIVOS Y MIXTOS..............................................................................................................46
1. DATOS BIVARIADOS:..........................................................................................................46
2. DISTRIBUCIONES ABSOLUTAS MARGINALES:..........................................................46
Semana 7...................................................................................................................................................53
SESIÓN 13: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS
CUANTITATIVOS...............................................................................................................................55
1. VARIABLES BIDIMENSIONALES.....................................................................................55
2. DIAGRAMA DE DISPERSIÓN:...........................................................................................55
Semana 8...................................................................................................................................................61
EVALUACIÓN PARCIAL...................................................................................................................61
Unidad III..............................................................................................................................................62
Semana 9...................................................................................................................................................63
SESIÓN 17: MEDIDAS DE TENDENCIA CENTRAL.......................................................................65
1. LA MEDIA ARITMÉTICA ( x ; x ; M ; M (a)¿:....................................................................65
2. LA MODA ( Mo ¿ :....................................................................................................................67
3.........................................................................................................................................................69
LA MEDIANA ( Me ¿:......................................................................................................................69
4.........................................................................................................................................................72
RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA.............................................72
Semana 10.................................................................................................................................................76
SESIÓN 19: MEDIDAS DE VARIACIÓN O DISPERSIÓN...............................................................78
1. LA VARIANZA Y LA DESVIACIÓN ESTANDAR:...........................................................78
2
Gestión Curricular
Asignatura: Estadística general
2. COEFICIENTE DE VARIACIÓN:.......................................................................................81
Semana 11.................................................................................................................................................87
SESIÓN 21: CUARTILES Y PERCENTILES......................................................................................89
1. CUARTILES:..........................................................................................................................89
2. PERCENTILES:......................................................................................................................92
4. RANGO INTERCUARTIL.....................................................................................................94
5. ANALISIS EXPLORATORIO DE DATOS..........................................................................94
6. GRÁFICA DE CAJA Y VIGOTE..........................................................................................95
7. COEFICIENTE DE CURTOSIS............................................................................................95
Semana 12...............................................................................................................................................101
EVALUACIÓN DE LA TERCERA UNIDAD...................................................................................101
Unidad IV.............................................................................................................................................103
Semana 13...............................................................................................................................................104
SESIÓN 25: PROBABILIDADES FUNDAMENTOS.......................................................................106
1. FUNDAMENTOS..................................................................................................................106
2. EXPERIMENTOS ALEATORIOS Y ESPACIO MUESTRAL........................................107
3. CONCEPTO DE PROBABILIDAD....................................................................................111
4. TIPOS DE PROBABILIDAD...............................................................................................111
5. LEYES O AXIOMAS DE LA PROBABILIDAD...............................................................113
Semana 14...............................................................................................................................................117
SESIÓN 27: DISTRIBUCIÓN BINOMIAL, POISSON.....................................................................119
1. DISTRIBUCIÓN BINOMIAL..............................................................................................119
2. DISTRIBUCIÓN POISSON.................................................................................................123
Semana 15...............................................................................................................................................129
SESIÓN 1: DISTRIBUCIÓN NORMAL............................................................................................131
1. Introducción...........................................................................................................................131
2. Definición...............................................................................................................................132
3. Curva Norma Tipificada (estándar, o reducida).................................................................134
Semana 16...............................................................................................................................................143
EVALUACIÓN FINAL......................................................................................................................143
3
Unidad I
ORGANIZACIÓN DE APRENDIZAJES
SEMANA N° 3 Actividad N° 4
SEMANA N° 4: ……….
1
Gestión Curricular
Asignatura: Estadística general
Semana 1
INTRODUCCIÓN A LA ESTADÍSTICA
La palabra Estadística procede del vocablo “Estado”, pues era función
principal de los Gobiernos de los Estados establecer registros de población,
nacimientos, defunciones, impuestos, cosechas... La necesidad de poseer
datos cifrados sobre la población y sus condiciones materiales de
existencia han debido hacerse sentir desde que se establecieron sociedades
humanas organizadas.
Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la civilización han existido formas
sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de
madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas.
La isla de Cerdeña, existen monumentos prehistóricos pertenecientes a los Nuragas, estos monumentos
constan de bloques de basalto superpuestos sin mortero y en cuyas paredes se encontraban grabados toscos,
signos que han sido interpretados con mucha verosimilizad como muescas que servían para llevar la cuenta
del ganado y la caza.
Los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción
agrícola y los géneros vendidos o cambiados mediante trueque.
En China existían los censos chinos ordenados por el emperador Tao hacia el año 2.200 a.C.
HISTORIA LA ESTADISTICA
758 Durante los mil años posteriores a la caída del Imperio Romano se hicieron muy pocas operaciones
URA
2
L Gestión Curricular
Asignatura: Estadística general
estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por
Pipino el Breve y por Carlomagno en los años 758 y 762, respectivamente. En Francia se realizaron algunos
censos parciales de siervos durante el siglo IX.
1532 Debido al temor que Enrique VII tenía de la peste, en el año 1532 empezaron a registrarse en Inglaterra
las defunciones causadas por esta enfermedad. En Francia, más o menos por la misma época, la ley exigía a
los clérigos registrar los bautismos, fallecimientos y matrimonios.
1540 Alrededor del año 1540, el alemán Sebastián Muster realizó una compilación estadística de los recursos
nacionales, que comprendía datos acerca de la organización política, instituciones sociales, comercio y
poderío militar.
1632 Durante un brote de peste que apareció a fines del siglo XVI, el gobierno inglés comenzó a publicar
estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en 1632 los llamados Bills of
Mortality (Cuentas de Mortalidad) ya contenían datos sobre los nacimientos y fallecimientos por sexo. En
1662, el capitán John Graunt compiló documentos que abarcaban treinta años, mediante los cuales efectuó
predicciones sobre el número de personas que morirían de diversas enfermedades, así como de las
proporciones de nacimientos de hombres y mujeres que cabía esperar. El trabajo de Graunt, condensado en su
obra Natural and political observations… made upon the Bills of Mortality (Observaciones políticas y
naturales…hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo de inferencia y teoría estadística.
1691 Gaspar Neumann, un profesor alemán que vivía en Breslau, se propuso destruir la antigua creencia
popular de que en los años terminados en 7 moría más gente que en los restantes, y para lograrlo hurgó
pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción,
pudo demostrar que en tales años no fallecían más personas que en los demás.
Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor del cometa
que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para las
tablas de mortalidad que hoy utilizan todas las compañías de seguros.
1760 Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que
extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia
serían el aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla en el término
latino s t a t u s, que significa “estado” o “situación”. Esta etimología aumenta el valor intrínseco de la
palabra por cuanto que la estadística revela el sentido cuantitativo de las más variadas situaciones.
FUENTE: Freedman, D. (1999). «From association to causation: Some remarks on the history of
statistics». Statistical Science 14 (3): 243-258. doi:10.1214/ss/1009212409. (Revised versión, 2002).
Hald, Anders (2003). A History of Probability and Statistics and Their Applications before 1750.
Hoboken, NJ: Wiley. ISBN 0-471-47129-1.
ESTADÍSTICA
Propósito:
Define la estadística e identifica los tipos de datos en situaciones cotidianas.
3
Gestión Curricular
Asignatura: Estadística general
1 DEFINICIÓN.
La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos,
series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o
algunas previsiones para el futuro.
La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la
interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva.
2 UTILIDAD E IMPORTANCIA.
La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para interpretar la
información obtenida, que puede ser aprovechada para demostrar la evolución de un fenómeno a través de cierto
tiempo. En Perú, el Instituto Nacional de Estadística e Informática (INEI) se encarga de recabar información
estadística y geográfica de todo el país, en diferentes áreas y contextos. Los datos que publica sirven para dar a
conocer, a cualquier persona, la situación en la que se encuentra el área de donde se obtuvo la información. Los
métodos estadísticos se utilizan prácticamente en investigaciones de todas las áreas de conocimiento, tanto en el
ámbito académico, como en el profesional y laboral; en todos ellos la finalidad es poder resolver un problema,
entendiendo que un problema queda definido como la diferencia entre lo real y lo deseado, en donde la
estadística muestra la realidad para que el investigador pueda analizar sus deseos y con ello tomar una decisión.
3 CLASES DE ESTADISTICA.
a) Estadística descriptiva.
Se orienta en la presentación y clasificación de los datos obtenidos de la población que se analiza, es decir,
describe datos. Esta aplicación de la estadística busca plantear y resolver problemas específicos y/o hacer
previsiones a partir de los datos de una muestra, dado que es muy difícil estudiar a la población completa.
Esta rama de la estadística concluye a partir de los datos, como la estimación de un resultado.
b) Estadística inferencial.
Permite sacar conclusiones sobre una población a partir de una muestra, cuando es difícil estudiar la
población debido a su gran tamaño o que provenga de un proceso que no se detiene, utilizando a la
probabilidad cuando no se está seguro de la verdad.
4
Gestión Curricular
Asignatura: Estadística general
b) Muestra:
Es una parte o un subconjunto representativo de la población seleccionada mediante técnicas de muestreo,
con el fin de obtener información acerca de la población de la cual proviene.
Ejemplo:
La muestra de estudiantes del III ciclo de la facultad de Arquitectura de la Universidad “Continental”.
c) Datos estadísticos:
Son números o medidas que han sido recogidos como resultado de observaciones, los que se pueden ser
comparados, analizados e interpretados.
Ejemplo:
Notas vigesimales: 00, 04, 08, 10, 15 20
Peso: 2kg, 15kgf, 45,6kg, 80N, etc.
d) Variable estadística:
Es cada una de las características definida en la población por el investigador, que pueden tomar dos o más
valores (cualidades o números). Se representan con una letra del alfabeto: X, Y, Z, etc.
Ejemplo:
En la población formada por los empleados de la Universidad “Continental”, algunas variables estadísticas
definidas son:
Clases de variables:
Variable cualitativa:
Son las cualidades, aquí no se pueden realizar operaciones matemáticas.
Ejemplo:
Género: masculino, femenino.
Profesión: docente, abogado, ingeniero, etc.
Estado civil: soltero, casado, viudo, etc.
Es decir, las variables cualitativas se refieren a características o cualidades que no pueden ser medidas
con números. Podemos distinguir dos tipos:
Variable cualitativa nominal:
Presenta modalidades no numéricas que no admiten un criterio de orden.
Ejemplo:
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.
Variable cualitativa ordinal:
5
Gestión Curricular
Asignatura: Estadística general
Variable cuantitativa:
Son valores que se obtienen por medición o conteos, aquí se pueden realizar operaciones matemáticas.
Ejemplo:
N° de estudiantes.
Temperatura,
N° de hijos,
Ingresos mensuales, etc.
Dentro de las variables cuantitativas se encuentran las variables: discretas y continuas.
e) Escalas de medición:
6
Gestión Curricular
Asignatura: Estadística general
4 REDONDEO DE DATOS:
Consiste en aproximar un número a su valor cercano.
Casos:
a) Cuando la primera cifra eliminada sea menor de 5, la última cifra a redondear debe mantenerse igual.
Ejemplos:
12.743 redondeando a dos decimales, queda 12.74
85.613 redondeando a un decimal, queda 85.6
b) Cuando la primera cifra eliminada es mayor de 5, la última cifra a redondear debe aumentar en uno.
Ejemplos:
1.658 redondeando a dos decimales, queda 1.66
124.869 redondeando a un decimal, queda 124.9
Según ITINTEC (Instituto de Investigación Tecnológica Industrial y de Normas Técnicas) considera un
caso especial (c), cuando la cifra a eliminar es cinco.
c) Cuando la primera cifra eliminada sea 5, la última cifra retenida debe incrementarse en una unidad si este
es impar, debe mantenerse igual si la última cifra retenida es par o cero.
Ejemplos:
12.475 redondeando a dos decimales, queda 12.48
14.425 redondeando a dos decimales, queda 14.42
24.205 redondeando a dos decimales, queda 24.20
Problemas Desarrollados
Respuestas:
1. Estadístico 2. Parámetro 3. Parámetro 4. Estadístico
7
Gestión Curricular
Asignatura: Estadística general
Problemas Propuestos
1. Identificar si cada una de las siguientes situaciones que se presenta a continuación representa a una población
(P) o a una muestra (M). Luego señale cuántas corresponden a muestras.
a) Alumnas egresadas del Colegio Estatal “Nuestra Señora del Rosario” durante el año
2018………………………………………………………………………………………… ( )
b) Habitantes del distrito del Tambo…………………………………………………………. ( )
c) Habitantes de la primera cuadra de la Av. San Carlos………………………………. ( )
d) 50% de los alumnos del Curso de Estadística General de la UCCI…………………. ( )
e) 60 mujeres embarazadas atendidas en el Hospital “D.A. Carrión” ………………… ( )
f) 30 hojas de papel bond……………………………………………………………………... ( )
g) 15 reos del penal de Huamancaca Chico, inculpados por narcotráfico………… ( )
h) Niños nacidos en la Clínica “Ortega” durante los primeros cinco días del mes… ( )
i) 60% de las raciones atendidas en un negocio de comida…………………………. ( )
j) El CI de los estudiantes del 5to. Año de Secundaria de todos los colegios estatales de
Junín……………………………………………………………………………... ( )
k) Edad de 25 pacientes con VIH atendidos en Es Salud Junín………………………… ( )
l) Precio del pollo en 10 puestos de venta del Mercado Mayorista de Huancayo… ( )
3. Identificar la clasificación (variable cualitativa, cuantitativa discreta, cuantitativa continua) a la que pertenecen
las siguientes variables. Luego señale cuántas son variables cualitativas.
a) Número de estudiantes matriculados en la UCCI durante el período 2018 – 10
8
Gestión Curricular
Asignatura: Estadística general
Variable: ______________________________
b) Color de cabello.
Variable: ______________________________
c) Distancia que recorren dos personas caminando durante 5 minutos.
Variable: ______________________________
d) Número de cursos desaprobados por un grupo de alumnos.
Variable: ______________________________
e) Talla de recién nacidos.
Variable: ______________________________
f) Temperatura corporal.
Variable: ______________________________
g) Peso de los alumnos del Primer Semestre de la EAP de Psicología.
Variable: ______________________________
4. Identificar el nivel de medición que se utilizará para medir las siguientes variables. Luego señale cuántas son de
nivel de razón.
a) Número de personas que vive en el distrito de Orcotuna.
________________________________________
j) Marcas de cerveza
9
Gestión Curricular
Asignatura: Estadística general
________________________________________
5. Una marca de cloro líquido se vende en botellas cuya etiqueta dice contener 128 onzas (un galón). Debido a
múltiples quejas recibidas de consumidores, INDECOPI decide investigar si la cantidad promedio en las
botellas es realmente 128 onzas. En su puesto de inspector de INDECOPI decide visitar algunos comercios y
compra 100 botellas de esta marca de cloro para corroborar las quejas de los consumidores. El resultado indica
que la cantidad promedio en las botellas es de 126 onzas.
Indique en términos del problema cuánto vale el parámetro.
_________________________________________________________________________________________
_________________________________________________________________________________________
Video de Apoyo
Semana 2
DISTRIBUCIONES DE FRECUENCIAS
UNIDIMENSIONALES
10
Gestión Curricular
Asignatura: Estadística general
John Graunt, A John Graunt se le atribuye haber iniciado la demografía formal. Sentó las bases de la
“regularidad estadística” al encontrar una “ley” para la mortalidad.
Edmund Halley, En 1693 retomó las tablas sobre la expectativa de vida de la población diseñadas por John
Graunt y las perfeccionó proponiendo algunas fórmulas para calcular la «población estacionaria» y la manera
como la edad está distribuida dentro de esa población, lo cual fue un gran adelanto no sólo para los futuros
estudios sobre demografía sino para el cálculo actuarial aplicable en el negocio de los seguros de vida
Fisher, Ronald Aylmer, Científico, matemático, estadístico, biólogo evolutivo y genetista inglés (1890-
1962).
Realizó muchos avances en la estadística, una de las contribuciones más importante fue la inferencia
estadística que descubrió en 1920.
Comerciante bien relacionado en Londres, tuvo acceso a los boletines parroquiales de mortalidad desde
finales del siglo XVI, su base documental. En 1662 depositaba cincuenta ejemplares de su Natural and
Political Observations on the Bills of Mortality en la Royal Sciety, que creó un comité para examinar la obra
y emitió un informe favorable. El propio rey Carlos II se interesó por la obra y le propuso como miembro.
En un momento en que el continente europeo era devastado por las epidemias, esta obra resume análisis de
las décadas anteriores, y aporta estadísticas vitales sobre los ciudadanos de Londres, incluyendo las causas de
11
Gestión Curricular
Asignatura: Estadística general
mortalidad, la población total de Londres y la monogamia, entre otros. Es pionero en calcular la razón de
masculinidad al nacer, la tasa bruta de mortalidad y detecta la estacionalidad de algunos fenómenos
demográficos. Añadió así profundidad al análisis, y la información numérica empezó a tener uso más allá de
los fines políticos y militares.
Pero su contribución más relevante aquí es la elaboración de la primera tabla de mortalidad. Los registros de
que disponía (Bills of mortality de la ciudad de Londres) sólo especificaban la causa de muerte y el sexo de
los fallecidos, pero no su edad. Graunt dedujo la proporción de muertes anteriores a los 6 años sumando las
muertes causadas por enfermedades infantiles y la mitad de las causadas por sarampión y viruela. Esto
sumaba el 36% de todas las muertes, de manera que podía suponer una supervivencia del 64% a esa edad.
Pero el libro no explica cómo estimó el resto de filas de la tabla, lo que ha supuesto un motivo de debate
constante en la historiografía demográfica. Algunos creen que simplemente inventó los números, pero otros
piensan que Graunt ya estaba dando por supuesta una ley constante de crecimiento exponencial (µ = .047)
que, interpolada, proporciona los valores intermedios de la tabla. Este supuesto de una fuerza de mortalidad
constante será el manejado poco después por Jan de Witt y Jan Hudde en sus tablas de mortalidad).
Fuente: Camúñez Ruiz, José Antonio y Basulto Santos, Jesús. (2012) En el alumbramiento de la
estadística moderna: John Graunt. Septem Ediciones.
García González, Juan Manuel. 2011, Observaciones políticas y naturales hechas a partir de los
boletines de mortalidad. EMPIRIA. Revista de Metodología de Ciencias Sociales. N.o 21, enero-junio,
pp. 185-199. ISSN: 1139-5737.
Vilquin Éric (1978). Une édition critique en français de l’œuvre de John Graunt (1620-1674).
Présentation d’un ouvrage hors collection de l’INED. Population, 33e année, n°2, pp. 413-423.
VARIABLES
CUALITATIV
AS
Propósito:
Define las variables estadísticas e identifica los tipos de frecuencias en situaciones cotidianas.
12
Gestión Curricular
Asignatura: Estadística general
2 DISTRIBUCIÓN DE FRECUENCIAS.
Se denomina distribución de frecuencias a los cuadros o tablas numéricos de las variables recopiladas para su
fácil comprensión, interpretación y análisis.
En general una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los
datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Aquí se encuentran las diferentes frecuencias tales como:
La frecuencia absoluta.
Frecuencia relativa.
Frecuencia porcentual.
Frecuencias acumuladas
3 CLASES DE FRECUENCIAS.
1.1. FRECUENCIAS SIMPLES:
Ejemplo:
En la siguiente tabla se representa las calificaciones obtenidas por los estudiantes del III ciclo de
Administración de la Universidad Continental, en la asignatura de Estadística.
Xi ni
X 1 =00 n1=6
X 2 =05 n2 =4
X 3 =10 n3 =12
X 4=15 n 4=13
X 5 =20 n5 =5
N=40
13
Gestión Curricular
Asignatura: Estadística general
ni
hi =
N
La suma de todas las frecuencias relativas es igual a uno (1).
Ejemplo:
De el ejemplo anterior.
Xi ni hi
X 1 =00 n1=60.150 n 3 12
h3 = = =0.3
X 2 =05 n2 =40.100 N 40
X 3 =10 n3 =12
0.300
X 4=15 n 4=13
0.325
X 5 =20 n5 =50.125
N=40
1.000
hi %=hix 100 %
Ejemplo:
Utilizando el ejemplo anterior.
Xi ni hi hi%
X 3 =10 n3 =12
0.300 30.0%
X 4=15 n 4=13
0.325 32.5%
N=40
1.000 100.0%
14
Gestión Curricular
Asignatura: Estadística general
N 1 = n1
N 2 = n1 + n2
N 3 = n2 + n3
N 4 = n3 + n4
………………………. etc.
b. Frecuencia relativa acumulada (Hi)
Es la suma sucesiva de las frecuencias relativas o simples anteriores y la dada.
Se define en cada fila como el cociente de la frecuencia absoluta acumulada (Ni) y el número total de
observaciones.
Hi= ¿
N
H 1 = h1
H 2 = h1 + h2
H 3 = h2 + h3
H 4 = h3 + h4
…………………….. etc.
c. Frecuencia relativa acumulada porcentual (Hi% ó Pi%)
Es la suma sucesiva de las frecuencias relativas o simples porcentuales (hi%) anteriores y la dada.
Se define en cada fila como:
Hi %=Hi x 100 %
Problemas Desarrollados
Ejemplo:
En una encuesta de opinión sobre preferencias de bebidas gaseosas por su marca: coca cola (K), inca cola (I),
sprite (S). 30 consumidores dieron las siguientes respuestas.
S S K I I I S K K S I K I S S
I I S K K S S K I K I K S I I
15
Gestión Curricular
Asignatura: Estadística general
K
30% I
37%
S
33%
16
Gestión Curricular
Asignatura: Estadística general
B eb id a s g a s eo s a s
40
35 36.7
30 33.3
25 30
20
ni%
15
10
5
0
I S K
Xi
Para realizar el cuadro de distribución de frecuencias de una variable discreta, primero ordenamos los “n” datos
recopilados en forma ascendente.
Podemos representar los datos en tres gráficos: diagrama de barras, polígono de frecuencias y gráfico de
sectores circulares.
Ejemplo:
En una encuesta a 28 hogares, para saber sobre el número de hijos por familia (X), se obtuvieron las siguientes
respuestas.
4 3 2 0 2 1 6 9 4 3 1 2 0 2
3 2 1 4 3 2 3 4 3 2 4 2 9 6
17
Gestión Curricular
Asignatura: Estadística general
N úme ro de hi j os
9
6
4
3
Xi
2
1
0
0 1 2 3 4 5 6 7 8 9
ni
Problemas Propuestos
1) En la Universidad Continental se ha realizado una encuesta 200 alumnos sobre el tipo de atención de esta
institución. El 32% afirma que está muy contento, el 40% está contento, el 23% no está contento, y el resto
muy descontento. Elabore la tabla de frecuencias e interprete.
2) Se ha llevado a cabo una encuesta a 27 empresas sobre el número de microcomputadoras que tienen,
encontrando los siguientes resultados:
5 7 9 7 8 5 2 4 3
6 8 7 6 9 8 4 6 4
8 5 9 6 7 9 4 7 5
3) Los directivos de “Real Plaza” realizan una prueba de mercado respecto a la facilidad de navegación en su
nuevo sitio web. Selecciona al azar 18 usuarios frecuentes y les solicita que califique la relativa facilidad para
navegar como mala (M), buena (B), excelente (E) o sobresaliente (S)”. Los resultados son los siguientes,
elabore la tabla de frecuencias e interprete.
B E S B M S
M S E S B E
M M B M E S
4) Para un estudio de accesibilidad, durante 30 días anotamos el número de plazas libres de aparcamiento a las 5
de la tarde. Elabore la tabla de frecuencias e interprete.
1 1 5 0 5 3 0 3 3 2
2 3 1 1 2 1 2 0 1 3
2 1 5 0 2 2 1 3 3 2
5) Se realizó una encuesta a los trabajadores de la casa de préstamos “Perú Cash”, sobre el número de hijos.
Elabore la tabla de frecuencias e interprete.
18
Gestión Curricular
Asignatura: Estadística general
2 1 2 4 1 3 2
3 2 3 2 0 3 4
3 2 1 3 2 1 2
Video de Apoyo
19
Gestión Curricular
Asignatura: Estadística general
Semana 3
DISTRIBUCIÓN DE FRECUENCIAS
UNIDIMENSIONALES
En el siglo XIX, la estadística entra en una nueva fase de su desarrollo con la
generalización del método para estudiar fenómenos de las ciencias naturales y
sociales. Galton (1.822-1.911) y Pearson (1.857-1936) se pueden considerar
como los padres de la estadística moderna, pues a ellos se debe el paso de la
estadística deductiva a la estadística inductiva.
David Huntsberger: Utilizo la palabra estadística con números apilados en grandes arreglos y tablas, de
volúmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, créditos y
así sucesivamente.
Sebastián Muster, durante el siglo XVII aportó indicaciones más concretas de métodos de observación y
análisis cuantitativo y amplió los campos de la inferencia y la teoría Estadística.
Gaspar Neumann, Sionista, teólogo y filólogo alemán, nacido en 1648 y muerto en 1715. Sus principales
obras son: Génesis linguae sanctae, Exodus linguae sanctae y Formulario de todas las oraciones.
20
LECTURA Gestión Curricular
Asignatura: Estadística general
Fuente: Pearson, Egon (1978). The History of Statistics in the 17th and 18th Centuries against the
changing background of intellectual, scientific and religious thought (Lectures by Karl Pearson given at
University College London during the academic sessions 1921-1933). Nueva York: MacMillanPublishng
Co., Inc. p. 744. ISBN 0-02-850120-9.
Salsburg, David (2001). The Lady Tasting Tea: How Statistics Revolutionized Science in the
Twentieth Century. ISBN 0-7167-4106-7.
Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty before 1900.
Belknap Press/Harvard University Press. ISBN 0-674-40341-X.
VARIABLES
CUANTITATIVA
S
Propósito:
Organizar datos en una tabla de distribución de frecuencias para variables cuantitativas continuas.
21
Gestión Curricular
Asignatura: Estadística general
Este cuadro se usa cuando la variable cuantitativa es continua o cuando el número de valores distintos de una
variable discreta es muy grande (N > 20).
1. RECOMENDACIONES:
Agrupar los datos en no más de 20 intervalos ni menos de 5
Los intervalos deben tener igual amplitud.
2. PASOS:
1° Identifique el dato mayor y dato menor.
Dato mayor = Xmax
Dato menor = Xmin
2° Hallamos el rango o recorrido (R).
R = Xmax – Xmin
3° Hallamos el número de intervalos (K).
Si: n ≥ 10, por la Regla de Sturges
K = 1 + 3.322 log(n)
Por la Ley de Portugal:
Si: 25 ≤ n ≤ 400
K = √n
Si: n ≤ 50
K = 1 + 3.322 log(n)
Si: n > 100
K = 2.7560 + 5.8154
l
22
Gestión Curricular
Asignatura: Estadística general
[
Utilizamos la siguiente fórmula: I k = X min + ( k −1 ) .C− X min + k . C ]
Ejemplo:
Las calificaciones obtenidas por un grupo de 45 estudiantes en una prueba escrita de estadística son:
63 89 36 49 56 64 59 35 78
43 53 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
53 64 76 44 73 56 62 63 60
23
Gestión Curricular
Asignatura: Estadística general
Entonces:
Organizamos una tabla de 7 intervalos (K = 7)
Con amplitud de 9 (C = 9)
I 1=¿
I 2=¿
I 3=¿
..……….=…………………
………………..=………………………...
Entonces el último intervalo será:
I 7=¿
Frecuencias simples
Intervalos
absolutas relativas porcentaje
¿ ni hi hi%
¿ 1 0.023 2.3
¿ 4 0.089 8.9
¿ 5 0.111 11.1
¿ 14 0.311 31.1
¿ 14 0.311 31.1
¿ 5 0.111 11.1
[80−89 ] 2 0.044 4.4
Total N = 45 1.000 100.0
HISTOGRAMA
16
14
14 14
12
10
8
ni
6
4 5 5
4
2
2
0 1
26 - 35 35 - 44 44 - 53 53 - 62 62 - 71 71 - 80 80 - 89
INTERVALOS
24
Gestión Curricular
Asignatura: Estadística general
POLÍGONO DE FRECUENCIAS
16
14 14 14
12
10
8
ni
6
5 5
4 4
2 2
1
0
26 - 35 35 - 44 44 - 53 53 - 62 62 - 71 71 - 80 80 - 89
INTERVALOS
Problemas Desarrollados
1. Los siguientes datos son los pesos en kg de 30 estudiantes del Programa BECA 18, atendidos en el mes de
diciembre del 2017, en el consultorio de nutrición del Hospital ESSALUD - HUANCAYO:
Solución
Identifique el dato mayor y dato menor
Dato mayor = Xmax = 99.8
Dato menor = Xmin = 58.4
Hallamos el rango o recorrido (R)
R = Xmax – Xmin = 99.8 – 58.4 = 41.4
Hallamos el número de intervalos (K)
Si: n = 30
Utilizamos la Ley de Portugal
Si: n ≤ 50 K = 1 + 3,322 log(n)
K = 1 + 3,322 log (30)
K = 5.90
Los posibles valores de: K = 5, 6 ó 7
Hallamos la amplitud o la longitud del intervalo de clase (C):
R
C=
K
R 41.4
C 1= = =8.28=8.3 aplicando R = K.C = 5 x 8.3 = 41.5
K 5
25
Gestión Curricular
Asignatura: Estadística general
R 41.4
C 2= = =6.9 aplicando R = K.C =6 x 6.9 = 41.4
K 6
R 41.4
C 3= = =5.91=5.9 aplicando R = K.C = 7 x 5.9 = 41.3
K 7
Organizamos una tabla de 8 intervalos (K = 6)
Con amplitud (C = 6.9)
Determinemos los extremos de los intervalos [ Li−LS ]
Si: X min=58.4 C = 6.9 K=6
I 1=¿ ¿
I 2=¿
I 3=¿
I 4=¿
I 5=¿
I 6=¿
Li - Ls ni hi hi% Ni Hi Hi%
¿ 4 0.13 13 4 0.13 13
¿ 11 0.37 37 15 0.50 50
¿ 7 0.23 23 22 0.73 73
¿ 3 0.10 10 25 0.83 83
¿ 3 0.10 10 28 0.93 93
¿ 2 0.07 7 30 1.00 100
N = 30 1.00 100
Problemas Propuestos
1. Se ha llevado a cabo un estudio para evaluar los volúmenes de venta (miles de soles por día) de 24
establecimientos comerciales de Huancayo y se encontraron los siguientes resultados. Elabore la tabla de
frecuencias e interprete.
2. En la fábrica de SAZON LOPESA se hizo un estudio sobre el peso (kg) de los trabajadores con el fin de
establecer una orientación sobre nutrición y buena salud. Los resultados fueron los siguientes: Elabore la tabla de
frecuencias e interprete.
60 84 112 120 72 61
70 74 68 90,5 81 75
26
Gestión Curricular
Asignatura: Estadística general
84 65 97,5 82 98 62
3. Las calificaciones finales del curso de ESTADISTICA donde las notas están sobre 10 son los siguientes. Elabore
la tabla de frecuencias e interprete.
4,5 8,0 8,5 7,5 6,5 3,5 6,0
4,5 4,5 8,5 8,5 10,0 7,0 6,5
9,5 7,0 6,0 8,5 6,5 6,5 8,5
4. Elabore la tabla de frecuencias e intérprete del registró de tiempo en minutos que demoran 30 estudiantes para
ejecutar una tarea, resulto los siguientes datos:
21.3 15.8 18.4 22.1 19.4 15.8 26.4 17.3 11.2 23.4
26.8 22.7 18.0 20.5 11.0 18.2 23.6 24.6 20.5 16.6
8.3 21.9 12.3 23.3 13.4 17.9 12.3 13.4 15.8 19.5
68 84 75 82 68 90 62 88 76 93
73 79 88 73 60 93 71 59 85 75
61 65 75 87 74 62 95 78 63 72
66 78 82 75 94 77 69 74 68 60
96 78 89 61 75 95 60 79 83 71
79 62 67 97 78 85 76 65 71 75
65 80 73 57 88 78 62 76 53 74
86 67 73 81 72 63 76 75 85 77
Video de Apoyo
27
Gestión Curricular
Asignatura: Estadística general
Semana 4
GRÁFICOS ESTADÍSTICOS
Los gráficos son medios popularizados y a menudo los más
convenientes para presentar datos, se emplean para tener una
representación visual de la totalidad de la información. Los
gráficos estadísticos presentan los datos en forma de dibujo de
tal modo que se pueda percibir fácilmente los hechos
esenciales y compararlos con otros.
28
Gestión Curricular
Asignatura: Estadística general
William Playfair, Ingeniero mecánico y economista político escocés. Trabajó más de 36 años en el diseño de
gráficos estadísticos. Se le considera pionero en el uso del gráfico lineal para representar series temporales, y fue
el creador del gráfico circular, de sectores y de barras.
Michael Van Langren: recogió las distintas estimaciones que se habían hecho de la distancia que separa
Toledo de Roma (12 en total).
C. Joseph Priestley: Utilizo gráficos estadísticos, principalmente mapas destacados en los años 1700 – 1799.
GRÁFICOS ESTADISTICA
Cuando se hace un estudio estadístico se obtiene una gran cantidad de datos numéricos. Para tener una
información clara y rápida de lo obtenido en el estudio se han creado las gráficas estadísticas.
LECTURA
Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio para informar
basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de información dependerá
de la presentación de los datos, siendo la forma gráfica uno de los más rápidos y eficientes, aunque también
uno de los que más pueden ser manipulados o ser malinterpretados si no se tienen algunas precauciones
básicas al realizar las gráficas.
Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno de ellos de
acuerdo al tipo de información que se está usando y los objetivos que se persiguen al presentar la información.
Entonces, algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier gráfica a
fin de que la información sea transmitida de la manera más eficaz posible y sin distorsiones son:
El eje que represente a las frecuencias de las observaciones (comúnmente el vertical o de las ordenadas) debe
comenzar en cero (0), de otra manera podría dar impresiones erróneas al comparar la altura, longitud o
29
Gestión Curricular
Asignatura: Estadística general
Hay un punto que conviene remarcar: existe software que permite la construcción rápida y eficiente de
gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán bonita, bien delineada, bien
coloreada o bien presentada esté una gráfica, si no se han tomado en cuenta consideraciones de este tipo que
tienen que ver más sobre el objetivo de estas herramientas y la Estadística: la transmisión eficiente de la
información.
Hay muchos tipos de gráficas estadísticas. Cada una de ellas es adecuada para un estudio determinado, ya que
no siempre se puede utilizar la misma para todos los casos. Tienen una estructura distinta, lo cual les permite
ser utilizados para diferentes objetivos, y es que la mayoría de las veces utilizan datos o variables distintos.
G
FUENTE: Stigler, Stephen M. (1999) Statistics on the Table: The History of Statistical Concepts
and Methods. Harvard University Press. ISBN 0-674-83601-4
GRÁFICOS
ESTADÍSTIC
OS
Propósito:
Construye gráficos estadísticos, analiza e interpreta los resultados.
1. GRÁFICA DE BARRAS.
Cada barra rectangular corresponde a una modalidad, tiene una base constante, y su altura puede ser medida en
unidades de frecuencia relativa, absoluta o porcentual.
30
Gestión Curricular
Asignatura: Estadística general
2. HISTOGRAMA.
Es una gráfica de barras donde la escala horizontal representa clases de valores de datos y la escala vertical
representa frecuencias. Las alturas de las barras corresponden a los valores de frecuencia y no existe separación
entre las barras.
3. POLÍGONO DE FRECUENCIAS.
Utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de los valores de las
marcas de clase. Las alturas de los puntos corresponden a las frecuencias de clase; en tanto que los segmentos
lineales se extienden hacia la derecha y hacia la izquierda, de manera que la gráfica inicia y termina sobre el eje
horizontal.
4. OJIVA.
Es una gráfica lineal que representa frecuencias acumulativas. La ojiva utiliza fronteras de clase a lo largo de la
escala horizontal, y que la gráfica comienza con la frontera inferior de la primera clase y termina con la frontera
superior de la última clase. Las ojivas son útiles para determinar el número de valores que se encuentran por
debajo de un valor específico.
31
Gestión Curricular
Asignatura: Estadística general
5. GRÁFICA DE PUNTOS.
Es aquella donde se marca cada valor de un dato como un punto a lo largo de una escala de valores. Los puntos
que representan valores iguales se apilan.
6. GRÁFICO DE PARETO.
Con el Diagrama de Pareto se pueden detectar los problemas que tienen más relevancia mediante la aplicación
del principio de Pareto (pocos vitales, muchos triviales) que dice que hay muchos problemas sin importancia
frente a solo unos graves. Ya que, por lo general, el 80% de los resultados totales se originan en el 20% de los
elementos.
32
Gestión Curricular
Asignatura: Estadística general
3. PICTOGRAMA.
También llamada gráfica de imágenes o pictografía. Es un diagrama que utiliza imágenes o símbolos para
mostrar datos para una rápida comprensión. En un pictograma, se utiliza una imagen o un símbolo para
representar una cantidad específica.
4. GRÁFICA CIRCULAR.
También se utilizan para visualizar datos cualitativos. Presenta datos cualitativos como si fueran rebanadas de un
pastel. Para construir una gráfica circular, se divide el círculo en las proporciones adecuadas. Cada sector
corresponde a una modalidad y su correspondiente ángulo en el centro.
5. DIAGRAMA DE DISPERSIÓN.
Es una gráfica de datos apareados (x, y), con un eje x horizontal y un eje y vertical. Los datos se aparean de tal
forma que cada valor de un conjunto de datos corresponde a un valor de un segundo conjunto de datos. Para
elaborar manualmente un diagrama de dispersión, construya un eje horizontal para los valores de la primera
variable, construya un eje vertical para los valores de la segunda variable y después grafique los puntos. El
patrón de los puntos graficados suele ser útil para determinar si existe alguna relación entre las dos variables.
33
Gestión Curricular
Asignatura: Estadística general
6. PIRAMIDE DE POBLACIÓN.
Es una representación gráfica de la distribución por edad y sexo de una población en un momento determinado.
Nos pueden brindar información sobre migración de la población, mortalidad, guerras, epidemias y muchas otras
situaciones que se presentan en una población. Además, que nos ayuda a comparar los resultados de diversos
fenómenos.
7. CAJA Y BIGOTES.
Son una representación visual que describe varias características importantes, al mismo tiempo, tales como la
dispersión y simetría. Para su realización se representan los tres cuartiles y los valores mínimo y máximo de
los datos, sobre un rectángulo, alineado horizontal o verticalmente.
Problemas Desarrollados
1. La empresa “La Grande” registra las horas extras de los colaboradores en un año determinado, obteniendo la
siguiente tabla:
Intervalos Xi fi Fi hi Hi pi Pi
[38-44> 41 7 7 0.0795 0.0795 7.95% 7.95%
[44-50> 47 8 15 0.0909 0.1705 9.09% 17.05%
34
Gestión Curricular
Asignatura: Estadística general
Interpretación:
De los 88 colaboradores de la empresa “La Grande”,25 trabajan de 56 a menos de 62 horas haciendo el
porcentaje en un 28,41%.
2. Determine la tabla de distribución de frecuencia del histograma que se muestra, donde se observa la cantidad de
columnas que tienen 21 construcciones:
Solución:
3. A partir del grafico que se muestra elabore su tabla de distribución de frecuencia, donde se muestran el
consumo de 300 comensales de “Rustica”:
35
Gestión Curricular
Asignatura: Estadística general
Solución:
Ventas de pi Pi
fi Fi hi Hi ángulo
comida % %
sándwiches 120 120 0.4 0.4 40 40 144
ensalada 63 183 0.21 0.61 21 61 76
sopa 45 228 0.15 0.76 15 76 54
bebidas 27 255 0.09 0.85 9 85 32
postres 45 300 0.15 1 15 100 54
TOTAL 300 1 100 360
Problemas Propuestos
1. El siguiente cuadro muestra el total de inasistencia de los alumnos del mes, de tres facultades distintas. Elabora
un gráfico de barras. (elige otro gráfico que te parezca conveniente)
FACULTADES
MESES
Ingeniería Derecho Medicina
Julio 30 24 20
Agosto 35 30 38
Septiembre 19 25 25
Octubre 20 19 27
Noviembre 15 20 32
Diciembre 18 22 38
2. La Cámara de Comercio de Huancayo está interesada en conocer de qué manera vienen desarrollando sus
actividades los restaurantes y las Número pollerías del centro de la ciudad. Para
fi
ello han tomado una muestra de 50 de quejas Fi de estos establecimientos y ha
revisado el libro de reclamaciones de cada uno para contabilizar el
1 2 2
número de quejas que presentaron 2 4 6 los clientes. Los datos se muestran a
continuación: 3 21 27
4 15 42
5 6 48
6 1 49
7 1 50
36
TOTAL 50
Gestión Curricular
Asignatura: Estadística general
Construya el gráfico estadístico correspondiente tanto para las frecuencias absolutas (diagrama de bastones) y las
acumuladas (diagrama de escalones).
3. La empresa ELECTROCENTRO S.A. está llevando a cabo un estudio minucioso acerca de los salarios que
perciben los obreros de esta institución, con la finalidad de realizar mejoras económicas entre su personal. La
siguiente tabla muestra los salarios que perciben una muestra de 26 de estos obreros:
Salarios Cantidad de obreros
2 ¿
4 ¿
6 ¿
7 ¿
3 ¿
3 ¿
1 [1650−1800]
Construir un diagrama de tallo y hojas para los datos indicados, indicar las características de la distribución.
5. En la siguiente tabla se muestran los resultados después de las evaluaciones a un grupo de estudiantes de la
carrera profesional de contabilidad. (utilizar dos tipos de gráficos)
ESTUDIANTES
CONDICIÓN (GENERO)
Varones Mujeres
Aprobado 65 96
Desaprobado 25 32
Retirado 10 8
Video de Apoyo
37
Gestión Curricular
Asignatura: Estadística general
(https://youtu.be/L2F2VkzsZwU)
Video 2: Tabla de frecuencias para variable cualitativa, diagrama de sectores
(https://www.youtube.com/watch?v=rsYCe73_q-I)
Unidad II
38
Gestión Curricular
Asignatura: Estadística general
ORGANIZACIÓN DE APRENDIZAJES
Semana 5
Problemas de repaso
39
Gestión Curricular
Asignatura: Estadística general
1. Coca-Cola. Coca-Cola Company tiene 366,000 accionistas y efectúa una encuesta mediante la selección aleatoria
de 30 accionistas de cada una de las 50 entidades de Estados Unidos. Se registra el número de acciones de cada
accionista de la muestra. a. ¿Los valores obtenidos son discretos o continuos? b. Identifique el nivel de medición
(nominal, ordinal, de intervalo, de razón) de los datos muestrales. c. ¿Qué tipo de muestreo (aleatorio,
sistemático, de conveniencia, estratificado, por conglomerados) se usa? d. Si se calcula el número promedio (la
media) de acciones, ¿el resultado es un estadístico o un parámetro? e. Si usted fuera el ejecutivo en jefe de Coca-
Cola Company, ¿qué característica del conjunto de datos consideraría usted que es extremadamente importante?
f. ¿Qué es lo que está incorrecto al evaluar la opinión de los accionistas enviando un cuestionario por correo, que
éstos podrían llenar y regresar por el mismo medio?
2. El Directorio y la Gerencia de la Universidad Continental han realizado un estudio para conocer la opinión de los
padres de familia de los estudiantes en general, respecto a las nuevas carreras que se vienen ofertando. Para ello,
durante la semana de matrículas se aplicó una encuesta a 860 padres de familia elegidos aleatoriamente, dentro
de las instalaciones del campus universitario, donde se obtuvo como resultado que el 87% de los encuestados se
manifestaron en total acuerdo por la innovación en carreras profesionales que se viene impulsando (las
respuestas iban de “Totalmente en desacuerdo” a “Totalmente de acuerdo”). De estudios anteriores se sabía que
sólo el 55% de los padres de familia de los estudiantes de esta casa superior de estudios apoyaban la iniciativa de
fomentar nuevas carreras en años pasados.
Del enunciado anterior, indique:
a) Población y parámetro: ________________________________________________________________
b) Muestra y estadístico: __________________________________________________________________
c) Variable: ______________________________________________________________________________
d) Tipo de variable: _______________________________________________________________________
e) Nivel de medición: _____________________________________________________________________
f) Unidad estadística: _____________________________________________________________________
3. Las calificaciones finales del curso de ESTADISTICA GENERAL donde las notas están sobre 10 y son los
siguientes. Elabore la tabla de frecuencias e interprete.
4,5 8,0 8,5 7,5 6,5 3,5 6,0
4,5 4,5 8,5 8,5 10,0 7,0 6,5
9,5 7,0 6,0 8,5 6,5 6,5 8,5
4. Los sistemas de cómputo fallan por muchas razones, entre ellas las fallas de hardware o software, errores del
operador, sobrecargas del sistema mismo y a otras causas. La tabla siguiente muestra los resultados obtenidos en
un estudio acerca de las causas de fallas en una muestra de 98 sistemas de cómputo. Usted debe priorizar entre
las dos principales causas de falla de los sistemas de cómputo. Elabore el gráfico apropiado que permita
visualizar dicho propósito.
40
Gestión Curricular
Asignatura: Estadística general
5. Como parte de un informe que deberán presentar al Ministerio de Trabajo, se ha tomado los datos referentes a
los sueldos mensuales de una muestra de empleados de la Municipalidad Distrital de Huancayo. Los datos se
muestran en la siguiente ojiva. Se pide reconstruir la tabla y contestar: ¿Qué porcentaje de la muestra representan
los empleados que perciben de S/. 900 a menos de S/. 1200?
Semana 6
DISTRIBUCIONES DE FRECUENCIAS
BIDIMENSIONALES
La estadística bivariada trata de ir más allá elaborando índices y
resultados estadísticos en términos de relaciones entre dos
variables de interés, así como de establecer inferencias sobre una
población a partir de datos que provienen de una muestra (como,
por ejemplo, en los estudios mediante encuesta).
41
Gestión Curricular
Asignatura: Estadística general
Francis
Gaston
Correlación
R. H.
Hooker
A. Francis Gaston: ideó el método conocido por Correlación, que tenía por objeto medir la
influencia relativa de los factores sobre las variables.
B. H. Hooker, que efectuaron amplios estudios sobre la medida de las relaciones.
Definición de bidimensional
LECTURA
El adjetivo bidimensional se utiliza para calificar a aquello que tiene dos dimensiones (2D). Un cuerpo que
se proyecta a lo largo y a lo ancho, por ejemplo, cuenta con dos dimensiones. En cambio, si también tiene
profundidad, se trata de un objeto con tres dimensiones (3D) y recibe el calificativo de tridimensional.
Por lo general las dimensiones se definen a partir de la cantidad mínima de coordenadas que se necesitan
para la especificación de un punto cualquiera en ella. De este modo, podemos afirmar que una línea es
unidimensional: alcanza una sola coordenada para ubicar un punto.
En el caso de los elementos bidimensionales, se requieren dos coordenadas para lograr la especificación de
un punto. Los polígonos, como los cuadrados o los triángulos, son bidimensionales debido a que, para situar
un punto, es necesario establecer la longitud y la latitud. Siguiendo con esta lógica, la localización de un
42
Gestión Curricular
Asignatura: Estadística general
Cabe destacar que, aún en una superficie bidimensional, es posible simular un efecto tridimensional. Una hoja
de papel es bidimensional: sin embargo, apelando a la perspectiva, es posible dibujar un cubo, dando una
sensación de tridimensionalidad.
Dentro del ámbito de la electricidad podemos establecer que también se utiliza el término que ahora nos ocupa.
En concreto, se emplea para referirse a la característica que puede tener un elemento conductor. Así, se
establece que si es bidimensional es porque en una de las direcciones del espacio es aislante mientras que en las
otras dos podemos determinar que cuenta con una mayor conductividad.
Además de todo lo indicado es necesario determinar que existe lo que se conoce como diseño gráico
bidimensional. Este es una disciplina que se sustenta en diseñar y darle forma a figuras de dos dimensiones para
diversos tipos de áreas. En concreto, para fotografías, dibujos, pinturas, imágenes de ordenador…
Fuente: Julián Pérez Porto y María Merino. Publicado: 2016. Actualizado: 2018.
Definición de: Definición de bidimensional (https://definicion.de/bidimensional/)
DATOS
CUALITATIV
OS Y MIXTOS
Propósito:
Organiza y compara dos variables cualitativas y mixtas; elaborando sus respectivas graficas e
interpretando los resultados.
43
Gestión Curricular
Asignatura: Estadística general
resultados pueden mostrarse en un diagrama de puntos o en un diagrama de cajas y bigotes con una escala
común.
Ambas variables son cuantitativas (ambas numéricas): Se acostumbra expresar matemáticamente los
datos como pares ordenados (x,y), donde “x” es la variable de entrada (variable independiente) y “y” es la
variable de salida (variable dependiente). Se llaman “emparejados” o “apareados” porque para cada valor
de “x” siempre hay un valor correspondiente de “y” de la misma fuente. Sus resultados se presentan en un
diagrama de dispersión.
2. DISTRIBUCIONES ABSOLUTAS MARGINALES:
Dada una distribución de frecuencias bidimensionales, podemos obtener dos distribuciones de frecuencias
absolutas marginales, una con respecto a la variable “x” y la otra respecto a la variable “y”.
Ejemplo:
Un grupo de estudiantes de la facultad de Ingeniería de la Universidad Continental están a punto de iniciar sus
prácticas pre profesionales en diferentes regiones de nuestro país (costa, sierra, selva). Se ha encuestado a un
grupo de ellos para conocer su género y la región elegida para llevar a cabo dichas prácticas. Los datos se
muestran a continuación:
GÉNERO REGIÓN GÉNERO REGIÓN GÉNERO REGIÓN
M Sierra F Selva F Selva
F Selva M Sierra M Selva
M Sierra M Sierra F Selva
M Costa M Costa F Selva
F Selva F Costa M Costa
M Selva M Selva M Sierra
F Costa M Selva F Selva
F Selva M Sierra M Sierra
Organiza los datos en una tabla de contingencia (tabla cruzada). Luego elabore la distribución de frecuencias
marginales y construya su gráfico de barras agrupadas.
Solución:
a) Construimos la tabla considerando la variable “Género” en las filas y “Región” en las columnas:
b) Completamos cada celda de la tabla con el número de veces que aparece cada dato bivariado. Para ello
contamos la cantidad de estudiantes de género masculino que viajarán a la costa, que viajarán a la sierra y a
la selva. Hacemos lo propio con las estudiantes de género femenino. Luego sumamos para calcular los
totales de fila y columna.
44
Gestión Curricular
Asignatura: Estadística general
Problemas Desarrollados
1. Determine la tabla cruzada y el gráfico apropiado a la variable del siguiente conjunto de datos:
SEXO ESTADO CIVIL
VARON SOLTERO(A)
MUJER CASADO(A)
45
Gestión Curricular
Asignatura: Estadística general
VARON SOLTERO(A)
VARON CASADO(A)
MUJER VIUDO(A)
MUJER SOLTERO(A)
VARON SOLTERO(A)
MUJER CASADO(A)
VARON CASADO(A)
VARON CASADO(A)
VARON SOLTERO(A)
MUJER VIUDO(A)
MUJER SOLTERO(A)
VARON VIUDO(A)
MUJER CASADO(A)
VARON VIUDO(A)
MUJER CASADO(A)
MUJER SOLTERO(A)
Solución
Aplicando el programa IBM SPSS Statistics Editor para obtener la tabla cruzada:
TABULACIÓN CRUZADA
ESTADO CIVIL
SOLTERO(A Total
CASADO(A) VIUDO(A)
)
VARON
Recuento 4 3 2 9
MUJER
Recuento 3 4 2 9
Recuento 7 7 4 18
Total
% del total 38,9% 38,9% 22,2% 100,0%
Graficando:
46
Gestión Curricular
Asignatura: Estadística general
Problemas Propuestos
1. La empresa PLAZA VEA como parte de su política de prestaciones de salud a sus colaboradores, ha iniciado
una campaña de prevención del cáncer pulmonar entre fumadores. Para ello aplicó una encuesta en la que se
preguntó, entre otras cosas, el género y si es fumador. Las respuestas se muestran a continuación:
47
Gestión Curricular
Asignatura: Estadística general
2. Treinta estudiantes de nuestra universidad se identificaron y clasificaron al azar según dos variables: Género
(M/F) y Especialidad: Ingeniería (I), Administración (A), Derecho (D).
F I F A F I
F A F I F A
F A M D M I
F D M A M A
M I M I F I
Elabore una tabla con tabulación cruzada o tabla de contingencia expresándola en porcentajes del gran total, y
conteste las siguientes preguntas:
a) ¿Qué porcentajes de estudiantes estudian derecho?
b) ¿Cuántos estudiantes estudian administración?
c) ¿Cuántos estudiantes estudian ingeniería y son del género femenino?
d) ¿Qué porcentaje de estudiantes estudian administración y son del género masculino?
3. Se está estudiando la relación que existe entre el grado de instrucción y el número de hijos que tienen las mujeres
de Huancayo. Para ello se ha entrevistado a un grupo de pobladoras y los resultados se muestran a continuación:
Nº Nº Nº
GDO. INST. HIJOS GDO. INST. HIJOS GDO. INST. HIJOS
SIN INSTRU. 6 SUPERIOR 1 PRIMARIA 3
SECUNDARI SECUNDARI
A 4 A 2 SUPERIOR 1
SECUNDARI SECUNDARI
A 3 A 2 PRIMARIA 2
SECUNDARI
SUPERIOR 2 A 3 SUPERIOR 2
SIN INSTRU. 5 SUPERIOR 2 PRIMARIA 3
SECUNDARI
SUPERIOR 1 SUPERIOR 2 A 3
a) Construya una tabla de contingencia para organizar dicha información, mostrando frecuencias absolutas y
relativas conjuntas.
b) Elabore la distribución de frecuencias marginales para cada variable.
c) Elabore el gráfico de barras agrupadas que represente a la tabla creada.
d) ¿Qué conclusión puede usted obtener al analizar la información ahora que está organizada?
4. Se han aplicado 3 métodos diferentes (Métodos: A, B y C) para la enseñanza de Análisis Matemático en la
facultad de Ciencias de la Empresa, luego de lo cual se aplicó una prueba para medir el tiempo (en minutos) que
los alumnos empleaban en resolver un conjunto de 20 ejercicios, siendo los resultados los siguientes:
Método A B B A C B B A C B B C B A B
Tiempo 15 8 10 18 15 11 9 10 11 8 10 10 12 15 8
Método B A C C B C A A B C A B B A C
48
Gestión Curricular
Asignatura: Estadística general
Tiempo 11 14 10 11 11 10 10 15 9 14 17 9 10 11 12
Video de Apoyo
49
Gestión Curricular
Asignatura: Estadística general
Semana 7
DISTRIBUCIONES DE FRECUENCIAS
BIDIMENSIONALES
A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por
Correlación, que tenía por objeto medir la influencia relativa de los factores
sobre las variables. De aquí partió el desarrollo del coeficiente de
correlación creado por Karl Pearson y otros cultivadores de la ciencia
biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que
efectuaron amplios estudios sobre la medida de las relaciones.
John Graunt:
Compilación
estadística
de los
recursos
nacionales
Sebastián
Muster:
A. John Graunt: fue un estadístico inglés a quien se considera el primer demógrafo, el fundador de
la bioestadística y el precursor de la epidemiología.
B. Sebastián Muster: realizó una compilación estadística de los recursos nacionales, comprensiva
de datos sobre organización política, instrucciones sociales, comercio y poderío militar.
RA
50
LE Gestión Curricular
Asignatura: Estadística general
DATOS
CUALITATIVO
S
Propósito:
Elabora la tabla bidimensional de dos variables cuantitativas e interpreta la relación positiva o
negativa.
51
Gestión Curricular
Asignatura: Estadística general
Ambas variables son cuantitativas (ambas numéricas): Se acostumbra expresar matemáticamente los datos como
pares ordenados (x,y), donde “x” es la variable de entrada (variable independiente) y “y” es la variable de salida
(variable dependiente). Se llaman “emparejados” o “apareados” porque para cada valor de “x” siempre hay un valor
correspondiente de “y” de la misma fuente. Sus resultados se presentan en un diagrama de dispersión.
2. DIAGRAMA DE DISPERSIÓN:
También conocido como gráfico de dispersión, gráfico de puntos, diagrama de XY o diagrama de dispersión,
consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la
relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra. En
este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la relación que
exista entre ellas, definimos su tipo de correlación.
Ejemplo:
Correlación lineal positiva: Temperatura y volumen
Correlación lineal negativa: Volumen y presión
No existe Correlación: inteligencia y la belleza.
Problemas Desarrollados
1. Los datos obtenidos al estudiar las variables X = “número de goles anotados” e Y = “número de goles
recibidos”, en 40 partidos jugados por el equipo campeón de la liga de fútbol sala, son:
(5;4) (4;2) (3;1) (3;2) (6;3)
(4;2) (5;3) (4;2) (4;3) (3;1)
52
Gestión Curricular
Asignatura: Estadística general
Frecuencias marginales
N° de goles N° de goles
Frecuencia Frecuencia
marcados recibidos
1 1 1 6
2 3 2 15
3 10 3 12
4 11 4 7
5 9
6 6
Total 40 Total 40
Diagrama de dispersión
53
Gestión Curricular
Asignatura: Estadística general
b. Gráfico 2
54
Gestión Curricular
Asignatura: Estadística general
c. Gráfico 3
No presentan relación
Problemas Propuestos
1. En una clase compuesta por 30 alumnos, se ha hecho un estudio sobre el número de horas diarias de estudio X y
el número de suspensos Y, obteniéndose los siguientes resultados:
(2, 0), (2, 2), (0, 5), (2, 1), (1, 2), (2, 1), (3, 1) (4, 0), (0, 4), (2, 2) (2, 1), (2, 1), (4, 0), (3, 1), (2, 4),
(2, 1), (1, 2), (2, 1), (2, 0), (3, 0) (3, 2), (2, 2), (2, 2), (2, 1), (0, 5), (1, 3), (2, 2), (2, 1), (1, 3), (1, 4)
Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de
dispersión. Luego señale el tipo de relación que existe entre ambas variables.
2. El número de horas dedicadas al estudio de una asignatura y la calificación final obtenida en el correspondiente
examen por ocho personas vienen dados en la tabla.
X: Horas de estudio 20 16 34 23 27 32 18 22
Y: Calificaciones del examen 6,5 6,0 8,5 7,0 9,0 9,5 7,5 8,0
55
Gestión Curricular
Asignatura: Estadística general
3. Las personas hipertensas, conscientes de la salud consultan a menudo la información relacionada con los
nutrientes que aparecen en los envases de los alimentos con el fin de evitar los que contengan grandes
cantidades de grasa, sodio o colesterol. La siguiente información se tomó de ocho marcas distintas de queso
americano en rebanadas:
Grasas Colesterol
Marca Grasa (g) Sodio (mg) Calorías
saturadas (g) (mg)
Kraft Deluxe American 7 4,5 20 340 80
Kraft Velveela Slices 5 3,5 15 300 70
Private Selectión 8 5,0 25 520 100
Ralphs Singles 4 2,5 15 340 60
Kraft 2% Milk 3 2,0 10 320 50
Kratl Singles American 5 3,5 15 290 70
Borden Singles 5 3,0 15 260 60
Lake to Lake American 5 3,5 15 330 70
Construya el diagrama de dispersión para colesterol y calorías. Observando la gráfica determine si existe algún
tipo de correlación entre ambas variables.
4. Los siguientes datos representan los años de práctica profesional y el ingreso anual (en miles de soles) para un
conjunto de servidores públicos:
Años de Años de
Ingreso Ingreso
práctica práctica
5 4 3 2
15 4 6 3
24 9 12 3
16 7 27 7
19 6 13 5
5. Un estadístico de una determinada línea aérea está estudiando la relación entre la distancia de destino con la
carga de mercancía para un tamaño estándar de embalaje. Se obtuvieron los siguientes datos para una muestra
aleatoria de diez facturaciones de carga:
Distancia Carga
22,4 6,8
56
Gestión Curricular
Asignatura: Estadística general
36,8 10,5
14,4 4,0
27,2 7,9
16,0 8,1
35,2 9,5
8,0 3,1
19,2 7,2
9,6 4,5
25,6 9,3
Video de Apoyo
Semana 8
EVALUACIÓN PARCIAL
57
Gestión Curricular
Asignatura: Estadística general
Unidad III
Resultado de Aprendizaje de la Unidad I:
Al finalizar la unidad, el estudiante será capaz de calcular las medidas de tendencia central,
variación, posición relativa y deformación para interpretar datos relacionados a su carrera
profesional.
ORGANIZACIÓN DE APRENDIZAJES
TEMAS Y SUBTEMAS ACTIVIDADES EVALUCIÒN
SEMANA N° 9 Actividad N° 17 Consolidado 2:
17. Medidas de tendencia central: Calcula las medidas de tendencia Evaluación individual de desarrollo
teórico-práctico
58
Gestión Curricular
Asignatura: Estadística general
Semana 9
MEDIDAS DE TENDENCIA CENTRAL
59
Gestión Curricular
Asignatura: Estadística general
Gustav
Theordor
Fechner:
Utilizo la
mediana
Francis
Galton
MEDIDAS DE CENTRALIZACIÓN
LECTURA
Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje, por sí
mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona
promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán
variadas son esas calificaciones.
Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar
las calificaciones que se obtienen en una prueba.
Volviendo a nuestro ejemplo, digamos que la calificación promedio en la prueba que hizo el alumno fue de
20 puntos. Con este dato podemos decir que la calificación del alumno se ubica notablemente sobre el
promedio. Pero si la calificación promedio fue de 65 puntos, entonces la conclusión sería muy diferente,
60
Gestión Curricular
Asignatura: Estadística general
MEDIDAS DE
CENTRALIZACI
ÓN
Propósito:
Calcular e interpretar las medidas de tendencia central (media, mediana y moda) de datos no agrupados y
agrupados.
Calcula e Grafique e interpreta la asimetría haciendo uso de las medidas de tendencia central.
Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la información con un solo
número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida
o parámetro de tendencia central o de centralización.
Entre las medidas de tendencia central tenemos:
Media aritmética
Mediana
Moda
1. LA MEDIA ARITMÉTICA ( x ; x ; M ; M (a)¿:
Es el resultado de dividir la suma de todas las observaciones entre el número de ellas.
a) M.A. para datos no agrupados:
61
Gestión Curricular
Asignatura: Estadística general
Sean: x1, x2, x3,…………xn un conjunto de datos de la variable cualitativa X, observados en una muestra.
Entonces su media aritmética es:
n
∑ Xi x1 + x 2 + x 3+ …+ x n
x= i=1 =
N N
Ejemplo:
Un estudiante rinde 4 evaluaciones obteniendo los siguientes puntajes.
x1 =10, x2 = 08, x3 =15, x4 =13
Hallar el promedio final ( x ):
4
∑ Xi x1 + x 2 + x 3+ x 4 10+ 08+15+13
x= i=1 = = =11.5
N 4 4
b) M.A. para datos agrupados:
Sean: x1, x2, x3…………xk, las marcas de clase y n 1, n2, n3, …………nm las frecuencias absolutas o simples,
k es el número de clase, entonces:
k
∑ ni X i
x= i=1
N
Se aumenta una columna donde se coloca el producto del valor de cada dato por su respectiva
frecuencia.
X Frecuencias ni X i
0 3 0
1 9 9
2 12 24
3 10 30
4 8 32
5 5 25
6 2 12
62
Gestión Curricular
Asignatura: Estadística general
7 1 7
N = 50 139
Solución
Aumentamos dos columnas, uno para la marca de clase y otro para el producto de cada marca de clase
con su respectiva frecuencia.
Li - Ls Xi ni ni.Xi
91.5 – 92.5 92 4 368
92.5 – 93.5 93 11 1023
93.5 – 94.5 94 20 1880
94.5 – 95.5 95 9 855
95.5 – 96.5 96 6 576
N = 50 4702
Luego:
k
Se utiliza la formula
∑ ni X i para hallar la M.A. x=
4702
=94.04
i=1
x= 50
N
Lo cual nos indica que semanalmente la producción promedio de 50 lingotes de acero por la
Minera es de 94.04 kg.
2. LA MODA ( Mo ¿ :
Es el valor que en una distribución de datos ocurre con mayor frecuencia, es decir, es el dato que se repite mayor
cantidad de veces que los demás. En algunas distribuciones de datos hay más de una moda y se les denomina
bimodal (dos modas) o multimodal (varias modas).
Cálculo de la moda:
63
Gestión Curricular
Asignatura: Estadística general
Hallar la moda.
Se observa que la puntuación que más se repite es 19, por lo tanto, la moda es:
Mo = 19
Ejemplo 2:
En la siguiente distribución de datos se tiene las puntuaciones:
14 16 16 16 18 19 19 19 21 22
Hallar la moda:
Las puntuaciones que más se repite son: 16 y 19, por lo tanto, la distribución de los datos es bimodal
Ejemplo:
Determina la moda de la distribución siguiente:
Mo=Li+
( ∆1
)
∆ 1+ ∆ 2
c
Donde:
Li = Es el límite inferior del intervalo de clase donde se encuentra la moda.
c = es la amplitud del intervalo de clase donde se encuentra la moda.
64
Gestión Curricular
Asignatura: Estadística general
∆ 1 = ni – ni – 1: diferencia entre la frecuencia del intervalo modal con la frecuencia del intervalo
anterior.
∆ 2 = ni – ni + 1: diferencia entre la frecuencia del intervalo modal con la frecuencia del intervalo
posterior.
Ejemplo:
En la siguiente distribución de frecuencias se dan las edades de una muestra de personas del anexo de
Batanyacu. Hallar la moda de dicha distribución:
Intervalos N° de personas
Li - Ls ni
10 – 20 3
20 – 30 7
30 – 40 15
40 – 50 28
50 – 60 40
60 – 70 31
70 – 80 16
80 - 90 8
Observando la distribución que la mayor frecuencia es 40, que se ubica en el intervalo (50 – 60),
denominándolo intervalo modal.
Hallamos:
El límite inferior: Li = 50
∆ 1 = ni – ni – 1 ∆ 2 = ni – ni + 1
∆ 1 = 40 – 28 ∆ 2 = 40 – 31
∆ 1 = 12 ∆2 = 9
Su amplitud (c): c = 10
Reemplazando en la fórmula:
Mo=Li+
( ∆1
∆ 1+ ∆2)c=50+
12
12+ 9
10=55.71( )
3. LA MEDIANA ( Me ¿:
La mediana es una medida de tendencia central, cuyo valor divide a un conjunto de datos, ordenado con respecto
a la magnitud de sus valores, de tal manera que el número de datos por encima de la mediana es igual al número
de datos por debajo de la misma.
65
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
Sean los siguientes 11 datos obtenidos de la observación de una variable X:
0 8 1 2 9 1 3 8 4 7 6
Significa que el 50% de los datos de la distribución son mayores que 4 y los otros 50% son menores que
4.
N° de caras Frecuencias
(Xi) (ni)
0 2
1 19
2 46
3 62
4 47
5 20
6 4
66
Gestión Curricular
Asignatura: Estadística general
Para hallar la Me en estas variables, se utiliza el mismo procedimiento anterior, pero utilizando la
siguiente fórmula:
( )
n
−N i−1
2
Me=l i + .c
ni
Donde:
li = límite inferior donde se encuentran la mediana.
c = amplitud del intervalo de clase.
n = tamaño de la muestra o total de datos de la distribución.
N i−1 = frecuencia acumulada del intervalo anterior donde se encuentra la mediana.
ni = frecuencia del intervalo donde se encuentra la mediana.
Ejemplo:
Sean datos correspondientes a la medición en centímetros de 200 varillas, determine la Me:
Li – Ls ni
29.5 – 30.5 4
30.5 – 31.5 8
31.5 – 32.5 23
32.5 – 33.5 35
33.5 – 34.5 62
34.5 – 35.5 44
35.5 – 36.5 18
36.5 – 37.5 4
37.5 – 38.5 1
38.5 – 39.5 1
Luego se busca un Ni que sea mayor o igual que N/2 (N = n° total de datos)
N/2 = 200/2 = 100
Entonces: ¿ ≥ 100 el más cercano será Ni = 132
33.5 – 34.5 62 132
li = 33,5
c=1
67
Gestión Curricular
Asignatura: Estadística general
n = 200
N i−1 = 70
ni = 62
Reemplazando en la fórmula:
( ) ( )
n 200
−N i−1 −70
2 2 30
Me=l i + . c=33.5+ .1=33.5+ =33 ,98
ni 62 62
Problemas Desarrollados
1. Una persona que trabaja en forma independiente gana en un mes s/. 200; otro mes s/.600, un tercer mes s/.400
y un cuarto mes S/.440, ¿En promedio ménsula cuánto gana?
200+ 600+400+ 440 1640
X= = =410
4 4
2. Se escogieron al azar 24 familias y se les pregunto por el número de hijos que tenía cada una; las respuestas
obtenidas fueron las siguiente: 2,4,6,6,2,3,0,0,4,5,3,3,4,3,5,2,1,2,0,3,4,5,1,1
Hallar el promedio del número de hijos de las 25 familias.
Solución
68
Gestión Curricular
Asignatura: Estadística general
Xi ni Xi.ni
0 3 0
1 3 3
2 4 8
3 5 15
4 4 16
5 3 15
6 2 12
n= 24 69
2–4 3 3 9
4–6 5 2 10
6–8 7 5 35
8 - 10 9 9 81
10 - 12 11 12 132
512 14 - 16 15 2 30
X= =10.67=10.7
48
16 - 18 17 5 85
N = 48 512
Problemas Propuestos
1. Una empresa ha realizado un test físico entre todos sus empleados para comprobar la capacidad de esfuerzo
que posee cada uno de ellos. Una de las medidas que componen el test es el número de pulsaciones después
69
Gestión Curricular
Asignatura: Estadística general
de una determinada actividad física que está altamente relacionada con las que se realizan a lo largo de una
jornada laboral. Los datos conseguidos han sido distribuidos en la siguiente tabla:
Numero de Número de
pulsaciones empleados
[65-70> 12
[70-75> 15
[75-80> 10
[80-85> 28
[85-90] 30
[90-95] 5
a) ¿Qué porcentaje de empleados tuvo menos de 85 pulsaciones?
b) Calcula la media aritmética, la mediana y la moda. Interpreta los resultados.
2. Los ingresos en dólares de 18 hombres elegidos al azar del Banco BBVA CONTINENTAL (entre un total
de 1000) se muestran a continuación:
45,16 83,61 79,85 22,07 76,91 65,73
88,91 99,49 62,59 34,20 88,61 41,50
68,89 92,22 54,33 53,20 16,60 62,59
a) Calcula la media aritmética empleando la tabla de frecuencias.
b) Halla la mediana y moda e interpreta (en termino de dólares).
c) ¿Se puede considerar que las poblaciones de 1000 personas tendrán la misma media que la muestra de
18 personas? ¿Por qué?
3. El grafico tallo y hoja muestra los productos vendidos de la tienda “La Moderna” en un día. Calcular las
medidas de tendencia central y graficar el sesgo y, ¿la media aritmética es significativa en los productos
vendidos?
TALL HOJAS
O
2 2
3 122
4 2333
5 228
6 7
4. De los 46 productos vendidos de la tienda “Casa Sueldo” un día domingo. Calcular las medidas de
tendencia central, asimetría e interpretar el sesgo. Elabora una tabla de frecuencias a partir del histograma.
70
Gestión Curricular
Asignatura: Estadística general
5. Se tiene el siguiente cuadro que corresponde quesos producidos por trabajador para la empresa
SERRANITA:
Litros de lácteos producidos 5-11> 11-17> 17-23> 23-29> 29-35>
Cantidad de trabajadores 12 18 13 9 10
Video de Apoyo
Video 1: Media, Mediana y Moda - Ejemplos y Ejercicios Resueltos - Medidas de Tendencia Central
(https://www.youtube.com/watch?v=jiceVfALmV0)
71
Gestión Curricular
Asignatura: Estadística general
Semana 10
MEDIDAS DE VARIACIÓN O DISPERSIÓN
La desviación típica cumple la llamada desigualdad de
Tchebychev: según la cual, los datos que se alejan de la media
una distancia igual o menor que s, multiplicado por un
coeficiente k suponen más de la proporción 1-1/k2. Así, el 75%
de los datos al menos, se encuentra a menos de dos desviaciones
típicas y el 89% a menos de tres.
72
Gestión Curricular
Asignatura: Estadística general
Hiparco de
NIcea
Telescopio
para observar
el cielo
Galileo Galilei
A. Hiparco de Nicea: el primer catálogo de estrellas; la división del día en 24 horas de igual
duración (hasta la invención del reloj mecánico en el siglo XIV las divisiones del día variaban
con las estaciones
B. Galileo Galilei: Fue el primer astrónomo que usó el telescopio para observar el cielo. La
Inquisición lo condenó a arresto domiciliario por sus descubrimientos, el cual fue levantado
359 años después por el papa Juan Pablo II.
VARIABILIDAD Y DISPERSIÓN
Las ideas de variabilidad y dispersión revisten una gran importancia en la estadística, pues dotan a
esta ciencia de su razón de ser y pueden ser abordadas, tanto desde la estadística descriptiva, como
LECTURA
de la probabilidad y la inferencia. Tanto Wild y Pfannkuch (1999), como Moore (1990) incluyen la
percepción de la variabilidad aleatoria como componentes esenciales del razonamiento estadístico.
Las medidas de dispersión son, además, esenciales en una distribución de datos,
complementando a las de posición central, al caracterizar la variabilidad de los datos respecto a las
mismas. Como sugieren Batanero, González- Ruiz, López-Martín y Contreras (2015), es
importante que los estudiantes las comprendan y diferencien las relacionadas con la distribución de
datos, la distribución de probabilidad y la distribución muestral.
A pesar de su importancia, la investigación didáctica sobre la comprensión de la
variabilidad y la dispersión es relativamente escasa, en comparación con la existente respecto a las
ideas de centro y medidas de posición central. Por este motivo me interesé en comenzar una línea
de investigación al respecto, que desembocará en un estudio del tema en los libros de texto y otro
estudio de evaluación amplio de la comprensión de estas ideas en estudiantes de educación
secundaria y se concretará en una tesis doctoral.
73
Gestión Curricular
Asignatura: Estadística general
La finalidad del este trabajo fin de Máster es realizar una síntesis de la investigación didáctica
relacionada con este tema, que sirva de fundamento para la futura tesis doctoral, ya avanzada. Para
llevarla a cabo se ha realizado una extensa consulta, estudio, análisis y síntesis de dicha
investigación, clasificándola y resumiéndola en esta memoria, que se organiza en los siguientes
capítulos:
En el primero de ellos se comienza justificando el interés de realizar este trabajo de síntesis, se
presenta una síntesis de la evolución histórica de estos conceptos, se analizan los contenidos
curriculares relacionados con las ideas de variabilidad y dispersión y se presentan los objetivos del
trabajo.
El segundo capítulo expone en forma resumida algunas ideas de nuestro marco teórico que es el
enfoque ontosemiótico que consideramos de interés para nuestro
trabajo actual y nuestra futura tesis doctoral.
En el tercer capítulo se presenta el trabajo de síntesis de la investigación previa
que se organiza a través de los significados de la dispersión, aportando a su vez estudios 5 sobre la
percepción y las concepciones de estudiantes y futuros profesores de las medidas de dispersión.
Fuente: (Hald, 1998, p. 33) Los errores aleatorios de las observaciones nos llevan a errores aleatorios
de una función de las observaciones que pueden ser grandes, incluso si los errores de observación son
pequeños.
MEDIDAS DE
VARIACIÓN O
DISPERSIÓN
Propósito:
Calcular e interpretar medidas de variación o dispersión.
Describir y comparar distribuciones de datos a partir de sus medidas de dispersión.
Aplicar las medidas de dispersión para analizar la representatividad de la media aritmética.
S=2∑ ( X i−Ma )
2
n
Donde:
Xi = dato u observación.
Ma = media aritmética
74
Gestión Curricular
Asignatura: Estadística general
Ejemplo:
S=
√ ∑ ( X i−Ma) 2
n
El tiempo que utilizan 6 niños de igual edad para desarrollar una misma tarea fue la siguiente:
16; 12; 15; 18; 13; 14 minutos
Hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos:
Solución:
Hallamos la Ma:
16 +12+15+18+13+14 88
Ma= = =14.7
6 6
Luego calculamos la suma de las desviaciones al cuadrado (varianza)
2
S=
∑ 2
( X i−Ma ) . ni
n
Fórmula para la desviación estándar:
S=
√ ∑ ( X i−Ma) 2 ni
n
Ejemplo:
En la siguiente distribución de frecuencias del número de hijos de 50 familias, se pide hallar la
varianza (S2) y la desviación estándar (S) del conjunto de datos:
N° de hijos N° de familias
Xi ni
75
Gestión Curricular
Asignatura: Estadística general
0 3
1 9
2 12
3 10
4 8
5 5
6 2
7 1
Completando columnas:
Xi ni ni X i ( X i−Ma ) 2 2
( X i−Ma ) .∋¿
0 3 0 7,73 23,19
1 9 9 3,17 28,53
2 12 24 0,61 7,32
3 10 30 0,05 0,5
4 8 32 1,49 11,92
5 5 25 4,93 24,65
6 2 12 10,37 20,74
7 1 7 17,81 17,81
N = 50 139 134,66
139
Hallando la M.A: Ma= =2.78
50
Luego: 2
S=
∑ 2
( X i−Ma ) . ni 134 , 66
= =2.69
n 50
Entonces: S= √ 2 , 69=1.64
El número de hijos de las 50 familias tienen una dispersión promedio de 1.64 hijos con respecto a la
media aritmética.
2
S=
∑ 2
( X i−Ma ) . ni
n
Fórmula para la desviación estándar:
Donde:
S=
√ ∑ ( X i−Ma) 2 ni
n
Xi = marca de clase
Ma = media aritmética
n = número total de datos
2
( X i−Ma ) = desviación al cuadrado de cada dato con respecto a la media.
Ejemplo:
Se han registrado el peso de 50 lingotes de acero producidos por SIDERPERU, la muestra fue
obtenido de la producción semanal y las unidades están dadas en kg. Hallar la varianza (S 2) y la
desviación estándar (S) del conjunto de datos.
76
Gestión Curricular
Asignatura: Estadística general
Li - Ls ni
91,5 – 92,5 4
92,5 – 93,5 11
93,5 – 94,5 20
94,5 – 95,5 9
95,5 – 96,5 6
N = 50
Solución
Hallando la Ma:
4702
Ma= =94.04
50
Completando la columna cinco:
2 2 2
| X i−Ma| =|X 1 −Ma| =|92−94 , 04| =4,1616
Completando la columna seis:
2 2 2
| X i−Ma| .∋¿|X 1 −94 , 04| . n1 =|92 , 0−94 , 04| .4=4,1616.4=16,6464
Aumentamos cuatro columnas:
2 2
Li - Ls Xi ni ni.Xi ( X i−Ma ) ( X i−Ma ) .∋¿
91.5 – 92.5 92 4 368 4,1616 16,6464
92.5 – 93.5 93 11 1023 1,0816 11,8976
93.5 – 94.5 94 20 1880 0,0016 0,32
94.5 – 95.5 95 9 855 0,9216 8,2944
95.5 – 96.5 96 6 576 3,8416 23,0496
N = 50 4702 60,2256
Hallando la varianza:
2
S=
∑ 2
( X i−Ma ) . ni 60,2256
= =1 ,20
n 50
Hallando su desviación estándar:
S=
√ ∑ ( X i−Ma) 2 ni =√ 1 ,20=1,095
n
Por lo tanto, los lingotes de acero en la producción semanal de SIDER PERÚ se dispersan en
promedio de 1,095 kg con respecto a la media aritmética.
2. COEFICIENTE DE VARIACIÓN:
Ejemplo 1.
77
Gestión Curricular
Asignatura: Estadística general
Hallar el coeficiente de variación (CV) del tiempo que utilizan 6 niños de igual edad para desarrollar una
misma tarea, los resultados son los siguientes: 16; 12; 15; 18; 13; 14 minutos.
Solución
Hallando la Ma:
16 +12+15+18+13+14 88
Ma= = =14.7
6 6
Determinando la varianza:
2
S =3.89
S= √3.89=1.97
Hallando el CV:
S 1.97
CV = x 100 %= x 100 %=13.40 %
Ma 14.7
Ejemplo 2.
Sea la distribución de frecuencias de las notas de Estadística general de estudiantes de la Universidad
Continental. Hallar S2, S, CV.
Li - Ls ni
00 – 02 3
02 – 04 5
04 – 06 2
06 – 08 12
08 – 10 8
10 – 12 3
12 – 14 7
14 – 16 10
N=50
Solución:
Completando cuadrados con los pasos estudiados:
2 2
Li - Ls Xi ni Xi.ni ( X i−Ma ) ( X i−Ma ) .∋¿
00 – 02 1 3 3 66.59 199.77
02 – 04 3 5 15 37.95 189.75
04 – 06 5 2 10 17.31 34.62
06 – 08 7 12 84 4.67 56.04
08 – 10 9 8 72 0.03 0.24
10 – 12 11 3 33 3.39 10.17
12 – 14 13 7 91 14.75 103.25
14 – 16 15 10 150 34.11 341.10
N=50 458 934.94
78
Gestión Curricular
Asignatura: Estadística general
458
Hallando la Ma: Ma= =9.16
50
Hallando S2:
S=2∑ 2
( X i−Ma ) . ni 934.94
= =18.70
n 50
Hallando S: S= √ 18.70=4.32
Hallando CV:
S 4.32
CV = x 100 %= x 100=47.16
Ma 9.16
Problemas Desarrollados
1. Las edades de 8 niños son las siguientes: 5, 6, 8, 7, 5, 6,9 y 10 años. Determine la varianza y la desviación
estándar.
Solución
Hallamos la Ma:
5+ 6+8+7 +5+6+ 9+10 56
Ma= = =7
8 8
Halando la varianza y la desviación estándar:
( 5−7 )2 + ( 6−7 )2 + ( 8−7 )2+ ( 7−7 )2+ ( 5−7 )2+ ( 6−7 )2 + ( 9−7 )2 + ( 10−7 )2
2
S=
8
2 4 +1+1+0+ 4+1+ 4+ 9
S=
8
2 24
S= =3
8
S= √3=1.73
2. Se han registrado la edad en una muestra de 53 niños que tienen problemas de salud. Hallar la varianza y la
desviación estándar.
Li - Ls ni
0-3 5
3-6 12
6-9 20
9 - 12 10
12 - 15 6
79
Gestión Curricular
Asignatura: Estadística general
Solución
Completando la tabla de frecuencias:
Determinamos la Ma:
397.5
Ma= =7.5
53
Hallando la varianza y desviación estándar:
2 594
S= =11.21
53
S= √11.21=3.35
3. Un docente de matemática aplico una evaluación a un grupo obteniendo los siguientes resultados:
37 35 43 45 45 35 35
42 40 46 35 34 44 43
34 40 38 37 40 38 36
80
Gestión Curricular
Asignatura: Estadística general
Li - Ls ni Xi Ni
Hallando la media aritmética (Ma):
ni.xi | X i−Ma| | X i−Ma|.∋¿ (xi - Ma)2 (xi - Ma)2.ni
[34-36[ 6 35 6 210 4.57 27.42 20.88 125.28
[36-38[ 3 37 9 111 2.57 7.71 6.60 19.80
[38-40[ 2 39 11 78 0.57 1.14 0.32 0.64
[40-42[ 3 41 14 123 1.43 4.29 2.04 6.12
[42-44[ 3 43 17 129 3.43 10.29 11.76 35.28
[44-46] 4 45 21 180 5.43 21.72 29.48 117.92
N=21 831 72.57 305.04
831
X= =39.57
21
Hallando la S2:
2 305.04
S= =14.53
21
S= √ 14.53=3.81
Problemas Propuestos
2. Calcular todas las medidas de dispersión para los datos de la siguiente distribución:
Xi 0-100 100-200 200-300 300-800
ni 90 140 150 120
3. Un artículo reportó los siguientes datos sobre consumo de oxígeno (ml/kg/min) para una muestra de diez
bomberos que realizaron un simulacro de supresión de incendio.
29,5 49,3 30,6 28,2 28,0
26,3 33,9 29,4 23,5 31,6
Calcule lo siguiente:
a) El rango muestral.
b) La varianza muestral (s2) a partir de la definición (es decir, calculando primero las desviaciones y luego
elevándolas al cuadrado, etcétera).
c) La desviación estándar muestral.
d) S2 utilizando el método más corto. (con ayuda de la formula)
4. Una compañía requiere los servicios de un técnico especializado. De los expedientes presentados, se han
seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos. Para decidir cuál de los 2 se va a contratar se
toman siete pruebas a cada uno de ellos. Los resultados se dan a continuación:
Prueba
1 2 3 4 5 6 7
81
Gestión Curricular
Asignatura: Estadística general
Video de Apoyo
(https://www.youtube.com/watch?v=oZRaDwnpXkY)
82
Gestión Curricular
Asignatura: Estadística general
Semana 11
MEDIDAS DE POSICIÓN RELATIVA
Son indicadores usados para señalar que porcentaje de datos dentro de una
distribución de frecuencias superan estas expresiones, cuyo valor representa el
valor del dato que se encuentra en el centro de la distribución de frecuencia
Ronald A.
Fisher
Biometría
Universidad
de
Cambridge
A. Ronald A. Fisher: Fisher expresó que las desviaciones que excedían dos veces la desviación
estándar eran consideradas significativas. Previamente a esto las desviaciones que excedían
tres veces el error probable eran consideradas significativas. Previamente a esto las
desviaciones que excedían tres veces el error probable eran consideradas significativas. Para
una distribución simétrica el error probable la mitad del rango intercuantil. El cuantil superior
83
Gestión Curricular
Asignatura: Estadística general
84
Gestión Curricular
Asignatura: Estadística general
MEDIDAS DE
POSICIÓN
Propósito:
Calcular e interpretar medidas de posición relativa (cuartiles y percentiles).
Efectuar análisis exploratorio de datos haciendo uso de diagramas de caja y bigote.
1. CUARTILES:
Son valores que dividen a un conjunto de datos ordenados en forma ascendente o descendente en cuatro partes
iguales del conjunto de datos.
Es decir:
Ejemplo:
Consideremos los siguientes datos ordenados (n = 13).
Posición 1 2 3 4 5 6 7 8 9 10 11 12 13
Datos 104 112 134 146 155 168 170 195 246 302 338 412 678
85
Gestión Curricular
Asignatura: Estadística general
Solución.
134+146
Posición del cuartil inferior = (13 + 1)/4 = 3.5 Q 1= =140
2
Posición de la mediana = (13 + 1)/2 = 7 Me=Q2=170
302+338
Posición del cuartil superior = 3.(13 + 1)/4 = 10.5 Q 3= =320
2
Dentro de los cuartiles se puede observar:
En nuestro ejemplo:
Mínimo = 104 25%
Cuartil inferior(Q1) = 140 25%
Mediana(Q2) = 170 25%
Cuartil superior(Q3) = 320 25%
máximo = 678
( )
j.N
−N i−1
4
Q j=li+ .c
ni
Donde:
j = 1,2,3
li = límite inferior donde se encuentra el primer cuartil
c = amplitud del intervalo de clase donde se encuentra el cuartil.
N = tamaño de la muestra o total de datos de la distribución.
N i−1= frecuencia acumulada del intervalo anterior donde se encuentra el
Ejemplo:
86
Gestión Curricular
Asignatura: Estadística general
Sean los siguientes datos correspondientes a la medición en centímetros de 200 varillas. Hallar el primer
y el tercer cuartil.
Li - Ls ni
29,5 – 30,5 4
30,5 – 31,5 8
31,5 – 32,5 23
32,5 – 33,5 35
33,5 – 34,5 62
34,5 – 35,5 44
35,5 – 36,5 18
36,5 – 37,5 4
37,5 – 38,5 1
38,5 – 39,5 1
Realizamos el mismo procedimiento que en la mediana, se aumenta una columna para la frecuencia
acumulada (Ni)
Li - Ls ni Ni
29,5 – 30,5 4 4
30,5 – 31,5 8 12
31,5 – 32,5 23 35
32,5 – 33,5 35 70
33,5 – 34,5 62 132
34,5 – 35,5 44 176
35,5 – 36,5 18 194
36,5 – 37,5 4 198
37,5 – 38,5 1 199
38,5 – 39,5 1 200
N =200
Hallando el Q1.
Luego se busca un Ni que sea mayor o igual que N/4 (N = n° total de datos)
N/4 = 200/4 = 50,
Entonces: ¿ ≥ 50 el más cercano será Ni = 70, esto nos indica que aquí esta Q1.
32,5 – 33,5 35 70
Donde:
Li = 32,5
c=1
N = 200
N i−1=35
ni =35
Reemplazando en la fórmula:
( ) ( )
n 200
−N i−1 −35
4 4
Q1=li+ . c=32.5+ .1=32.93
ni 35
Hallando el Q3.
Luego se busca un Ni que sea mayor o igual que 3N/4 (N = n° total de datos)
3N/4 = 3(200)/4 = 150,
Entonces: ¿ ≥ 150 el más cercano será Ni = 176, esto nos indica que aquí esta Q3.
34,5 – 35,5 44 176
87
Gestión Curricular
Asignatura: Estadística general
Donde:
Li = 34,5
c=1
N = 200
N i−1=132
ni =44
Reemplazando en la fórmula:
( ) ( )
3n 3.200
−N i−1 −132
4 4
Q3=li+ . c=34.5+ .1=34.91
ni 44
∴ Q1=32.93 ∧Q3=34 , 91
2. PERCENTILES:
Los percentiles dividen al conjunto de observaciones en cien partes iguales. Hay 99 percentiles.
P1=1% P5=5% P50=50% P99=99
1% 1% 1% 1% 1% 1%
L= ( 100k ) xn
n = Número de valores
k = Percentil buscado
“L” es un número entero, si el valor de k-énesimo percentil está a la mitad entre el L-énesimo
valor y el siguiente valor en el conjunto ordenado de datos. Obtenga Pk sumando el L-énesimo
valor y el siguiente valor, luego dividiendo el total entre 2.
No modifique L redondeando al siguiente entero más grande.
El valor de Pk es el L-énesimo valor, contando a partir del más bajo.
Ejemplo:
Determine el cuartil 3 de los siguientes valores muestrales:
25 – 18 – 47 – 35 – 32 – 19 – 20 – 26 – 35 – 30 – 28 – 30
Solución
88
Gestión Curricular
Asignatura: Estadística general
18 – 19 – 20 – 25 – 26 – 28 – 30 – 30 – 32 – 35 – 35 – 47
Calcule el valor del localizador para el P75 = Q3
L = (75/100).12 = 9 (Se promedia el 9no y 10mo dato)
Calcule el valor del P75 = Q3
P75 = (32 + 35)/2 = 33,5
INTERPRETACIÓN: El 75% de los valores son menores o iguales a 33,5, mientras que el 25% restante
son mayores o iguales a 33,5
( )
10(35)
−3
Reemplazando en la fórmula: 100
P10=C 10=75+ .5=75.83
3
Hallando P90:
90 n 90(35)
Si: = =31.5 ⟹ N i ≥ 31.5 ⟼ N i=35
100 100
Considerando el intervalo:
90 – 95 12 35
( )
90(35)
−23
Reemplazando en la fórmula: 100
P90=C 90=90+ .5=93.54
12
89
Gestión Curricular
Asignatura: Estadística general
a) Q1 = P25
b) Q2 = P50 = Mediana
50% 50%
Me
c) Q3 = P75
Q P
3 75
4. RANGO INTERCUARTIL.
Es una medida de dispersión estadística, la cual indica la distancia a la que se encuentra el 50% central de datos.
Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico es altamente
recomendable cuando la medida de tendencia central utilizada es la mediana (ya que la mediana es insensible a
posibles valores extremos)
R.I. = Q3 – Q1
Q Q Q
1 2 3
Es el proceso que consiste en utilizar herramientas estadísticas (como gráficas, medidas de tendencia central y
medidas de variación) con la finalidad de investigar conjuntos de datos para comprender sus características
importantes.
Se llama "valor extremo" o “dato distante” a aquel que está muy alejado de la mayor parte de los demás
valores. Los valores extremos se deben considerar ya que pueden revelar información importante y afectar en
gran medida el valor de la media y de la desviación estándar.
Ejemplo:
Datos 1: 9 – 10 – 13 – 14 – 17 – 56
90
Gestión Curricular
Asignatura: Estadística general
Datos 2: 3 – 34 – 36 – 40 – 42 – 47
Una caja es un rectángulo que se construye sobre la base de los valores del primer cuartil, la mediana y el
tercer cuartil. Permite comparar diversos conjuntos de datos simultáneamente respecto a simetría,
variabilidad, centro, valores extremos y valores atípicos.
1,5RIQ 1,5RIQ
RIC = Q3 – Q1
7. COEFICIENTE DE CURTOSIS.
3RIQ 3RIQ
Curtosis es la deformación vertical de una curva de frecuencias. Se define como el grado de apuntamiento de
la curva.
7.1. Clases de curtosis:
a) Leptocurtica, se denomina así cuando la curva de apuntamiento es muy pronunciada.
c) Mesocurtica, se denomina así cuando la curva de apuntamiento está en el intermedio de las dos
anteriores.
91
Gestión Curricular
Asignatura: Estadística general
Si:
K=0 la curva de la distribución es mesocurtica
K>0 la curva de la distribución es leptocurtica
K<0 la curva de la distribución es platicurtica
Ejemplo:
Se toman las pulsaciones de un equipo de atletas después de una competencia. Los datos obtenidos son:
Pulsaciones 70 - 75 75 - 80 80 - 85 85 - 90 90 - 95
N° de atletas 3 3 7 10 12
Solución:
Hallando Q 3 y Q 1 , P90 y P10
Completando la tabla:
Li - Ls ni Ni
70 – 75 3 3
75 – 80 3 6
80 – 85 7 13
85 – 90 10 23
90 - 95 12 35
35
Hallando Q1:
( )
n
−N i−1
Recordando: 4
Q1=Li + .c
ni
n 35
Si: = =8.75⟹ N i ≥ 8.75↦ N i=13
4 4
Considerando el intervalo:
80 – 85 7 13
Reemplazando datos:
( )
n
−N i−1
Q1=Li +
4
ni
. c=80+
8.75−6
7
.5=81.96 ( )
Hallando Q3:
( )
3n
−N i−1
Recordando: 4
Q3=li+ .c
ni
3 n 3 (35)
Si: = =26.25⟹ N i ≥26.25 ⟼ N i=35
4 4
Considerando el intervalo:
90 - 95 12 35
Reemplazando en la fórmula:
92
Gestión Curricular
Asignatura: Estadística general
( ) ( )
3n 3(35)
−N i−1 −23
4 4
Q3=li+ . c=90+ .5=91.35
ni 12
Hallando P10:
10 n 10 (35)
Si: = =3.5 ⟹ N i ≥3.5 ⟼ N i=6
100 100
Considerando el intervalo:
75 – 80 3 6
( )
10(35)
−3
Reemplazando en la fórmula: 100
P10=C 10=75+ .5=75.83
3
Hallando P90:
90 n 90(35)
Si: = =31.5 ⟹ N i ≥ 31.5 ⟼ N i=35
100 100
Considerando el intervalo:
90 – 95 12 35
( )
90(35)
−23
Reemplazando en la fórmula: 100
P90=C 90=90+ .5=93.54
12
Por lo tanto:
Q 3−Q1 91.35−81.96 9.39 9.39
K= = = = =0.2651=0.27
2(P 90−P 10) 2(93.54−75.83) 2(17.71) 35.42
Significa que viene a ser una curva de frecuencias suavemente leptocurtica
Problemas Desarrollados
Solución:
Primer paso:Ordenar los datos en forma ascendente:
91 – 115 – 120 – 160 – 170 – 185 – 190 – 233 – 255 – 265
Segundo paso: Se sabe que Q1 = P25, por lo tanto, calcularemos el percentil 25.
25
Calcular el localizador L: (k = 25) L= × 10=2 , 5
100
Tercer paso: Redondeamos L con las reglas del redondeo que hemos aprendido anteriormente, en este
caso L=3
Cuarto paso: Calculamos el valor de P25 (el dato que ocupa la posición 3 empezando del menor dato).
91 – 115 – 120 – 160 – 170 – 185 – 190 – 233 – 255 – 265
93
Gestión Curricular
Asignatura: Estadística general
P25=120
Interpretación: El 25% de los datos son menores o iguales a 120 y el 75% restante son mayores o iguales
que este valor.
2. Sean los calificativos de una evaluación de estadística de 45 estudiantes, determina el percentil 10 y 90.
¿ ni
¿ 1
¿ 2
¿ 4
¿ 10
¿ 16
¿ 8
¿ 3
¿ 1
N = 45
Solución
Completamos la tabla, aumentando una columna para la frecuencia absoluta acumulada (Ni).
¿ ni Ni
¿ 1 1
¿ 2 3
¿ 4 7
¿ 10 17
¿ 16 33
¿ 8 41
¿ 3 44
¿ 1 45
N = 45
Hallando el: P10
Si: 10N/100 =10(45)/100= 4.5
Se busca un Ni que sea mayor o igual que N/4 (N=n° Total de datos)
Entonces: Ni ≥ 4.5 el más cercano será Ni= 7
¿ 4 7
Dónde:
Li = 42 N i−1=3 ni =4 c=8
Remplazando en la fórmula:
( ) ( )
10 n 10 ( 45 )
−N i−1 −3
100 100
P10=l i + .c =42+ .8=45
ni 4
Hallando el: P90
Si: 90N/100 =90(45)/100= 40.50
Luego se busca un Ni que sea mayor o igual que N/4 (N=n° Total de datos)
94
Gestión Curricular
Asignatura: Estadística general
¿ 8 41
Dónde:
Li = 66 N i−1=33 ni =8 c=8
( ) ( )
90 n 90 ( 45 )
−N i−1 −33
100 100
P90=l i + . c=66+ .8=73.50
ni 8
Problemas Propuestos
Me = P5 ( ) Q2 =P50 =Me ( )
95
Gestión Curricular
Asignatura: Estadística general
Video de Apoyo
Video 1: Cuartiles introducción | Qué son y como encontrarlos en datos sin agrupar
(https://www.youtube.com/watch?v=suSz9RXFNTs)
Semana 12
EVALUACIÓN DE LA TERCERA UNIDAD
SESIÓN 23: PRUEBA DE DESARROLLO
Problemas de repaso
96
Gestión Curricular
Asignatura: Estadística general
1. La tabla siguiente muestra los nombres de los 42 presidentes de Estados Unidos, junto con el número de sus
hijos.2
Washington 0 Hayes 8 F.D. Roosevelt 6
Van Buren 4 J.Q. Adams 4 Carter 4
Buchanan 0 Fillmore* 2 T. Roosevelt* 6
Adams 5 Garfi eld 7 Truman 1
W.H. Harrison 10 Jackson 0 Taft 3
Lincoln 4 Pierce 3 Eisenhower 2
Jefferson 6 Arthur 3 G.H Reagan* 4
Tyler* 15 Cleveland 5 .W. Bush 6
A. Johnson 5 Coolidge 2 Wilson* 3
Madison 0 Nixon 2 Kennedy 3
Polk 0 B. Harrison* 3 Clinton 1
Grant 4 Hoover 2 Harding 0
Monroe 2 Ford 4 L.B. Johnson 2
Taylor 6 McKinley 2 G.W. Bush 2
*Casado dos veces
Fuente: Time Almanac 2007
2. El número de pases completados por Brett Favre, mariscal de campo de los Empacadores de Green Bay, se
registró en cada uno de los 16 juegos regulares de la temporada de verano de 2006 (www.espn.com) 9.
15 31 25 22 22 19 17 28 24 5 22 24 22
20 26 21
3. Los científicos del medio ambiente están cada vez más preocupados por la acumulación de elementos
tóxicos en mamíferos marinos, así como en el paso de esos elementos a los descendientes de esos animales.
El delfín de franjas (Stenella coeruleoalba), considerado el principal depredador en la cadena alimenticia
marina, fue objeto de este estudio. Las concentraciones de mercurio (microgramos/gramo) en los hígados de
28 delfi nes de franjas machos fueron como sigue:
97
Gestión Curricular
Asignatura: Estadística general
4. Los pesos (en libras) de los 27 paquetes de carne molida de res del ejercicio 2.24 (véase el conjunto de datos
EX0224) aparecen a continuación, en orden de menor a mayor:
Unidad IV
ORGANIZACIÓN DE APRENDIZAJES
98
Gestión Curricular
Asignatura: Estadística general
Semana 13
PROBABILIDADES FUNDAMENTOS
99
Gestión Curricular
Asignatura: Estadística general
Andréi
Nikoláyevic
h
Kolmogórov
B. efectos
psicologicos
C. Euclides
A. Andréi Nikoláyevich Kolmogórov: Fue un matemático ruso que realizó aportes de primera
línea en los contenidos de teoría de la probabilidad y de topología.
B. Mijaíl Alekséyevich Lavréntiev: En 1927, Lavréntiev pasó medio año en Francia,
colaborando con matemáticos franceses. Tras volver a la Unión Soviética, se incorporó a la
Universidad de Moscú. Posteriormente, hizo lo propio en el Instituto Steklov de Matemáticas.
TEORÍA DE LA PROBABILIDAD
El origen de las probabilidades se inicia en el año de 1654 cuando el matemático francés Blaise Pascal hacia
un viaje con el apasionado jugador de dados y cartas, conocido como El Caballero de Mere, quien era noble e
LECTURA
ilustrado. Este creía que había encontrado una falsedad en los números al analizar el comportamiento de los
dados, era diferente cuando se utilizaba un dado, que cuando se utilizaban dos dados. Esta presunción era una
comparación errónea, entre las probabilidades de sacar un seis en un solo dado o de sacar un seis con dos
dados.
PROBLEMA PLANTEADO CON DIFERENTES JUEGOS DE AZAR Lo planteado por Mere a Pascal
dieron origen a una correspondencia entre pascal y algunos de sus amigos matemáticos entre ellos PIERRE
DE FERMAT abogado de profesión pero amantes de las matemáticas.
ORIGEN DE LAS PROBABILIDADES Las probabilidades abarca un periodo de tiempo que se pierde en las
nieblas de la antigüedad y que llega hasta el siglo 16 con los cambios de PACHOLI, TARTAGLIA, entre
100
Gestión Curricular
Asignatura: Estadística general
otros. En este periodo se usaron conceptos rudimentarios de probabilidad, azar y aleatoriedad, que están
relacionados con aspectos adivinatorios y religiosos. Rabinovitch 1973 recoge ejemplos de usos de
mecanismos aleatorios mencionado en la literatura Talmúdica y Rabinica.
La talmúdica describe propiedades de ,mecanismos aleatorios tales como juegos de azar, lanzamiento de una
moneda, etc. La rabínica es usada para medir la opinión sobre la ocurrencia de un seceso, parte de suponer
unas probabilidades iniciales o aprioris. La manera de pasar de una a otra probabilidad es mediante el
concurso del teorema de BAYES que en su versión continua dice: rc(8lx)=rc(8)f(xl8) Jrc(8)f(x l8)d8.
Fuente: P. Ibarrola, L. Pardo y V. Quesada (1997): Teoría de la Probabilidad, Ed. Síntesis, ISBN 84-
7738-516-5.
Spiegel, Murray. 1970. Estadística, McGraw-Hill, México.
Olav Kallenberg, Probabilistic Symmetries and Invariance Principles. Springer-Verlag, New York
(2005). 510 pp. ISBN 0-387-25115-4
Kallenberg, O., Foundations of Modern Probability, 2nd ed. Springer Series in Statistics. (2002). 650 pp.
ISBN 0-387-95313-2
PROBABILIDAD
ES
Propósito:
Identificar los elementos de los experimentos aleatorios.
Calcular e interpretar la probabilidad de la ocurrencia de eventos aleatorios.
1. FUNDAMENTOS.
Si el único propósito del investigador fuese describir los resultados de un experimento o fenómeno concreto, los
métodos analizados en Estadística Descriptiva pueden considerarse suficientes. Pero si lo que se pretende es utilizar
la información obtenida para extraer conclusiones generales sobre todos aquellos objetos del tipo de los que han sido
estudiados, entonces estos métodos constituyen sólo el principio del análisis, y debe recurrirse a métodos de
inferencia estadística, los cuales implican el uso inteligente de la teoría de la probabilidad.
Utilizando la teoría de la probabilidad podremos sacar conclusiones precisas acerca de una población en base a una
muestra extraída de ella, y que muchos de los estudios estadísticos son de hecho, estudio de las propiedades de una o
más variables estadísticas.
En muchas oportunidades nos hemos encontrado con afirmaciones donde no existe 100% de certeza sobre la
aparición o realización de un hecho o fenómeno.
101
Gestión Curricular
Asignatura: Estadística general
102
Gestión Curricular
Asignatura: Estadística general
El resultado obtenido forma parte de un conjunto de posibles resultados ha obtenerse, a este conjunto
de resultados posibles se le denomina ESPACIO MUESTRAL (Ω ó E), a cada uno de los elementos
del espacio muestral se denominan SUCESOS ELEMENTALES (a, b, c,….etc) ó (e1, e2, e3, …,etc)
Ejemplo:
Si echamos un dado sobre una mesa, ignoramos qué cara quedará arriba.
El resultado depende del azar.
La vida cotidiana está plagada de sucesos aleatorios. Muchos de ellos, de tipo sociológico (viajes,
accidentes, número de personas que acudirán a un gran almacén o que se matricularán en una
carrera.......,etc) aunque son suma de muchas decisiones individuales, pueden ser estudiados, muy
ventajosamente, como aleatorios.
Por lo tanto:
Un experimento aleatorio, es un proceso de observación, donde el resultado exacto no se conoce,
predominando, por tanto, cierto margen de duda.
Ejemplos:
Sea el experimento: Resultado
“Resultado del examen final en el Antes del examen, el resultado no se conoce con
Por lo
curso de Estadística por parte de exactitud; es decir, no sabemos si el estudiante
tanto el
un estudiante. aprobará o desaprobará el examen final.
experimen
Resultado del lanzamiento de una Existe margen de duda en el resultado exacto,
to es
moneda. pues, es posible que en éste aparezca cara o
aleatorio
sello.
En general:
Todos los juegos al azar constituyen experimentos aleatorios: Rifas, dados, carreras de caballos,
loterías, barajas, etc.
Los trabajos de investigación constituyen también experimentos aleatorios, ya que antes de
ejecutarlos, no se sabe si las hipótesis planteadas serán probadas o desaprobadas.
103
Gestión Curricular
Asignatura: Estadística general
En una empresa de lácteos hacen control de calidad al llenado de bolsas de leche de 1000 cc de volumen.
Cada 20 minutos se verifica el volumen de llenado de la máquina. La evaluación continua hasta encontrar
una bolsa que no cumple las especificaciones.
Sea “s” el hecho de que la bolsa de leche cumple con las especificaciones de volumen, y “n” las que no
cumple con ellas. ¿Cuál es el espacio muestral de este experimento?
El espacio muestral se representa como una secuencia de las letras s y n. Dado que el experimento
termina cuando una bolsa de leche no cumple con las especificaciones de volumen, el espacio muestral
estará formado por una secuencia de “s” seguida por una “n”.
S = {n, sn, ssn, sssn, ssssn, sssssn,...}
d. SUCESOS O EVENTOS.
Suceso aleatorio es un acontecimiento que ocurrirá o no, dependiendo del azar.
Además, un suceso aleatorio es cualquier subconjunto del espacio muestral y se denota con las letras
mayúsculas A, B, C, etc.
Ejemplos 1:
Sea el experimento aleatorio:
“Selección de un alumno de acuerdo a su rendimiento académico
El espacio muestral será:
EM ={ SOBRESALIENTE , BUENO , REGULAR , MALO }
Podemos observar que cada resultado es un subconjunto del espacio muestral, por lo tanto, cada uno de
ellos es un evento. Si denotamos por A, B, C, D los eventos; entonces tendremos:
Evento A={ SOBRESALIENTE }
Evento B={ BUENO }
Evento C= { REGULAR }
Evento D={ MALO }
Ejemplos 2:
Un experimento aleatorio sería el lanzamiento de un dado, siendo su espacio muestral:
Ω={ 1; 2 ; 3 ; 4 ; 5 ; 6 }
Pudiéndose dar infinidad de procesos aleatorios, tales como:
A :obtención de un número par en ellanzamineto de un dado
A={ 2; 4 ; 6 } ⟹ A ⊂ Ω
B: obtención de un número menor que 3 en ellanzamineto de un dado
B= {1 ; 2 } ⟹ B ⊂ Ω
Ejemplos 3:
Otro experimento aleatorio sería el lanzamiento de dos monedas, siendo su espacio
muestral:
E={ cc ; cs ; sc ; ss }
Siendo algunos de los procesos aleatorios:
A :obtención dos sellos en el lanzamineto de dos monedas
104
Gestión Curricular
Asignatura: Estadística general
A={ ss } ⟹ A ⊂ E
B: obtención de exactamente un sello en el lanzamineto de dos monedas
B= { sc ; cs } ⟹ B ⊂ E
EVENTO SEGURO O SUCESO UNIVERSAL (U).
Se llama así al evento que de todas maneras debe ocurrir.
Ejemplo:
Sea el experimento:
“Selección de un propietario de inmueble con ingresos medio-alto, de la Urbanización Las
Casuarinas – Lima.
Se puede apreciar que el Evento es seguro o universal, ya que, al Seleccionar un propietario de
inmueble, éste de todas maneras tendrá ingresos medio - alto, ya que se trata de una zona residencial de
Lima.
EVENTO IMPOSIBLE (ɸ).
Es el evento que no va a ocurrir.
Ejemplo:
Sea el experimento:
“Selección de un propietario de inmueble con ingresos bajos, de la Urbanización Las Casuarinas –
Lima.
En este caso, el evento es imposible, ya que no se podrá seleccionar un propietario de inmuebles con
bajos ingresos en una zona residencial.
EVENTO COMPLEMENTARIO.
El complemento del Evento A, se denota por el símbolo A (se lee: no A), y significa que el Evento A
no ocurre.
Ejemplo:
Sea el evento: A={ Paciente con tumor canceroso }
Entonces su complemento será:
A={ Paciente con tumor no canceroso }
EVENTOS MUTUAMENTE EXCLUYENTES.
Dos o más eventos son mutuamente excluyentes, si la ocurrencia de uno de ellos, anula la ocurrencia de
los demás.
Ejemplo:
Sea el experimento aleatorio:
“Selección de un profesor de la Universidad X, según categoría docente”.
El espacio muestral es:
105
Gestión Curricular
Asignatura: Estadística general
B=Profesor asociado
C=Profesor auxiliar
D=Profesor jefe de práctica
Los cuatro eventos son mutuamente excluyentes, porque al seleccionar un Docente, este tendrá sólo una
categoría; anulándose el resto de los eventos. No es posible sostener, por ejemplo, que al seleccionar un
Docente, éste tenga la categoría de Principal y Jefe de Práctica a la vez.
EVENTOS INDEPENDIENTES.
Dos eventos son independientes si ambos no tienen ninguna relación entre sí; es decir, si la ocurrencia
de uno de ellos, no incluyen en la ocurrencia del otro.
Ejemplo:
Sean los eventos:
X =Primer alumno que apruebe el examen de estadistica
Y =Segundo alumno que apruebe el examen de estadistica
X e Y son independientes porque al ocurrir el evento X, éste no incluye para que el evento Y ocurra.
3. CONCEPTO DE PROBABILIDAD.
La probabilidad es una disciplina abstracta que se usa como modelo para hacer deducciones relativas a eventos
que posiblemente pueden ocurrir.
4. TIPOS DE PROBABILIDAD.
Existen tres enfoques para el estudio de la probabilidad:
a. Probabilidad clásica.
Llamada también probabilidad a priori debido a que es posible conocer el resultado con anterioridad, es
decir, sin llevar acabo el experimento y sólo basado en un razonamiento lógico.
Generalmente esta probabilidad se usa para experimentos simples.
Se calcula a través de:
Casos favorablesde Ocurrencia del Evento A
p ( A )=
Total de Casos Posibles
Ejemplo 1:
Hallar la probabilidad de obtener cara en el lanzamiento de una moneda.
Solución
Definimos el espacio muestral:
EM ={ cara , sello }
Sea el evento:
A=Obtener cara
Luego:
Casos favorablesde Ocurrencia del Evento A 1
p ( A )= =
Total de casos posibles 2
106
Gestión Curricular
Asignatura: Estadística general
Ejemplo 2:
Hallar la probabilidad de obtener el número 2 en el lanzamiento de un dado.
Solución
Definimos el espacio muestral:
EM ={ 1 , 2, 3 , 4 ,5 , 6 }
Sea el evento:
B=Obtener el número 2
Luego:
Casos favorables d Ocurrencia del Evento A 1
p ( B )= =
Total de casos posibles 6
p ( B )=0.17=17 %
c. Probabilidad Subjetiva.
Es la probabilidad asignada bajo un criterio “personal”; basándose en cualquier tipo de evidencia
disponible.
107
Gestión Curricular
Asignatura: Estadística general
Estas probabilidades se asignan a eventos que puedan suceder sólo una vez o muy pocas veces.
Ejemplos:
La probabilidad de que el hombre llegue a habitar la luna en los próximos 20 años.
La probabilidad de que se encuentre una cura para el sida en los próximos 5 años.
Se puede decir que, dado un experimento determinado la probabilidad subjetiva de un evento “A” es el
grado de creencia asignado a la ocurrencia de este evento por un individuo basado en toda la evidencia a su
disposición con las siguientes exigencias:
a) P(A )=0 Representa que A no ocurrirá.
108
Gestión Curricular
Asignatura: Estadística general
Problemas Desarrollados
2. Teniendo en cuenta los resultados del espacio muestral, en el ejercicio anterior, hallar las siguientes
probabilidades:
a) Que el nacimiento sea del sexo femenino.
b) Que un menor de edad padezca de desnutrición leve.
c) Que gane Perú en el partido de vóley.
d) Que el producto “x” tenga demanda elástica.
Solución
Utilizaremos para el cálculo de probabilidad de cada uno de ellos, la probabilidad clásica cuya fórmula es:
Casos favorablesde Ocurrencia del Evento A
p ( A )=
Total de Casos Posibles
a) Sea el evento: F=nacimiento del sexo femenino
1
Luego: p ( F ) = =0.5=50 %
2
La probabilidad de que el nacimiento sea del sexo femenino es de 50%
b) Sea el evento: L=menor padeszcade desnutrición leve
1
Luego: p ( L )= =0.25=25 %
4
La probabilidad de que un menor padezca de desnutrición leve es de 25%
c) Sea el evento: G=Gane Perú en el partído de vóley
109
Gestión Curricular
Asignatura: Estadística general
1
Luego: p ( G )= =0.5=50 %
2
La probabilidad de que gane
d) Sea el evento: E=Producto x tengademanda elástica
1
Luego: p ( E )= =0.2=20 %
5
1
3. Un experimento genera un espacio muestral que contiene ocho sucesos (E 1, E2,……,E8) con la p ( E1 )= , i =
8
1,2,3,…..,8. Los sucesos A y B se definen así:
A={ E1 , E 4 , E6 }
B= { E 3 , E 4 , E 5 , E6 , E7 }
Encuentre: p(A), p(Al), p(AUB)
Solución
Graficando:
3
a) p ( A )= =0.38=38 %
8
5
p ( A ) = =0.63=63 %
l
b)
8
6
c) p ( A ∪ B )= p ( A ) + p ( B )−p ( A ∩ B ) =c= =0.75=75 %
8
Problemas Propuestos
110
Gestión Curricular
Asignatura: Estadística general
4. En una muestra aleatoria de 120 pacientes, se encontró que 30 de ellos tienen cáncer. ¿cuál es la probabilidad de
que un paciente elegido al azar tenga cáncer?
5. En la empresa Scotiabank, se tiene una muestra de cuatro hipotecas para vivienda está clasificada como de tasa
Fija (F) o tasa Variable (V).
a) ¿Cuáles resultados están en el evento de que exactamente tres de las hipotecas seleccionadas sea de tasa
variable?
b) ¿Cuáles resultados están en el evento de que las cuatro hipotecas sean del mismo tipo?
c) ¿Cuáles resultados están en el evento de que a lo sumo una de las cuatro hipotecas sea de tasa Variable?
Video de Apoyo
Semana 14
DISTRIBUCIÓN DE PROBABILIDAD DISCRETA
111
Gestión Curricular
Asignatura: Estadística general
Siméon
Denis
Poisson
Matemático
y científico
suizo
Johann
Bernoulli
A. Siméon Denis Poisson, ue un físico y matemático francés al que se le conoce por sus
diferentes trabajos en el campo de la electricidad y por sus publicaciones acerca de la
geometría diferencial y la teoría de probabilidades.
B. Johann Bernoulli: Siendo joven, su padre Nikolaus Bernoulli lo envió a la Universidad de
Basilea para estudiar filosofía y teología, con el ánimo de que se convirtiera en teólogo. Pero
Jakob continuó, a escondidas, las que eran sus auténticas aficiones: la física y las matemáticas.
Poisson nació en Pithiviers, Loiret, hijo de Siméon Poisson. Su padre sirvió como soldado raso en
las guerras de Hanover, pero disgustado por el trato abusivo que recibió de los oficiales nobles,
LECTURA
desertó. Cuando nació su hijo, ocupaba diversos cargos administrativos, y al parecer estuvo a la
cabeza del gobierno local durante el período revolucionario.
Siméon Denis fue enviado primero con su tío, un cirujano de Fontainebleau, y comenzó a aprender
el oficio, pero hizo pocos progresos. Tras mostrar los primeros signos de su talento como
112
Gestión Curricular
Asignatura: Estadística general
matemático, fue enviado a la Escuela Central de Fontainebleau, donde tuvo la oportunidad de tener
una clase con un profesor receptivo, M. Billy, que se dio cuenta rápidamente de que era superado
por su alumno, le alentó a aprender las ramas más difíciles de las matemáticas, y predijo su futura
fama recordando unas líneas del famoso fabulista Jean de La Fontaine, jugando con el significado
de su apellido en francés:
«Petit Poisson deviendra grand // Pourvu que Dieu lui prête vie.»
DISTRIBUCIÓN
BINOMIAL, POISSON
Propósito:
Explica y diferencia las principales distribuciones de probabilidad para variables aleatorias discretas.
Aplica e interpreta las distribuciones de probabilidades para variables aleatorias discretas en el
desarrollo de prácticas y ejercicios.
1. DISTRIBUCIÓN BINOMIAL.
Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los siguientes
requisitos:
El procedimiento tiene un número fijo de ensayos.
113
Gestión Curricular
Asignatura: Estadística general
Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las
probabilidades de los demás ensayos).
Todos los resultados de cada ensayo deben estar clasificados en dos categorías (generalmente llamadas éxito
y fracaso).
La probabilidad de un éxito permanece igual en todos los ensayos.
El desarrollo de este tema, implica comprender previamente los siguientes conceptos:
a) Notación factorial.
Se utiliza para representar las operaciones de multiplicación secuencial.
Su desarrollo significa el producto ordenado de los números enteros positivos, desde el que indica el signo
factorial, hasta llegar a 1.
Ejemplo:
Tres factorial 3 !=3 x 2 x 1=6
Cinco factorial 5 !=5 x 4 x 3 x 2 x 1=120
. .
. .
N factorial N != ( N )( N −1 ) ( N −2 ) … . x 2 x 1
Por definición:
0 !=1
1 !=1
b) Combinaciones.
Es un método que nos permite agrupar un conjunto de elementos en diferentes formas sin considerar el
orden de colocación.
n!
C n=
x x ! ( n−x ) !
Ejemplo:
De un equipo multidisciplinario, formado por un economista, un sociólogo, un antropólogo. ¿Cuántos
comités de dos profesionales pueden formarse?
Solución
Según datos:
n = 3, x = 2
Luego la cantidad de comités a formarse, serían:
3! 3x 2x 1 6
C 3= = = =3
2 2 ! ( 3−2 ) ! ( 2 x 1 )( 1 ) ! 2
Se pueden formar 3 comités, que serían:
Primer comité : Economista, Sociólogo.
Segundo comité : Sociólogo, Antropólogo.
Tercer comité : Economista, Antropólogo.
c) Cálculo de probabilidades mediante la distribución binomial.
La distribución binomial se utiliza para calcular probabilidades de variables discretas.
114
Gestión Curricular
Asignatura: Estadística general
Se aplica en aquellos experimentos aleatorios que tienen sólo dos resultados mutuamente excluyentes.
Ejemplos:
EXPERIMENTO ALEATORIO RESULTADOS POSIBLES
1) Lanzamiento de una moneda al aire. Cara o sello
2) Nacimiento de un ser humano con respecto al varón o mujer
sexo.
3) Estado de salud de una persona. Sano o enfermo
4) Situación ocupacional de una persona. Ocupado o desocupado
Estos experimentos con resultados Dicotómicos, se le conoce con el nombre de ensayo de BERNOULLI,
en honor al científico que lo descubrió.
d) Requisitos de una distribución de probabilidad binomial.
El procedimiento tiene un número fijo de ensayos.
Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las
probabilidades de los demás ensayos).
Todos los resultados de cada ensayo deben clasificar en dos categorías (generalmente llamadas
éxito y fracaso)
La probabilidad de un éxito permanece igual en todos los ensayos.
e) Notación para la distribución de probabilidad binomial.
Al llevar a cabo un experimento aleatorio, siempre estamos interesados en que suceda uno de los dos
resultados, si el resultado que esperábamos efectivamente sucede, diremos que hubo ÉXITO. Si el
resultado que esperábamos no sucede, entonces diremos que hubo FRACASO. Estos dos resultados, se
designan en términos de probabilidad, como p y q.
Es decir:
RESULTADOS PROBABILIDA
D
ÉXITO p PROBABILIDAD DE
ÉXITO
FRACASO q PROBABILIDAD DE
FRACASO
Dónde: p+q=1
Si E y F (éxito y fracaso) denotan las dos categorías posibles de todos los resultados.
Entonces:
Ejemplo:
Supongamos que en la comunidad “x”, hemos encontrado a través de una muestra, que el 30% de la
población en edad activa, se encuentran desempleados y el 70% tenía empleo.
En este experimento esperamos como éxito que la población tenga empleo, y como fracaso que la
población esté desempleada, por lo tanto:
EVENTOS RESULTADO PROBABILIDAD
S
Empleados Éxito p = 0.70
Desempleados Fracaso q = 0.30
Total p + q = 1.00
115
Gestión Curricular
Asignatura: Estadística general
Podemos decir entonces: Si seleccionamos una persona al azar de esta población, la probabilidad de que se
encuentre con empleo es de 0.70, y de que se halle desempleado es de 0.30.
Pero si seleccionamos dos personas al azar de esta población, una después de otra, según el orden de
extracción podemos obtener:
Personas seleccionadas:
PRIMERA SEGUNDA
Ocupada Ocupada
Ocupada Desocupada
Desocupada Ocupada
Desocupada Desocupada
APARICIÓN DEL
PROBABILIDAD DEL RESULTADO
RESULTADO
PRIMER
SEGUNDA SIMBÓLIC
SELECCIÓ LITERAL NÚMERICA
SELECCIÓN A
N
Ocupado Probabilidad que las dos 2
Ocupado
personas estén ocupadas p . p= p (0.70)(0.70)=0.49
Ocupado Probabilidad que la 1ª
Desocupado persona esté ocupada y la p.q (0.70)(0.30)=0.21
2ª desocupada
Desocupado Probabilidad que la 1ª
Ocupado persona este desocupada y q. p (0.30)(0.70)=0.21
la 2ª ocupada
Desocupado Probabilidad de que las
2
Desocupado dos personas estén q . q=q (0.30)(0.30)=0.09
desocupadas
Al sumar la probabilidad simbólica y numérica, observamos que se trata de una expansión binomial, así:
SIMBÓLIC 2 2 2 2 2
p + pq+qp+ q ¿ p +2 pq+ q ¿ ( p+q )
A:
NÚMERICA 0.49+0.21+ 0.21+ 0.09 ¿ 0.49+2 ( 0.21 ) +0.09 ¿(0.70+0.30)
2
:
Expansión binomial Binomio
El binomio esta elevado al exponente 2, porque se trata de 2 ensayos o 2 selecciones.
Esto quiere decir que, si el número de ensayos o selecciones se incrementan, el exponente será mayor.
Por ejemplo, si seleccionamos 5 personas al azar, entonces tendríamos:
116
Gestión Curricular
Asignatura: Estadística general
Y si quisiéramos hallar la probabilidad de que las 5 personas estén ocupadas, sería sumamente laborioso
desarrollar la expansión binomial.
Para ello existe una fórmula que nos ayuda a simplificar cualquier valor específico de probabilidad.
Ejemplo:
Supongamos en la comunidad “x”, donde a través de una muestra se encontró que el 30% de la población
en edad activa estaba desempleada. Calcular la probabilidad de seleccionar dos personas ocupadas en
esta población.
Solución
Según datos del problema:
n=2 entonces p = 0.70
x=2 personas ocupadas q = 0.30
Aplicando la fórmula:
n! x
p ( x )= . p q(n −x )
x ! ( n−x ) !
2! 2 0
p ( x=2 )= . (0.70) (0.30)(2−2)=(0.49)(0.30)
2 ! ( 2−2 ) !
p ( x=2 )=0.49
La probabilidad de seleccionar dos personas ocupadas de esta población, es de 49%. (coincide con el
resultado de la tabla anterior).
μ=n . p 2
σ =n . p . q σ =√ n . p . q
2. DISTRIBUCIÓN POISSON.
117
Gestión Curricular
Asignatura: Estadística general
Una distribución de probabilidad Poisson resulta de un procedimiento que cumple con todos los siguientes
requisitos:
El experimento consiste en contar el número “x” de veces que ocurre un evento en particular durante una
unidad de tiempo dada, o en un área o volumen dado.
La probabilidad de que un evento ocurra en una unidad dada de tiempo, área o volumen es la misma para
todas las unidades.
El número de eventos que ocurren en una unidad de tiempo, área o volumen es independiente del número de
los que ocurren en otras unidades.
El número medio (o esperado) de eventos en cada unidad se denota por la letra griega (“lambda”) ( λ )
2.1. Introducción.
La distribución de Poisson se usa para modelar situaciones en la que el número de pruebas es muy grande y
el número de éxitos es muy pequeño, situaciones en las que hay ocurrencias aleatorias de sucesos por
unidad de espacio o tiempo, y en donde se desea conocer la probabilidad de un número específico de éxitos.
El intervalo de tiempo dado puede ser de cualquier duración, por ejemplo, un minuto, un día, una semana,
etc. Así la variable aleatoria x puede representar el número de llamadas telefónicas por hora, el número de
pacientes fallecidos en un día determinado. El espacio podría ser un segmento de línea, un área o volumen,
un pedazo de material. Así, x podría representar el número de bacterias en un determinado campo de
cultivo.
2.2. El proceso de Poisson.
Las siguientes proposiciones describen lo que se conoce como proceso de Poisson:
a) Las ocurrencias de los eventos son independientes.
b) Teóricamente, debe ser posible un número infinito de ocurrencias del evento en el intervalo.
c) La probabilidad de una ocurrencia del evento en un intervalo dado es proporcional a la longitud del
intervalo.
La distribución de probabilidad de Poisson está dada por:
−λ x
( ) e .λ
p x=
x!
x=0 , 1 , 2, …
Donde:
x=¿ número de ocurrencias cuya probabilidad se desea conocer.
e=¿ constante matemática = 2,71828.
λ=¿número promedio de ocurrencias por unidad de tiempo o espacio.
2.3. La media y varianza:
118
Gestión Curricular
Asignatura: Estadística general
3 por día. Si dicha oficina está en lo cierto, al suponer una distribución de Poisson, hallar la probabilidad de
que:
a) En un día dado, mueran exactamente 2 pacientes con esa enfermedad.
b) En un día particular, nadie muera de la enfermedad.
c) En un día particular, mueran 3 ó 4 pacientes.
Solución
Sea:
x=¿ el número de pacientes fallecidos debido a la enfermedad
λ=¿ número promedio de muertes = 3 por día
a) En un día dado, mueran exactamente 2 pacientes con esa enfermedad.
−3 2
e .3 0 , 05 x 9
p ( x=2 )= = =0,225
2! 2 x1
La probabilidad de que mueran 2 pacientes es de 22,5%
b) En un día particular, nadie muera de la enfermedad.
−3 0
e . 3 0 ,05 x 1
p ( x=0 ) = = =0 ,05
0! 1
La probabilidad de que nadie muera es del 5%
c) En un día particular, mueran 3 ó 4 pacientes.
−3 3 −3 4
e .3 e . 3 0 , 05 x 27 0 , 05 x 81 =0,225+0,16875=0 , 39
p ( x=3 ) + p ( x=4 )= + = +
3! 4! 3 x 2x 1 4 x 3x 2 x1
La probabilidad de que mueran 3 ó 4 pacientes es de 39%
Problemas Desarrollados
Distribución binomial
1. Utilice la fórmula de probabilidad binomial para calcular la probabilidad de x éxitos, dada la probabilidad p
de éxito en un solo ensayo si:
3
n=12 , x=10 , p= =0.75
4
Utilizando la fórmula, hallamos:
Si: n=12 , x=10 , p=3 /4=0.75 , q=0.25
Remplazando en la fórmula:
n! x
p ( x )= . p q(n −x )
x ! ( n−x ) !
12 ! 10 12 x 11 x 10 ! 10 2
p ( 10 )= .(0.75) ( 0.25)(12−10 )= .(0.75) (0.25)
10 ! ( 12−10 ) ! 10 ! .2!
12 x 11 10 2
p ( 10 )= .(0.75) (0.25) =66 ( 0.06 ) ( 0.06 ) =66 ( 0.0036 ) =0.24=24 %
2!
119
Gestión Curricular
Asignatura: Estadística general
2. La probabilidad de que un cliente potencial de la pastelería “PARIS”, elegido al azar, realice una compra es
de 0,20. Si su agente de ventas visita a 6 clientes, ¿cuál es la probabilidad de que realice exactamente 4
ventas?
Solución
n x ( n−x ) n! x
Remplazando los datos en la fórmula p ( x )=C p q = . p q (n−x )
x x ! ( n−x ) !
6 4 6! 4
p ( 4 )=C . ( 0 , 20 ) .(0 , 80)(6 −4)= . ( 0 , 20 ) .(0 , 80)(6−4 )
4 4 ! ( 6−4 ) !
p ( 4 )=0,0154=1.54 %
3. Suponiendo que la probabilidad de que un automovilista respete la luz verde es de 0.75, utilice la fórmula
de probabilidad binomial para calcular la probabilidad de obtener exactamente 3 automovilistas que
respeten la luz verde cuando va a cambiar de luz 5 segundos antes.
Solución
Calculamos, p(3) dado que n = 5
Si: x = 3 p = 0.75 q = 0.25
Remplazando en la fórmula:
n! x
p ( x )= . p q(n −x )
x ! ( n−x ) !
5! 3 5 x 4 x 3! 3
p ( 3 )= .(0.75) (0.25)(5−3 )= .(0.75) (0.25)( 2)=10.(0.42)(0.06)
3 ! ( 5−3 ) ! 3 ! ( 2) !
p ( 3 )=( 10 )( 0.025 )=0.25=25 %
Los 3 automovilistas que respeten la luz verde cuando va a cambiar de luz 5 segundos antes representa un
25%.
Distribución de Poisson.
1. En tiendas “EFE”, en la sección de electrodomésticos, unos promedios de 12 personas por hora le hacen
preguntas al encargado. ¿Cuál es la probabilidad de que exactamente 3 personas se acerquen al encargado a
hacer preguntas en un periodo de 10 minutos?
120
Gestión Curricular
Asignatura: Estadística general
(x)
Utilizando la fórmula:
−λ x
e .λ
p ( x )=
x!
−5 3
e .5
p ( 3 )= =0,1404=14.04 %
3!
Problemas Propuestos
Distribución binomial
1. Utilice la fórmula de probabilidad binomial para calcular la probabilidad de x éxitos, dada la probabilidad p de
éxito en un solo ensayo.
a) n=20 , x =4 , p=0.15
b) n=9 , x=2 , p=0.35
2. Se tiene información que, en la comisaria de Huancayo, el 25% de los detenidos se encuentran allí por delitos
menores. Se selecciona una muestra aleatoria de 20. ¿Cuál es la probabilidad de que el número de detenidos por
delitos menores en esa muestra sea 4?
3. Se sabe que en el Centro de Huancayo el 70% de los establecimientos comerciales pequeños no entregaban
boleta al momento de efectuar una transacción económica. ¿Cuál es la probabilidad de que, en una muestra de 15
negocios, a lo más la mitad entregue boleta?
4. La probabilidad de que una persona se muera por consumir bebidas alcohólicas es 0.4. Después de un estudio
realizado en un sector de Huancayo, se conoce que a la semana 30 personas consumen bebidas alcohólicas, cual
es la probabilidad que:
a) Sobrevivan al menos 14 personas
b) Sobrevivan exactamente 5
c) Cuantos, en promedio, sobrevivirán
d) ¿Cuál es la varianza de la v.a. en cuestión?
5. La encargada de los préstamos del banco “BBVA CONTINENTAL” estima, con base en sus años de
experiencia, que la probabilidad de que un solicitante no sea capaz de pagar su préstamo es 0.035. El mes pasado
realizó 45 préstamos. ¿Cuál es la probabilidad de que 3 préstamos no sean pagados oportunamente?
Distribución de Poisson
121
Gestión Curricular
Asignatura: Estadística general
1. La central telefónica de una empresa recibe un promedio de 3,5 órdenes de pedido por hora. Estas ocurrencias se
producen al azar. ¿Cuál es la probabilidad de que se produzcan exactamente 4 llamadas en una hora dada?
2. Se sabe que el número promedio de camiones-tanque de aceite que llegan por día al puerto del Callao, es 10. las
instalaciones del puerto pueden atender cuándo más a 15 camiones-tanque en un día. ¿Cuál es la probabilidad de
que en un determinado día se tengan que regresar los camiones?
3. El número promedio de Buses que llegan cada día al Terminal Terrestre de Huancayo es 11. Las facilidades que
tiene el Terminal hace a que pueden manejar hasta 22 buses por día. ¿Cuál es la probabilidad de que en un día
dado se tenga que rechazar el ingreso de buses al Terminal Terrestre de Huancayo?
4. En Caja Centro se analiza la cantidad de clientes que se atiende en las ventanillas, se obtuvo que la cantidad de
clientes promedio que se atiende en esta institución financiera en un lapso de 30 minutos es de 10 clientes. ¿Cuál
es la probabilidad de que se atiendan a 7 clientes en 20 minutos?
5. En una investigación realizada en Huancayo, se ha determinado que el número de muertes debido a accidentes
de tránsito ha sido en promedio 4 por en dos meses. Suponiendo que el número de muertes sigue una
distribución de Poisson, hallar la probabilidad de que en un determinado mes mueran 3 personas.
Video de Apoyo
122
Gestión Curricular
Asignatura: Estadística general
Semana 15
DISTRIBUCIÓN NORMAL
Abraham
de Moivre
Distribución
gaussiana
en música
Lannis
Xenakis
A. Abraham de Moivre
La distribución normal fue presentada por primera vez por Abraham de Moivre en un artículo del año
1733,5 que fue reimpreso en la segunda edición de su The Doctrine of Chances, de 1738, en el contexto
de cierta aproximación de la distribución binomial para grandes valores de n. Su resultado fue ampliado
por Laplace en su libro Teoría analítica de las probabilidades (1812), y en la actualidad se llama
Teorema de De Moivre-Laplace.
123
Gestión Curricular
Asignatura: Estadística general
DISTRIBUCIÓN NORMAL
LECTURA
La distribución normal fue presentada por primera vez por Abraham de Moivre en un artículo del año 1733, 5 que
fue reimpreso en la segunda edición de su The Doctrine of Chances, de 1738, en el contexto de cierta
aproximación de la distribución binomial para grandes valores de n. Su resultado fue ampliado por Laplace en su
libro Teoría analítica de las probabilidades (1812), y en la actualidad se llama Teorema de De Moivre-Laplace.
Laplace usó la distribución normal en el análisis de errores de experimentos. El importante método de mínimos
cuadrados fue introducido por Legendre en 1805. Gauss, que afirmaba haber usado el método desde 1794, lo
justificó rigurosamente en 1809 asumiendo una distribución normal de los errores. El nombre de Gauss se ha
asociado a esta distribución porque la usó con profusión cuando analizaba datos astronómicos 6 y algunos autores
le atribuyen un descubrimiento independiente del de De Moivre. 7Esta atribución del nombre de la distribución a
una persona distinta de su primer descubridor es un claro ejemplo de la ley de Stigler.
El nombre de "campana" viene de Esprit Jouffret que usó el término "bell surface" (superficie campana) por
primera vez en 1872 para una distribución normal bivariante de componentes independientes. El nombre de
"distribución normal" fue otorgado independientemente por Charles S. Peirce, Francis Galton y Wilhelm Lexis
hacia 1875.[cita requerida] A pesar de esta terminología, otras distribuciones de probabilidad podrían ser más
apropiadas en determinados contextos; véase la discusión sobre incidencia,
Fuente: Estadística Básica. ITM. 2007. ISBN 9789589831410. Consultado el 12 de diciembre de 2017.
Orrego, Juan José Manzano (2014). LOGISTICA DE APROVISIONAMIENTO. Ediciones Paraninfo,
S.A. ISBN 9788497329811. Consultado el 12 de diciembre de 2017.
Gómez-Chacón, Inés Ma; Català, Claudi Alsina; Raig, Núria Planas; Rodríguez, Joaquim Giménez;
Muñoz, Yuly Marsela Vanegas; Sirera, Marta Civil (4 de octubre de 2010). Educación matemática y
ciudadanía. Grao. ISBN 9788499801667. Consultado el 12 de diciembre de 2017.
DISTRIBUCIÓ
N NORMAL
Propósito:
Identifica el tipo de variable aleatoria y construye la distribución de la función de probabilidad.
124
Gestión Curricular
Asignatura: Estadística general
1. Introducción.
Si se tiene una muestra grande de valores que corresponden a variables continuas, como por ejemplo el peso en
kg de 44 recién nacidos en un hospital, para el análisis de la información se procedería a tabularlos a través de
una distribución de frecuencias y su gráfico correspondiente, el histograma, tal como se muestra a continuación:
HOSPITAL “X”
Distribución de frecuencias de recién nacidos por peso
Peso (en kg) Frecuencia
(cantidad)
1.00 – 1.99 4
2.00 – 2.99 10
3.00 – 3.99 20
4.00 – 4.99 8
5.00 – 5.99 2
Total 44
Histograma de la distribución de frecuencias de recién nacidos por peso.
Analizando los datos en el histograma, observamos que, con respecto al peso de los recién nacidos, existen:
a) Pocos niños con bajo peso al nacer (4 niños tienen entre 1 y 2 kg de peso)
b) La mayoría de recién nacidos, tienen peso medio (20 niños tienen entre 3 y 4 kg de peso)
c) Pocos niños tienen sobrepeso al nacer (2 niños tienen entre 5 kg y 6 kg de peso)
Esta distribución de datos se llama “NORMAL” y se presenta en múltiples mediciones de la vida real.
Si unimos, mediante una curva los puntos medios de cada rectángulo en el histograma, se obtiene el siguiente
gráfico.
A esta curva se le conoce con el nombre de “CURVA NORMAL” o también “CAMPANA DE GAUSS”.
125
Gestión Curricular
Asignatura: Estadística general
Es importante por que posibilita el cálculo de probabilidades, a través de áreas comprendidas bajo la curva
normal.
Una distribución asume la forma de la curva normal conforme el tamaño de la muestra aumenta (es decir, cuando
se usa gran cantidad de datos)
La representación gráfica de la distribución normal, corresponde a la siguiente función:
( )
2
−1 x−μ
1 2 σ
f ( x )= .e
σ √2 π
Donde:
x=variable independiente , cuyos valores asumidos van desde−∞ hasta+∞
μ=media poblacional
x−μ=desvio
σ =desviación típica
f ( x )=densidad de probabilidad
e=2.718
π=3.1416
Por lo tanto, podemos sostener que:
2. Definición.
La distribución normal es una de las distribuciones más utilizadas, que permiten calcular probabilidades para
variables continuas.
Muchas poblaciones tienen distribución normal o pueden ajustarse muy bien a ella.
Ejemplos:
Estatura, peso y otras características físicas.
Errores de medición en experimentos científicos
Tiempos de reacción en experimentos psicológicos
Mediciones de inteligencia y aptitud.
Calificaciones en diversas pruebas.
Muchas medidas e indicadores económicos.
126
Gestión Curricular
Asignatura: Estadística general
a) La media o promedio de la población ( μ), que fija la posición de la curva respecto al eje x.
b) La desviación estándar (σ ), que determina la forma (dispersión) de la curva.
A menos dispersión (σ ), la curva será más estrecha y puntiaguda;
A mayor dispersión (σ ), la curva será más aplanada y desplazada.
De acuerdo a ello, se puede presentar los siguientes casos:
μ1 μ 2 μ3
Observamos en este gráfico que las 3 curvas normales tienen idéntica dispersión, pero distintas medias.
μ1
μ2
μ3
Observamos en este gráfico que las 3 curvas normales tienen distintas dispersión, pero igual medias.
Esto significa que cada curva normal tiene su propia distribución, lo que hace imposible el cálculo de
probabilidades. Por lo tanto, se hace necesario que la curva normal así obtenida se trasforme en una CURVA
NORMAL TIPIFICADA.
127
Gestión Curricular
Asignatura: Estadística general
σ
σ =1
μ
μ=0
CURVA NORMAL CURVA NORMAL TIFICADA
Observamos en el gráfico que la variable “x” se ha trasformado en z; la μ se ha igualado a cero, por lo tanto los
valores de z hacia la derecha son positivos y hacia la izquierda negativos; la desviación standard se trasforma en
valor de 1, lo que significa que la dispersión o todo el área debajo de la curva normal tiene un valor de 1 (100%)
que es el valor máximo que asume la probabilidad.
3.1. Características de la curva normal tipificada.
Es simétrica respecto a su media (50% a la derecha y 50% a la izquierda).
Es asintótica respecto a z (es decir, no cruza la línea z)
El área total encerrada es 1 ó 100%
La media, mediana y moda son iguales.
3.2. Cálculo de áreas bajo la curva normal tipificada.
Para calcular probabilidades, es necesario calcular las áreas bajo la curva normal tipificada. Esto se obtiene
trasformando la variable x en variable tipificada z cuyo valor se ubican en la primera fila superior y en la
primera columna de la izquierda de la tabla adjunta.
En el interior de la tabla se encuentran las áreas o probabilidades desde z = 0 hasta cualquier valor de z.
Los diferentes casos que se pueden presentar sólo consisten en sumar o restar áreas.
Es necesario que Ud. tenga en cuenta que toda el área bajo la curva normal tipificada tiene un valor de 1 ó
100%, y cada mitad 0.50 ó 50%.
Ejemplo 1:
Determinar el área bajo la curva normal para valores de z entre:
z=0 y z=1.8 (es decir 0 ≤ z ≤ 1.8).
Solución
Construyendo el gráfico del área pedida.
Área pedida
128
Gestión Curricular
Asignatura: Estadística general
Por lo tanto 0.4641 es el área pedida, o también podemos decir que la probabilidad de que z esté
comprendida entre 0 y 1.8, es:
p ( 0 ≤ z ≤1.8 )=0.4641=46.41 %
Ejemplo 2:
Los coeficientes de inteligencia (CI) de un grupo de estudiantes, tienen aproximadamente una
distribución normal, con una media de 100 y una desviación típica de 10. Se pide:
a) Hallar la proporción de estudiantes con CI mayores que 125.
b) ¿Cuál es la probabilidad de que un estudiante elegido al azar entre los de esa población, tenga una CI
entre 105 y 115?
Solución
Sea: x = coeficiente de inteligencia.
Donde: μ=100 σ =10
a) Se pide: p ( x ≥ 125 )
Graficando:
129
Gestión Curricular
Asignatura: Estadística general
σ =10 σ =1
Área Pedida
p ( x ≥ 125 )= p( z ≥ 2.5)=0.50−0.4938=0.0062
p ( z ≥ 2.5 )=0.62%
Entonces:
La población de pacientes con CI mayores que 125, es de 0.62%
b) Se pide: p(105 ≤ x ≤ 115)
Graficando:
AREA PEDIDA
σ =10
130
Gestión Curricular
Asignatura: Estadística general
0.4332 0.1915
131
Gestión Curricular
Asignatura: Estadística general
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993
3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995
3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997
3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998
3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998
3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999
3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
4.0 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000
Problemas Desarrollados
1. Determinar el área bajo la curva normal para valores de z entre: z = 0 y z = -1.8 (es decir: −1.8 ≤ z ≤ 0
Solución
Construyendo el gráfico del área pedida.
132
Gestión Curricular
Asignatura: Estadística general
Área pedida
Como se puede observar, en la tabla no existen valores negativos de z, por lo tanto siempre que aparezcan
valores negativos de z, se obvia el signo para buscar su valor en la tabla.
El resultado en este caso es el mismo que el ejemplo anterior debido a que la curva normal tipificada es
simétrica.
p (−1.8 ≤ z ≤ 0 )=0.4641=46.41 %
2. Determinar el área bajo la curva normal para valores a la derecha de
z=−1.15 (es decir: z ≥−1.15).
Solución
Construyendo el gráfico del área pedida.
Área pedida
En la tabla, ubicamos el número entero con un decimal (1.1) en la primera columna de la izquierda, y el
segundo decimal (5)z=−1.15
lo ubicamos
y en
z=0la primera fila superior,0.50
de la siguiente manera:
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.000 0.004 0.008 0.012 0.016 0.019 0.023 0.027 0.031
0.0 0.0359
0 0 0 0 0 9 9 9 9
. .
. .
0.364 0.374
1.1
3 9
Luego:
ÁREA PEDIDA = 0.3749 + 0.50 = 0.8749
ÁREA PEDIDA = p ( z ≥−1.15 )=0.8749=87.49 %
133
Gestión Curricular
Asignatura: Estadística general
3. Determinar el área bajo la curva normal, para valores entre z = 0.92 y z = 2.84
(es decir: 0.92 ≤ z ≤ 2.84)
Solución
Construyendo el gráfico del área pedida.
Área pedida
Ubicamos los valores de z = 0.92 y z = 2.84 en la tabla, de la misma forma que en los ejemplos anteriores.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
Luego:
ÁREA PEDIDA = 0.4977 – 0.3212 = 0.1765
También: p ( 0.92 ≤ z ≤2.84 )=0.1765=17.65 %
Problemas Propuestos
134
Gestión Curricular
Asignatura: Estadística general
d) A la derecha de z = 1.84
e) Entre z = 1.97 y z = 0.56
2. Calcule el valor de "z" para las probabilidades (área a la izquierda):
a) Probabilidad de 0.7734
b) Probabilidad de 0.9871
c) Probabilidad de 0.4013
d) Probabilidad de 0.9505
e) Probabilidad de 0.1251
3. Calcule la probabilidad acumulada a la izquierda de:
a) z1 ≤ 2,1564
b) z1 ≤ - 1,6851
4. Calcule el valor “z” que corresponde en cada caso y determine las probabilidades y grafique en:
a) Áreas de construcción: μ = 150 m2 ; σ = 1,03 m2. ; x = 148,6 m2. P(x<148.6) = ?
b) Distancia recorrido por un auto: μ = 25 Km.; σ = 2,2 Km.; x = 22,8 Km. P(x>22,8) = ?
c) Tiempo de almorzar: μ = 38 min.; σ = 4,3 min.; x = 47,675 min. y x = 30,131 min. P(30,131<x<47,675) = ?
d) Tiempo en llegar a la universidad desde su casa: μ = 45 min; σ = 3,8 min. ; x = 39,4 min. y
x = 51,4 min. ¿Cuál es la probabilidad entre esos dos tiempos?
e) Se tiene una probabilidad de 0.9842, μ = 37 litros; σ = 3,2 litros. ¿Cuánto vale x?
5. El promedio de talla de los estudiantes es de 1.58 m. con una desviación estándar de 3.25 m. Si seleccionamos a
un estudiante al azar, determine las siguientes probabilidades:
a) que mida a lo más 1.65 m
b) que mida entre 1.45 y 1.78 m
c) que mida al menos 1,48 m
Video de Apoyo
135
Gestión Curricular
Asignatura: Estadística general
Semana 16
EVALUACIÓN FINAL
136
Gestión Curricular
Asignatura: Estadística general
Referencias bibliográficas
Díaz, A. (2013). Estadística aplicada a la administración y la economía. México D. F.: McGraw Hill.
Universidad de Valladolid. (13 de abril de 2012). Probabilidad y estadística orientada a la economía y la empresa
[página web]. Recuperado de: goo.gl/41Ck0B
Pérez, C. (2012) Estadística Aplicada –IBM SPSS. España: Garceta grupo editorial.
Robert Johnson, Patricia Kuby. Estadística Elemental. Thomson Editorial. México 2002
137
Gestión Curricular
Asignatura: Estadística general
Ross, S. (2011). Probabilidad y Estadística para Ingenieros. 3a. ed. México: Mc Graw Hill, 2001.
138