Está en la página 1de 73

HIDALGO TORRES JOSE LUIS

RUIZ AZUAJE MICHAEL ABRAHAM


LADERA GARCÍA ARON ELEAZAR
ROSERO ORTIZ TONNY FABIAN
COLLINS VENTURA NATHYN VICTOR

Estadísitica

s
Grupo de capacitación e investigación pedagógica
Primera edición: enero 2019

© Ediciones Grupo Compás 2019

ISBN: 978-9942-33-232-5
Diseño de portada y diagramación: Grupo Compás

Este texto ha sido sometido a un proceso de


evaluación por pares externos con base en la
normativa de la editorial.

Quedan rigurosamente prohibidas, bajo las


sanciones en las leyes, la producción o
almacenamiento total o parcial de la presente
publicación, incluyendo el diseño de la portada, así
como la transmisión de la misma por cualquiera de
sus medios, tanto si es electrónico, como químico,
mecánico, óptico, de grabación o bien de
fotocopia, sin la autorización de los titulares del
copyright.

Guayaquil-Ecuador 2019
Estadí sitica

Autores
HIDALGO TORRES JOSE LUIS
RUIZ AZUAJE MICHAEL ABRAHAM
LADERA GARCÍA ARON ELEAZAR
ROSERO ORTIZ TONNY FABIAN
COLLINS VENTURA NATHYN VICTOR
Estadísitica
Autor.

HIDALGO TORRES JOSE LUIS


RUIZ AZUAJE MICHAEL ABRAHAM
LADERA GARCÍA ARON ELEAZAR
ROSERO ORTIZ TONNY FABIAN
COLLINS VENTURA NATHYN VICTOR

Experiencia académica:
Docentes del Instituto Superior Tecnológico
Corporativo Edwards Deming.

Este libro fue elaborado en el contexto de


desarrollo de la educación por el Instituto Superior
Tecnológico Corporativo Edwards Deming, sus
contenidos son una estructura básica para lograr
un proceso de aprendizaje ideal.

El documento mantien una revisión de doble par


ciego lo que permite considerarse como una
obra que contribuye con la formación profesional,
consiguiendo el aval de universidades en América
como la Universidad de Oriente y UO University.

s
Grupo de capacitación e investigación pedagógica
Contenido
Introducción.......................................................................................... 3
Capítulo I: Fundamentación teórica .................................................. 4
La estadística ........................................................................................ 4
Historia de la estadística .................................................................... 5
Importancia del estudio de la estadística ....................................... 6
Fundamentación teórica................................................................... 6
Población ............................................................................................ 6
Muestra ................................................................................................ 7
Muestreo ............................................................................................. 7
Parámetro ........................................................................................... 7
Datos Estadísticos ............................................................................... 7
División de la estadística .................................................................... 8
Estadística descriptiva ........................................................................ 8
Estadística inferencial......................................................................... 8
Variables de datos ............................................................................. 8
La variables ......................................................................................... 8
Variable cualitativa ............................................................................ 9
Variable cuantitativa ......................................................................... 9
Variable discreta ................................................................................ 9
Variable continúa............................................................................... 9
Escalas de medición ........................................................................ 10
Clasificación de las escalas ............................................................ 11
Escala nominal o clasificatoria........................................................ 11
Escala ordinal.................................................................................... 12
Escala discreta o discontinua ......................................................... 12
Escala concreta o continua ............................................................ 13
Escala dicotómica ........................................................................... 13
Escala cronológica .......................................................................... 14
Capítulo II: Distribución de frecuencias........................................ 15
Distribución de Frecuencias ............................................................ 15

1
Frecuencia ........................................................................................ 17
Rango ................................................................................................ 18
Números de Intervalos de Clase ..................................................... 19
Límites de cada clase ...................................................................... 19
Datos estadísticos ............................................................................. 21
Histogramas ...................................................................................... 21
Diagramas lineales ........................................................................... 25
Ojivas o polígono de frecuencias acumulada.............................. 27
Características de las ojivas ............................................................ 28
Diagrama de sectores ..................................................................... 30
Capítulo III: Análisis y descripción de los datos............................ 36
Medidas de tendencia central .............................................. 36
Media Aritmética o promedio ........................................................ 36
Mediana ............................................................................................ 36
Moda ................................................................................................. 36
Medidas de posición de datos no agrupados y agrupados42
Cuartiles............................................................................................. 42
Deciles ............................................................................................... 42
Percentiles ......................................................................................... 42
Medidas de dispersión de datos agrupados ........................ 51
Varianza ............................................................................................ 51
Desviación estándar ........................................................................ 51
Coeficiente de desviación .............................................................. 51
La Distribución Normal o Campana de Gaus. ...................... 55
Característica de la curva de Distribución Normal ....................... 58
Glosario de términos ................................................................ 64
Referencia Bibliográficas ......................................................... 67

2
Introducción
Para ustedes queridos estudiantes hemos desarrollado este libro y
ha sido pensado como instrumento para el conocimiento. Hemos
puesto nuestro mejor esfuerzo por guiar su educación en una de
sus áreas como lo es la estadística bajo tres premisas
fundamentales: estudiar y reflexionar sobre conceptos estadísticos
unidos al contexto y a sus vivencias; reivindicar la estadística como
una disciplina, cuyo aprendizaje permite la generación de valores
que están acoplados a la formación de ciudadanía y al desarrollo
de una verdadera sociedad democrática y participativa; y
propiciar que el aprendizaje de la estadística en nuestras aulas y
otros lugares de aprendizaje, desarrolle la comprensión de
conceptos y procedimientos. Aspiramos que el acople de estas
tres premisas les permita adquirir el instrumental matemático-
estadístico, tanto desde el aspecto cognitivo como ético, que les
exhorte a formar parte activa en la construcción del país, que
queremos y merecemos.
Según Nathalie. R. comenta que:
La estadística es de gran importancia en la investigación científica
debido a que: Permite una descripción más exacta, nos obliga a
ser claros y exactos en nuestros procedimientos y en nuestro
pensar, permite resumir los resultados de manera significativa y
cómoda, nos permite deducir conclusiones generales. (Nathalie.
R. 2017).
Por lo anterior expuesto se deriva que el objetivo final de este
material es invitarte a participar en modelar, conjeturar, contar,
medir, estimar, diseñar y argumentar. Resolvamos problemas para
la vida que nos inciten a descubrir quiénes somos en esta
sociedad. En este libro de estudio te proponemos un aprendizaje
crítico de la estadística, al servicio de la humanidad, que sirva
para entender el universo, que sea útil para el desarrollo del
hombre y su comunidad.

3
Capítulo I: Fundamentación teórica
La estadística
(Gutiérrez, 2015) (Ángel, 2018) (López, 2016)
La estadística es la La estadística es la La estadística es
ciencia que estudia ciencia de los datos, la rama del
cómo debe la cual implica su conocimiento
emplearse la recolección, humano que
información y cómo clasificación, tiene como
dar una guía de síntesis, objeto el estudio
acción en organización, de ciertos
situaciones análisis e métodos
prácticas que interpretación, para inductivos
entrañan la toma de aplicables a
incertidumbre. decisiones frente a fenómenos
la incertidumbre. susceptibles de
expresión
cuantitativa.

4
Historia de la estadística

Datos Históricos de la Estadística.


Graunte F. (2017). Graunte F. (2017). Graunte F. (2017).
La palabra Los fundamentos A partir de
Estadística de la estadística mediados del siglo
procede del actual y muchos XX comienza lo
vocablo Estado , de los métodos de que podemos
pues era función inferencia son denominar la
principal de los debidos a R. A. estadística
Gobiernos de los Fisher. Se interesó moderna, uno de
Estados establecer primeramente por los factores
registros de la eugenesia, lo determinantes es la
población, que le conduce, aparición y
nacimientos, siguiendo los pasospopularización de
defunciones, de Galton a la los computadores.
impuestos, investigación El centro de
cosechas, entre estadística, sus
gravedad de la
otros. La trabajos culminan metodología
necesidad de con la publicación estadística se
poseer datos de la obra
empieza a
cifrados sobre la Métodos desplazar técnicas
población y sus estadísticos para
de computación
condiciones investigaciones. Enintensiva aplicadas
materiales de él aparece la
a grandes masas
existencia han metodología de datos, y se
debido hacerse estadística tal y empieza a
sentir desde que se como hoy la
considerar el
establecieron conocemos. método estadístico
sociedades como un proceso
humanas iterativo de
organizadas. búsqueda del
modelo ideal
Que te parece: el anterior cuadro nos resume tres momentos
históricos de la Estadística.

5
Importancia del estudio de la estadística
La importancia de esta hermosa área de la matemática radica
en que la Estadística es la base del conocimiento práctico y real.
Su definición, lo deja claro es una de las ramas de la ciencia
matemática que se centra en el trabajo con datos e
informaciones que son ya de por sí numéricos o que ella misma se
encarga de transformar en números. La estadística, si bien es una
ciencia de extracción exacta, tiene una injerencia directa en
cuestiones sociales por lo cual su utilidad práctica es mucho más
comprensible que lo que sucede normalmente con otras ciencias
exactas como la matemática.
Fundamentación teórica
A continuación, abordaremos una serie de conceptualizaciones
teóricas para aclarar términos que posteriormente estarás usando
continuamente, espero sea de tu agrado y enriquezca tu
vocabulario profesional.
Estadística básica
Laguna C. (2016); La Estadística se ocupa de los métodos y
procedimientos para recoger, clasificar, resumir, hallar
regularidades y analizar los datos, siempre y cuando la
variabilidad e Diplomado en Salud Pública 2. Metodología en
Salud Pública 01. Introducción a la Estadística 2 - 12 incertidumbres
sea una causa intrínseca de los mismos; así como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la toma
de decisiones y en su caso formular predicciones.
Población
Laguna C. (2016); Población: conjunto de individuos o elementos
que cumplen ciertas propiedades y entre los cuales se desea
estudiar un determinado fenómeno.

6
Muestra
Laguna C. (2016); subconjunto representativo de una población.
Estadístico: función definida sobre los valores numéricos de una
muestra.
Muestreo
Laguna C. (2016); Cuando se decide cuantificar sólo una parte
de las unidades de una población y a partir de esta información
estimar sus parámetros, entonces estamos planteando un
problema de muestreo.
Parámetro
Laguna C. (2016); Parámetro: función definida sobre los valores
numéricos de características medibles de una población.
Datos Estadísticos
Laguna C. (2016); Son números que representan las modalidades
de las variables. Por ejemplo, el 1 puede representar la modalidad
"Mujer". Los datos pueden ser clasificados según diferentes
criterios, uno de los cuales se basa en las modalidades que
presentan.
Ejercicio Aplicado: a continuación, presentamos un ejemplo base
para profundizar y afianzar los conceptos anteriormente
estudiados:
El Instituto Tecnológico Corporativo Edwards Deming se plantea
estudiar dentro de toda su matrícula inscrita en la carrera
Administración del Sistema de la Calidad, el nivel de agrado en el
trato pedagógico de sus tutores o tutoras.
Fenómeno a estudiar: Nivel de agrado de los tutores o tutoras de
la carrera Administración del Sistema de la Calidad.
Población: Toda la Matricula del Instituto inscrita en la carrera
Administración del Sistema de la Calidad.
Muestra: Una sección de fin de semana aleatoria ósea escogida
al azar inscrita en la carrera Administración del Sistema de la
Calidad.
Muestreo: ante la siguiente pregunta: Estas conforme con el nivel
de conocimiento que el tutor o tutora tiene sobre la materia
asignada : Posibles Respuestas Si ( ) -- No( )
El anterior es un planteamiento que generará una información, a
esto le llamamos muestreo.
Parámetro: el ejemplo anterior solo podrá tener dos posibles

7
respuestas, Si o No.
Datos Estadísticos: cada respuesta de los estudiantes
seleccionados para el estudio será un dato estadístico, se
recogerán y se cuantificarán.

División de la estadística
Estadística descriptiva
Describe, analiza y representa un grupo de datos utilizando
métodos numéricos y gráficos que resumen y presentan la
información contenida en ellos.
Estadística inferencial
Apoyándose en el cálculo de probabilidades y a partir de datos
muéstrales, efectúa estimaciones, decisiones, predicciones u otras
generalizaciones sobre un conjunto mayor de datos. Su tarea
fundamental es la de hacer inferencias acerca de la población a
partir de una muestra extraída de la misma.

Variables de datos
La variables
La variable estadística se refiere a una característica o cualidad
de un individuo que está propenso adquirir diferentes valores.
Estos valores se caracterizan por poder medirse. Fuente

8
Enciclopedia de Estadistica en las Economías (2017).
Tipo de Variable: a objedto de estudio de esta asignatura solo
estaremos estudiando las variables cuantitativa, y su derivadas.
Variables

Cualitativas Cuantitativas

Discretas

Continuas

Variable cualitativa
Las variables cualitativas son aquellas características o cualidades
a las que no se le pueden aplicar estudios o formulas matemáticas
en su procesamiento, sino que lo hacen con palabras, inferencias
o conclusiones, Fuente Enciclopedia de Estadistica en las
Economías (2017).
Variable cuantitativa
son aquellas características o cualidades que sí pueden
expresarse y medirse a través de números, luego de la aplicación
de procedimientos y fórmulas matemáticas, Fuente Enciclopedia
de Estadistica en las Economías (2017).
Variable discreta
Aquella variable que usa valores enteros y no finitos. Por ejemplo:
La cantidad de familiares que tiene una persona (2, 3, 4 ó más),
Fuente Enciclopedia de Estadistica en las Economías (2017).
Variable continúa
Aquella variable que utiliza valores finitos y objetivos. Suele
caracterizarse por utilizar valores decimales. Por ejemplo: El peso
de una persona (64.3 Kg, 72.3 Kg, etc), Fuente Enciclopedia de
Estadistica en las Economías (2017).
Ejercicio Aplicado
Si se nos plantea realizar un estudio en una comunidad de la
ciudad de Quito, con las siguientes preguntas:
Marque con una (x) la opción según sea su caso.

9
1. Cuantas personas habitan en la vivienda.
1 ( ) 2 ( ) 4 ( ) mas de 4 ( )
2. Escriba en el siguiente espacio la cantidad de años que ud
tiene viviendo en la comunidad, sea lo mas exacto posible.
Ejemplo puede escribir 1,5 años o 3,5 años.
Años en la vivienda ( )
3. Escriba en pocas palabras como es la relación interpersonal
entre los habitantes de la comunidad.
Partiendo de la conceptualización previa obtenemos los
siguientes resultados.
La 1ra pregunta: estudia la variable cantidad de habitantes , es
Variable Cuantitativa del tipo Discreta solo generará un número
entero exacto.
La 2da pregunta: estudia la variable tiempo en la vivienda , es
Variable Cuantitativa del tipo Continua pues la respuesta variara
entre un entero y otro, bien puede ser 1 ó 1,3 ó 3,6 ó 4,5 y así
sucesivamente.
La 3ra pregunta: estudia la variable calidad de relación
interpersonal , es Variable Cualitativa la misma no podrá ser
medida con ningún instrumento matemático y sus posibles
respuestas variaran según las condiciones de otras variables,
como cultura, calidad de vida, estados de ánimo entre otros.

Escalas de medición
Como hemos dicho, para que los datos tengan sentido es
necesario compararlos. Y para poder compararlos debemos
utilizar escalas de medición. Dichas escalas tendrán diferentes
propiedades en función de las características de los datos que se
compararán.
Tambien se puede definir como un instrumento de medida, de
acuerdo al cual se asignan valores a los datos estadísticos. Se

10
reconocen cuatro niveles de medición: nominal, ordinal, de
intervalo y de razón. En la siguiente figura, se resumen las
principales características de cada nivel.

Clasificación de las escalas


A continuación te presentamos una figura que te dara una idea
clara de las escalas de medición y su relación con los tipos de
variables:
Escalas

Cualitativas Cuantitativas

Nominal Discretas - Discontinua

Ordinal Concreta - Continuas

Cronológica

Escala nominal o clasificatoria


Este tipo de variables, no presentan un ordenamiento previo, más
al contrario es arbitraria, de ahí que se haya ideado tres
parámetros para entender mejor este tipo de escala; variable,
escala y diferencia, por Ejemplo:

Variable Profesión
Escala Ingeniero, Médico, Abogado, Enfermero, Odontólogo
Diferencia No existe diferencia entre los profesionales en cuanto
a nivel de estudio (tercer nivel)

Variable Provincias de la Costa del Ecuador


Escala Esmeraldas, Manabí, Guayas, Santa Elena, El Oro
Diferencia Ninguna

Variable Estado civil


Escala Soltero, Casado, Divorciado, Viudo, Unión libre
Diferencia Ninguna

Variable Sexo

Escala Masculino, Femenino

Diferencia Ninguna

11
Escala ordinal
Son variables susceptibles de ser medidas siguiendo un
ordenamiento (orden), formada por una clase mutuamente
excluyente, que se agrupan de acuerdo a un orden pre asignado.
Por ejemplo:

Variable Grado de instrucción


Escala Primaria, Secundaria, Superior, Posgrado
Diferencia Existe diferencia entre diferentes niveles de la escala
entre los estudiantes no solo años de experiencia,
sino de conocimiento.

Variable Grado de militar y/o policial


Escala Soldado, Sargento, Suboficial, Oficial, General
Diferencia Existe diferencia entre los grados jerárquicos no solo
en Años de experiencia, sino en tiempo de estudio.

Variable Jerarquía familiar


Escala Hijo menor, Hijo intermedio, Hijo mayor, Madre o Padre,
Padre o Madre
Diferencia Existe diferencia entre los grados jerárquicos de la
familia no solo en años de experiencia, sino en edad.

Escala discreta o discontinua


Se dice que, si la variable medida es susceptible a ser contada, se
puede construir una escala discreta, formada por números
ENTEROS con incrementos fijos, donde las fracciones no son
consideradas; para esto, se debe considerar la magnitud de los
números expuestos. Por ejemplo:
Variable Número de hijos

Escala 1 hijo, 2 hijos, 3 hijos, 4 hijos

Amplitud Entre 4 y 1 hijos, existe una amplitud de 3 hijos

12
Variable Número de visitas
Escala De 1 a 3 visitas, De 4 a 6 visitas, De 7 a 9 visitas, De
10 a 12 visitas
Amplitud Entre 1 y 3, existe una amplitud de 2

Variable Número de caries dental


Escala De 1 a 3 caries, De 4 a 6 caries, De 7 a 9 caries
Amplitud Entre 1 y 3 caries, existe una amplitud de 2 caries

Escala concreta o continua


Cuando se cuenta con variables de tipo cuantitativo continuo o
concreto, se pude utilizar este tipo de escala, cuyo requisito es el
de poder presentar números relativos o racionales (fraccionados,
porcentuales y/o decimales) siendo esta medición aproximada.
Por ejemplo:

Variable Estatura
Escala 1,65 m; 1,66 m; 1,67 m; 1,68 m; 1,69 m
Amplitud Entre 1,65 y 1,69 m, existe una amplitud
de 0,5 m

Variable Peso
Escala 6,5 Kg; 7,5 Kg; 8,5 Kg; 9,5 Kg
Amplitud Entre 6,5 y 9,5 kg, existe una amplitud de
4,0 kg

Variable Tiempo
Escala 1,10 h; 2,10 h; 3,10 h; 4,10 h
Amplitud Entre 1,10 y 4,10 h, existe una amplitud de
4 h.

Escala dicotómica
Es aquella escala que presenta tan solo dos opciones para medir
la variable, siendo esta variable de tipo cualitativo o cuantitativo,
dependiendo de la información o resultado que se busque. Por
ejemplo:
Variable Preferencia por un equipo de fútbol
Escala Liga y Barcelona
Respuesta Liga o Barcelona

13
Variable Cambios físicos de una persona
Escala al 1 año, 5 años, 25 años, 50 años, 75
años, 100 años
Respuesta descripción de las alteraciones físicas
durante su vida
Variable Sexo de un estudiante del Instituto Universitario.
Escala Masculino y femenino
Respuesta Masculino o femenino

Escala cronológica
Es un tipo de escala cuantitativa continua, se la utiliza para
estudiar algunos fenómenos en función al tiempo, algunos autores
la tratan como si fuera una escala de variable independiente,
permite conocer un determinado fenómeno a través del tiempo,
es decir permite un seguimiento temporalizado (en el pasado, en
el presente o en el futuro).

14
Capítulo II: Distribución de frecuencias
Distribución de Frecuencias
Al respecto Salazar y Castillo. (2018). establece
Es una tabla estadística donde se presentan los datos resumidos,
de tal manera que se puede en una visión panorámica establecer
un criterio sobre su comportamiento, entendiéndose por
comportamiento, la determinación aproximada de los valores
centrales, la variabilidad que presentan y si son o no relativamente
simétricos con relación a un valor central.
En una tabla de frecuencias se pueden resumir cualquier tipo de
datos, categóricos (nominales), ordinales, discretos y continuos,
para este último tipo de datos, más adelante se verá un
procedimiento para crear una distribución de frecuencias.
Tabla de frecuencias para datos nominales, ordinales y discretos,
la distribución de frecuencias constará básicamente de dos
columnas, la izquierda reservada para las categorías (valores) que
aparecen en el estudio respectivo y la de la derecha donde se
ubica la frecuencia de clase respectiva. Antes de dar Ejemplos de
estas distribuciones veamos dos criterios que son muy utilizados.

Frecuencia Frecuencia de clase


Es el número de veces que Es el número de elementos que
un elemento se repite en un tiene cada una de las categorías
estudio estadístico. mutuamente excluyente de una
distribución si la información de un
estudio estadístico no está
categorizada, entonces no
aparecerán frecuencias de clase y
solo habrá frecuencia en caso de
elementos que se repiten.
La distribución de frecuencias deberá contar con un título que
informe sobre qué versa el estudio y referencias (fuente) en caso de
ser tomado de estudios anteriores.

Construcción de Tablas de Frecuencias con Variables Discretas.


A continuación, desarrollaremos varios ejemplos de construcción
de tablas de frecuencias, y en la misma medida en que te
expliquemos como hacer cada paso, abordaremos la definición

15
y el procedimiento, el mismo te ayudará a comprender mucho
mejor el tema en cuestión.
Estudio de caso #1.
Estudio sobre tipo de automotores que circularon en quince
minutos en la intersección de la Av. 6 de Diciembre
TIPO Nº Vehículos
Automóvil 25
Bus 12
Camioneta 10
Camión 5
Furgoneta 8
TOTAL 60

La Tabla, representa un estudio realizado con una variable de


carácter nominal, se puede observar que la categorización
representa a los datos que fueron observados y no existe un orden
predeterminado para realizar la categorización; además cabe
resaltar que no aparece otro tipo de automotor ya que en los
quince minutos en los cuales se hizo el estudio, no pasaron por la
intersección ningún otro tipo de vehículo.
Estudio de caso #2.
Percepción del servicio recibido en la atención a los estudiantes,
en la recepción del I.T.C. EDWARDS DEMING.
La siguiente tabla, Percepción del servicio recibido en la atención
a los estudiantes, en la recepción del I.T.C. Edwards Deming.

SERVICIO Nº Personas
Excelente 20
Muy bueno 15
Bueno 20
Regular 18
Malo 7
TOTAL 80

16
En esta tabla, los datos de la variable de estudio (calidad de
servicio) están medidos en escala ordinal, por lo tanto, las
categorías constan en la tabla con un orden establecido. De la
misma manera que en la anterior, las categorías son mutuamente
excluyentes y exhaustivas.

Construcción de Tablas de Frecuencias con Variables Continuas.


Para abordar el tema de la construcción de tablas de frecuencias
con variables continuas, debemos abordar primero un marco
teórico que te ubicará y te guiará.

Frecuencia
Según el portal (2018).
Es el número de veces en que dicho evento se repite durante un
experimento o muestra estadística.

Ejemplo: si le preguntamos a 15 personas su preferencia con


respecto a 3 playas de la costa de Ecuador. Sus resultados son:
Salinas, Manta, Galápagos, Galápagos, Galápagos, Salinas,
Manta, Galápagos, Salinas, Manta, Galápagos, Salinas, Manta,
Galápagos, Manta.
Playa Frecuencia
Salinas 04
Manta 05
Galápagos 06
TOTAL 15

A partir de este punto plantearemos un ejercicio que iremos


desarrollando a medida que desarrollemos el tema para un mejor
seguimiento y entendimiento.
Un centro deportivo decide tomar la medida de estatura a cada
uno de sus 108 deportistas entre las edades de 12 a 16 años, de
sexo femenino, para evaluar su crecimiento, obteniendo los
siguientes resultados:

17
Tabla de distribución de frecuencias de datos
Estatura Frecuencia Estatura Frecuencia Estatura Frecuencia
(X) (fx) (X) (fx) (X) (fx)

125 1 138 3 151 4

126 0 139 6 152 6

127 0 140 3 153 7

128 0 141 2 154 5

129 0 142 5 155 2

130 0 143 8 156 0

131 0 144 6 157 3

132 2 145 9 158 4

133 0 146 5 159 3

134 0 147 4 160 1

135 0 148 4 161 0

136 1 149 5 162 1

137 5 150 3 Total 108

Procedemos a construir una tabla de distribución de frecuencias


agrupadas en intervalos de clase, para esto iremos paso a paso.
Rango
Según el portal khanacademy.orgc. Se define el rango o
recorrido de una variable estadística como la diferencia entre el
mayor y el menor valor de la variable. El rango indica la longitud
del intervalo en el que se hallan todos los datos de la distribución.
El rango es una medida de dispersión importante aunque
insuficiente para valorar convenientemente la variabilidad de los
datos.
La ecuación para calcular el rango o recorrido es: Rango =
Valor Mayor − Valor Menor
En el ejercicio en cuestión tenemos: Valor Mayor 162; Valor
menor: 125; si aplicamos la ecuación
Rango = 162 − 125 Rango = 37
Ahora bien que representa este valor 37 ; entre los valores 125 a
162 existen 37 valores por los cuales todos los demás valores
estarán recorriendo.

18
Números de Intervalos de Clase
Según el portal es.khanacademy.org. Para determinar el número
de clases del tamaño de la muestra. Como regla general, se
utilizan de cinco a siete clases para un tamaño de la muestra de
hasta 50, de ocho a 10 clases para un tamaño de la muestra entre
50 y 100, 10 a 15 clases para un tamaño de la muestra entre 100 y
250 y de 15 a 20 clases para un tamaño de la muestra mayor a
250.
Como el ejemplo que estamos desarrollando es de 108 datos en
la muestra, podemos trabajar con el valor 8, ya que está muy
próximo a 100.
Este valor seleccionado de 8 nos va a servir para calcular el
intervalo procediendo de la siguiente forma:
Por conveniencia llamaremos al Intervalo i.
Rango
Intervalo =
Nro de Intervalos
37
i = => i = 4,6
8
Cuando el valor no es entero debemos redondearlo al mayor o
inferior según sea el caso; si el decimal es < que 4, redondeamos
por defecto al entero inferior; si el decimal es >= que 5
redondeamos al inmediatamente superior.
En nuestro caso redondeamos 4,6 a 5. Representando entonces
que nuestro estudio en el ancho del intervalo no será mayor a 5.
A su vez este valor amplitud de la clase 5 , infiere directamente
en el rango generando entonces debemos volver a calcular el
mismo:
Nuevo Rango = Amplitud de la clase ∗ Nro de clases
Nuevo Rango = 5 ∗ 8 => Nuevo Rango = 40
Este nuevo rango difiere del otro en 3 , a continuación
explicaremos que haremos con esa diferencia.
Límites de cada clase
Procedimiento extraído en gran parte de: Spiegel, R. (2018).
Para calcular los límites de cada clase debemos desarrollar el
siguiente procedimiento:
1ro debemos conocer cuál es el límite superior y el límite inferior
que tendrá la tabla, para eso procedemos; recordemos que el
nuevo rango tiene una pequeña diferencia de 3 que
distribuiremos así:

19
𝑙𝑖𝑚 _𝑠𝑢𝑝 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑠 𝑎𝑙𝑡𝑜 + 2
“3” la dif. del nuevo rango
𝑙𝑖𝑚 _𝑖𝑛𝑓 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑠 𝑏𝑎𝑗𝑜 − 1

Obteniendo los siguientes valores:


lim _sup = 162 + 2 => lim _ sup = 164
lim _inf = 125 − 1 => lim _inf = 124

Seguidamente formamos los intervalos de clase definitivo,


agregando i-1; obteniendo, 5-1=4 este valor se lo sumaremos a
cada clase iniciando con el Lim _inf=124. Obteniendo la siguiente
tabla:
Amplitud
i-1=4
Lim _inf Lim _sup
124 +4= 128
129 +4= 133
134 +4= 138
139 +4= 143
144 +4= 148
149 +4= 153
154 +4= 158
159 +4= 163

Ahora bien, ese valor 1 que restamos a i lo agregaremos en cada


clase quedando así:
Lim _inf Lim _sup
124-0,5 128+0,5
129-0,5 133+0,5
134-0,5 138+0,5
139-0,5 143+0,5
144-0,5 148+0,5
149-0,5 153+0,5
154-0,5 158+0,5
159-0,5 163+0,5

20
Quedando finalmente como sigue, agrupando los datos en cada
clase:
Intervalos de Clases
(estatura / Centimetros) Frecuencia
Lim _inf Lim _sup (deportistas)
123,5 128,5 1
128,5 133,5 4
133,5 138,5 9
138,5 143,5 24
143,5 148,5 29
148,5 153,5 22
153,5 158,5 14
158,5 163,5 5
Total 108

Datos estadísticos
Ahora querido estudiante le invitamos a que pueda seguir
analizando el ejercicio anterior, para vamos a crear varias
representaciones gráficas que nos ayudaran a entender más el
manejo y la lectura de los datos.
Histogramas
Para desarrollar los diferentes tipos de diagramas deberás utilizar
algunas herramientas como: lápiz, sacapuntas, borrador, regla,
escuadra, transportador, compas, entre otros.
El respecto Spiegel, R. (2018).
Un histograma es un gráfico de barras vertical que representa la
distribución de frecuencias de un conjunto de datos.
El histograma, una de las Siete Herramientas básicas de la
Calidad, es especialmente útil cuando se tiene un amplio número
de datos que es preciso organizar, para analizar más
detalladamente o tomar decisiones sobre la base de ellos.
También es un medio eficaz para transmitir a otras personas
información sobre un proceso de forma precisa e inteligible. Otra
aplicación del histograma es la comparación de los resultados de
un proceso con las especificaciones previamente establecidas.
En este caso, mediante el histograma, puede determinarse en qué
grado el proceso está produciendo buenos resultados. Y hasta
qué punto existen desviaciones respecto a los límites fijados en las

21
especificaciones. En este sentido, el estudio de la distribución de
los datos puede ser un excelente punto de partida para
establecer hipótesis acerca de un funcionamiento insatisfactorio.
Ventajas
Su construcción ayudará a comprender la tendencia central,
dispersión y frecuencias relativas de los distintos valores.
Muestra grandes cantidades de datos ofreciendo una visión clara
y sencilla de su distribución.
Utilidades
Proporciona, mediante el estudio de la distribución de los datos,
un excelente punto de partida para formular hipótesis acerca de
un funcionamiento insatisfactorio.
El histograma es especialmente útil cuando se tiene un amplio
número de datos que es preciso organizar, para analizar más
detalladamente o tomar decisiones sobre la base de ellos.
Es un medio eficaz para transmitir a otras personas información
sobre un proceso de forma precisa e inteligible.
Permite la comparación de los resultados de un proceso con las
especificaciones previamente establecidas para el mismo. Ayuda
a determinar si el proceso satisface los requisitos del cliente.
Hace posible determinar si ha habido cambios en un proceso.
Iniciaremos explicando el diseño de un diagrama de barras:
1ro trazamos los ejes de coordenadas X abscisa; Y ordenadas.
2do dividimos en partes iguales cada eje, tomando en cuenta
que su cruce es el valor 0 , cero.

eje de ordenadas Y

Eje de Absisas

Ya trazados los ejes y dividido cada uno en partes iguales


procedemos a colocar los valores, en el caso de las absisas debes
colocar los valores o la escala de los intervalos de clases y en las

22
ordenadas colocaras una escala conveniente según las
frecuencias que tienes en la tabla, para el presente trabajo que
estamos realizando colocaremos la escala en intervalos de 5,
ósea, 5, 10, 15, .. hasta superar el valor máximo de la tabla.

20 eje de ordenadas Y
15
10
5 Eje de Absisas
0
123,5-128,5 128,5-133,5 133,5-138,5 138,5-143,5

Luego procedes a dibujar cada barra usando la regla, y el ancho


de la barra lo decides tu pero no puede exceder el ancho de la
clase de la columna de las absisas, elevaras la barra según te lo
indique el valor de la frecuencia y usaras como referencia la
escala que construiste en el eje de las ordenadas.

Por ejemplo, en la clase 3; 133,5 - 138,5 la frecuencia es 9 entonces

20
15
10
5
0
123,5- 128,5- 133,5- 138,5-
128,5 133,5 138,5 143,5

elevamos la barra hasta casi 10.

23
Así sucesivamente con cada clase, las barras las podrás rellenar,
colorear o dejarlas vacías, como mejor te parezca que se vean
presentables.
Se representa en el eje de ordenadas las modalidades y en
abscisas las frecuencias absolutas o las frecuencias relativas.

Distribución de la población femenina y


su estatura

29
24
22

14
9
1 4 5
123,5 - 128,5

148,5 - 153,5
128,5 - 133,5

133,5 - 138,5

138,5 - 143,5

143,5 - 148,5

153,5 - 158,5

158,5 - 163,5
Como podrás observar ya con la graficas puedes visualizar el
comportamiento de la variable estatura , en el club deportivo, a
partir de este diagrama de barra puedes inferir, por ejemplo; la
mayoría de los atletas del club están en la estatura entre 138cm a
153cm, pues se visualiza como las barras más altas . O también
puedes deducir que son pocos los atletas de baja estatura del
club .
Ahora bien, también existe el diagrama de barra de
comparación. Si se intentan comparar varias poblaciones entre sí,
usando el diagrama, existen otras modalidades, como las
mostradas en la siguiente figura.

24
Supongamos que tenemos una tabla de las estaturas de todos los
chicos del club (femenino y masculino).

Intervalos de Clases
(estatura / Frecuencia Frecuencia
Centimetros) (deportistas (deportistas
Lim Femeninas) Masculinos)
Lim _inf _sup
123,5 128,5 1 1
128,5 133,5 4 2
133,5 138,5 9 11
138,5 143,5 24 30
143,5 148,5 29 32
148,5 153,5 22 25
153,5 158,5 14 6
158,5 163,5 5 1
Total 108 108

Obtenemos un diagrama de barras como sigue:


Distribución de la poblacion total del Club según su estatura
35
30
25
20
15
10
5
0
138,5 - 143,5
123,5 - 128,5

128,5 - 133,5

133,5 - 138,5

143,5 - 148,5

148,5 - 153,5

153,5 - 158,5

158,5 - 163,5

Cant de Deportistas Fem Cant de Deportistas Masc

Diagramas lineales
Para desarrollar el diferente tipo de diagramas deberás utilizar
algunas herramientas como: lápiz, sacapuntas, borrador, regla,

25
escuadra, transportador, compas, entre otros.
Ahora explicaremos el diseño de un diagrama de líneas:
1ro trazamos los ejes de coordenadas X abscisa; Y ordenadas.
2do dividimos en partes iguales cada eje, tomando encuentra
que su cruce es el valor 0 , cero.

eje de
ordenadas Y

Eje de
Absisas

Ya trazados los ejes y dividido cada uno en partes iguales


procedemos a colocar los valores, en el caso de las absisas debes
colocar los valores o la escala de los intervalos de clases y en las
ordenadas colocaras una escala conveniente según las
frecuencias que tienes en la tabla, para el presente trabajo que
estamos realizando colocaremos la escala en intervalos de 5,
ósea, 5, 10, 15, .. hasta superar el valor máximo de la tabla.

20 eje de ordenadas Y
15
10
5 Eje de Absisas
0
123,5-128,5 128,5-133,5 133,5-138,5 138,5-143,5

Luego procedes a lo siguiente: con línea punteada cruzaras el


valor de la frecuencia con el intervalo, en el cruce colocaras un
punto pequeño, luego de hacer lo mismo para todos debes unir

26
los puntos; observa el siguiente ejemplo:
Intervalos de Clases
(estatura / Frecuencia
Centimetros) (deportistas)
Lim _inf Lim _sup
123,5 128,5 1
128,5 133,5 4
133,5 138,5 9
138,5 143,5 24
143,5 148,5 29
148,5 153,5 22
153,5 158,5 14
158,5 163,5 5
Total 108

30
25
20
15
10
5
0
123,5- 128,5- 133,5- 138,5- 143,5 148,5 153,5 - 158,5
128,5 133,5 138,5 143,5 - - 158,5 -163,5
148,5 153,5

Ojivas o polígono de frecuencias acumulada


La ojiva es un polígono de frecuencias acumuladas, es decir, en
las abscisas se colocan los límites superiores de cada intervalo de
clase y en las ordenadas se coloca la frecuencia acumulada de
la clase.
La ojiva es útil para, calcular el número o el porcentaje de
observaciones que corresponden a un intervalo determinado de
la variable, calcula los percentiles de la distribución de los datos

27
Características de las ojivas
Muestran frecuencias acumuladas.
Se prefiere para el tratamiento de datos cuantitativos.
El punto de inicio equivale a una frecuencia de 0.
El punto final equivale al 100% de los datos.
Interpretando la información en las ojivas
Dada su ventaja de representar frecuencias acumuladas, las
ojivas se convierten en una herramienta vital para el análisis
estadístico.
Ahora explicaremos el diseño de una ojiva:
1ro trazamos los ejes de coordenadas X abscisa; Y ordenadas.
2do dividimos en partes iguales cada eje, tomando en cuenta
que su cruce es el valor 0 , cero.

eje de ordenadas Y

Eje de Absisas

Ya trazados los ejes y dividido cada uno en partes iguales


procedemos a colocar los valores, en el caso de las absisas debes
colocar los valores o la escala de los intervalos de clases y en las
ordenadas colocaras una escala conveniente según las
frecuencias acumuladas que tienes en la tabla, para el presente
trabajo que estamos realizando como el valor mayor de la
frecuencia acumulada es 108, colocaremos la escala en
intervalos de 10, ósea, 10, 20, 30, .. hasta superar el valor máximo
de la tabla.

28
50
40 eje de ordenadas Y
30
20
10 Eje de Absisas
0
123,5- 128,5- 133,5- 138,5-
128,5 133,5 138,5 143,5

Luego procedes a lo siguiente: con línea punteada cruzaras el


valor de la frecuencia acumulada con el intervalo, en el cruce
colocaras un punto pequeño, luego de hacer lo mismo para
todos debes unir los puntos; observa el siguiente ejemplo:

Para construir una ojiva debemos organizar los datos; en el


ejemplo que estamos desarrollando vamos a proceder a incluir
una columna a la derecha y en la misma colocaremos las
frecuencias acumuladas, será cada frecuencia relativa sumada
con la frecuencia anterior, veamos:

Intervalos de Clases Frecuencia


(estatura / Frecuencia Acumulada
Centimetros) (deportistas) (deportistas)
Lim _inf Lim _sup
123,5 128,5 1 1
128,5 133,5 4 5
133,5 138,5 9 14
138,5 143,5 24 38
143,5 148,5 29 67
148,5 153,5 22 89
153,5 158,5 14 103
158,5 163,5 5 108
Total 108

29
110
100
90
80
70
60
50
40
30
20
10
0
123,5- 128,5- 133,5- 138,5- 143,5 148,5 153,5 158,5
128,5 133,5 138,5 143,5 - - - -
148,5 153,5 158,5 163,5
Puedes observar en el diagrama acumulativo denominado ojiva
el crecimiento o la curva de crecimiento de la variable en estudio

Diagrama de sectores
Un diagrama de sectores es un gráfico que consiste en un círculo
dividido en sectores de amplitud proporcional a la frecuencia de
cada valor. Se utiliza con datos cualitativos y cuantitativos.
A continuación un ejemplo:
Un compañero de Marta decidió preguntar a sus 20 compañeros
por su deporte favorito y obtuvo los datos, que aparecen en la
tabla siguiente:
Frec.
absoluta

Danza 5

Fútbol 8

Tenis 2

Baloncesto 3

Atletismo 2

SUMA 20

30
Posterior a esto agregaremos una columna denominada
frecuencia porcentual, y aplicamos la ecuación que te
colocamos a continuación y obtenemos el siguiente cuadro:

Frec. 𝑓𝑎
Frec. % %= ∗ 100
absoluta 𝑡𝑜𝑡𝑎𝑙
1er caso
Danza 5 25% 5
%= ∗ 100 => 25%
20
Fútbol 8 40% 2do caso
Tenis 2 10% 8
%= ∗ 100 => 40%
20
Baloncesto 3 15% 3er caso
2
Atletismo 2 10% %= ∗ 100 => 10%
20
SUMA 20 100 Y sigues hasta llegar al último, la
suma de todos los % debe ser
igual a 100

Posterior a este paso viene uno muy importante, el cálculo de los


grados de cada parte o sector del diagrama circular, cabe
destacar que debemos recordar que una circunferencia en su
totalidad ósea el 100% de ella equivale a 360°, para el cálculo de
los grados de cada sector aplicaremos la siguiente ecuación
hasta alcanzar la totalidad de la circunferencia.
%
°= ∗ 360
100
1er caso
25%
°= ∗ 360 => 90°
100
2do caso
40%
°= ∗ 360 => 144°
100
3er caso
10%
°= ∗ 360 => 36°
100

Y sigues hasta llegar al último, la suma de todos los °de cada


sector debe ser igual a 360, obteniendo la siguiente tabla.

31
Frec. Frec. Grados del

absoluta relativa
% sector

Danza 5 0,25 25% 90º


Fútbol 8 0,4 40% 144º
Tenis 2 0,1 10% 36º
Baloncesto 3 0,15 15% 54º
Atletismo 2 0,1 10% 36º
SUMA 20 1 100 360º

Procedamos a desarrollar el diagrama circular.


Paso 1. Con el uso de la regla trazamos una línea por lo menos de
5 cm., iniciando en el centro de la hoja.
Paso 2. Con ayuda del compás dibujamos una circunferencia,
haciendo centro en A , y abrimos el compás del tamaño del
segmento dibujado, y procedemos a trazar la circunferencia
completa.

Partiendo de esta regla, y colocando encima el transportador de


ángulos, marca los 90° del 1er dato de la tabla estadística,
Recuerda que el valor lo buscaras recorriendo el transportador en
contra de las agujas del reloj.

32
A

Quitamos el transportador y procedemos trazar una línea desde el


centro A de la circunferencia al lugar donde hicimos la 1ra
marca. Quedando como sigue:

Obtenemos
El 1er
sector

Ahora te explicare como obtener el 2do sector, presta mucha


atención este paso lo realizarás, tantas veces hasta que hayas
terminado todos los sectores.
Como podrás observar el transportador fue girado hasta hacer de
la línea del 1er sector como línea base y a partir de allí buscaremos
el 2do valor que es, 144°. Recuerda que el valor lo buscaras
recorriendo el transportador en contra de las agujas del reloj.

33
Quitamos el transportador y procedemos a trazar una línea desde
el centro A de la circunferencia al lugar donde hicimos la 1ra
marca. Quedando como sigue:

Obtenemos
El 1er
Obtenemos sector
El 2do
sector

Este último procedimiento lo repetirás hasta llegar al final de la


tabla estadística.
Ya tienes casi acabado tu gráfico circular. A partir de lo que tienes
hecho solo necesitarás colorear con colores distintos las partes
que le corresponde a cada grupo. Un consejo que te ofrecemos
para que te quede mucho mejor es que marques con un rotulador
o bolígrafo las líneas que separan un sector del otro y borres todas
las celdas intermedias. De este modo te quedarán grandes

34
sectores uniformes y quedará un resultado final impecable.
Finalmente deberás hacer una leyenda en la que indiques el título
de cada sector y a que color se corresponde para que la gente
pueda interpretar tu gráfico circular.

http://www.dspace.uce.edu.ec/ -Libro.pdf

35
Capítulo III: Análisis y descripción de los datos
Medidas de tendencia central
El respecto Spiegel, R. (2018), al respecto dice:
Las medidas de tendencia central son medidas estadísticas que
pretenden resumir en un solo valor a un conjunto de valores.
Representan un centro en torno al cual se encuentra ubicado el
conjunto de los datos. Las medidas de tendencia central más
utilizadas son: media, mediana y moda.
Los procedimientos para obtener las medidas estadísticas difieren
levemente dependiendo de la forma en que se encuentren los
datos. Si los datos se encuentran ordenados en una tabla
estadística diremos que se encuentran agrupados y si los datos
no están en una tabla hablaremos de datos no agrupados .
Medidas de tendencia central de datos no agrupados y
agrupados.
Media Aritmética o promedio
El respecto Spiegel, R. (2018), comenta:
La medida de tendencia central más conocida y utilizada es la
media aritmética o promedio aritmético. Se representa por las
letras cuando se trata del promedio del universo o población.
Es importante destacar que µ es una cantidad fija. La media
aritmética µ , se expresa en la misma unidad que los datos
originales: centímetros, horas, gramos, entre otros.
Mediana
Igualmente, Spiegel, R. (2018), añade:
Es el valor de la variable que ocupa la posición central, cuando
los datos se disponen en orden de magnitud. Es decir, el 50% de
las observaciones tiene valores iguales o inferiores a la mediana y
el otro 50% tiene valores iguales o superiores a la mediana.
Denotaremos este valor con las letras Me .
Moda
Al respecto Spiegel, R. (2018), nos ilustra diciendo:
Se define como el valor de la variable que más se repite. La
denotamos con el símbolo Mo . En un polígono de frecuencia la
moda Mo , corresponde al valor de la variable que está bajo el
punto más alto del gráfico. Una muestra puede tener más de una
moda Mo . Cuando en un estudio estadístico se consiguen dos
Mo , se dice que la variable es Vi-modal, a su vez si el estudio
posee más de dos Mo , la misma se define como Multi-modal.

36
Procedimiento para el cálculo de medidas de tendencia central
de datos no agrupados.
A continuación con un mismo ejemplo te explicaremos como
calcular la Media Aritmética , la Mediana Me y la Moda
Mo , de datos no agrupados: supongamos que hacemos una
recolección de información con 13 estudiantes del salón en
cuanto a la edad que tienen obteniendo los siguientes:
18;20;21;18;23;21;21;22;21;21;19;18;21
Media Aritmética o promedio : para calcular debemos
sumar todos los datos x obtenidos y dividir el resultado entre la
cantidad n de datos recolectados, en el ejemplo que estamos
desarrollando quedaría:
∑x ∑ 18+20+21+18+23+21+21+22+21+21+19+18+21
“µ” = “µ” =
n 13

285
“µ” = “µ” = 21,9
13

Mediana Me : es el valor que ocupa el centro de todos los datos


una vez ordenados, entonces lo 1ro que debemos hacer es
ordenar los datos.
Datos originales: 18;20;21;18;23;21;21;22;21;21;19;18;21
Datos ordenados: 18;18;18;19;20;21;21;21;21;21;21;22;23.
Si observas estan los mismos 13 datos.

Una vez ordenados los datos x , se pueden desarrollar de dos formas


En caso en que la cantidad de datos x sean En caso en que la cantidad de x
impares procedemos a buscar el datos que sean pares procedemos a buscar
se ubique en el centro de los mismos. los dos datos que se ubian en el
centro de los mismos, y calcular el
promedio de ellos. Usaremos otro
ejemplo para explicar este:
Edades de 8 personas:

18;18;18;19;20;21;21;21;21;21;21;22;23. 13,13,13,14,15,15,16,16
Si ubicamos al del centro, entonces Me=21 Si ubicamos los dos x centrales
años son: 14;15; a estos dos datos le
cálculamos el promedio:
14 + 15
µ= => µ = 14,5 años
2

37
Moda, Mo: es el o los valores que con más frecuencias se repite
en la lista de datos:
Datos ordenados: 18;18;18;19;20;21;21;21;21;21;21;22;23 en estos
datos el valor que más (5 veces), se repite es el 21 por lo ese es el
valor modal: Mo=21 años.
Procedimiento para el cálculo de medidas de tendencia central
de datos agrupados.
Para calcular estas medidas con datos agrupados primero
construimos una tabla; la siguiente tabla corresponde a la edad
de 20 personas que viven en un sector: i es intervalos de clases; µi
es el promedio de la clase; f es la frecuencia relativa; fa es la
frecuencia relativa acumulada.
Edades (i) µi f fa

13 - 15 14 4 4

15 - 17 16 9 13

17 19 18 3 16

19 21 20 3 19

21 23 22 1 20

Media Aritmética o promedio : para calcular , en datos


agrupados debemos aplicar la siguiente ecuación:
∑ µi ∗ f
µ=
n
A continuación, procedemos a construir la casilla µi ∗ f en la tabla,
le aclaro que lo que debemos hacer es multiplicar µi por f,
quedando asi;

Edades (i) µi F fa µi ∗ f Aplicamos la


ecuación
13 - 15 14 4 4 56 ∑ µ𝑖 ∗ f
µ=
15 - 17 16 9 13 144 𝑛

336
17 19 18 3 16 54 µ= => µ
20
19 21 20 3 19 60 = 16, 8 𝑎ñ𝑜𝑠
la Media Aritmética
21 23 22 1 20 22 o promedio es 16,8
suma 20 336 años

38
Mediana Me : para calcular la Me, aplicaremos la siguiente
ecuación:

Si el número de datos es par: Si el número de datos es


impar:

n n+1
Me = Li + 2 − fa − 1 ∗ i 2 − fa − 1
f Me = Li +
f
∗i

Explicación de la nomenclatura de la ecuación:


Me; Mediana
Li; Limite inferior de la clase con la que vamos a trabajar
n; Cantidad de Datos
fa-1; es la frecuenia acumulada del intervalo anterior a la clase
en la que estamos ubicados
f; frecuencia relativa de la clase
i; Amplitud del Intervalo i=Ls-Li

Ahora bien: la ecuacion que vamos a seleccionar dependera


logicamente de la cantidad n de datos que tengamos agrupados
en la tabla, como en nuestro caso son 20, y este es un número par,
trabajaremos con la siguiente ecuación:
n − fa − 1
Me = Li + 2 ∗i
f
Otro detalle muy importante que debemos tomar en cuenta es
con cual clase o intervalo vamos a trabajar: esto lo sabremos lo
sabremos aplicando: n/2, como nuestro tabla tiene 20 valores y
este es par, por eso utilizamos esta pequeña y sencilla ecuancio,
entonces:
n/2 => 20/2 = 10. Este valor lo debemos ubicar en la tabla, entre
las frecuencias, si el mismo no se encuentra ubicamos a la
frecuencia inmediatamente superior, en nuestro ejemplo sera 13.

39
Edades (i) µi f fa µi ∗ f

13 15 14 4 4 56
clase con la que
15 17 16 9 13 144 trabajaremos
17 19 18 3 16 54

19 21 20 3 19 60

21 23 22 1 20 22

Suma 20 336

Ahora bien apliquemos la formula pana calcular la Mediana, Me,


que en nuestro caso es:

n − fa−1 20 − 4
2 2
Me = Li + ∗i Me = 15 + ∗ 2)
f 9
6
Me = 15 + ∗2
9
Me = 15 + 0,67 ∗ 2

Me = 15 + 1,33

Me = 16,33 años

Como podemos notar el valor resultante de Me=16.33 años, es un


valor entre 15-17, que es el intervalo seleccionado, ojo de no ser
así quiere decir que existe un erros en el procedimiento.

Moda, Mo: para calcular la moda, debemos recordar que la Mo,


es el dato con mayor repitencia entre las frecuencias, para
nuestro caso es 13, por lo cual con esa clase trabajaremos, ojo no
siempre se trabaja con la misma clase que con Me.:

40
Edades (i) µi f fa µi ∗ f
13 15 14 4 4 56
15 17 16 9 13 144 clase con la que
17 19 18 3 16 54 trabajaremos
19 21 20 3 19 60
21 23 22 1 20 22
suma 20 336

La ecuacion a utilizar es la siguiente, para datos agrupados:

f− f−1
Mo = Li + ∗i
f− f−1 + f− f+1
Explicación de la nomenclatura de la ecuación:
Mo; Moda
Li; Limite inferior de la clase con la que vamos a trabajar
f; frecuencia relativa de la clase
f-1; es la frecuenia absoluta del intervalo anterior a la clase
en la que estamos ubicados.
F+1; es la frecuenia absoluta del intervalo posterior a la
clase en la que estamos ubicados
i; Amplitud del Intervalo i=Ls-Li

Apliquemos entonces la ecuación:


f− f−1
Mo = Li + ∗i
f− f−1 +f− f+1

9− 4
Mo = 15 + ∗2
9− 4 +9− 3

5
Mo = 15 + ∗2
5+6

Mo = 15 + 0,45 ∗ 2

Mo = 15 + 0,90

Mo = 15,90años

41
Como podemos notar el valor resultante de Mo=15.99 años, es un
valor entre 15-17, que es el intervalo seleccionado, ojo de no ser
así quiere decir que existe un erros en el procedimiento.
En resumen: los valores obtenidos son:
µ = 16, 8 años; la Media Aritmética o promedio es 16,8 años.
Me=16,33 años; la Mediana es 16,33 años.
Mo=15.99 años; la Moda es 15,99 años.
Medidas de posición de datos no agrupados y agrupados
Las medidas de posición se llaman en general cuantiles y se
pueden clasificar en tres grandes grupos: Cuartiles, deciles,
percentiles.
Las medidas de posición como los cuartiles, deciles y percentiles
dividen a una distribución ordenada en partes iguales.
Cuartiles
Según Salazar y Castillo (2018):
Los cuartiles son los tres valores de la variable que dividen a
un conjunto de datos ordenados en cuatro partes iguales. Q1,
Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y
al 75% de los datos. Cabe destacar que Q2 coincide con
la mediana.
Deciles
Según Salazar y Castillo (2018):
Los deciles son los nueve valores que dividen la serie
de datos en diez partes iguales. Los deciles dan los valores
correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.
Percentiles
Según Salazar y Castillo (2018):
Los percentiles son los 99 valores que dividen la serie
de datos en 100 partes iguales. Los percentiles dan los valores
correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide
con la mediana.
Procedimiento para el cálculo de medidas de posición de datos
no agrupados.
Cuartiles
Inicialmente luego de tomar una serie de datos tenemos:
supongamos que solicitamos la edad de 11 jóvenes de una
comunidad y los resultados son:

42
15; 17; 16; 16; 15; 17; 15; 18; 14; 16; 15. Una vez obtenidos los datos
los ordenamos de menos a mayor.
14 15 15 15 15 16 16 16 17 17 18

Si el número de datos es par: Si el número de datos es


impar:
k∗n k∗ n+1
Qk = Qk =
4 4
Explicación de la nomenclatura de la ecuación:
Qk; Quartil en la posición k.
k; es la posición puede ser 1; 2; 3.
n; Cantidad de Datos
4; valor constante porque trabajamos con cuartiles.

Calculemos en el ejercicio propuesto los 3 cuartiles. Como la


cantidad de datos es impar (11);
k∗ n+1
Para Q1; Qk = 4

1∗ 11+1 12
Q1 = Q1 = Q1=3 quiere decir que el 1er cuartil está
4 4
en la 3ra posición.

k∗ n+1
Para Q2; Qk = 4

2∗ 11+1 24
Q2 = Q2 = Q2=6 quiere decir que el 2do cuartil está
4 4
en la 6ta posición.

k∗ n+1
Para Q3; Qk = 4

3∗ 11+1 36
Q3 = Q3 = Q3=9 quiere decir que el 3er cuartil está
4 4
en la 9na posición.
Quedando así:
14 15 15 15 15 16 16 16 17 17 18
Q1 Q2 Q3

43
Deciles
Inicialmente trabajaremos con la misma tabla de datos anteriores:
supongamos que solicitamos la nota alcanzada por 30
estudiantes en Estadística Básica y los resultados son (escala al
100):

41 85 95 62 42 75 84 41 51 24
75 84 41 43 86 85 74 42 84 62
42 95 84 75 62 84 95 84 51 24
Una vez obtenidos los datos los ordenamos de menos a mayor,
quedando:
24 24 41 41 41 42 42 42 43 51
51 62 62 62 74 75 75 75 84 84
84 84 84 84 85 85 86 95 95 95
La ecuación a aplicar es la siguiente:

k∗n
Dk =
10
Explicación de la nomenclatura de la ecuación:
Dk; Decil en la posición k.
k; es la posición puede ser 1; 2; 3;4;5;6;7;8;9.
n; Cantidad de Datos
10; valor constante porque trabajamos con deciles.

Calculemos en el ejercicio propuesto 3 deciles.


k∗n
Para D3; Dk = 10
3∗30 90
D3 = D3 = 10 D3=9 quiere decir que el 3er decil está en
10
la posición 9na. Y corresponde al valor 43.

k∗n
Para D5; Dk = 10
5∗30 150
D5 = D5 = D5=15 quiere decir que el 5to decil está
10 10
en la posición 15ava. Y corresponde al valor 74.
k∗n
Para D8; Dk =
10
8∗30 240
D8 = D8 = D8=24 quiere decir que el 8vo decil está
10 10

44
en la posición 24ava. Y corresponde al valor 84

Quedando así:

24 24 41 41 41 42 42 42 43 51

D3

51 62 62 62 74 75 75 75 84 84

D5

84 84 84 84 85 85 86 95 95 95

D8

Percentiles
Inicialmente trabajaremos con la misma tabla de datos anteriores:
supongamos que solicitamos la nota alcanzada por 30
estudiantes en Estadística Básica y los resultados son (escala al
100):

41 85 95 62 42 75 84 41 51 24

75 84 41 43 86 85 74 42 84 62

42 95 84 75 62 84 95 84 51 24
Una vez obtenidos los datos los ordenamos de menos a mayor,
quedando:

24 24 41 41 41 42 42 42 43 51

51 62 62 62 74 75 75 75 84 84

84 84 84 84 85 85 86 95 95 95

45
La ecuación a aplicar es la siguiente:

k∗n
Pk =
100

Explicación de la nomenclatura de la ecuación:


Pk; Percentil en la posición k.
k; es la posición puede ser 1; 2; 3;4;5;6;7;8;9 hasta
99.
n; Cantidad de Datos
100; valor constante porque trabajamos con
deciles.

Calculemos en el ejercicio propuesto 3 percentiles.


k∗n
Para P21; Pk = 100
21∗30 630
P21 = P21 = 100 P21=6,3 quiere decir que el 21avo
100
percentil esta entre la 6ta y 7ma posición ya que el valor 6,3 no es
exacto. Y corresponden a los valores 42 y 42, osea el valor del
21avo percentil es 42.

k∗n
Para P55; Pk = 100
55∗30 1650
P55 = P55 = P55=16,5 quiere decir que el
100 100
55avo percentil esta entre la 16ta y 17ma posición ya que el valor
16,5 no es exacto. Y corresponden a los valores 75 y 75, osea el
valor del 55avo percentil es 75.

k∗n
Para P89; Pk = 100
89∗30 2670
P89 = P89 = P89=26,7 quiere decir que el
100 100
89avo percentil esta entre la 26ma y 27ma posición ya que el valor
26,7 no es exacto. Y corresponden a los valores 85 y 86, osea el
valor del 89avo percentil es un valor entre 85 y 86, por lo cual
redondeamos el valor 26,7 a 27 y podemos decir que el percentil

46
89avo está en la posición 27 y corresponde al valor 86.

Quedando así:
24 24 41 41 41 42 42 42 43 51
P21
51 62 62 62 74 75 75 75 84 84
P55
84 84 84 84 85 85 86 95 95 95
P89

3.1.2.5 Procedimiento para el cálculo de medidas de posición


de datos agrupados.
Cuartiles: para calcular las medidas de posición partiremos de un
ejemplo práctico, a continuación: se evalúan a 100 estudiantes y
se colecta la cantidad de preguntas correctas de cada uno y
obtenemos la siguiente tabla:

Resp. F Fa

0-10 5 5

10-20 9 14

20-30 25 39

30-40 32 71

40-50 21 92

50-60 8 100

Total 100

Para calcular los Cuartiles en datos agrupados procedemos a


aplicar la siguiente ecuación:

47
k∗n
− fa−1
Qk = Li + i ∗ 4
))
fa+1 − fa−1

Explicación de la nomenclatura de la ecuación:


Qk; Quartil en la posición k.
Li; Limite inferior de la clase con la que
trabajaremos.
i; es el intervalo de la clase.
k; es la posición puede ser 1; 2; 3.
n; Cantidad de Datos
fa-1; es la frecuencia acumulada anterior a la
clase con la que trabajaremos.
fa+1; es la frecuencia acumulada posterior a la
clase con la que trabajaremos.

Con esta información aplicaremos la ecuación a los datos:


Resp. F Fa Calcularemos el cuartil
3; el mismo
0-10 5 5 procedimiento será
utilizado para el
10-20 9 14 cuartil 1 y 2.
Antes de aplicar la
20-30 25 39 ecuación debemos
saber con que clase
30-40 32 71 vamos a trabajar y
75, posición
de Q3. pare esto se aplica la
40-50 21 92 ecuación de posición,
∗𝑛
entonces:
50-60 8 100 4

∗𝑛
Total 100 𝑄3 = 𝑄3 =
4
3∗100
𝑄3 = 75
4

k∗n
− fa−1 75− 71
4
Qk = Li + i ∗ Q3 = 40 + 10 ∗
fa+1 − fa−1 92 − 71

4
Q3 = 40 + 10 ∗ (
21
Q3 = 40 + 10 ∗ 0,19 Q3 = 40 + 1,9 Q3 = 41,9

Finalmente, el 3er cuartil es 41,9.

48
Deciles
Con el mismo ejemplo anterior procederemos a explicar cómo se
calculan los deciles en datos agrupados, procedemos a aplicar la
siguiente ecuación:

k∗n
− fa−1
Dk = Li + i ∗ 10
))
fa+1 − fa−1

Explicación de la nomenclatura de la ecuación:


Dk; Quartil en la posición k.
Li; Limite inferior de la clase con la que
trabajaremos.
i; es el intervalo de la clase.
k; es la posición puede ser 1; 2; 3 9
n; Cantidad de Datos
fa-1; es la frecuencia acumulada anterior a la
clase con la que trabajaremos.
fa+1; es la frecuencia acumulada posterior a la
clase con la que trabajaremos.

Con esta información aplicaremos la ecuación a los datos:

Calcularemos el decil 2; el
Resp. F fa mismo procedimiento será
0-10 5 5 utilizado para todos los
deciles.
10-20 9 14 Antes de aplicar la ecuación
20, posición
20-30 25 39 de D2. debemos saber con que clase
vamos a trabajar y pare esto
30-40 32 71
se aplica la ecuación de
40-50 21 92 ∗𝑛
posición, 10 entonces:
50-60 8 100 𝐷2 =
∗𝑛
10
Total 100 𝐷2 =
2 ∗ 100
10
k∗n
− fa−1 𝐷2 = 2014
20−
10
Dk = Li + i ∗ D2 = 20 + 10 ∗
fa+1 − fa−1 39 − 14
6
D2 = 20 + 10 ∗ 25
D2 = 20 + 10 ∗ 0,24 D2 = 20 + 2,4 D2 = 22,4
Finalmente el 2do Decil es 22,4.

49
Percentiles
Con el mismo ejemplo anterior procederemos a explicar cómo se
calculan los percentiles en datos agrupados, procedemos a
aplicar la siguiente ecuación:

𝐤∗𝐧
− 𝐟𝐚−𝟏
𝐏𝐤 = 𝐋𝐢 + 𝐢 ∗ 𝟏𝟎𝟎
))
𝐟𝐚+𝟏 − 𝐟𝐚−𝟏

Explicación de la nomenclatura de la ecuación:


Pk; Percentil en la posición k.
Li; Limite inferior de la clase con la que
trabajaremos.
i; es el intervalo de la clase.
k; es la posición puede ser 1; 2; 3 9
n; Cantidad de Datos
fa-1; es la frecuencia acumulada anterior a la
clase con la que trabajaremos.
fa+1; es la frecuencia acumulada posterior a la
clase con la que trabajaremos.

Con esta información aplicaremos la ecuación a los datos:


Resp. F Fa
Calcularemos el percentil 97; el mismo
procedimiento será utilizado para todos los
0-10 5 5 percentiles.
Antes de aplicar la ecuación debemos saber
10-20 9 14 con que clase vamos a trabajar y pare esto se
∗𝑛
aplica la ecuación de posición, 100 entonces:
20-30 25 39 𝑃97 =
∗𝑛
100
𝑃97 =
97∗100
100
𝑃97 = 97

30-40 32 71

40-50 21 92
97, posición de P97.
50-60 8 100

Total 100

50
k∗n
− fa−1 97− 92
100
Pk = Li + i ∗ P97 = 50 + 10 ∗
fa+1 − fa−1 100 − 92
5
P97 = 50 + 10 ∗ P97 = 50 + 10 ∗ 0,625
8
P97 = 50 + 6,25 P97 = 56,25
Finalmente, el Percentil 97 es 56,25.
Medidas de dispersión de datos agrupados
Varianza
Según Romero L. (2018).
La varianza de una muestra se calcula casi en la misma forma
que la desviación media, con dos pequeñas diferencias: 1) las
desviaciones se elevan al cuadrado antes de ser sumadas y, 2) se
obtiene el promedio, utilizando n -1 en lugar de n. La varianza
muestral se puede calcular mediante la fórmula siguiente:
∑ x−µ 2
σ2 = ∗f
n
Desviación estándar
Según Romero L. (2018).
El desvío estándar es simplemente la raíz cuadrada positiva de la
varianza. De este modo si la varianza es 81, la desviación estándar
es 9. Para obtener la desviación estándar se puede utilizar la
siguiente fórmula:

∑ x−µ 2 ∗f
σ=
n

En el mismo sentido Romero L. (2018).


El desvío estándar es una de las medidas que más se utiliza y
desempeña un papel muy importante en la estadística. Es
importante observar que las unidades de la desviación estándar
son las mismas que las de la media. Por ejemplo, si la media está
en unidades monetarias, la desviación estándar también lo
estará. Si la media es en metros, lo mismo ocurrirá con la
desviación estándar, la varianza se expresa en unidades al
cuadrado.
Coeficiente de desviación
Romero L. (2018).
En estadística, cuando se desea hacer referencia a la relación
entre el tamaño de la media y la variabilidad de la variable, se

51
utiliza el coeficiente de variación (suele representarse por las siglas
"C.V").
Su fórmula expresa la desviación estándar como porcentaje de la
media aritmética, mostrando una mejor interpretación porcentual
del grado de variabilidad que la desviación típica o estándar. Por
otro lado presenta problemas ya que a diferencia de
la desviación típica este coeficiente es variable ante cambios de
origen. Por ello es importante que todos los valores sean positivos
y su media dé, por tanto, un valor positivo. A mayor valor del
coeficiente de variación mayor heterogeneidad de los valores de
la variable; y a menor C.V., mayor homogeneidad en los valores
de la variable. Es decir, si el C.V es menor o igual al 20%, significa
que el promedio es representativo del conjunto de datos, por
ende el conjunto de datos es "Homogéneo". Por el contrario, si el
C.V supera al 20%, el promedio no será representativo del
conjunto de datos por lo que resultará "Heterogéneo". Se calcula:
σ
Cv = ∗ 100
µ

Procedimiento para el cálculo de medidas de dispersión de datos


agrupados.
A continuación desarrollaremos un ejercicio donde pretendemos
explicar las medidas de dispersión con datos agrupados; para
esto vamos a suponer que realizamos una recolección de
información concerniente a la edad de 60 personas que habitan
en una comunidad, obteniendo el siguiente cuadro.

Edad F A esta tabla lo primero que debemos hacer es


calcular los promedios de cada intervalo de clase,
10 - 15 5 para esto aplicamos la ecuación 𝑥 =
𝑙𝑠+𝑙𝑖
, esto lo
2
15 - 20 9 aplicamos a cada clase, ejemplo:
15+10
20 - 25 12 1era clase 𝑥 = 2 𝑥 = 12,5
20+15
25 - 30 15 2da clase 𝑥 = 2
𝑥 = 17,5

30 - 35 11 25+20
3ra clase 𝑥 = 2 𝑥 = 22,5
35 - 40 8 sucesivamente hasta llegar a la última clase.
Quedando el cuadro como sigue:
Suma 60

52
Ahora bien una vez obtenido
x, que es el promedio de
Edad F X clase, vamos ahora a
calcular la varianza, 𝛔𝟐 .
10 - 15 5 12,5 Para esto aplicaremos la
siguiente ecuación:
∑ 𝒙−µ 𝟐
15 - 20 9 17,5 𝛔𝟐 = ∗𝒇
𝒏

20 - 25 12 22,5 Como podemos observar


uno de los datos requeridos
25 - 30 15 27,5 es µ que correspondetos,
para calcular este promedio
30 - 35 11 32,5 usaremos la siguiente
ecuación:
35 - 40 8 37,5 ∑𝒙∗𝒇
µ=
𝒏
Suma 60

Como debemos multiplicar (x *


f), en cada intervalo y luego
sumarlo para después dividirlo
Edad F X x*f
entre n, lo haremos
directamente en la tabla;
10 - 15 5 12,5 62,5 quedando como se presenta a
continuación:

15 - 20 9 17,5 157,5
Lo anterior lo realizamos con
la única intención de
20 - 25 12 22,5 270 calcular el promedio µ or lo
cual ya podemos hacer uso
25 - 30 15 27,5 412,5 de la ecuación:
∑𝒙 ∗ 𝒇
µ=
𝒏
30 - 35 11 32,5 357,5 𝟏𝟓𝟔𝟎
µ=
𝟔𝟎
35 - 40 8 37,5 300 µ = 𝟐𝟔
finalmente el promedio es
Suma 60 1560 µ = 26

53
A su vez podemos observar que para hacer uso de la ecuación
de la varianza

∑ x−µ 2
σ2 =
∗f
n
Tambien debemos conocer dos datos más como son:
x−µ 2 x−µ 2∗f
Para tambien la calcularesmos dentro de la tabla que venimos
construyendo, como sigue:

Edad f x x*f (x-µ)2 (x-µ)2 *f Cálculemos el 1ro de cada


columna:
10 - 15 5 12,5 62,5 182,25 911,25
(x-µ)2 nos queda (12,5-26)2
15 - 20 9 17,5 157,5 =182,25

20 - 25 12 22,5 270
(x-µ)2 *f el resultado anterior lo
25 - 30 15 27,5 412,5 multiplicamos por la
frecuencia f :
30 - 35 11 32,5 357,5

35 - 40 8 37,5 300 (x -µ)2 *f => 182,25 * 5 = 911,25

Suma 60 1560 Debes seguir hasta llenar la


µ = 26 tabla y obtendras como la
que sigue

Edad F X x*f (x-µ)2 (x-µ)2 *f


10 - 15 5 12,5 62,5 182,25 911,25
15 - 20 9 17,5 157,5 72,25 650,25
20 - 25 12 22,5 270 12,25 147
25 - 30 15 27,5 412,5 2,25 33,75
30 - 35 11 32,5 357,5 42,25 464,75
35 - 40 8 37,5 300 132,25 1058
Suma 60 1560 3265
µ = 26
Una vez finalizada toda la tabla ahora si podremos calcular la
varianza y otras medidas:
2
∑ x−µ 2
σ = ∗f
n
3265
σ2 =
60
σ = 54,416 años
2 2

54
Una vez calculada la varianza procedemos a calcular la
desviación estandar, que la raiz cuadrada de la varianza:
∑ x−µ 2 ∗f
σ=
n

σ= 54,416
σ = 7,37 años

finalmente el Coeficiente de variación:


σ
Cv = ∗ 100
µ

7,37
Cv = ∗ 100
26
lo multiplicamos por 100 para que nos de en terminos de
porcentaje:
Cv = 28%

La Distribución Normal o Campana de Gaus.


El siguiente es un material extraido de definicion.de. El concepto
de campana procede del latín tardío camp na, a su vez
vinculado a la región italiana de Campania. Allí se emplearon por
primera vez las campanas, que son instrumentos de metal con
forma de copa invertida que se golpean para que emitan un
sonido. Los objetos con forma similar a estos instrumentos también
reciben el nombre campana.
Gauss, por su parte, es el apellido de un
físico y matemático Carl Friedrich Gauss
que nació en 1777 en Brunswick y murió
en 1855 en Gotinga. Sus aportes
científicos han marcado el desarrollo de
las matemáticas.
La noción de campana de Gauss alude
a la representación gráfica de una distribución estadística
vinculada a una variable. Dicha representación tiene la forma de
una campana.
Otro de los conceptos que aparece en el contexto de la
campana de Gauss es la variable continua. Para explicarlo es

55
necesario comenzar definiendo variable discreta, que es aquélla
que no acepta un valor «intermedio» entre los expuestos en un
conjunto dado, sino solamente los que se observan en él; por
ejemplo, si deseamos contar el número de personas que hay en
una habitación, el resultado siempre será entero (como ser, 3 o 4,
pero nunca 3.2).

La noción de variable continua, por otro lado, sí acepta estos


valores, y por eso su aplicación es muy diferente. Por ejemplo, la
medición de la estatura de un ser humano arroja una variable de
este tipo, y la precisión del resultado depende siempre del
instrumento utilizado, razón por la cual debemos contemplar un
cierto margen de error.
En la campana de Gauss se puede reconocer una zona media
(cóncava y con el valor medio de la función en su centro) y dos
extremos (convexos y con tendencia a acercarse al eje X). Esta
distribución evidencia cómo se comportan los valores de variables
cuyos cambios obedecen a fenómenos aleatorios. Los valores
más comunes aparecen en el centro de la campana y los menos
frecuentes, en los extremos.
Con la campana de Gauss se puede analizar, por ejemplo, el
ingreso promedio de la población económicamente activa de
una región X. Si bien hay personas que en dicho territorio
ganan 10 dólares por mes y otras que reciben más de 1 000 000,
la mayoría de los individuos obtienen entre 5 000 y 10 000 dólares.
Esos valores se concentrarán en el centro de la campana de
Gauss.

Existe una tabla para buscar los valores de probabilidad en Z es la


siguiente:

56
Fuente:ipepgranada.es

57
Característica de la curva de Distribución Normal

−𝜎 µ +𝜎

µ
Promedio o media = µ; La desviación estándar = σ
La representación de los datos es simétrica a ambos lados de la
media, es decir la misma medida que tiene de ∞ a 0 (izquierdo),
es lo mismo de 0 a +∞ (derecho).
Los valores de las mediciones tienden a agruparse alrededor de
un punto central, la media
Las desviaciones estándares quedan situadas a igual distancia
unas de otras
La proporción de mediciones situada entre la media y las
desviaciones es una constante en la que:
La media ± 1 * desviación estándar = cubre el 68,3% de los
casos
La media ± 2 * desviación estándar = cubre el 95,5% de los
casos
La media ± 3 * desviación estándar = cubre el 99,7% de los
casos
Podemos analizar el comportamiento de los procesos gráficos y
determinar su efectividad tomando como base su grado de
aproximación a la curva de distribución normal a partir de los
datos generados y la creación de histogramas que permitan la
comparación con curva de distribución normal.
Toda el área bajo la curva de la campana corresponde a 1;
quiere decir por simetría que del centro a la izquierda es 0,5 y del
centro a la derecha es también de 0,5.
Procedimiento para el desarrollo de la Campana de Gauss.
A continuación, como ha sido norma en el desarrollo del libro,
presentaremos un ejercicio para el desarrollo de una distribución
normal o campana de gauss.
Ejercicio1: el coeficiente intelectual promedio de los ecuatorianos

58
es 90, con una desviación estándar de 12, entonces si se elige un
ecuatoriano al azar ¿cuál es la probabilidad de que tenga un
coeficiente intelectual MENOR a 65?. Tomemos en cuenta que
me mandan a buscar el área bajo la curva y está a la izquierda
ya que 65 en menor que 90 (media)
Inicialmente debemos tomar en cuenta que los valores para
realizar la curva de distribución normal o campana de gauss son:
Promedio o media = µ = 90;
La desviación estándar = σ = 12;
La probabilidad (P) en X, en este caso menor a 65 nos queda
P(X<=65);
Z= es el valor a buscar
Antes de aplicar la ecuación graficaremos el razonamiento lógico
de la campana de Gauss:

𝑙𝑎 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑

µ − 2𝜎 µ − 𝜎 µ = 90 µ+𝜎 x
𝑥 = 65 66 78 102

La ecuación a utilizar será:


X−µ
Z=
σ
Z el 2do decimal en la parte superior:
Entero
Y
1er
Dec.

65−90 −25
Z= Z= => Z = −2.08
12 12

El valor es negativo porque esta a la izquierda de eje de simetría.


Buscamos este valor en la tabla Z-, recordando que el entero y

59
1er decimal a la Izquierda y el 2do decimal en la parte superior,
también debes tomar en cuenta que el valor encontrado
corresponde al área bajo la curva desde infinito hasta Z.:

Z = −2.08; Buscamos -2,0 a la izquierda y 08 en la parte superior:


Obteniendo el siguiente resultado:0,0188 si este valor lo
multiplicamos x 100
No queda 18,8% su interpretación es que hay una probabilidad
del 18% de que el coeficiente intelectual de este ciudadano
ecuatoriano sea menor o igual a 65.

𝑙𝑎 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
Es 0,0188 = 18,8%

µ − 2𝜎 µ−𝜎 µ = 90 µ+𝜎 x
66 78 102
𝑍 = −2,08

60
Ejercicio2: el coeficiente intelectual promedio de los ecuatorianos
es 90, con una desviación estándar de 12, entonces si se elige un
ecuatoriano al azar ¿cuál es la probabilidad de que tenga un
coeficiente intelectual MAYOR a 80?. tomemos en cuenta que
me mandan a buscar el área bajo la curva y está a la izquierda
ya que 65 en menor que 90 (media)
Inicialmente debemos tomar en cuenta que los valores para
realizar la curva de distribución normal o campana de gauss son:
Promedio o media = µ = 90;
La desviación estándar = σ = 12;
La probabilidad (P) en X, en este caso mayor a 90 nos queda:
P(X>=80) = P(Z>=80);
Z= es el valor a buscar
Antes de aplicar la ecuación graficaremos el razonamiento lógico
de la campana de Gauss:

𝑙𝑎 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑

µ − 2𝜎 µ − 𝜎 µ = 90 µ+𝜎 x
66 78 𝑥 = 80 102

La ecuación a utilizar será:


X−µ
Z=
σ

80−90 −10
Z= Z= => Z = −0.83
12 12
El valor es negativo porque x=80 está a la izquierda de eje de
simetría.
Es de hacer notar que el resultado es desde la Izquierda hasta x=80
pero nos piden es los mayores a 80, ósea las probabilidades
mayores (derecha) que 80 (zona sombreada).
Buscamos este valor en la tabla Z-, recordando que el entero y 1er
decimal a la Izquierda y el 2do decimal en la parte superior,
también debes tomar en cuenta que el valor encontrado
corresponde al área bajo la curva desde infinito hasta Z.:

61
Z el 2do decimal en la parte superior:
Entero
Y
1er
Dec.

Z = −0.83; Buscamos -0,8 a la izquierda y 03 en la parte superior:


Obteniendo el siguiente resultado:0,2033; sin embargo este valor
representa la zona rayada, y nos interesa es la zona sombreada a
la derecha de 80 ósea mayores o igual a 80, procedemos así:

Anteriormente dijimos que toda la zona bajo la curva equivale a


1, pues bien si a 1 le restamos la zona rayada = -0,83 entonces
conseguimos el valor de la zona sombreada; quedando:

P(X>=80) = P(Z>=80)=1-0,2033 =0,7967


Si este valor lo multiplicamos x 100

62
No queda 79,67% su interpretación es que hay una probabilidad
alta de 79% de que el coeficiente intelectual de este ciudadano
ecuatoriano sea mayor o igual a 80.

𝑙𝑎 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
0,796 = 79%

µ − 2𝜎 µ − 𝜎 µ = 90 µ+𝜎 x
66 78 𝑧 = −0,83 102

63
Glosario de términos
Terminología extraída de la Enciclopedia en línea Wikipedia 2018:
es.wikipedia.org

Censo: censo de población, en estadística descriptiva, el


recuento de elementos de una población;
Ciencia: es un sistema ordenado de conocimientos estructurados
que estudia, investiga e interpreta los fenómenos
naturales, sociales y artificiales. El conocimiento científico se
obtiene mediante observación y experimentación en ámbitos
específicos. Dicho conocimiento es organizado y clasificado
sobre la base de principios explicativos, ya sean de forma teórica
o práctica.
Coeficiente Intelectual: es un estimador de la inteligencia general
resultado de alguno de los test estandarizados diseñados para
este fin. Algunos autores consideran que el cerebro humano es lo
suficientemente complejo como para no poder medir
la inteligencia con un único factor, pero otros consideran que
tiene gran valor predictivo en términos de rendimiento
académico o laboral.
Constante: Una constante matemática, un valor fijo.
Diagrama: es un dibujo geométrico, muy utilizado en ciencia,
en educación y en comunicación; con el que se obtiene
la presentación gráfica de una proposición, de la resolución de
un problema, de las relaciones entre las diferentes partes o
elementos de un conjunto o sistema, o de la regularidad en la
variación de un fenómeno que permite establecer algún tipo
de ley.
El Investigador: es alguien que lleva a cabo, es decir, que lleva
adelante un proyecto orientado a la búsqueda de conocimiento
y al esclarecimiento de hechos y de relaciones.
Encuesta: es un procedimiento dentro de los diseños de una
investigación descriptiva en el que el investigador recopila datos
mediante un cuestionario previamente diseñado, sin modificar el
entorno ni el fenómeno donde se recoge la información ya sea
para entregarlo en forma de tríptico, gráfica o tabla.
Medios Audiovisuales: son aquellos materiales y equipos que
registran, reproducen, difunden mensajes visuales y sonoros con el

64
fin de facilitar conocimientos y, especialmente motivar
aprendizajes y actitudes. También actúan como elementos
contextualizados en los procesos de enseñanza-aprendizaje y, al
mismo tiempo permiten desarrollar una dinámica participativa.
Informe Técnico: es un documento escrito en prosa informativa
(científica, técnica o comercial) con el propósito de comunicar
información del nivel más alto en una organización. Por
consiguiente, refiere hechos obtenidos o verificados por el autor
(reconocimientos, investigaciones, estudios o trabajos). Además,
aporta los datos necesarios para una completa comprensión del
caso, explica los métodos empleados y propone o recomienda la
mejor solución para el hecho tratado.
Investigación científica: es una formulación de pasos a seguir a la
hora de aplicar el método empírico-analítico aparte de la forma
convencional.
La Probabilidad: es una medida de la certidumbre asociada a un
suceso o evento futuro y suele expresarse como un número entre
0 y 1 (o entre 0 % y 100 %).
Métodos gráficos: es el nombre dado a cualquier imagen
generada por una computadora. Originariamente se llamaba así
a los histogramas, pero, por extensión, empezó a llamarse así a
todas las representaciones visuales que el ordenador podía
generar que no fueran texto. Con el tiempo, el término se ha
generalizado, aplicándose a cualquier tipo de imagen de
ordenador.
Métodos numéricos: es la rama de las matemáticas encargada
de diseñar algoritmos para simular aproximaciones de solución a
problemas en análisis matemático. Se distingue del cómputo
simbólico en que no manipula expresiones algebraicas, sino
números.
Observaciones: es la adquisición activa de información a partir
del sentido de la vista. Se trata de una actividad realizada por un
ser vivo (humanos, animales, etc), que detecta y asimila los rasgos
de un elemento utilizando los sentidos como instrumentos
principales. El término también se puede referir a
cualquier datorecogido durante esta actividad.
Preguntas abiertas: aquellas que dan al encuestado la posibilidad
de contestar empleando sus propias palabras. Ejemplo; ¿Qué

65
opinión merece sobre ?
Preguntas Cerradas: que el encuestado solo puede responder en
aquellos parámetros que la pregunta indica como
predeterminados. Ejemplo; coloque una x en la opción
correcta:
Preguntas de opciones múltiples, de selección múltiple o múlti-
opción: es una forma de evaluación por la cual se solicita a los
encuestados o examinados seleccionar una o varias de las
opciones de una lista de respuestas.
Procedimiento: es un conjunto de acciones u operaciones que
tienen que realizarse de la misma forma, para obtener siempre el
mismo resultado bajo las mismas circunstancias.
Técnica: es el conjunto de procedimientos, reglas, normas
o protocolos que tiene como objetivo obtener un resultado
determinado y efectivo, ya sea en el campo de la informática, las
ciencias, el arte, el deporte, la educación o en cualquier otra
actividad.
Visión panorámica: es la que muestra un panorama (del
griego pan, todo, y horama, vista), usualmente paisajístico o
arquitectónico, y que se distingue por el amplio horizonte visual
que cubre. Su elaboración ha ido cambiando a través del tiempo,
desde los paisajes pintados en cuadros, pasando por
la fotografía clásica y la digital, hasta la edición o incluso la
creación completa de imágenes en el computador.

66
Referencia Bibliográficas

Enciclopedia de la estadística en las economías (2017). Estadística


- enciclopedia de economía - economia48.
Www.economia48.com/spa/d/estadística/estadistica.htm
Estadística matemáticas profe alex, (2017).
Https://matematicasprofealex.wordpress.com/category/estadisti
ca/
Estadística - Wikipedia, la enciclopedia libre,
ttps://es.wikipedia.org/wiki/estadística
Graute f. (2017), estadística - universidad complutense de madrid
https://webs.ucm.es/info/astrof/users/jaz/estadistica/libro_gcz201
7.pdf
Khanacademy (2018).
Https://es.khanacademy.org/math/statistics-probability.
Laguna c. (2016). Estadística descriptiva: problemas resueltos
campus virtual ull
https://campusvirtual.ull.es/ocw/pluginfile.php/6104/mod.../pr6-
estdescriptiva.pdf
Matemáticas profe alex, (2017). Publicado el 7 mar. 2017;
https://www.youtube.com/watch?v=xq3thcqqwbc
Romero l. (2018). Estadística para todos - 9788436833263 - romero
lamos, eva ...https://www.marcialpons.es libros
Salazar y castillo (2018). Fundamentos básicos de estadística
repositorio digital. Www.dspace.uce.edu.ec/handle/25000/13720
Spiegel r. (2018). Probabilidad y estadistica.pdf - universidad clea.
Https://clea.edu.mx/.../spiegel%20murray%20%20probabilidad%2
0y%20estadistica....
Spiegel r. (2018). Estadística. Serie schaum- 4ta edición - murray r.
Spiegel.pdf -
ensfepensfep.edu.mx/.../estadística.%20serie%20schaum
%204ta%20edición%20-%20murra...

Graute f. (2017), estadística - universidad complutense de madrid


https://webs.ucm.es/info/astrof/users/jaz/estadistica/libro_gcz201
7.pdf
Laguna c. (2016). Estadística descriptiva: problemas resueltos

67
campus virtual ull
https://campusvirtual.ull.es/ocw/pluginfile.php/6104/mod.../pr6-
estdescriptiva.pdf
Enciclopedia de la estadísticas en las economías (2017).
Estadística - enciclopedia de economía - economia48.
Www.economia48.com/spa/d/estadistica/estadistica.htm
Salazar y castillo (2018). Fundamentos básicos de estadística
repositorio digital. Www.dspace.uce.edu.ec/handle/25000/13720
Khanacademy (2018).
Https://es.khanacademy.org/math/statistics-probability.
Spiegel r. (2018). Estadística. Serie schaum- 4ta edición - murray r.
Spiegel.pdf -
ensfepensfep.edu.mx/.../estadística.%20serie%20schaum
%204ta%20edición%20-%20murra...

Spiegel r. (2018). Probabilidad y estadistica.pdf - universidad clea.


Https://clea.edu.mx/.../spiegel%20murray%20%20probabilidad%2
0y%20estadistica....
Romero l. (2018). Estadística para todos - 9788436833263 - romero
lamos, eva ...https://www.marcialpons.es libros
Estadistica matemáticas profe alex, (2017).
Https://matematicasprofealex.wordpress.com/category/estadisti
ca/
Matemáticas profe alex, (2017). Publicado el 7 mar. 2017;
https://www.youtube.com/watch?v=xq3thcqqwbc
Estadística - wikipedia, la enciclopedia libre,
ttps://es.wikipedia.org/wiki/estadística

68
Raúl Díaz Ocampo

s
Grupo de capacitación e investigación pedagógica

También podría gustarte