Está en la página 1de 52

14/03/2017

Definición de Estadística.

Según la Real Academia de la Lengua Española, el término


estadística es la ciencia que utiliza conjuntos
de datos numéricos para desarrollar u obtener inferencias
basadas en el cálculo de probabilidades.

Otra definición :

Estadística : Es un conjunto de métodos científicos para la


recopilación, representación, condensación y análisis de
los datos extraídos de un sistema en estudio, con el objeto
de poder hacer estimaciones y sacar conclusiones, necesarias
para la toma de decisiones.

El término estadística tiene su raíz en la palabra Estado.

Surge cuando se hace necesario para sus intereses (los del


estado) cuantificar conceptos.

Ej: - N° de hectáreas cultivadas con trigo


- N° de hospitales
- N° de escuelas básicas
- Etc. (generar otros ejemplos).

En la mayoría de los casos esta cuantificación se hará en


función de fines económicos, administrativos, científicos,
militares u otros objetivos.

El estado quiere conocer censo de personas, de


infraestructura, de recursos en general, para poder obtener
conclusiones de esta información y de esta forma desarrollar
una mejor planificación para el futuro, dado que si el estado
conoce los recursos con los que cuenta, como consecuencia de
ello, podrá conocer sus reales necesidades o falencias.
En Chile : A través del Censo se pueden conocer las
características de los habitantes del país, por ejemplo, cómo
crece la cantidad de hombres y mujeres; cuál es el nivel
educativo o su religión; cuántos pertenecen a pueblos
originarios o el número de personas con discapacidad.

Además, permite saber datos de las viviendas y de qué manera


están equipadas.

Los Censos en nuestro país se realizan desde 1813 y han sido


un gran aporte a la historia de nuestro país, ya que los
gobiernos toman decisiones que afectan a todos los chilenos a
partir de los datos que se obtienen en este proceso.
Fuente : INE; 2012

Actualmente la estadística es una ciencia.

No es ya una cuestión solamente reservada al estado.

Podríamos decir que se encuentra en la totalidad del resto de


las ciencias, dado que hoy forma parte del Método Científico.

Para el buen desempeño y aplicación de esta ciencia, por una


parte la estadística proporciona técnicas precisas para
obtener información, (que es la recolección y descripción de
datos, siendo estos los métodos de muestreo) y por otra parte
proporciona métodos para el análisis de esta información,
siendo estos los métodos de análisis.

De ahí el nombre de ESTADÍSTICA DESCRIPTIVA, dado que


consiste en que a partir de una muestra representativa y su
análisis propiamente tal, es posible describir el verdadero
comportamiento o características de la población de la cual
se obtuvo la muestra.
Etapas de un Procesos Estadístico

La base de los procesos estadísticos se fundamenta en


las observaciones de la población, donde este proceso
consiste en el recuento, ordenación y clasificación
de los datos obtenidos a partir de muestras
efectuadas en la población.

Un proceso de investigación a una población debe


contar, necesariamente con las cuatros etapas que se
señalan a continuación.

a.- Obtención de la información.

Esta etapa se cumple cuando se obtiene la información


mediante algún procedimiento de muestreo sobre la
población.

En este punto se estudian los diferentes métodos de


muestreo que existen, los cuales pretenden
fundamentalmente obtener el máximo de información de
una población a un mínimo costo.

Entre los distintos métodos de muestreo existentes se


encuentran los siguientes :

- Muestreo Aleatorio Simple.

- Muestreo Sistemático.

- Muestreo Estratificado.

- Muestreo Bietápico.

- Muestreo por Conglomerado.

- Muestreo Proporcional al Tamaño.

- Muestreo Proporcional a la Predicción.

- Etc.
b.- Organización y Representación de la Información

Esta etapa consiste en organizar los datos


obtenidos de manera tal que sea posible
sacar de ellos la mejor información posible.

Ej. Tabulación y representación gráfica.

Representación Tabular y Gráfica


Estimación de Crecimiento Según IMMA (Dg)
Razón de
Densidad
Mort. 6,11 0,061 (CD)
IMMA Idem.
Año Dg Frec. Ar.Bas. C.D.
2008 17,88 639 16,040 22,1
2009 20,11 600 19,060 20,3
2010 22,35 563 22,092 18,9
2011 24,58 529 25,098 17,7
2012 26,82 496 28,044 16,7
2013 29,05 466 30,901 15,9
2014 31,29 438 33,648 15,3
2015 33,52 411 36,266 14,7
2016 35,76 386 38,741 14,2
2017 37,99 362 41,062 13,8
2018 40,23 340 43,222 13,5
2019 42,46 319 45,215 13,2
2020 44,70 300 47,038 12,9
Razón Real de Mortalidad
Do 1250 Periódo 8 (%)
Df 639 Razón 76,39 6,11
c.- Análisis de datos.

La estadística consiste en someter los datos a un análisis


de manera tal de poder obtener de ellos información
respecto al comportamiento de la población.

Parte del análisis de los resultados consiste en obtener


claro está, los valores de medida que sean representativas
de la muestra y a partir de ella de la población, tal como
las medidas de tendencia central (media, mediana, moda,
media geométrica, media armónica); medidas de dispersión
(rango, desviación media, desviación estándar, varianza,
covarianza) y medidas de posición tal como los cuantiles
(deciles, cuartiles, percentiles), etc.

d.- Generar de conclusiones.

Esto no es otra cosa que la discusión de los resultados y


concluir a partir de ellos.

Para qué sirve la estadística

1. Para la descripción de datos.

Nos entrega herramientas para poder efectuar una adecuada


descripción de los datos generados a partir de una muestra.

2. Para conocer parámetros poblacionales a partir de datos de


muestra.

Mediante la estadística podemos efectuar inferencias respecto


al comportamiento de la población a partir del conocimientos
de los datos de la muestra.

3. Para ver las relaciones entre los datos. (Análisis de


Regresión, Análisis de Correlación, Estudio de las
Covarianzas, entre otros).

Nos permite ver como se relacionan ciertos datos, vale decir,


como el comportamiento de ciertos datos afectan al
comportamiento de otros
Importancia de la Estadística

La estadística ha jugado un papel primordial en el desarrollo


de la sociedad moderna, al proporcionar herramientas
metodológicas generales para analizar la variabilidad,
determinar relaciones entre variables, diseñar en forma
óptima estudios y experimentos y mejorar las predicciones y
toma de decisiones en situaciones de incertidumbre.

Las técnicas estadísticas se aplican de manera amplia en


mercadotecnia, contabilidad, control de calidad,
investigación respecto a procesos productivos, ingeniería de
diseño, ingeniería en prevención de riesgos y en otras
actividades, tales como estudios de consumidores, análisis
de resultados en deportes, administradores de instituciones
y procesos de administración, en la educación; organismos
políticos, médicos y por otras personas que intervienen en
la toma de decisiones.

PAPEL DE LA ESTADÍSTICA EN LA INVESTIGACIÓN CIENTÍFICA

La Estadística es considerada también como un suministro de


un conjunto de herramientas sumamente útiles en la
investigación.

No existe investigación, proceso o trabajo encaminado a


obtener información cuantitativa válida, en la que la
estadística no tenga una participación.

La estadística no puede ser ignorada por ningún investigador,


aún cuando no tenga ocasión de emplear la Estadística
Aplicada en todos sus detalles y ramificaciones de su
investigación.

El papel de la estadística en la investigación es entonces,


funcionar como una herramienta en el diseño de
investigaciones, en el análisis de datos, y en la extracción
de conclusiones a partir de ellos.

ESTADÍSTICA GENERAL - DIVISIÓN DE LA ESTADÍSTICA


La Estadística para su mejor estudio se ha dividido en dos
grandes ramas; a saber :

Estadística Descriptiva y la Estadística Inferencial; dentro


de la Estadística Inferencial, existen, además dos ramas que
son, según la naturaleza de las distribuciones poblaciones
que se están investigando, Estadística Paramétrica y
Estadística no Paramétrica.

Para los efectos del presente curso, nos concentraremos sólo


en la primera categorización, vale decir, Estadística
Descriptiva.

Descriptiva
Estadística
Inferencial Est.Paramétrica
Est.No Paramétrica

A.- Estadística Descriptiva:

Se denomina estadística descriptiva, al conjunto de métodos


estadísticos que se relacionan con el resumen y descripción
de los datos, como tablas, gráficas, y el análisis mediante
algunos cálculos.

B.- Estadística Inferencial :

Se denomina estadística inferencial o inferencia estadística


al conjunto de métodos con los que se hacen la generalización
o la inferencia sobre una población utilizando una muestra.

La inferencia puede contener conclusiones que pueden no ser


ciertas en forma absoluta, por lo que es necesario que
éstas sean dadas con una medida de confiabilidad que es la
probabilidad, ejemplo caso de la moneda, en la cual uno
puede afirmar, a priori, que la mitad de las veces que se
lance saldrá cara y que la otra mitad saldrá sello; este
resultado puede no darse exactamente.

Estas dos partes de la estadística (A y B) no son mutuamente


excluyentes, sino más bien complementarios dado que para
utilizar los métodos de la inferencia estadística,
se requiere conocer los métodos de la estadística
descriptiva.

La Estadística Inferencial analiza una población a


partir de una muestra tomada de la misma.

Individuo

El individuo corresponde a la unidad básica de la población.

Esto quiere decir que una población es un conjunto de


individuos que presentan una característica común.

Ejemplo :

Población : El conjunto de personas que forman parte de


esta casa de estudios.

Individuo : Una persona, ya sea administrativo, profesor o


estudiante.

Población

El concepto de población en estadística va más allá de lo que


comúnmente se conoce como tal.

Una población se precisa como un conjunto finito o infinito


de personas u objetos que presentan características comunes.

Dar Ejemplos:

Destacamos algunas definiciones:

"Una población es un conjunto de todos los elementos que


estamos estudiando, acerca de los cuales intentamos sacar
conclusiones". Levin & Rubin (1996).

"Una población es un conjunto de elementos que presentan


una característica común". Cadenas (1974).
Tamaño de la Población *****

Fin Clase (14/03/2017)

16/03/2017

El tamaño que tiene una población es un factor de suma


importancia en el proceso de investigación estadística, y
este tamaño vienen dado por el número de elementos que
constituyen la población, según el número de elementos la
población puede ser finita o infinita.

Cuando el número de elementos que integra la población es muy


grande, se puede considerar a esta como una población
infinita, por ejemplo; el conjunto de todos los números
positivos.

Una población finita es aquella que está formada por un


limitado número de elementos, por ejemplo; el número de
alumnos de esta casa de estudio.

Cuando la población es muy grande, es obvio que la


observación y/o medición de todos los elementos multiplica la
complejidad, en cuanto al trabajo, tiempo y costos necesarios
para efectuar dicha observación o medición; este
inconveniente queda solucionado cuando en lugar de medir u
observar a toda la población, esto se hace sólo a una muestra
estadística.

Es a menudo imposible o poco práctico observar la totalidad


de los individuos de una población, sobre todos si estos son
muchos.

En lugar de examinar el grupo entero llamado población o


universo, se examina una pequeña parte del grupo denominada
muestra.

Ejemplo 1
Ejemplo 2

Individuo
Ejemplo 3

Trabajadores (Población)
Muestra

Individuo
Muestra:

La muestra es una representación significativa de las


características de una población, se compone de una fracción
de ella y que al estudiarla nos permite obtener conclusiones
válidas que son aplicables a la población de la cual se
obtuvo.

"Se llama muestra a una parte de la población a estudiar que


sirve para representarla". Murria R. Spiegel (1991).

"Una muestra es una colección de algunos elementos de la


población, pero no de todos". Levin & Rubin (1996).

"Una muestra debe ser definida en base de la población


determinada, y las conclusiones que se obtengan de dicha
muestra solo podrán referirse a la población en referencia",
Cadenas (1974).***

Por ejemplo estudiamos los valores sociales de una población


de 5000 habitantes aprox., entendemos que sería de gran
dificultad poder analizar los valores sociales de todos
ellos, por ello, la estadística nos dota de una herramienta
que es la muestra para extraer un conjunto de población que
represente a la globalidad y sobre la muestra realizar el
estudio.

Una muestra representativa contiene las características


relevantes de la población en las mismas proporciones que
están incluidas en tal población.

Los expertos en estadística recogen datos de una muestra,


utilizan esta información para hacer inferencias sobre la
población que está representada por la muestra.

En consecuencia muestra y población son conceptos relativos.

Una población es un todo y una muestra es una fracción o


segmento de ese todo.
Definiciones:

Unidad : Corresponde al objeto que se observa.

Ejemplo : Si observamos a un hormiguero, la unidad será la


hormiga.

Sujeto : Cuando lo que se observa o el objeto que se


observa es una persona.

Ejemplo : Si observamos el comportamiento de los niños en un


jardín infantil, el sujeto será un niño, el cual pasa a ser
la unidad.
Variable : Corresponde a la característica o
información que puede variar de unidad en unidad, vale decir,
es lo que queremos obtener de cada observación a la unidad.

Ejemplo 1 : En un estudio respecto al coeficiente


intelectual de distintos grupos étnicos, el investigador
procede a tomar muestras de estos grupos y en cada muestra,
determina el coeficiente intelectual de cada individuo
(variable), para de este modo, mediante la obtención de
estadígrafos es posible satisfacer su objetivo final.

Ejemplo 2 : En un estudio respecto de la obesidad infantil,


se pretende conocer el Índice de Masa Corporal de los niños,
siendo este índice una relación entre el peso y la estatura;
en este caso la característica que observamos en los niños es
su peso y su estatura, siendo estas las variables que
buscamos obtener en cada sujeto.

Ejemplo 3 : En una fabrica de muebles, se busca evaluar el


grado de seguridad que existe en sus instalaciones para con
sus trabajadores.

Se procede a contabilizar el número de accidentes que se


tiene en el año, haciendo un recuento mensual de los
accidentes ocurridos.
En este caso la variable es Número de Accidentes al Mes.

Ejemplo 4 : En esta casa de estudio se pretende conocer


cuales son las preferencias de los estudiantes, hombres y
mujeres, por las distintas carreras, además se quiso conocer
el color del cabello de cada uno; el administrador señaló que
eso se podía obtener durante el proceso de matrícula desde
donde se obtiene la cantidad de alumnos matriculados en cada
una de ellas y es posible observar el color del cabello.

En este caso las variables son:

a.- Número de alumnos hombres matriculados por carrera.


b.- Número de alumnos mujeres matriculados por carrera.
c.- Color del cabello de cada uno.

Observamos que para cada sujeto existen tres variables,


siendo estas, el género, color del cabello y su preferencia
por la carrera.
Estadígrafos : Corresponden a indicadores o valor
numérico que representa a la muestra en estudio, tal como son
las medidas de tendencia central y las medidas de dispersión.

De la Muestra

Parámetro : Corresponden a indicadores o valor numérico


que representa a la población en estudio, tal como son las
medidas de tendencia central y las medidas de dispersión; por
lo general es muy difícil obtener los parámetros, lo que se
hace es estimarlos a partir de los estadígrafos.

De la Población

Ejemplo : Media Aritmética, Mediana, Moda, Media Armónica,


Media Geométrica, Rango, Desviación Media, Desviación
estándar, Varianza, Coeficiente de Variación, Coeficiente de
Correlación etc.; cuando se obtienen de la o las muestras, se
habla de estadígrafos; pero cuando estos valores estiman el
valor poblacional se dice que están estimando un parámetro.

Propiedades de los Parámetros

a.- Son Objetivos, vale decir se calculan de manera directa,


mediante una fórmula, lo que no da posibilidades a que
existan ambigüedades. (ejemplo . Promedio de Notas de un
aasignatura)

b.- Son Consistentes; esto implica que no desprecia a priori


ninguna observación, lo que significa que este parámetro
representará de mejor forma a la población en la medida de
que la muestra que genera esta estimación sea lo más
consistente o representativa.

c.- Son Interpretable, generalmente los parámetros se


encuentran en las mismas unidades con las que son observadas
las muestras, vale decir, si las muestras se toman en cm, los
parámetros serán igual en cm, lo que hace que sean
interpretables.

d.- Son Estables, vale decir, son poco sensible a las


fluctuaciones de las observaciones, de lo contrario, si
pequeñas variaciones en los datos de la muestra, afectan de
manera significativa al parámetro, se dice que este parámetro
es poco representativo de la población.

Estimador

Los estimadores, que se obtienen de las muestras, son


instrumentos que nos permiten efectuar la inferencia
estadística, vale decir, a partir de ellos estimamos el valor
poblacional, equivalente a dicho estimador.

El estimador obtenido de una muestra, será un mejor estimador


en la medida que este haya sido obtenido de una muestra
representativa, la cual debe contener la totalidad de la
información de la población y en las mismas proporciones.

En estadística un estimador corresponde a un valor obtenido


de la muestra (estadígrafos) utilizado para estimar un
parámetro (valor poblacional).

Ejemplo : Si se desea conocer el peso medio de los alumnos de


esta casa de estudio, se procede a tomar una muestra
representativa y de esta se obtiene el valor medio
(estadígrafo), y con este valor se estima el valor
poblacional (parámetro) que es el peso medio de toda la
población.

En estadística se utiliza la estimación puntual y estimación


por intervalos.

El ejemplo presentado anteriormente, se trata de estimación


puntual, donde a partir de la estimación de un estadífrago,
se estima el valor poblacional o parámetro, se trata de
estimación puntual.

El promedio de las notas de una asignatura corresponde a una


estimación puntual.

Cuando se estima el estadígrafo dentro de un intervalo de


confianza, se dice que se está frente a una estimación por
intervalos.

Intervalo de Confianza para la Media

Media – Error <= Media <= Media + Error

Vale decir, está entre “este valor” y “este otro valor”

Un buen estimador debe tener ciertas características, siendo


las más importante las siguientes:

a.- Estimador Insesgado : El estimador es insesgado cuando la


media de su distribución muestral asociada, coincide con la
esperanza matemática, siendo este el parámetro poblacional.

Estimador Insesgado

Media X(i) === Media Poblacional

b.- De Varianza Mínima : La variabilidad de un estimador


viene determinada por el cuadrado de su desviación estándar;
en el caso de la media tenemos que :
Estimador de Varianza Mínima

Σ (X(i) – X med.)²
Desviación Estándar : S =
Σ f(i)

De lo anterior, observamos que si el valor de (N) crece, la


desviación estándar disminuye, dado que ( N = Σ f(i) ) y la
varianza es el cuadrado de la desviación estándar.

Varianza = S²

Además, un buen estimador debe poseer las mismas


características que posee el parámetro, dado que a este
último lo genera el estimador (a, b, c y d).

Base de Datos : Corresponde a una colección de


observaciones con una o más variables.

Ejemplo : El Directorio telefónico

En este instrumento aparecen tres variables para cada unidad


observada, siendo estas el nombre, la dirección y el número
telefónico.

Clasificación de Variables Según Su Naturaleza

|------------------------- Variables ---------------------|


| |
----------- Cuantitativas ------ ----- ------ Cualitativas -------
| | | |
| | | |
Discretas Continuas Nominales Ordinales
Variables Cuantitativas

Variables cuantitativas son aquellas variables que están


representadas por valores numéricos y corresponden a
atributos de la unidades de donde fueron obtenidas ejemplo de
esto son las unidades de medida (largo, peso, etc.) o
frecuencias (número de ocurrencias).

Tiene sentido realizar operaciones numéricas con estas


variables.

Además distinguimos dentro de las variables cuantitativas las


variables Discretas y Variables Continuas.

Variable Discreta : Corresponde a aquella en la cuál se


puede contar el número posible de valores.

Ejemplo 1 : Número de asistentes en esta sala.

Ejemplo 2 : Número de llamadas que se reciben en el celular


durante el día.

Ejemplo 3 : El número de veces que sale par al lanzar un


dado cinco veces.

Variable Continuas : Corresponde a aquella variable que puede


tomar cualquier valor dentro de un intervalo determinado; hay
que tener en cuenta que entre dos valores siempre va existir
un valor intermedio, lo que genera la característica
fundamental de una variable continua.

Ejemplo 1 : El peso de los niños del Jardín Infantil.

Es necesario señalar que el valor numérico de cada peso de


los niños va a depender del grado de precisión del
instrumento que se esté empleando para obtenerlo;

Así pues sigamos este ejemplo:

Niño (1) Peso : 15.5 Kg


Niño (2) Peso : 17.0 Kg
En la gráfica se observa que entre el peso del niño (1) que
es de 15.5 Kg y el peso del niño (2) que es de 17.0 Km,
existen otros pesos posibles, vale decir, es posible
encontrar niños cuyo peso esté entre estos dos valores ya
observados, vale decir, es posible encontrar un niño que pese
16 Kg, o 16.5 Kg, o 16.8 Kg, etc., lo cual es la
característica fundamental que posee una variable continua.

Ejemplo 2 : La temperatura mínima registrada en el día.

Ejemplo 3 . La altura máxima que alcanza la jirafa macho.

Variables Cualitativas

Variables cualitativas son aquellas variables que clasifican


las unidades en categorías.

Las categorías pueden tener un orden natural (Nominales) u


(Ordinales).

Las variables cualitativas también se llaman variables


categóricas.

Este tipo de variables aporta más bien características


propias que permiten identificar al individuo o caso que se
está observando.

Con estas variables podemos contar número de casos, comparar


entre categorías, pero no podemos realizar operaciones
numéricas.

Variables Nominales : Son aquellas que se asocian a nombres,


tal como marcas (de ropa, de auto, de celulares), género,
religión, profesión, etc.
En esta variables no existe el concepto de calidad entre
ellas, por lo que no es posible categorizarlas, vale decir,
no es posible decir cual de ellas es mayor y o cual es menor.

Ejemplo : Variable Género

Esta variable puede tomar valores de Hombre o de Mujer, no


incluyendo el concepto de calidad entre ellos, sólo señala
que ser hombre o ser mujer significa que se pertenece a una
nominación diferente, lo que implica que ser hombre no es
mejor que ser mujer y viceversa, sólo se es distinto.

Ejemplo 1 : Para un estudio de mercado se emplea un


estacionamiento de automóviles central para tener un
registro de los autos que ingresan según su marca.

Ejemplo 2 : Una fabrica textil necesita conocer cual es la


tendencia en colores de blusas para señorita, luego
implementan un muestreo en un lugar céntrico de la ciudad y
observan cuales son los colores más usados.

Variables Ordinales : Corresponden a aquellas que se asocian


a un orden jerárquico, como es el caso del nivel de ingreso
promedio de varios grupos sociales, el nivel cultural de un
grupo, para los países del tercer mundo es importante conocer
el nivel nutricional de las poblaciones de niños, etc.

Ejemplo 3 : Una ciudad necesita asignar a los distintos


barrios una clasificación por categoría, según el nivel de
peligrosidad, de manera de poder asignar de forma más
racional sus recursos policiales.

Ejemplo 4 : En una industria es necesario conocer el nivel


de peligrosidad que existe en los distintos patios de
trabajo, para de este modo, asignar los recursos (medidas de
seguridad), según su categoría de peligrosidad que posean
dichas áreas.

Ejemplo 5 : En una práctica de esta casa de estudio, el


profesor decide organizar a sus alumnos en grupos según
rangos de edades, para lo cual define a los de mayor edad con
la letra (A), edad intermedia letra (B) y los de menor edad
con la letra (C)

Ejemplo 6 : En una industria, es necesario conocer y


clasificar los distintos productos químicos con los que se
trabaja, de manera de poder asignar una racional distribución
en el almacenaje.
Ejercicio Práctico
Determine qué tipo son las siguientes variables. Si son
variables cualitativas (nominal u ordinal) o cuantitativas
(discretas o continuas).

a) Marca de automóvil.
b) Duración de un disco compacto (segundos).
c) Número de temas de un disco compacto.
d) Nivel educacional (básica, media, universitaria).
e) Temperatura al mediodía en Chillán (grados Celsius).
f) Estado civil (soltero, casado, divorciado, viudo).
g) Cantidad de lluvia en un año en Chillán (mm3)
h) Nivel de peligrosidad de las distintas secciones de
trabajo en una industria. (bajo – medio – alto).
Tablas de Frecuencias:

Corresponde al mecanismo que se utiliza para presentar de


manera ordenada a un conjunto de observaciones.

Estas tablas pueden ser de dos o más columnas, lo anterior


depende del tipo de variables que se propone representar,
siendo la más simple, aquella tabla que se relaciona con una
sola variable.

Estas tablas son de bastante utilidad cuando se requiere


obtener resultados de un gran conjunto de datos observados.

Ejemplo: Si Juan Pérez quisiera conocer su promedio de notas


que obtuvo en la asignatura de estadística, donde son 4 las
notas a promediar, le resultaría fácil desarrollar el
cálculo, dado el bajo volumen de observaciones.
Nota 1 : 5.5 Primer Certamen
Nota 2 : 4.5 Segundo Certamen
Nota 3 : 6.2 Tercer Certamen
Nota 4 : 5.8 Cuarto Certamen

A Juan Pérez sólo le basta sumar sus notas y dividirlas por 4


que es el número de Notas o de observaciones
Suma : 22 ; luego 22 / 4 = 5.5 (promedio de notas)
Podemos observar que, al ser bajo el número de observaciones
resulta fácil y cómodo el cálculo del promedio de notas de
Juan Pérez.

La cosa se complica un poco cuando se trata de un gran


conjunto de observaciones, donde sí es recomendable recurrir
a técnicas que permitan facilitar el proceso de cálculo y en
este caso se recomienda emplear una Tabla de Distribución de
Frecuencia.
Ejemplo : Se tiene el resultado de un examen de estadística
de un número de 1000 alumnos de una cierta casa de estudios.

Nota Frecuencia
X(i) f(i)
1.2 1
1.4 2
1.6 3
1.8 8
2.0 15
2.2 18
2.4 19
2.6 22
2.8 25
3.0 26
3.2 28
3.4 31
3.6 35
3.8 38
4.0 45
4.2 46
4.4 48
4.6 52
4.8 58
5.0 60
5.2 55
5.4 53
5.6 51
5.8 50
6.0 46
6.2 44
6.4 40
6.6 32
6.8 31
7.0 18

Total 1000

Obsérvese que la frecuencia corresponde al número de veces


que se repite una nota, tal es el caso de la nota 4, donde 45
alumnos (45 observaciones) obtuvieron la nota 4, de igual
forma, la nota 6 fue observada 46 veces.

En el caso anterior podemos observar lo siguiente:

Nota : se asocia a una clase de observaciones (marca de


clase), donde las clases serán las notas propiamente tal y se
denota como X(i)
Frecuencia : corresponde al número de observaciones para cada
clase, en este caso se trata de Frecuencia Absoluta y se
denotará en el futuro como f(i), que corresponde a la iésima
observación de la variable observada (X)

Total : Corresponde a la suma de las frecuencias absolutas y


recibirá el nombre de Frecuencia Total (Suma f(i)) o
simplemente (N).13/03/2013).

Frecuencia Acumulada

Es la suma de los distintos valores de la frecuencia absoluta


tomando como referencia un individuo dado.

La última frecuencia absoluta acumulada es igual al número de


casos. Se denota por N

Este dato es importante a la hora de querer saber como se


está acumulando el conjunto de observaciones a medida que se
avanza hacia el final de la tabla de distribución de
frecuencias.

Ejemplo : En el ejemplo siguiente se procede a complementar


la tabla de las notas de los alumnos.
Nota Frecuencia Frecuencia
x(i) Absoluta Acumulada
f(i) F(i)
1.2 1 1
1.4 2 3
1.6 3 6
1.8 8 14
2.0 15 29
2.2 18 47
2.4 19 66
2.6 22 88
2.8 25 113
3.0 26 139
3.2 28 167
3.4 31 198
3.6 35 233
3.8 38 271
4.0 45 316
4.2 46 362
4.4 48 410
4.6 52 462
4.8 58 520
5.0 60 580
5.2 55 635
5.4 53 688
5.6 51 739
5.8 50 789
6.0 46 835
6.2 44 879
6.4 40 919
6.6 32 951
6.8 31 982
7.0 18 1000

Total 1000 ------


Nótese que para la última clase (Nota 7), se encuentra
acumulada la totalidad de la información observada y
Frecuencia Acumulada se denota como F(i).***
Fin Clase 16/03/2017

21/03/2017
Frecuencia Relativa

Corresponde al valor de la frecuencia absoluta expresada en


porcentaje respecto al valor total.

Este valor se obtiene para cada una de las x(i) observaciones


y se genera dividiendo el valor de la observación por la
frecuencia total.

Frecuencia Relativa de la f(i) observación

Fr.(%)(f(i)) = f(i) / Suma f(i)

Este dato es útil a la hora de buscar la participación


porcentual de cada una de las clases existentes en nuestra
distribución de frecuencia.

Ejemplo : En el ejercicio siguiente se procede a


complementar el cuadro agregando la Frecuencia Relativa.
Nota Frecuencia Frecuencia Frec.Relativa
x(i) Absoluta Relativa Acumulada
f (i) h(i)% (%)
1.2 1 0,001 0,00
1.4 2 0,002 0,01
1.6 3 0,003 0,01
1.8 8 0,008 0,03
2.0 15 0,015 0,05
2.2 18 0,018 0,07
2.4 19 0,019 0,09
2.6 22 0,022 0,11
2.8 25 0,025 0,14
3.0 26 0,026 0,17
3.2 28 0,028 0,20
3.4 31 0,031 0,23
3.6 35 0,035 0,27
3.8 38 0,038 0,32
4.0 45 0,045 0,36
4.2 46 0,046 0,41
4.4 48 0,048 0,46
4.6 52 0,052 0,52
4.8 58 0,058 0,58
5.0 60 0,060 0,64
5.2 55 0,055 0,69
5.4 53 0,053 0,74
5.6 51 0,051 0,79
5.8 50 0,050 0,84
6.0 46 0,046 0,88
6.2 44 0,044 0,92
6.4 40 0,040 0,95
6.6 32 0,032 0,98
6.8 31 0,031 0.99
7.0 18 0,018 1.00

Total 1000 1,000 100 (%)


Construcción de una Tabla de Distribución de Frecuencia.

Ejercicio: En el curso de una investigación de salud, se


pretende determinar el peso promedio de un grupo de adultos
que forman parte de los apoderados del curso de estadística.

Para obtener los resultados, se procede a pesar (kg) a cada


individuo.

En el cuadro siguiente se presentan los pesos en Kg de cada


uno de los miembros del grupo y se hace necesario tabularlos
a través de una Tabla de Distribución de Frecuencia.

Tabla de Datos

45 52 58 56 54 60 75 84 90 96
48 82 54 50 50 48 65 59 60 60
72 43 85 85 96 78 73 72 70 70
62 66 64 63 84 86 79 80 55 50
72 67 63 57 52 58 81 90 50 49

Paso 1. (Ordenar de Menor a Mayor)

Lo primero es ordenar los datos de menor a mayor, de manera


de poder reconocer los extremos de la tabla y además se
facilita su manejo.

Datos Ordenados de Menor a Mayor

43 45 48 48 49 50 50 50 50 52
52 54 54 55 56 57 58 58 59 60
60 60 62 63 63 64 65 66 67 70
70 72 72 72 73 75 78 79 80 81
82 84 84 85 85 86 90 90 96 96

Paso 2. (Cálculo del Rango)

En esta etapa es necesario determinar el rango del conjunto


de observaciones.

Entiéndase por Rango la diferencia entre el mayor valor con


el menor valor.

(R) Rango = X(i) máximo - X(i) mínimo

Para este conjunto de Datos (R) = 96 – 43  53


Paso 3. (Número de Clases)

Al construir una tabla de distribución de frecuencias, es


necesario determinar el Número de Clases (K), entre las que
serán organizados los datos (número de filas).

Tabla de Distribución de Frecuencia


(Peso (KG) de Miembros del Grupo de Apoderados Curso Estadística)
(*)Intervalo de Marca de Frecuencia Frecuencia Frecuencia Frec. Relativa
Clases Clase Absoluta Acumulada Relativa Acumulada
x(i) f(i) F(i) h(i) H(i)
(1)[ 43 – 51 ) 47 9 9 0.18 0.18
(2)[ 51 – 59 ) 55 9 8 0.18 0.36
(3)[ 59 – 67 ) 63 10 28 0.20 0.56
(4)[ 67 – 75 ) 71 7 35 0.14 0.70
(5)[ 75 – 83 ) 79 6 41 0.12 0.82
(6)[ 83 – 91 ) 87 7 48 0.14 0.86
(7)[ 91 – 99 ) 95 2 50 0.04 1.00

T O T AL ----- 50 ----- 1.00 -----


(K)=(7)

Para obtener el valor de (K) existe más de un procedimiento,


la mayoría son métodos empíricos.

Método 1 : (K) = Raíz cuadrada (N)

Donde (N) corresponde al número total de observaciones, en


este caso (N) = 50.

(K) = Raíz Cuadrada (N)

Luego (K) = Raíz cuadrada (50)  7,07 … K = 7

Método 2 : (Método de Sturges)

Este procedimiento, por cierto, también empírico consiste en


aplicar el siguiente algoritmo.

(K) = 1 + 3.322 Log (N)

Luego (K) = 1 + 3.322 Log (50)  6.64 …. K = 7

Método 3 : (Método Libre)


En muchos casos, de acuerdo al tipo de investigación que se
esté desarrollando, el investigador decide aplicar el Método
Libre, el cual le permite decidir en forma libre el número de
clases que empleará.

Es necesario señalar que, para el cálculo del número de


clases, se recomienda que este valor se encuentre entre 5 y
20 y que además, en la medida de lo posible, sea un valor
impar.

Paso 4. (Amplitud del Intervalo)

La amplitud del intervalo de clases, es una relación entre el


rango con el número de clases.

La amplitud del intervalo debe asegurar la continuidad de los


intervalos, no permitiendo que quede información observada
fuera de la tabla.

Definiremos la amplitud del intervalo con la letra (C)

(C) = Rango / (K)

Luego (C) = 53 / 7  7.57 … C = 8

Paso 5. (Definir el tipo de Intervalo)

Caso 1. Intervalo Cerrado y Abierto

Esto consiste en como se considerará el intervalo; en la


mayoría de los casos, se considera cerrado por un lado y
abierto por el otro { [ ; ) }, es decir, el valor de la
izquierda se incluye en el intervalo y el de la derecha se
excluye.

Ejemplo : [15 – 20) Incluye los valores iguales y


superiores a 15 hasta llegar a 20, sin incluir el 20.

[20 – 25) Incluye los valores iguales y superiores a 20


hasta llegar a 25, sin incluir el 25.
Caso 2. Determinando Límites Reales

En general, cuando se trata de estudios de investigación


donde se trata de variables continuas, se procede a
determinar límites reales, donde se resta la mitad de la
unidad al límite real inferior y se suma la mitad de la
unidad al límite real superior, de manera tal de permitir con
ello que en los límites queden incluidos el total de las
observaciones

Ejemplo : (14.5 – 20.5) Incluye del 15 al 20


(20.5 – 25.5) Incluye del 21 al 25

Paso 6. (Definir Marca de Clase)

Este valor corresponde al valor medio de cada intervalo de


clase, para este caso sería 17.5, 23.0, etc.

Luego con esta información procedemos a construir nuestra


tabla.

Tabla de Distribución de Frecuencia

Tabla de Distribución de Frecuencia


(Peso (KG) de Miembros del Grupo de Apoderados Curso Estadística)

(*)Intervalo Marca de Frecuencia Frecuencia Frecuencia Frec. Relativa


de Clases Clase Absoluta Acumulada Relativa Acumulada
x(i) f(i) F(i) h(i) H(i)

[ 43 – 51 ) 47 9 99 0.18 0.18

[ 51 – 59 ) 55 9 18 0.18 0.36

[ 59 – 67 ) 63 10 28 0.20 0.56

[ 67 – 75 ) 71 7 35 0.14 0.70

[ 75 – 83 ) 79 6 0.12 0.82
41

[ 83 – 91 ) 87 7 48 0.14 0.86

[ 91 – 99 ) 95 2 50 0.04 1.00

T O T AL ----- 50 ----- 1.00

(*) Nótese, se trata de un intervalo cerrado por la izquierda y abierto


por la derecha.
Ejercicio :

En una investigación respecto a la tasa de accidentabilidad


diaria de un complejo industrial, se procedió a desarrollar
un muestreo durante 60 días, obteniendo el siguiente
resultado:

Número de accidentes por día en el complejo industrial

5 7 9 5 8 8 9 5 5 12
4 7 9 5 7 6 6 4 4 3
8 5 4 9 11 12 10 10 7 6
7 15 7 14 15 12 8 9 4 14
13 12 15 7 4 3 8 9 5 6
8 7 9 9 10 5 11 4 7 9

1°.- Ordenar los Datos de Menor a Mayor.

2°.- Determinar Rango. (R) (Valor Mayor – Valor Menor)

3°.- Determinar N° de Clases (Sturges).(K)= 1 + 3.322*Log(N)

4°.- Amplitud del Intervalo. (C) = (R)/(K)

5°.- Tipo de Intervalo [ , )

6.- Construir la Tabla.


Desarrollar una Tabla de Distribución de Frecuencia.

[ Li Mc Ls ) f(i) F(i) h(i) H(i)

2 3 4 2 2 3,33 3,33
4 5 6 15 17 25,00 28,33
6 7 8 13 30 21,67 50,00
8 9 10 15 45 25,00 75,00
10 11 12 5 50 8,33 83,33
12 13 14 7 57 11,67 95,00
14 15 16 3 60 5,00 100,00

Total 60 100,00

REPRESENTACIÓN GRÁFICA

Corresponde a la representación gráfica explícita de una tipo


de población o fenómeno.

La idea de representar gráficamente el comportamiento de una


población radica en el hecho que basta con sólo un golpe de
vista y ya se tiene la idea central de lo que se quiere
representar, permitiendo con ello obtener información, que de
ser de otro modo, hay que necesariamente proponerse un
análisis de la población en estudio.

Ejemplo : Para el ejercicio de la medición de masa corporal


de un grupo una cierta muestra de individuos, se puede
representar gráficamente de la siguiente forma :

Distribución de
Frecuencia de Pesos
(Kg)

Marca Frecuencia
de (Alumnos)
Clase
(Peso
Kg)
51 9
59 9
67 9
75 7
83 12
91 2
99 2
Total 50
4.3.1.- DIAGRAMA DE PUNTOS

Uno de los tipos de representación gráfica a considerar


corresponde al Diagrama de Puntos, estos son instrumentos que
permiten presentar gráficamente tablas en las cuales se
consideran únicamente una variable y una cantidad asociada a
cada valor de la misma. El diagrama de puntos resulta de
utilidad cuando el conjunto de datos es razonablemente
pequeño o hay relativamente pocos datos distintos.

Cada dato se representa con un punto encima de la


correspondiente localización en una escala horizontal de
medida.

Cuando un valor se repite, hay un punto por cada ocurrencia y


se colocan verticalmente. Permite por ejemplo analizar la
dispersión y detectar datos atípicos.

Ejemplo : Graficar mediante el diagrama de puntos, la


relación (Peso / Altura) de un grupo de alumnos de cierta
universidad.

Gráfico de Relación
(Peso/Altura))
Par N° Peso Altura
(Kg) (m)
1 55 1,48
2 54 1,49
3 57 1,50
4 58 1,51
5 56 1,52
6 54 1,53
7 60 1,54
8 65 1,55
9 58 1,56
10 72 1,57
11 59 1,58
12 60 1,59
13 60 1,60
14 84 1,61
15 72 1,62
16 65 1,63
17 67 1,64
18 68 1,65
19 70 1,66
20 75 1,67
Fin Clase 21/03/2017

23/03/2017

Existen dos tipos de Diagramas de Puntos, siendo estos los


siguientes:

Tipo 1:- Corresponde a aquel diagrama que emplea la marca de


clase y esta la asocia a un único valor el cual representa la
frecuencia absoluta que corresponde a esa marca de clase.

En el ejercicio anterior (Distribución de Frecuencia de Pesos


de los Alumnos), el diagrama de puntos queda representada de
la siguiente forma:

Distribución de Frecuencia de Pesos (Kg)

Marca de Clase Frecuencia (Alumnos)


(Peso Kg)
51 9
59 9

67 9

75 7
83 12

91 2

99 2

Total 50
Tipo 2:- Corresponde a aquel diagrama donde, en el eje
horizontal se encuentra la marca de clase con su
correspondiente intervalo de clase y sobre este intervalo, se
dibujan tantos puntos como la frecuencia absoluta lo señale.

Este tipo de gráfico es útil cuando se trata de representar


muestras pequeñas, además es útil porque nos da una idea de
la distribución (dispersión) de los datos en sus respectivas
marcas de clase.

En este caso, cuando se repiten los valores para las clases,


se recomienda localizar los puntos de manera vertical sobre
cada marca de clase.

Para el ejercicio anterior, el diagrama de puntos queda


representada de la siguiente forma: (Hacer gráfica en papel
milimetrado)(Pizarra).
Histogramas:
Este tipo de representación gráfica corresponde a una gráfica
de columnas verticales sin dejar espacios entre ellas, donde
el eje de cada columna corresponde a la marca de clase (eje
de las abscisas) y en el eje de las ordenadas se deja
señalada la frecuencia absoluta o la frecuencia relativa de
la distribución.

En la construcción de un histograma se debe tener en cuenta


que los intervalos de clase deben ser idénticos para cada una
de las clase, lo permite que cada columna sea una
representación porcentual de la participación en el total de
cada una de las clases.

Las etapas que se deben cubrir en la construcción de un


histograma son las siguientes:

1.- Marcar en el eje horizontal los límites de clase.

2.- Marcar en el eje vertical las frecuencias relativas o


absolutas.

3.- Trazar rectángulos verticales contiguos cuya base son los


Intervalos de clases y su altura las frecuencias que
corresponden a la clase.

En el caso del ejercicio de la distribución de frecuencia de


los pesos de los alumnos, se tiene lo siguiente:
Distribución de
Frecuencia de Pesos
(Kg)

Marca de Frecuencia
Clase (Alumnos)
(Peso Kg)

47-51-55 9
55-59-63 9

63-67-71 9

71-75-79 7
79-83-87 12

87-91-95 2

95-99-103 2

Total 50

Histograma y polígono de frecuencias acumuladas

Si se representan las frecuencias acumuladas de una


tabla de datos agrupados, se obtiene un histograma de
frecuencias acumuladas; si sobre sus valores medios
(Marcas de clase) se traza una línea continua, se
obtiene un Polígono de Frecuencias Acumuladas
(Ojivas).
------------------------------------------+++++++++++++++++++---------------------------------------------------------

TAREA N° 1

Tema : Distribución de Frecuencia / Histogramas (En Clases)

Fecha : (Entrega)
Fecha : (Recepción)
Carácter : Obligatorio

El peso de 65 personas adultas viene dado por la siguiente tabla:

Tabla de Distribución de Frecuencias (Peso Kg./ N° Personas)

Intervalo de Marca Frecuencia Frecuencia Frecuencia Frecuencia


Clases de Absoluta Acumulada Relativa Relativa
Clase Acumulada
X(i) f(i) F(i) h(i) H(i)

55 8

65 10

75 16

85 14

95 10

105 5
115 2

Total ……… 65 ……… ………

Responder :

a.- Identificar la variable a estudiar.


b.- Completar la Tabla de Distribución de Frecuencia.
c.- Desarrollar un Diagrama de Puntos.
d.- Desarrollar Histograma de Frecuencias Absolutas .
e.- Desarrollar Histograma de Frecuencias Acumuladas .
f.- Entre que intervalo se encuentra la mayor concentración de
la población.

------------------------------------------+++++++++++++++++++---------------------------------------------------------

Histogramas con intervalos de Amplitud Diferente

Es posible la representación gráfica de poblaciones


que, al ser tabuladas resultan intervalos de
amplitudes diferentes, siendo esta situación tratada
de manera un tanto diferente.

Para construir histogramas con intervalos de amplitud diferentes, es necesario calcular


las alturas de los rectángulos del histograma de acuerdo con el siguiente algoritmo:

h(i) = f(i)/a(i)

Donde:

h(i) : Es la altura del intervalo (i).


f(i) : Es la frecuencia absoluta del intervalo (i).
a(i) : Es la amplitud del intervalo (i).

Ejemplo : En la siguiente tabla se muestra las calificaciones


(Malo, Regular, Bueno y Muy Bueno) obtenidas por un
grupo de 50 alumnos.

Distribución de Frecuencia (Intervalos de Clases Desiguales)

Amplitud Altura
Intervalo Marca de Frecuencia
del del
de Clase Observación Clase absoluta Intervalo Intervalo
a(i) h(i)
Calificación x(i) f(i)
(Eje X) (Eje Y)
[0, 5) Malo 2.5 15 5 3
[5, 7) Regular 6.0 20 2 10
[7, 9) Bueno 8.0 12 2 6
[9, 10) Muy Bueno 9.5 3 1 3
T O T A L ----- ----- 50 ------ ------

Mediante este procedimiento es posible construir un


histograma de frecuencias absolutas y acumuladas, además se
puede construir los respectivos polígonos de frecuencia.

POLÍGONOS DE FRECUENCIA

Un polígono de frecuencia se forma a partir de la unión de

los distintos puntos medios de las cimas de las columnas que

configuran lo que es un histograma de frecuencia.

Este se caracteriza porque utiliza siempre lo que son

columnas de tipo vertical y porque nunca debe haber espacios

entre lo que son unas y otras.

Este instrumento es empleado en las distintas disciplinas con

la finalidad de mostrar gráficamente un fenómeno, o una

población.
En estudios relacionados con la conducta humana, en la

biología, en las ciencias económicas es donde con más

frecuencia se hace uso de estos instrumentos.

Es un gráfico de líneas que se usa para presentar las

frecuencias absolutas de los valores de una distribución en

el cual la altura del punto asociado a un valor de las

variables es proporcional a la frecuencia de dicho valor.

Ejemplo 1: En la tabla siguiente se presenta el resultado de una investigación

respecto a la altura de 100 estudiantes de tercero medio de un colegio de la ciudad.

Altura de 100 estudiantes del 3° medio del Colegio GTD

Intervalo de Altura Número de Estudiantes


Clase (Marca de Clase) (frecuencia absoluta)
(Pulg.) X(i)(Pulg.) f(i)

60 - 62 61 5

63 - 65 64 18

66 - 68 67 42

69 - 71 70 27

72 - 74 73 8

Total ------ 100


Polígono de Frecuencia para Datos Agrupados

Se conoce como polígonos de frecuencia para datos agrupados a

aquellos que se desarrollan mediante la marca de clase que

tiene coincidencia con el punto medio de las distintas

columnas del histograma.

Ejemplo N 2 :

Las temperaturas en un día de otoño de una ciudad varía según

el siguiente cuadro:

Temperatura
Horas

6 7º

9 12°

12 14°

15 11°

18 12°

21 10°

24 8°
El polígono de frecuencia se construye tomando en cuenta la
marca de clase x(i), que coincide con el punto medio de cada
rectángulo de un histograma.

FRECUENCIA ACUMULADA

La Frecuencia acumulada es la suma de los distintos valores


de la frecuencia absoluta tomando como referencia un
individuo dado.

La última frecuencia absoluta acumulada es igual al número de


casos. Se denota por N

Este dato es importante a la hora de querer saber como se


está acumulando el conjunto de observaciones a medida que se
avanza hacia el final de la tabla de distribución de
frecuencias.

Ejemplo :

A una importante empresa de negocios se le encarga


desarrollar un estudio de mercado respecto a la frecuencia
con que las personas asisten a los supermercados durante un
año; para lograr su objetivo se tomó una muestra de 400
personas generando el resultado registrado en el cuadro
siguiente:

La tabla siguiente presenta el resultado


Tabla de Distribución de Frecuencias (Asistencia a Supermercados)

Intervalo de Marca de Clase Frecuencia Frecuencia Frecuencia Frecuencia


Clases X(i) Absoluta Acumulada Relativa Relativa
(N° de veces que Acumulada
asisten a f(i) F(i) h(i) H(i)
supermercados

60
[ 50 – 60 ) 55 60 12.3 12.3

145
[ 60 – 70 ) 65 85 15.4 27.7

258
[ 70 – 80 ) 75 113 24.6 52.4

348
[ 80 – 90 ) 85 90 21.5 73.8
40
388
[ 90 – 100 ) 95 15.4 89.2
[ 100 – 110) 105 10 398
96.9
7.7
115 2 400
[ 110 – 120)
3.1 100.0

Total
……… 400 ……… 100 ………

Si se grafica el histograma de las frecuencias absolutas y


sobre las marcas de clase de cada uno de los rectángulos se
traza una línea continua, se obtiene el polígono de
frecuencias absoluta.

Polígono de frecuencias acumuladas (Ojivas)


Si se representan las frecuencias acumuladas de una tabla de
datos agrupados, se obtiene el histograma de frecuencias
acumuladas, y si sobre el eje central de cada una de las
columnas (marca de clase x(i)), se traza una línea continua,
se tiene un polígono de frecuencias acumuladas o comúnmente
llamado ojivas.

Al considerar los datos de la tabla anterior, es posible


construir el Histograma y Polígono de Frecuencia Absoluta.

La ojiva es el polígono de frecuencias acumuladas, es decir,


que en ella se permite ver cuántas observaciones se
encuentran por encima o debajo de ciertos valores, en
lugar de solo exhibir los números asignados a cada
intervalo.

Ejemplo : En la tabla siguiente se presenta el resultado de


una investigación respecto a la altura de 100 estudiantes de
tercero medio de un colegio de la ciudad.

Intervalo Altura Número de Estudiantes Número de Estudiantes


de Clase (Marca de Clase) (frecuencia absoluta) (frecuencia Acumulada)
X(i) f(i) F(i)

60 - 62 61 5 5

63 - 65 64 18 23
66 - 68 67 42 65

69 - 71 70 27 92
72 - 74 73 8 100
Total ------ 100 ------

Curvas de Frecuencia . Ojivas Suavizadas.


Un conjunto de datos puede ser considerado como una muestra
extraída de una población grande.

A cusa de muchas observaciones que podemos realizar en la


población, es posible teóricamente (para datos continuos)
elegir los intervalos de clases muy pequeños y todavía tener
un número adecuado de observaciones dentro e cada clase; así
tenemos que el polígono de frecuencia o de frecuencias
relativas para una población grande puede estar formado por
muchos pequeños segmentos rectos que aproximan el conjunto a
una curva.

Las curvas de este tipo pueden llamarse curvas de frecuencia


o curvas de frecuencia relativas.

En consecuencia, es de esperar que tales curvas teóricas


provengan de la suavización de los polígonos de frecuencia o
de los polígonos de frecuencias relativas de la muestra,
donde la aproximación es tanto más exacta en la medida que
aumenta el tamaño de la muestra. Por esta razón, una curva
de frecuencia se conoce como un polígono de frecuencia
suavizado.

De forma análoga, las ojivas suavizadas, provienen de la


suavización de los polígonos de frecuencias acumuladas u
ojivas.

Normalmente es más sencillo suavizar una ojiva que un


polígono de frecuencia.

En la gráfica siguiente es posible observar un conjunto de


curvas o distribuciones que muestran el comportamiento de
distintas poblaciones
Gráficos Circulares

Las Gráficas circulares, corresponden a un conjunto de


procedimientos que nos permiten la representación visual de
proporciones o porcentajes de participación de los elementos
de una determinada distribución.

La gráfica circular nos permite una visión de conjunto, la


cual, apoyada con la implementación de colores, hace que las
distintas proporciones sean aún más notorias.

Las gráficas circulares tienen la desventaja es que no aporta


mayor información al investigador.

Construcción:

El gráfico circular es útil para representar proporciones de


distintas clases dentro de una muestra.

La muestra es representada por un círculo y cada una de las


clases que la componen, por un sector de éste.

El ángulo de cada sector mantiene la misma proporción de de


la clase que se quiere representar, respecto al total de la
muestra.

La proporción del ángulo tendrá como total o 100% a los 360°


o 400° según sea el sistema en el que se trabaje, siendo
estos los sistemas sexagesimal o centesimal.

Ejemplo : Una importante empresa del rubro Metalmecánica, le


encarga un estudio para determinar el efecto día en el nivel
de accidentabilidad al interior de la industria.

De manera de efectuar este estudio, el investigador procedió


a desarrollar un recuento de la totalidad de los accidentes
ocurridos durante el año 2015 y procedió a tabularlos y luego
graficarlos.

En el cuadro siguiente se presentan los resultados:

Registro de Accidentes Año 2014


Día Accidentes Part.(%) Grados
(Sexagesimal)

(1) Lunes 8 10,8 39


(2) Martes 5 6,8 24
(3) Miércoles 7 9,5 34
(4) Jueves 10 13,5 49
(5) Viernes 24 32,4 117
(6) Sábado 20 27,0 97

Total 74 100,0 360

En la gráfica es posible observar que el fin de semana


(viernes y sábado) concentran el mayor porcentaje de
accidentabilidad, donde, el 59.5% de los accidentes
registrados durante el año 2015, ocurrieron durante esos
días.