Está en la página 1de 26

Captulo 1

TERMINOLOGIA BASICA
1.1. APLICACIN DE LA ESTADSTICA
En la vida diaria los diversos fenmenos de orden econmico, social, poltico,
educacional, e incluso biolgico, aparecen, se transforman y finalmente desaparecen.
Para tan abundante y complejo material, es preciso tener un registro ordenado y
continuo a fin de conseguir en un momento dado, los datos necesarios para el estudio
de lo que ha sucedido, sucede o puede suceder.
Para ello se requiere contar con un mtodo, o conjunto de reglas o principios, que nos
permita la observacin, el ordenamiento, la cuantificacin y el anlisis de dichos
fenmenos. Ese mtodo se denomina Estadstica.
La palabra estadstica se refiere a un sistema o mtodo usado en la recoleccin,
organizacin, anlisis y descripcin numrica de la informacin.
Hay dos fases en el campo de la Estadstica. En primer lugar est la fase que slo se
limita a la descripcin de una serie de datos sin llegar a conclusiones o a generalizar
con respecto a un grupo mayor. Esta (fase) se conoce como Estadstica deductiva o
descriptiva. En segundo lugar est la fase de anlisis que trata de llegar a
conclusiones acerca de un grupo mayor basado en la informacin de un grupo menor
o muestra: es esta la Estadstica inductiva o de inferencia.
En un principio se consideraba que la funcin de la estadstica era la descripcin de
las caractersticas de grupo, actividad que la hacia confundir con el papel que cumple
la historia de observar y describir el hecho. En su origen, las estadsticas eran
historias; hoy en da, la estadstica, adems de ser descriptiva, es analtica,
considerndose esta ltima como la funcin ms importante que realiza, ya que
permite obtener conclusiones para un grupo mayor, denominado poblacin,
partiendo de una investigacin realizada en un grupo menor, conocido como
muestra, cuyo elementos, en la mayora de casos, se seleccionan aleatoriamente o al
azar.
La estadstica descriptiva o deductiva tiene como finalidad colocar en evidencia
aspectos caractersticos (promedios, variabilidad de los datos, etc.), que sirven para
efectuar comparaciones sin pretender sacar conclusiones de tipo ms general.
Esta descripcin se realiza a travs de la elaboracin de cuadros, grficos, clculo de
promedios, varianzas, proporciones de una o ms variables, que deben estar
relacionadas.
La estadstica inferencial o inductiva busca dar explicaciones al conjunto de
observaciones, probar la significacin o validez de los resultados; intenta descubrir
las causas que lo originan, con gran aplicacin en el campo del muestreo, logrndose
de esta manera, conclusiones que se extienden ms all de las estadsticas mismas.

Uno de los principales objetivos de la estadstica es hacer inferencias acerca de los


valores estadsticos de la poblacin, denominados parmetros, a travs de la
informacin obtenida en una muestra, que permite el clculo de estimadores.
La estadstica descriptiva-inferencial, se define como un conjunto sistemtico de
procedimientos para observar y describir numricamente el fenmeno, y descubrir
las leyes que regulan la aparicin, transformacin y desaparicin del mismo.

La estadstica, de acuerdo con todo lo anterior, se podra definir como la ciencia


mediante la cual se desarrolla y aplica tcnicas especficas para recopilar,
consolidar y analizar informacin representativa, suficiente, confiable y
oportuna con el fin de evaluar la incertidumbre en el proceso de la toma de
decisiones.

ACTIVIDAD
ESTADISTICA

PRODUCTO

Planeamiento y diseo.
Recopilacin.
Procesamiento
Anlisis e indicadores

INFORMACION
TOMA DECISIONES

CARACTERISTICA

Representativa
Suficiente
Confiable
Oportuna

Generalmente se asocia la palabra Estadstica con cifras sobre algn campo


particular. Podemos asociarla con cifras sobre el nmero de nacimientos,
defunciones, transacciones comerciales, valor de las acciones en el mercado de
valores, volumen fsico y monetario de las importaciones y exportaciones, beneficio
y utilidad de las empresas, demanda presente o potencial de algn producto.
Estadsticas (en plural). Se refiere a un ordenamiento sistemtico de datos
presentados en forma de cuadros y grficos. En otras palabras, las estadsticas son
datos agrupados metdicamente y consignados en publicaciones, elaboradas por las
diversas empresas o entidades, buscando que sean conocidas por los interesados. Se
clasifican en:
Estadsticas o fuentes primarias. Son aquellos datos obtenidos ya sea por encuestas
directas, mediante la utilizacin de cuestionarios, o como resultados de la
observacin directa; es una tcnica muy utilizada en estudios de carcter cientfico o
en investigacin de mercados. Se puede decir tambin que son datos publicados por
quien recoge directamente de la fuente de informacin primaria. Son fuentes
primarias: personales (entrevistas, correo, etc. y experimentos), unipersonales
(auditoria anlisis de rastreo o de contenido, simulacin); mixta (observaciones).
Estadsticas o fuentes secundarias. En estas, los datos se obtienen de publicaciones,
las cuales pueden ser reproducciones totales o parciales. Son valiosas para cualquier

tipo de investigacin. Son fuentes secundarias:


documentacin, folletos, revistas, archivos, etc.

bibliotecas,

centros

de

Las estadsticas tambin se pueden clasificar como internas y externas. Las


estadsticas internas de una empresa se forman de los registros internos, tales como
produccin, ventas, salarios y otros. Las estadsticas externas son registros originados
fuera de la empresa, por ejemplo: precios de la competencia, opinin de los
consumidores respecto al producto, etc.
Clases de estadsticas. Se clasifican de acuerdo con el tema o materia de estudio; as,
por ejemplo, se elaboran diversas clases de estadsticas: industriales, agropecuarias,
construcciones, transporte y comunicaciones, comercio interior, moneda y finanzas,
precios y salarios, comercio exterior, sector publico, empleo y laborales,
demogrficas, salubridad, justicia y educacin.
1.2. ALGUNOS TRMINOS Y CONCEPTOS QUE SE DEBEN CONOCER Y
MANEJAR.
A continuacin se definen algunos trminos que sern utilizados en el desarrollo de
los diferentes captulos, en los cuales se ha dividido esta asignatura.
Es de suma importancia el conocimiento y el manejo de los trminos que se
expondrn, ya que nos permitir hablar un solo lenguaje, precisar lo que se va a hacer
y entender su uso en los diversos aspectos que conlleva el desarrollo de los temas de
la presente asignatura.
Universo. Se denomina universo, a un conjunto de elementos (que consiste de
personas, familias, establecimientos, animales, objetos, artculos producidos, etc.)
que contienen una o ms caractersticas observables de naturaleza cualitativa o
cuantitativa que se pueden medir en ellos.
Elementos o unidades. Son los elementos o unidades que integran el universo.
Adems el elemento puede ser una entidad simple (una persona) o una entidad
compleja (una familia), que se denomina unidad, la que a su vez, puede estar
compuesta de elementos o de unidades, que en algunos casos se les define como
conglomerados.
Por ejemplo, los empleados de una empresa en un da laborable, constituyen un
universo en la que cada empleado (elemento), tiene muchas caractersticas a ser
observadas, como por ejemplo: sexo, estado civil, lugar de procedencia, grado de
instruccin, etc. (caracterstica cualitativa), o nmero de hijos, ingresos mensuales,
etc. (caracterstica cuantitativas).
El resultado de medir una caracterstica observable de una unidad o elemento, se
denomina dato estadstico o valor observado o simplemente observacin.
Poblacin. Por otra parte, el universo viene definido por la investigacin estadstica
a realizarse. Y como la medicin de la caracterstica especificada por la investigacin
se hace a cada unidad elemental, se puede considerar a la poblacin como el
conjunto de medidas o el recuento de todos los elementos que presentan una
caracterstica comn.

Segn sea el nmero de elementos, la poblacin puede considerarse como finita o


infinita. Es una poblacin finita cuando el nmero de elementos que la compone es
limitado; infinita cuando consta de ilimitado nmero de elementos.
Marco muestral. Se denomina marco muestral o marco de referencia, a la lista,
mapa o cualquier otro material aceptable, que contenga todas las unidades o
elementos perfectamente identificadas y actualizadas, de la cual se selecciona la
muestra.
Caractersticas. Es importante resaltar el hecho de que a pesar de encontrarse un
universo constituida por un grupo de elementos o unidades, a la estadstica no le
interesa el elemento o la unidad en s, sino su caracterstica.
Investigacin total. Denominada tambin como censo o investigacin exhaustiva, es
aquella en la cual se toma la totalidad de los elementos o unidades que conforman la
poblacin objeto de estudio.
No siempre se puede realizar una investigacin total, y debemos observar una parte
de ellas, debido a circunstancias como las que se detallan a continuacin:
Muestra o investigacin parcial. Se define como un conjunto de medidas o el
recuento de una parte de los elementos pertenecientes a la poblacin, con el fin de
obtener informacin acerca de la poblacin de la cual proviene.
El estudio de muestras es ms sencillo que el estudio de la poblacin completa;
cuesta menos y lleva menos tiempo. Por ltimo se aprobado que el examen de una
poblacin entera todava permite la aceptacin de elementos defectuosos, por tanto,
en algunos casos, el muestreo puede elevar el nivel de calidad.
Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin
para hacer referencias sobre la poblacin que est representada por la muestra. En
consecuencia muestra y poblacin son conceptos relativos. Una poblacin es un todo
y una muestra es una fraccin o segmento de ese todo.
Parmetro. Es una medida utilizada para describir alguna caracterstica de una
poblacin, y para determinar su valor es necesario utilizar la informacin de la
poblacin completa y por lo tanto, las decisiones se tomarn con certidumbre total.
Las ms utilizadas son:
Media poblacional ( )
Varianza poblacional (2 )
Proporcin poblacional (p)
Tambin se le denomina valor verdadero, ya que una caracterstica poblacional
tendr un solo parmetro (media, varianza, etc.). Sin embargo, una poblacin puede
tener varias caractersticas y, por tanto, varios parmetros. Algunos lo denominan
como valor estadstico de la poblacin.
Estadstica o estadgrafo: Es una medida utilizada para describir alguna
caracterstica de la muestra y la toma de decisiones contiene un grado de
incertidumbre. Las ms utilizadas son:

Media muestral ( X )
Varianza muestral (S 2 )
Proporcin muestral ( p )
De una poblacin se pueden obtener M nmero de muestras posibles y en cada una
de ellas se puede cuantificar la caracterstica, obtenindose por lo general, valores
diferentes para cada muestra, a pesar de ser utilizado el mismo estadgrafo o medida.
Tambin se le conoce como Estimador Puntual si se trata de un promedio, varianza,
proporcin, etc. Como por lo general, existe una diferencia entre el estimador y el
parmetro, denominado error, es aconsejable utilizar el estimador por intervalos,
dentro del cual deber estar contenido el parmetro con cierto margen de seguridad,
establecido por el investigador.
La diferencia entre el estimador y el parmetro, como ya se dijo, se le denomina
como error de muestreo, y lo fija el investigador para determinar el tamao de la
muestra, con base en la experiencia y el conocimiento que tenga sobre el
comportamiento y, la variacin que tenga la caracterstica o caractersticas
principales relacionadas con el objetivo mismo de la investigacin.
Muestreo: Esto no es ms que el procedimiento empleado para obtener una o ms
muestras de una poblacin. Este se realiza una vez que se ha establecido un marco
muestral representativo de la poblacin, se procede a la seleccin de los elementos de
la muestra aunque hay muchos diseos de la muestra.
Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada
muestra no necesariamente seran iguales, y lo ms probable es que variaran de una
muestra a otra.

Muestras posibles

Prob. De Seleccin

Muestra
seleccionada

Estimador
(Frmula)

Estimacin
Nmero
Caracterstica
a estimar de
la poblacin.

Figura 1.2.

1.3. MEDICIN DE CARACTERES


Existen diversas definiciones del trmino "medicin", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la
cuantificacin y el proceso mismo de la construccin de una escala o instrumento de
medicin.
En general, se entiende por medicin la asignacin de nmeros a elementos u objetos
para representar o cuantificar una propiedad. El problema bsico est dado por la
asignacin de un numeral que represente la magnitud de la caracterstica que
queremos medir y que dicho nmeros pueden analizarse por manipulaciones de
acuerdo a ciertas reglas. Por medio de la medicin, los atributos de nuestras
percepciones se transforman en cantidades conocidas y manejables llamadas
"nmeros". Es evidente que el mundo resultara catico si no pudiramos medir
nada. En este caso cabra preguntarse de que le servira al fsico saber que el hierro
tiene una alta temperatura de fusin.
1.4. VARIABLES ESTADSTICAS
La caracterstica que se mida en las unidades elementales de una poblacin definida
por la tarea estadstica, tiene diversos valores de naturaleza cualitativa o cuantitativa.
Por ejemplo, la caracterstica "gnero" tiene dos modalidades: hombre y mujer, la
caracterstica "peso en kilogramos" tiene infinitos valores.
Definicin: Se denomina variable estadstica a una caracterstica definida en la
poblacin por la tarea o investigacin estadstica, que puede tomar dos o ms valores
(cualidades o nmeros) de un conjunto llamado dominio de la variable.
Se representa por una letra del alfabeto. Por ejemplo, en el universo constituida por
los trabajadores administrativos de la universidad Nacional de Piura, algunas
variables estadsticas definidas en sta poblacin son:
X: "Gnero". Valores: Masculino, Femenino
Y: "estado civil". Valores: Soltero, casado, viudo, divorciado
Z: "nmero de hijos", Valores: 0,1, 2, etc.
W: "ingresos mensuales", Valores: Nmeros reales positivos.

Figura 2.3. Variable estadstica

Si una variable se denota por X, entonces, sus valores observados en n unidades


estadsticas se denotan por x 1 , x 2 ,..., x n , conforme al orden en que se han obtenido.

Este conjunto de n observaciones constituye una muestra de tamao n obtenida de


una poblacin.

1.5. Escalas o Niveles de medicin


La asignacin de valores a cada una de las unidades estadsticas mediante una
variable, se hace siguiendo determinadas escalas de medicin.
Definicin. Se denomina escala de medicin a un instrumento de medida, con el que
se asigna valores (cualidades o nmeros) a las unidades estadsticas para una variable
definida.
El conocimiento de las escalas de medicin es muy importante, pues cada una de
ellas tiene mtodos estadsticos especficos. Podemos distinguir las siguientes escalas
de medicin: Nominal, Ordinal, De intervalos, y De razn.
Escala nominal
Definicin: Se tiene una escala de medida nominal si dos o ms valores de una
variable, slo permiten percibir las diferencias o semejanzas de las unidades
estadsticas que se midan. Tales valores son como etiquetas que identifican a las
unidades estadsticas y las hacen iguales o diferentes entre si.
Si se asignan nmeros a estos valores cualitativos (modalidades o categoras), slo
sirven nica y exclusivamente para identificar la modalidad y con estos no se pueden
realizar operaciones aritmticas. Slo son vlidas las relaciones de igualdad () y no
igualdad ().
Otro ejemplo, la variable "sexo" asigna a las personas dos valores: "masculino" y
"femenino" que son de escala nominal. Con los valores de esta variable las personas
estn en una misma modalidad o en modalidades diferentes. Si se asigna un
"cero" al sexo "masculino" y un "uno" al sexo femenino, con estos nmeros, no se
pueden realizar operaciones aritmticas. Slo se puede decir que el smbolo 0 es
distinto al smbolo 1, pero no podemos decir que 1 es mayor que 0, o que 0 es menor
que 1. Las variables estadsticas: "estado civil", "ideas religiosas", especialidades
que funcionan en la facultad de ciencias de la UNP, entre otras, tienen
modalidades que son de escala nominal.
El mtodo estadstico con datos obtenidos en escala nominal consiste bsicamente en
obtener el nmero o porcentaje de casos en cada modalidad y obtener la moda (valor
de mayor frecuencia)
Escala ordinal
Definicin: Una escala ordinal es una escala nominal donde los valores de la
variable se pueden ordenar en forma ascendente (o descendente).
En una escala ordinal los valores o modalidades reflejan el orden existente de las
unidades estadsticas. Si se asignan nmeros a tales modalidades, con estos, no se
pueden realizar operaciones aritmticas. Slo son vlidas las relaciones de igualdad
(), de no igualdad () y de orden ().

Por ejemplo, la variable "estatus socioeconmico" con sus modalidades: clase baja,
media y alta se mide, en escala ordinal. La variable "orden de mrito" cuyas
modalidades son 1, 2, 3, etc. mide las calificaciones de las unidades estadsticas
en escala ordinal. Al asignar un nmero a los pacientes de una consulta mdica,
segn el orden de llegada, estamos llevando una escala ordinal, es decir que al
primero en llegar le asignamos el N 1, al siguiente el N 2 y as sucesivamente.
El mtodo estadstico con datos obtenidos en escala ordinal consiste bsicamente en
obtener el nmero o porcentaje de casos en cada modalidad y obtener la moda, la
mediana, los percentiles y el coeficiente de correlacin por rangos.
Escala de intervalos
Definicin: Una escala de intervalos es una escala ordinal con cuyos "valores" no
slo se pueden verificar igualdad, no igualdad y orden, si no tambin, se puede elegir
una unidad de escala y comprobar cuntas veces la diferencia entre dos valores es
igual a la diferencia entre otros dos valores de la escala (es decir, podemos
comparar intervalos).
Esto es, si x 1 , x 2 y x 3 son tres valores en la escala de intervalo, se verifica, por
ejemplo, la relacin:
x 3 x1 c ( x 2 x1 )

x 3 x1
x 2 x1

donde c es una constante.


Escala de razn o cociente
Definicin. La escala de razn es una escala de intervalo con cuyos valores adems
podemos comprobar cuntas veces un valor de la escala es igual a otro valor de la
escala. Esto es, si x 1 y x 2 son dos valores en la escala de razn, se verifica la
relacin:
x 2 cx 1

donde c es una constante, y

x1 0

x2

x1

La escala de razn tiene un cero absoluto (ausencia total de la caracterstica que se


observa). Con los nmeros de esta escala son vlidas las relaciones de igualdad, de
no igualdad, de orden y todas las operaciones matemticas. Los valores de esta escala
se obtienen en general, por mediciones tipo conteo (discretos) o por mediciones tales
como de longitud, peso, volumen, vida til, etc. (continuos).
Por ejemplo, si la variable X, es la longitud (en metros) de un objeto, entonces, los
valores de esta variable son de escala de razn. En efecto, si tres objetos A, B, y C
miden 2, 4 y 16 metros, se pueden establecer las relaciones: 2 4 16, 2 4 16,
1627(42), adems, 4/2 = 2, 16/2 = 8, y 16/4 = 4. Es decir, la longitud de B es el
doble que la de A, el de C es 8 veces que la de A y el de C es 4 veces que la de B.

Otro ejemplo: En una encuesta realizada en un barrio de esta localidad se observ


que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble
de hijos que aquellas que tienen 3 hijos.

Propiedad: Una escala de razn x permanece invariante ante la transformacin:


y ax

donde a es una constante arbitraria.


Por ejemplo, si la variable X: tiene valores 4 y 16 medidos en escala de razn,
entonces, la transformacin Y (1/2)X que produce los valores respectivos 2 y 8 es
la misma escala de razn. Es decir, estos dos juegos de valores 4, 16 y 2, 8, miden
la misma caracterstica y verifican las mismas relaciones, en particular:
16
4

8
2

NOTA. La aplicacin de mtodos estadsticos cuantitativos requiere que la variable


se mida por lo menos en escala de intervalos.
Ejemplo: Las notas de un cierto curso se miden en una escala de intervalos de 0 a
20. Por razones prcticas se trata de expresar estas notas en la misma escala de
intervalos pero de tal manera que el 20 se transforme en 100 y el 15 se transforme en
80, en cunto debe transformarse el 0?

Solucin
Sea el valor que corresponde al 0.Entonces, si 0, 15, 20 y , 80, 100 son dos juegos
de valores en la misma escala de intervalos, entonces,
? 80
80 100

0 15
15 20

, de donde resulta

? 20 .

1.6. Clasificacin de variables.


Las variables se clasifican en dos grupos de acuerdo al nivel de medicin utilizado
para su observacin: clases cualitativas y cuantitativas.
Variable cualitativa o atributo, es la caracterstica cuyos valores se expresan en
escala nominal u ordinal, por ejemplo, sexo, profesin, estado civil, orden de
mritos, etc.. Con sus valores, que son cualidades, no se pueden realizar operaciones
aritmticas.
Variable cuantitativa, es la caracterstica cuyos valores se expresan en escalas de
intervalo o de razn, por ejemplo, temperatura, nmero de hijos, edad, ingresos

mensuales, tiempo de vida til, etc.. Con sus valores, que son nmeros, se pueden
realizar operaciones aritmticas.
Las variables cuantitativas, a su vez, se clasifican en: discretas, y continuas.
Variable cuantitativa discreta, es aquella variable cuantitativa que puede tomar
slo un determinado nmero de valores y no admite ningn valor entre dos valores
consecutivos fijos. Generalmente, es una variable cuyos valores se obtienen por
conteo (nmeros naturales). Por ejemplo, una familia puede tener 0, 1, 2,...hijos, pero
no algn valor intermedio.
Otro ejemplo, el nmero de estudiantes de una clase es una variable discreta ya que
solo tomar los valores 1, 2, 3, 4... Ntese que no encontramos valor como 1.5
estudiantes
Variable cuantitativa continua, es aquella variable cuantitativa que puede tomar
cualquier valor dentro de dos valores consecutivos. Por ejemplo, el salario, el peso, el
tiempo empleado para realizar un trabajo, la estatura, volumen, longitud, etc..
No obstante en muchos casos el tratamiento estadstico hace que las variables
discretas las trabajemos como si fuesen continuas y viceversa.
Una variable continua puede pues tomar infinitos valores intermedios en un intervalo
dado. Para fines prcticos los valores numricos de las variables continuas siempre
son valores aproximados.
Ejercicio. Clasifique las variables e indique el tipo de escala en que estn medidas
las siguientes caractersticas:
- Profesin
- Nacionalidad
- Grado de instruccin
- Nmero de hermanos
- Nmero de telfono
- Direccin

- Ao de nacimiento
- Edad
- Estado civil
- Ingreso mensual familiar
- Documento nico de identidad

1.7. Datos Estadsticos.


Los datos estadsticos no son otra cosa que el producto de las observaciones
efectuadas en las personas y objetos en los cuales se produce el fenmeno que
queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras)
necesarios para llegar al conocimiento de un hecho o para reducir las consecuencias
de este.
Los datos estadsticos se pueden encontrar de forma no ordenada, por lo que es muy
difcil en general, obtener conclusiones de los datos presentados de esta manera. Para
poder obtener una precisa y rpida informacin con propsitos de descripcin o
anlisis, estos deben organizarse de una manera sistemtica; es decir, se requiere que
los datos sean clasificados. Esta clasificacin u organizacin puede muy bien hacerse
antes de la recopilacin de los datos.

Ejemplo 2.29. Si se quiere conocer las caractersticas de los estudiantes de la


Universidad Nacional de Piura, que solicitan prstamo a la biblioteca central de
dicha Universidad. La recoleccin de la informacin debe clasificar a cada
estudiante sobre la base de: Especialidad que estudia, edad, semestre de estudios, etc.
Vemos pues que la clasificacin marca la pauta de la clase de datos que debe ser
obtenido.
1.8. Clasificacin de los datos
Los datos estadsticos pueden ser clasificados en cualitativos, cuantitativos,
cronolgicos y geogrficos.

Datos Cualitativos: cuando los datos son cualitativos, la diferencia entre


ellos es de clase y no de cantidad.

Ejemplo: Si deseamos clasificar los estudiantes que cursan la asignatura de


Estadstica Empresarial en la maestra de Administracin por su estado civil,
observamos que pueden existir solteros, casados, divorciados, viudos.

Datos cuantitativos: cuando los valores de los datos representan diferentes


magnitudes, decimos que son datos cuantitativos.

Ejemplo: Se clasifican los estudiantes de la facultad de Ciencias de la UNP de


acuerdo a sus notas, observamos que los valores (nota) representan diferentes
magnitudes.

Datos cronolgicos: cuando los valores de los datos varan en diferentes


instantes o perodos de tiempo, los datos son reconocidos como cronolgicos.

Ejemplo: Al registrar los promedios de notas de los Alumnos del alumnos de la


facultad de Ciencias de la UNP en los diferentes semestres.

Datos geogrficos: cuando los datos estn referidos a una localidad


geogrfica se dicen que son datos geogrficos.

Ejemplo: El nmero de estudiantes de educacin superior en las distintas


regiones del pas.
1.9. Fuentes de datos Estadsticos:
Los datos estadsticos necesarios para la comprensin de los hechos pueden
obtenerse a travs de fuentes primarias y fuentes secundarias.

Fuentes de datos primarias: es la persona o institucin que ha recolectado


directamente los datos.

Fuentes secundarias: son las publicaciones y trabajos hechos por personas o


entidades que no han recolectado directamente la informacin.
Las fuentes primarias ms confiables, son las efectuadas por oficinas
gubernamentales encargadas de tal fin.
En la prctica, es aconsejable utilizar fuentes de datos primarias y en ltima
instancia cuando estas no existan, usar estadsticas de fuentes secundarias. Con
este ltimo tipo no debemos pasar por alto que la calidad de las conclusiones

estadsticas depende en grado sumo de la exactitud de los datos que se recaben.


De nada servira usar tcnicas estadsticas precisas y refinadas para llegar a
conclusiones valederas, si estas tcnicas no son aplicadas a datos adecuados o
confiables.
Cuando un investigador quiere obtener datos estadsticos relativo a un estudio
que desea efectuar, puede elegir entre una fuente primaria o en su defecto, una
secundaria. O recopilar los datos por s mismo. La posibilidad mencionada en
ltimo trmino podr deberse bien a la inexistencia de los datos o bien a que
estos no se encuentran discriminados en la forma requerida.
Ejemplo: Si un investigador quiere conocer el nmero de alumnos repitentes en
educacin secundaria, clasificados por grado acadmico, para los ltimos diez
aos, el investigador puede usar una fuente primaria, tal como la memoria con
que cuenta el Ministerio de Educacin cada ao.
1.10. Presentacin de los datos.
Comprende a resmenes y consolidaciones de informaciones dispersas que se
efectan con fines de realizar una presentacin ordenada y clasificada de resultados
de modo que se facilite su anlisis e interpretacin para la toma de decisiones. Las
tablas de informacin resultan de identificar las necesidades de informacin por tanto
es necesario que para su elaboracin se consideren las caractersticas que puedan
cumplir su objetivo final: informar.
La informacin obtenida no slo requiere ser organizada y presentada en tablas, sino
que tambin puede ser representada mediante grficos estadsticos.
1.11. Distribucin de frecuencias
La distribucin de frecuencias es un mtodo utilizado para organizar y resumir datos.
Bajo este mtodo los datos que componen una serie se clasificaran en valores o en
intervalos, indicndose el nmero de veces que se repite.
La distribucin de frecuencia nos permite manejar grandes cantidades de
informacin en espacios pequeos, ya sea a travs de tablas o cuadros y por medio de
grficos que lo complementan.
En el caso de una variable cuantitativa, si se tienen pocos datos, y estos son valores
discretos, entonces conviene presentar una tabla de distribucin de frecuencias sin
intervalos; pero si se tiene valores continuos o muchos valores discretos, conviene
presentar una tabla de distribucin de frecuencia por intervalos.
Aunque no se pueden fijar normas rgidas, en la presentacin de los cuadros o tablas,
sin embargo, es posible dar una estructura general que debe seguir una tabla de
informacin estadstica:
1. Nmero de tabla. Es un cdigo de identificacin que permite citarlo cuantas
veces sea necesario a lo largo de los comentarios de un informe.

2. Ttulo. Corresponde a una descripcin resumida de la informacin estadstica


que contiene. En general debera responder a las clsicas preguntas: QUE,
DONDE, COMO y CUANDO.

Qu: Qu informacin contiene la tabla o cuadro?


Dnde: A dnde corresponde la informacin tabulada?
Cmo: Cmo est arreglada o clasificada la informacin?
Cundo: A qu perodo de tiempo se refiere la informacin?

3. Encabezamiento. Es la descripcin resumida sobre contenido de las filas y


columnas que contiene la tabla de informacin.
4. Cuerpo de la tabla. Comprende al contenido numrico de la informacin de
la tabla.
5. Notas de pi o llamadas. Anote las aclaraciones sobre trminos, siglas,
abreviaturas usadas. Tambin precisar las unidades de medida y
equivalencias que se estn utilizando para expresar cantidades.
6. Fuente. Se debe anotar el nombre de la institucin o de la investigacin de
donde se han tomado los datos individuales.
7. Elaboracin. Se anotar el nombre de la unidad responsable de la
formulacin y presentacin del tabulado de informacin estadstica.
8. Fecha. Registre la fecha en que se realiz la tabla para dejar constancia del
evento y poder actualizar de ser pertinente.

Ejemplo. Segn informacin preliminar de la oficina de Admisin del hotel


CONFORT, en el mes de febrero de 2007 el hotel atendi a los turistas extranjeros
siguientes:
Turista
1
2
3
4
5
6
7
8
9
10
11

Nacionalidad
Argentina (*)
Argentina
Argentina
Argentina
Argentina
Argentina
Boliviana
Boliviana
Boliviana
Chilena
Chilena

Sexo
Masculino
Masculino
Masculino
Femenino
Femenino
Femenino
Masculino
Masculino
Femenino
Masculino
Femenino

(*) El cliente no acredit su nacionalidad.

Elabore una tabla de resultados que consolide la informacin dispersa en esta base de
datos construida por la Oficina de Admisin del Hotel CONFORT.

Solucin.
NUMERO Tabla N 1
TITULO
Qu?
Nmero de turistas extranjeros que fueron atendidos.
Dnde? en el hotel CONFORT
Cmo?
segn nacionalidad por sexo (1)
Cundo? (Periodo: Febrero 2007)

Encabezado

Cuerpo

Nmero de Turistas
Extranjeros
Nacionalidad Nmero
%
(n i )
(h i )
Argentina (2)
6
54.5
Boliviana
3
27.3
Chilena
2
18.2
Total General
11
100.0

NOTAS DE PIE

Sexo
Masculino
Femenino
Nmero
%
Nmero
(n i )
(h i )
(n i )
3
50.0
3
2
33.3
1
1
16.7
1
6
100.0
5

%
(h i )
60.0
20.0
20.0
100.0

(1) Cifras preliminares registradas al 01/ 03 / 2007.


(2) Comprende a ciudadanos con nacionalidad no acreditada

FUENTE

Oficina de Admisin del hotel CONFORT

RESPONSABLE

Elaborado por: Asesores y Consultores S.A.

FECHA

01/ 03 / 2007

1.12. Distribucin de frecuencias sin intervalos:


La distribucin de frecuencia sin intervalos o clases es recomendable utilizarse
cuando se tienen pocas observaciones y, por tanto, la variable estadstica tome pocos
valores; o tambin cuando se han hecho muchas observaciones y, sin embargo, la
variable toma muy pocos valores distintos, incidiendo de una manera considerable el
estudio de las repeticiones de cada valor. Estos casos caern dentro del estudio de
variable discreta.
Cuando se estudia una variable cuantitativa X de la poblacin, el mayor inters es
conocer la distribucin de esta variable a travs de los posibles valores del mismo.
Suponga que se han recolectado n valores de alguna variable discreta X. El
procedimiento ms simple de organizar estos n datos, consiste en ordenar estos
valores numricos en forma ascendente.
Si algunos valores se repiten, y si al terminar el ordenamiento se obtienen k ( k n )
valores distintos de X, digamos, x 1 , x 2 ,..., x k , con frecuencias absolutas respectivas
n 1 , n 2 ,..., n k , la distribucin de frecuencias de estos n datos se resume en la tabla 2.5
como sigue:

Tabla 2.5. . Distribucin de frecuencias de variable discreta

Valores de la
variable X
x1
x2
.
.

Frecuencias
absolutas n i
n1
n2
.
.

xk

Frecuencias
relativas h i
h1
h2
.
.

nk

hk

Total

pk

Frecuencias
porcentajes p i
p1
p2
.
.

i 1

i 1

p i 100

i 1

Ejemplo. Supngase que ante la pregunta del nmero de hijos por familia (variable
X) una muestra de 20 hogares, marc las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 3, 2, 1, 3, 2, 3, 3, 1, 2, 4.
Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1,
2, 3, 4 que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribucin de
frecuencias de X se da en la tabla 2.6.
Tabla 2.6. Distribucin de frecuencias del nmero de hijos por familia.
Nmero de
hijos
Xi
0
1
2
3
4
Total

Frecuencias
Absolutas
ni
1
4
7
6
2
20

Frecuencias
Relativas
hi
0.05
0.20
0.35
0.30
0.10
1.00

Frecuencias
Porcentajes
hi (%)
5
20
35
30
10
100

Fuente.- Datos obtenidos de los formularios de la encuesta.

1.13. Distribucin de frecuencias por intervalos.


La distribucin de frecuencia por intervalos o clases se usa cuando se han hecho
muchas observaciones y la variable estadstica (contina) toma muchos valores
distintos o cuando el nmero de valores distintos de una variable discreta es grande,
con lo que el campo de variabilidad es muy grande.
En este caso, trataremos de agrupar los valores de la variable en intervalos
adecuadamente elegidos para no perder mucha informacin.
Para esclarecer la construccin de la tabla de frecuencia para datos agrupados en
intervalos de clase, desarrollaremos un ejemplo.

Ejemplo 2.32. La siguiente informacin corresponde a las medidas de las alturas de


100 alumnos (dados en cm.) tomados en la oficina mdica de Bienestar Universitario
de la UNP, durante la ltima semana de setiembre de 2007.
151
173
167
180
170
189
176

161
176
168
185
172
181
178

166
179
169
159
175
178
161

168
182
171
164
177
175
156

169
154
174
167
181
172

170
163
177
168
187
170

173
166
180
170
160
169

176
168
184
171
165
168

179
169
158
175
167
165

182
171
163
177
168
161

152
174
167
181
170
161

162
176
168
186
172
166

166
180
169
159
175
168

168
183
171
165
178
169

169
155
174
167
181
170

170
163
177
168
188
173

Se pide representar los datos en una tabla de frecuencias.


Solucin.
1. Debemos de determinar el rango ( R ) de variacin de los datos que se define por:
R = X max - X min
En nuestro ejemplo, tenemos:
Valor mnimo X min = 151
Valor mximo X mx = 189
Luego el rango es R= 189 - 151= 38
2. Tenemos que calcular cuantas clases deben formarse?. Para eso se usa la frmula
de Sturges:
K 1 3.322 log n

donde:
K = nmero de clases
n = nmero de elementos en la muestra (tamao de la muestra).
Est formula es muy til porque orienta al principiante. Sin embargo, es un poco
conservador y tiende a dar un nmero de clases un poco menor del que se utiliza en
la practica.
En nuestro ejemplo:

K = ? , n = 100

Aplicando la frmula tenemos:


K 1 3.322 log 100 7.644

redondeando al entero inmediato mayor por que, como ya se indico, la formula es un


poco conservadora, obtenemos:
K = 8.
Nota.- por razones extradas de la prctica, se adoptan los siguientes lmites para K.
5 K 15

3. La idea es resumir los valores con el fin de percibir algunas caractersticas o


propiedades de los datos que no aparecen a simple vista. Para esto vamos a clasificar
los 100 alumnos en 8 clases, de acuerdo con la formula de Sturges.

La amplitud de cada intervalo de clase que representamos con la letra c, se obtiene


por medio de la formula:
c

R
K

Aplicando los datos a la frmula anterior, se tiene:


c

38

4 . 75

Redondeamos a 5.
Luego c = 5 y por tanto, el nuevo recorrido ser:
R c K 5 8 40

4. Teniendo en cuenta que este recorrido es mayor que el recorrido original,


buscaremos el exceso:
Exceso = 40 - 38= 2 cm.
Debemos repartir este exceso a los dos extremos del recorrido original, mitad a cada
lado, en este caso 1 a cada extremo.
Sumamos el nmero 1 al valor mximo: 189 + 1 = 190 y restamos el nmero 1 al
valor mnimo: 151 - 1 = 150.
A partir de este valor 150 agregamos sucesivamente la amplitud 5 y obtenemos los
puntos de divisin que determinan los 8 intervalos (ver figura 1.2).
150

155

160

165

170

175

180

185

190

Figura 2.4

Sin embargo una dificultad se presenta cuando algunos de los datos coincide con
cualquiera de los puntos de divisin: 150, 155, 160, 165, 170, 175, 180, 185 y 190.
5. Supongamos que un dato es 155 donde lo colocamos?- en el primer intervalo
cuyos extremos son 150 y 155?- (ver Fig. 2.1) en el segundo intervalo que tiene
por extremos 155 y 160?Para aclarar est ambigedad adoptamos, el intervalo abierto por la izquierda que no
incluye al valor 150 (lmite inferior del intervalo) y cerrado por la derecha que
incluye al valor 155 (lmite superior del intervalo). Este tipo de intervalo se
representa matemticamente por: ( Y i 1 Y i , donde Y i 1 representa el lmite inferior
del intervalo y Y i representa el lmite superior.
As, en nuestro ejemplo el primer intervalo lo escribiremos como
Por tanto los intervalos de clase quedan definidos como:

( 150 155

Intervalo
de clases

(150 - 155]

(180 - 185]

(155 - 160]

(160 - 165]

(165 - 170]

(170 - 175]

(170 - 180]

(185 - 190]

Nota.- Tambin existen otros dos tipos de intervalos de clases, definidas como:
( Y i 1 Y i )

Intervalo abierto. Los lmites son abiertos e indican que la clase


contiene valores superiores al lmite inferior y valores inferiores al lmite superior.
[ Y i 1 Y i )

Intervalo semi-cerrado. Este intervalo es cerrado por la izquierda


(incluye al lmite inferior del intervalo) y abierto por la derecha (no incluye al lmite
superior del intervalo).

Y i 1

Intervalo cerrado. Este intervalo incluye a ambos lmites del intervalo.

6. Es conveniente que todos y cada uno de los datos que se hallen dentro de un
mismo intervalo, estn representados por un mismo valor. Este valor caracteriza a la
clase y por eso se llama marca de clase, se obtiene promediando los lmites de cada
intervalo. Una formula para calcular la marca de clase o punto medio de un intervalo
es:
Yi

Y i 1 Y i
2

7. A continuacin debemos realizar la clasificacin y conteo de los datos (ver tabla


1.2), es decir, colocar cada uno de ellos dentro de su clase, todos representados por
un mismo signo: una tarja.
Tabla 2.7.
Intervalo de clase
( Y i 1 Y i

150
155
160
165
170
175
180
185

155
160
165
170
175
180
185
190

Marca de clase
Yi

Conteo

Frecuencia
ni

152.5
157.5
162.5
167.5
172.5
177.5
182.5
182.5

A continuacin presentamos la tabla 2.8, conocida como tabla de distribucin de


frecuencias absolutas.

Tabla. Distribucin de frecuencias de 100 alumnos de la Universidad Nacional de


Piura, segn su estatura (en cm.). Oficina de Bienestar Universitario.
Setiembre de 2007.
Intervalo de clase

Marca de clase

( Y i 1 Y i

Yi

150 - 155
155 - 160
160 - 165
165 - 170
170 - 175
175 - 180
180 - 185
185 - 190
Total

Frecuencia Frecuencia Frecuencia


relativa
acumulada
ni

152.5
157.5
162.5
167.5
172.5
177.5
182.5
187.5

4
5
12
33
17
16
9
4
100

0.04
0.05
0.12
0.33
0.17
0.16
0.09
0.04
1.00

4
9
21
54
71
87
96
100

Frecuencia
acumulada

0.04
0.09
0.21
0.54
0.71
0.87
0.96
1.00

Fuente.- Registro de la atencin medica de la Oficina de Bienestar Universitario de


la UNP. 24 de setiembre de 2007.

1. Frecuencia absoluta: (ni )


Llamaremos frecuencia absoluta de un valor xi de la variable estadstica X, al
nmero de veces aparece repetido dicho valor en el conjunto de las observaciones
realizadas.
k

Propiedad.

n1 n

i 1

2. Frecuencia absoluta acumulada: (Ni )


La frecuencia absoluta de un valor xi de la variable X es igual a la suma de los
valores inferiores o iguales a dicho valor evidentemente. As, la frecuencia
absoluta acumulada del ultimo valor ser n (donde n = nmero de observaciones
realizadas).
i

n1 n

j1

Propiedad.

i 1

ni

, de donde

ni N1 N

i 1

3. Frecuencia relativa: (hi )


Llamaremos frecuencia relativa de un valor observado xi de la variable X, al
cociente entre su frecuencia absoluta y el nmero de observaciones realizadas
(n), y se denota por:
hi

ni

0 hi 1

i 1, 2, ..., k. .

n
k

Propiedad.

h1 h

i 1

4. Frecuencia relativa acumulada: (Hi )


Se llama frecuencia relativa acumulada de un valor x i de la variable X, al
cociente entre su frecuencia absoluta acumulada y el nmero de observaciones
realizadas (n), y se denota por:
i

Propiedad.

i 1

N
n

j1

j1

n
n

i
j

j1

hi

Interpretacin.
n2 = 5, significa que 5 alumnos tienen una estatura mayor de 155 cm. y menor o igual
a 160 cm.
N4 = 54, significa que 54 alumnos tienen una estatura mayor que 150 cm. y menor o
igual que 170 cm., o tambin significa que 54 alumnos tienen una estatura menor o
igual a que 170 cm.
h3 = 0.12, significa que el 12% de los alumnos tienen una estatura mayor de 160 cm.
y menor o igual a 165 cm.
H6 = 0.87, significa que el 87% de los alumnos tienen una estatura mayor que 150
cm. y menor o igual que 180 cm., o tambin significa que 87% de los alumnos tienen
una estatura menor o igual a que 180 cm.
N6 - N2 = 87 - 9 = 78 alumnos tienen una estatura mayor que 160 cm. Y menor o
igual que 180 cm.
Observacin 1.
1. Cuando el tamao de la muestra n < 25, el nmero de intervalos de clases a
considerar debe ser K=5; y K n , si n > 25.
2. Los limites reales de clase, se calculan dependiendo de si los lmites de los
intervalos son abiertos o cerrados.
3. Si los intervalos son cerrados o abiertos en ambos lmites, la marca de clase se
calcula como el promedio de los lmites superior e inferior de cada intervalo. Si los
lmites de clases son diferentes (inferior cerrado y superior abierto, o viceversa) la
marca de clase se obtiene promediando el lmite inferior (o superior) con el mismo
limite que lo precede.
1.14. Distribucin de frecuencias: Variable cualitativa
Supongamos que en una muestra de n unidades estadsticas se observan k categoras
o modalidades diferentes C1, C2,..., Ck, de alguna variable cualitativa X. Para
ilustrar la tabulacin de la distribucin de frecuencias por categoras, consideremos
el siguiente ejemplo.

Ejemplo. En una encuesta de opinin acerca de las preferencias de una marca de


bebidas gaseosas por sus colores: Negro (N), Blanco (B), Rojo (R), 20 consumidores
dieron las siguientes respuestas:
B, N, N, B, R, N, N, B, B, N, B, N, N, R, B, N, B, R, B, N.
Construir la distribucin de frecuencias.
Solucin.
La tabulacin de estos datos, donde la variable cualitativa es X: Color de bebida
gaseosa, es la distribucin de frecuencias de la tabla 2.9.
Tabla. Distribucin de personas por su color preferido de la bebida gaseosa.
Color de
Bebida
Blanco (B)
Negro (N)
Rojo (R)
Total

Nmero de
Consumidores: ni
8
9
3
20

Frecuencias
relativas: hi
0.40
0.45
0.15
1.00

Frecuencias
Porcentajes: hi(%)
40
45
15
100

Fuente.- Datos obtenidos de la encuesta realizada.

1.15. Representacin grfica de las distribuciones de frecuencias.


La presentacin de datos a travs de tablas estadsticas es una actividad importante
dentro de los sistemas de informacin general, estas se fortalecen significativamente
cuando se la acompaan con grficos descriptivos e ilustrativos. En el contexto de
los sistemas de informacin, en ms de una oportunidad se encontrar que un buen
grfico resume y expresa mucho ms que prrafos completos de comentarios e
interpretaciones literales.
En general la representacin grfica de una tabla de frecuencias permite percibir con
mayor claridad algunas caractersticas de la masa de datos que se investiga. Por ello,
a travs de grficos, resulta bastante ms fcil transmitir conclusiones a personas no
habituadas a la interpretacin de tablas de frecuencias.
Grfico de la distribucin sin intervalos.
La representacin grfica ms comn para este tipo distribucin de frecuencias es el
diagrama de barras que consiste en trazar en cada valor distinto de la variable,
segmentos de lneas proporcionales a su frecuencia.

Nmero de hijos por familia


8

N m er o de fa m ilia s

0
0

Nmero de hijos

Figura 2.5. Diagrama de barras para los datos de la tabla 2.9.

Grfico de la distribucin por intervalos.


Los grficos ms usadas son: Histograma, Polgono de frecuencias y polgono de
frecuencias acumuladas u ojiva.
a) Histograma.
Es una representacin grfica de una distribucin de frecuencias agrupadas en
intervalos de clase, mediante una serie de rectngulos contiguos que tienen:

Estatura de los alumnos de la UNP

Nmero de alumnos

40

30

20

10

0
150 155 160 165 170 175 180 185 190
Estatura en cm.

Figura 2.6. Histograma de frecuencias del alumnos segn su estatura, ver tabla 2.8.

b) Polgono de frecuencias.
Cuando la variable est agrupada en intervalo de clase, el polgono de frecuencia
se obtiene uniendo los puntos medios de las bases superiores de cada rectngulo
en el histograma.

Estatura de los alumnos de la UNP

Nmero de alumnos

40

30

20

10

0
147.5 152.5 157.5 162.5 167.5 172.5 177.5 182.5 187.5 192.5

Estatura en cm.
Figura 2.7. Polgono de frecuencias de la estatura de los alumnos de la tabla 2.8.

c) Polgono de frecuencias acumuladas u ojivas.


Est representacin es vlida para variables estadsticas agrupadas en intervalos
de clase. En el eje de las abscisas representamos los distintos intervalos de clase
que han de estar naturalmente traslapados. En el extremo superior de cada
intervalo se levanta una vertical con altura igual a la frecuencia (absoluta o
relativa) acumulada, luego se unen los extremos superiores de las verticales con
segmentos rectilneos. As el polgono de frecuencias acumuladas absolutas
alcanzar su mxima altura en el ltimo intervalo.

Estatura de los alumnos de la UNP

Nmero de alumnos

100
80
60
40
20
0
150

155

160

165

170

175

180

185

190

Estatura en cm.
Figura 2.8. Polgono de frecuencias acumuladas Menor o igual que para la estatura
de los alumnos de la tabla 2.8.

Grfico para la distribucin de frecuencia de variable cualitativa.


Los grficos ms comunes para la distribucin de frecuencias de variable cualitativa
son el de diagrama de rectngulos y el de sectores circulares.
En un Diagrama de rectngulos los datos de cada una de las modalidades
(caracteres cualitativos) se representa por un rectngulo vertical (u horizontal), cuya
altura (o largo) es proporcional a su frecuencia (absoluta o relativa). Los rectngulos
se dibujan dejando un espacio entre ellos.
Ejemplo 2.36. Abriendo la ventana Descripcin, escogiendo Datos cualitativos
Tabulacin y finalmente en el icono Opciones grficas seleccionar Diagrama de
barras para obtener el diagrama de rectngulos para los datos de la tabla 2.9.

Diagrama de rectangulos para las bebidas gaseosas de acuerdo a su color.

N m e ro d e p e rso n a s

10
8
6

4
2
0
Blanco

Negro

Rojo

Color de las bebidas gaseosas

Figura 2.9. Diagrama de rectngulos para los datos de la tabla 2.9.

En un grfico circular, los datos de cada categora se representan por un sector


circular. Es utilizado principalmente cuando se pretende comparar cada valor de la
variable con el total. Para construir se divide el circulo en sectores, cuyas reas sern
proporcionales a los valores de la variable. Est divisin es obtenida a travs de la
regla de 3 simples.
Total 360o
Parte xo
Ejemplo 2.37. Construir el diagrama de sectores para la informacin contenida en la
tabla 2.9. Abriendo la ventana descripcin, escogiendo Datos cualitativos
Tabulacin y finalmente en el icono Opciones grficas seleccionar Diagrama de
sectores.
Tabla auxiliar.
Color de
Bebida
Blanco (B)
Negro (N)
Rojo (R)
Total

Nmero de
Consumidores: ni
8
9
3
20

Frecuencias Frecuencias
relativas: hi Porcentajes: hi(%)
0.40
40
0.45
45
0.15
15
1.00
100

Sector circular:
en grado
144.0
162.0
54.0
360.0

Diagrama de Sectores de para las gaseosas, segn su color de preferencia.


Color de preferencias

15.00%
Blanco
Negro
Rojo

40.00%

45.00%

Figura 3.10. Diagrama de sectores circulares para los datos de la tabla 2.9.

Observacin 2. (Intervalos de clases de tamaos desiguales). Es muy comn el


uso de intervalos de clases con tamaos desiguales en el agrupamiento de los datos
en tablas de frecuencias. En estos casos se deber tomar algunos cuidados especiales
en cuanto al anlisis y construccin del histograma.

Un primer cuidado es construir una columna que indique las amplitudes c i de


cada clase.

Un segundo paso es la construccin de la columna de las densidades de


frecuencias en cada clase, que es obtenido dividiendo las frecuencias relativas
h i por las amplitudes c i. Esto es, una medida que indique cul es la
concentracin por unidad de variable.

También podría gustarte