Está en la página 1de 10

ESTADÍSTICA

INTRODUCCIÓN

El gerente de producción del Dalmont Carpet Company es


responsable de la fabricación de alfombras en más 500 telares. Para
no tener que medir la producción diría (en yardas) de cada telar, toma
una muestra de 30 telares cada día, con lo que llega a una conclusión
respecto a la producción promedio de alfombras de las 500 máquinas.
La tabla que se presenta más adelante exhibe la producción de cada
uno de los 30 telares de la muestra. Estas cantidades son los datos
sin procesar a partir de los cuales el director de producción puede
sacar conclusiones acerca toda la población de telares en su
desempeño el día anterior.

16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.9
15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0
16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3
Producción en yardas de 30 telares para alfombra

El vicepresidente de mercadotecnia de una cadena de


restaurantes de comida rápida está estudiando el
desarrollo de las ventas de las 100 sucursales que se
encuentran en el distrito oriental y ha elaborado la
siguiente distribución de frecuencias para las ventas
anuales:

El vicepresidente desea comparar las ventas del distrito


oriental con las ventas de otros tres distritos del país.
Para llevar a cabo esto, hará un resumen de la
distribución, poniendo especial cuidado en el acopio de
información sobre la tendencia central de los datos. En
este capítulo analizaremos también cómo se puede medir
la variabilidad de una distribución y, por tanto, cómo
obtener una percepción mucho mejor de los datos.

Mediante los métodos estadísticos podemos ayudar al gerente en producción y al


vicepresidente de mercadotecnia a llegar a conclusiones correctas para la toma de
decisiones.
ESTADÍSTICA

La Estadística se ocupa de los métodos científicos que se utilizan para recolectar, organizar,
resumir, presentar y analizar datos así como para obtener conclusiones razonables con base
en este análisis.

El término Estadística también se usa para denotar los datos o los números que se obtienen de
esos datos; por ejemplo, los promedios. Así, se habla de estadística de empleo, estadística de
accidentes, etcétera.

VARABLES: DISCRETAS Y CONTINUAS

Una variable es un símbolo; por ejemplo, X, Y, H , x o B, que puede tomar cualquiera de los
valores de determinado conjunto al que se le conoce como dominio de la variable que solo
puede tomar un valor se le llama constante.

Una variable que puede tomar cualquiera de los valores entre dos números dados es una
variable continua; de lo contrario es una variable discreta.

EJEMPLO 1: La cantidad N de hijos que tiene una familia puede tomar los valores 0, 1, 2, 3,
…, pero no puede tomar valores como 2.5 o 3.842; esta es una variable discreta.

EJEMPLO 2: La estatura H de una persona que puede ser 62 pulgadas (in), 63.8 in o 65.8341
in, dependiendo de la exactitud con que se mida, es una variable continua.

Los datos descritos mediante una variable discreta son datos discretos y los datos descritos
mediante una variable continua son datos continuos. Un ejemplo de datos discretos es la
cantidad de hijos que tiene cada una de 1 000 familias, en tanto que un ejemplo de datos
continuos son las estaturas de 100 estudiantes universitarios. En general, una medición
proporciona datos continuos; en cambio, una enumeración o un conteo proporciona datos
discretos.

Es útil ampliar el concepto de variable a entidades no numéricas; por ejemplo, en el arco iris,
color C es una variable que puede tomar los “valores” rojo, anaranjado, amarillo, verde, azul,
índigo o violeta. Estas variables se pueden reemplazar por números; por ejemplo, se puede
denotar rojo con 1, anaranjado con 2, etcétera.
POBLACIÓN Y MUESTRA; ESTADÍSTICA INDUCTIVA (O INFERENCIAL) Y ESTADÍSTICA
DESCRIPTIVA

Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Podemos


recopilar el número de teléfonos que diferentes empleados instalan en un día dado o el número
de teléfonos que instala un trabajador dado durante un día en un periodo de varios días, y
podemos llamar datos a estos resultados. Una colección de datos se conoce como conjuntos
de datos; una sola observación es un dato puntual.

Cuando se recolectan datos sobre las características de un grupo de individuos o de objetos,


por ejemplo, estatura y peso e los estudiantes de una universidad o cantidad de pernos
defectuosos y no defectuosos producidos en determinado día en una fábrica, suele ser
imposible o poco práctico observar todo el grupo, en especial si se trata de un grupo grande.
En vez de examinar todo el grupo, al que se le conoce como población o universo, se examina
solo una pequeña parte del grupo, al que se le llama muestra.

Las poblaciones pueden ser finitas o infinitas. Por ejemplo, la población que consta de todos
los pernos producidos determinado día en una es finita, en tanto que la población que consta
de todos los resultados (cara o cruz) que se pueden obtener lanzando una y otra vez una
moneda es infinita. Si la muestra es representativa de la población, el análisis de la muestra
permite inferir conclusiones validas acera de la población. A la parte de la estadística que se
ocupa de las condiciones bajo la cuales tales inferencias son válidas se le llama estadística
inductiva o inferencial. Como estas inferencias no pueden ser absolutamente ciertas, para
presentar estas conclusiones se emplea el lenguaje de la probabilidad.

A la parte de la Estadística que únicamente trata de describir y analizar un grupo dado, sin
sacar ninguna conclusión ni hacer inferencia alguna acerca de un grupo más grande, se le
conoce como estadística descriptiva o deductiva.

GRAFICAS

Una gráfica es una representación visual de la relación entre las variables. En estadística,
dependiendo de la naturaleza de los datos y del propósito que se persiga, se emplean distintos
tipos de graficas: graficas de barras, de pastel, pictogramas, etc. A las gráficas también se les
suele llamar cartas o diagramas. Así, se habla de cartas de barras, diagramas de pastel, etc.
DATOS EN BRUTO

Los datos en bruto son los datos recolectados que aún no se han organizado. Por ejemplo, las
estaturas de 100 estudiantes tomados de la lista alfabética de una universidad.

ORDENACIONES

Ordenación se le llama a los datos numéricos en bruto dispuestos en orden creciente o


decreciente de magnitud. A la diferencia entre el número mayor y el número menor se le
conoce como el rango de los datos. Por ejemplo, si la estatura mayor en los 100 estudiantes es
74 pulgadas (in) y la menor es 60 in, el rango es 74 – 60 = 14 pulgadas (in).

DISTRIBUCIONES DE FRECUENCIA

Al organizar una gran cantidad de datos en bruto, suele resultar útil distribuirlos en clase o
categorías y determinar la cantidad de datos que pertenece a cada clase; esta cantidad se
conoce como la frecuencia de clase. A la disposición tabular de los datos en clase con sus
respectivas frecuencias de clase se le conoce como distribución de frecuencia o tabla de
frecuencias. La tabla 2.1 es una distribución de frecuencias de las estaturas (registradas a la
pulgada más cercana), de 100 estudiantes de la Universidad XYZ.

A los datos organizados y resumidos se les llama datos agrupados. Aunque al agrupar los
datos se pierden muchos de los detalles originales de los datos, esto tiene la ventaja de que se
obtiene una visión general clara y se hacen evidentes las relaciones.
LA MARCA DE CLASE

La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los límites de
clase inferior y superior y dividiendo entre 2. Así, la marca de clase del intervalo 60-62 es (60 +
62)/2 = 61. A la marca de clase también se le conoce como punto medio de clase.
Para los análisis matemáticos posteriores, se supone que todas las observaciones que
pertenecen a un intervalo de clase dado coinciden con la marca de clase. Así, se considera que
todas las estaturas en el intervalo de clase 60-62 in son de 61 in.

INTERVALOS DE CLASE Y LÍMITES DE CLASE

Al símbolo que representa una clase, como 60-62 en la tabla 2.1, se le conoce como intervalo
de clase. A los números de los extremos, 60 y 62, se les conoce como límites de clase; el
número menor (60) es el límite inferior de clase, y el número mayor (62) es el límite superior de
clase. Los términos clase e intervalo de clase se suelen usar indistintamente, aunque el
intervalo de clase en realidad es un símbolo para la clase. Un intervalo de clase que, por lo
menos teóricamente, no tenga indicado el límite de clase superior o el límite de clase inferior,
se conoce como intervalo de clase abierto. Por ejemplo, al considerar grupos de edades de
personas un intervalo que sea “65 años o mayores” es un intervalo de clase abierto.

FRONTERAS DE CLASE

Si las estaturas se registran a la pulgada más cercana, el intervalo de clase 60-62 comprende
teóricamente todas las mediciones desde 59.5000 hasta 62.5000 in. Estos números que se
indican brevemente mediante los números exactos 59.5 y 62.5 son las fronteras de clase o los
límites de clase reales; el menor de los números (59.5) es la frontera inferior de clase y el

número mayor (62.5) es la frontera superior de clase. En la práctica, las fronteras de clase se
obtienen sumando el límite de un intervalo de clase al límite inferior del intervalo de clase
inmediato superior y dividiendo entre 2.

Algunas veces, las fronteras de clase se usan para evitar ambigüedades cuando se usa
notación, las fronteras de clase no deben coincidir con las observaciones. Por lo tanto, si una
observación es 62.5, no es posible decidir si pertenece al intervalo 59.5-62.5 o al intervalo 62.5-
65.5.

TAMAÑO O AMPLITUD DE UN INTERVALO DE CLASE


El tamaño, o la amplitud, de un intervalo de clase es la diferencia entre sus fronteras superior e
inferior y se le conoce también como amplitud de clase, tamaño de clase o longitud de clase. Si
en una distribución de frecuencia todos los intervalos de clase tienen la misma amplitud, esta
amplitud común se denota c. En este caso, c es igual a la diferencia entre los límites inferiores
de clases sucesivas o entre dos limites superiores de clase sucesivas.

HISTOGRAMAS Y POLÍGONOS DE FRECUENCIA

Los histogramas y los polígonos de frecuencia son dos representaciones graficas de las
distribuciones de frecuencias.

1. Un histograma o histograma de frecuencia consiste en un conjunto de rectángulos que tienen:


a) sus bases sobre un eje horizontal (el eje x), con sus centros coincidiendo con las marcas de
clase de longitudes iguales a la amplitud del intervalo de clase, y b) áreas proporcionales a las
frecuencias de clase.
2. Un polígono de frecuencia es una gráfica de línea que presenta las frecuencias de clase
graficadas contra las marcas de clase. Se puede obtener conectando los puntos medios de las
partes superiores de los rectángulos de un histograma.
DISTRIBUCIONES DE FRECUENCIAS RELATIVAS

La frecuencia relativa de una clase de una clase es la frecuencia de la clase dividida entre la
suma de las frecuencias de todas las clases y generalmente se expresa como porcentaje. Por
ejemplo, en la tabla 2.1, la frecuencia relativa de la clase 66-68 es 42/100 = 42%. Por supuesto,
la suma de las frecuencias relativas de todas las clases es 1, 0 100%.
Si en la tabla 2.1 las se sustituyen por frecuencias relativas, la tabla que se obtiene es una
distribución de frecuencias relativas, distribución porcentual o tabla de frecuencias relativas.
Las representaciones graficas de las distribuciones de frecuencia relativas se obtienen a partir
de los histogramas o polígonos de frecuencia, cambiando únicamente, en la escala vertical, las
frecuencias relativas y conservando la gráfica exactamente igual. A las gráficas que se
obtienen se les llama histogramas de frecuencias relativas (o histogramas porcentuales) y
polígonos de frecuencia relativas (o polígonos porcentuales), respectivamente.

A una tabla en la que se presentan las frecuencias acumuladas se le llama distribución de


frecuencias acumuladas, tabla de frecuencias acumuladas o simplemente distribución
acumulada, y se presenta en la tabla 2.2 para la distribución de las estaturas de los estudiantes
de la tabla 2.1.

Tabla 2.2

Estatura (in) Cantidad de estudiantes

Menos de 59.5 0

Menos de 62.5 5

Menos de 65.5 23

Menos de 68.5 65
Menos de 71.5 92

Menos de 74.5 100

Una gráfica que muestra las frecuencias acumuladas menores de cada frontera superior de
clase respecto a cada frontera superior de clase se le conoce como grafica de frecuencias
acumuladas u ojiva. En algunas ocasiones se desea considerar distribuciones de
frecuencias mayores o iguales que la frontera inferior de cada intervalo de clase. Como en
ese caso se consideran las estaturas de 59.5 in o más, de 62.5 in o más, ect., a estas
distribuciones se les suele llamar distribuciones acumuladas “o más que”, en tanto que las
distribuciones consideradas antes son distribuciones acumuladas “o menos que”. Una puede
obtenerse fácilmente de la otra. A las ojivas correspondientes se les llama ojivas “más que”
y ojivas “menos que”. Aquí, siempre que se hable de distribuciones acumuladas o de ojivas,
sin más, se tratara del tipo “menos que”.

DISTRIBUCIONES DE FRECUENCIAS ACULADAS RELATIVAS Y OJIVAS


PORCENTUALES

La frecuencia acumulada relativa o frecuencia acumulada porcentual es la frecuencia


acumulada dividida entre la suma de todas las frecuencias (frecuencia total). Por ejemplo, la
frecuencia acumulada relativa de las de las estaturas menores que 68.5 in es 65/100 = 0.65
o 65%, lo que significa que 65% de los estudiantes menores a 68.5 in. Si en la tabla 2.2 se
emplean las frecuencias acumuladas relativas en lugar de las frecuencias acumuladas, se
obtiene una distribución de frecuencias acumuladas relativas (o distribución acumulada
porcentual) y una gráfica de frecuencias acumuladas relativas (u ojiva porcentual),
respectivamente.

DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS Y OJIVAS

A la suma de todas las frecuencias menores que la frontera superior de un intervalo de clase
dado se le llama frecuencia acumulada hasta ese intervalo de clase inclusive. Por ejemplo,
en la tabla 2.1, la frecuencia acumulada hasta el intervalo de clase 66-68 inclusive es 5 + 18
+ 42 = 65, lo que significa que 65 estudiantes tienen una estatura menor a 68.5 in.

CURVAS DE FRECUENCIAS Y OJIVAS SUAVIZADAS

Suele considerarse que los datos recolectados pertenecen a una muestra obtenida de una
población grande. Como de esta población se pueden obtener muchas observaciones,
teóricamente es posible (si son datos continuos) elegir intervalos de clase muy pequeños y,
a pesar de eso, tener un número adecuado de observaciones que caigan en cada clase.
De esta manera, cuando se tienen poblaciones grandes puede esperarse que los polígonos
de frecuencias, o los polígonos de frecuencia relativa, correspondiente a estas poblaciones
estén formados por una gran cantidad de pequeños segmentos de recta de manera que sus
formas se aproximen a las de unas curvas, a las cuales se les llama curvas de frecuencias o
curvas de frecuencias relativas, respectivamente. Es razonable esperar que estas curvas
teóricas puedan ser aproximadas suavizando los polígonos de frecuencias o los polígonos
de frecuencias relativas de la muestra; esta aproximación mejorara a medida que aumenta el
tamaño de la muestra. Esta es la razón por la que las curvas de frecuencias se les suele
llamar polígonos de frecuencias suavizados. De igual manera, suavizando las gráficas de
frecuencia acumuladas u ojivas, se obtienen ojivas suavizadas. Por lo general, es más fácil
suavizar una ojiva que un polígono de frecuencias.

TIPOS DE CURVAS DE FRECUENCIA

1. Las curvas simétricas o en forma de campana se caracterizan porque las


observaciones equidistantes del máximo central tienen la misma frecuencia. Las
estaturas tanto de hombres como de mujeres adultos tienen distribuciones en forma
de campana.
2. Las curvas que tienen colas hacia la izquierda se dice que son sesgadas a la
izquierda. Pocos mueren jóvenes y la mayoría muere entre los 60 y los 80 años. En
general, las mujeres viven en promedio diez años más que los hombres.
3. Las curvas que tienen colas hacia la derecha se dice son sesgadas a la derecha. Las
curvas de las edades a las que se casan tanto hombres como mujeres son sesgadas
a la derecha. La mayoría se casa entre los veinte y treinta años y pocos se casan
alrededor de cuarenta, cincuenta, sesenta o setenta años.
4. Las curvas que tienen aproximadamente las mismas frecuencias para todos sus
valores se dice que son curvas distribuidas uniformemente. Por ejemplo, las
máquinas dispensadoras de refrescos lo hacen de manera uniforme entre 15.9 y 16.1
onzas.
5. Las curvas de frecuencia en forma de j o en forma de j inversa son curvas en las que
el máximo se presenta en uno de sus extremos.
6. Las curvas de frecuencia en forma de u son curvas que tienen un máximo en cada
extremo y un mínimo en medio.
7. Las curvas bimodales son curvas que tienen dos máximos.
8. Las curvas multimodales tienen más de dos máximos.

También podría gustarte