Está en la página 1de 9

UNIDAD 3 ESTADISTICA DESCRIPTIVA

Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta parte
se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su
presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos
parámetros útiles para la explicación de la información.

La Estadística Descriptiva es la parte que conocemos desde los cursos de educación primaria, que se
enseña en los siguientes niveles y que, por lo general, no pasa a ser un análisis más profundo de la
información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de
presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere
decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la
mayoría de la población humana, resulta de suma importancia considerar para así evitar malentendidos,
tergiversaciones o errores.

3.1 Conceptos básicos de estadística: Definición, Teoría de decisión, Población,


Muestra aleatoria, Parámetros aleatorios.
POBLACION es el conjunto de todos los sucesos susceptibles de aparecer en un problema y que interesan a
la persona que hace el estudio; y señalamos que una MUESTRA en un subconjunto de mediciones
seleccionadas de la población. La población según su tamaño puede ser: finita o infinita; y si nos referimos a
su número se toma como el tamaño de la población.

El concepto de infinita sólo existe en teoría pues en la práctica nos encontraremos aplicación a poblaciones de
elementos infinitos: Estrellas del universo (tiempo y costo). Se elige una MUESTRA lo suficientemente
representativa de la población.

Muestreo Aleatorio

Una muestra se dice que es extraída al azar cuando la manera de selección es tal, que cada
elemento de la población tiene igual oportunidad de ser seleccionado.

Una muestra aleatoria es también llamada una muestra probabilística son generalmente preferidas
por los estadísticos porque la selección de las muestras es objetiva y el error muestral puede ser
medido en términos de probabilidad bajo la curva normal.

Los tipos comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático,
muestreo estratificado y muestreo de conglomerados.

Parámetros aleatorios

Existen medidas para realizar descripciones cuantitativas de los conjuntos de datos, o poblaciones, y
de sus muestras, diferenciándose entre ellas las que se refieren a las mismas poblaciones y a las
muestras.

Para el caso de las POBLACIONES, las medidas que las describen se denominan PARÁMETROS,
y suelen estar representadas con letras griegas (por ejemplo u y O).

Por otro lado, para el caso de aquellas medidas que describen a una MUESTRA se les llama estadísticos o
estimadores, y son representados por letras de nuestro alfabeto (por ejemplo, x o s).
3.2 Descripción de datos: Datos agrupados y datos no agrupados, Frecuencia de
clase, Frecuencia relativa, Punto medio, Límites de clases.

DATOS AGRUPADOS Y NO AGRUPADOS.

TRATAMIENTO PARA DATOS NO AGRUPADOS.

¿A qué se refiere esto? Cuando la muestra que se ha tomado de la población o proceso que se desea
analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces estos datos son analizados sin
necesidad de formar clases con ellos y a esto es a lo que se le llama tratamiento de datos no agrupados.
TRATAMIENTO PARA DATOS AGRUPADOS.

Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de
estas determinar las características de la muestra y por consiguiente las de la población de donde fue
tomada.
Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana,
moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como
se agrupan los datos.

Pasos para agrupar datos.


a. Determinar el rango o recorrido de los datos.

Rango = Valor mayor – Valor menor

b. Establecer el número de clases (k) en que se van a agrupar los datos tomando como base para esto la
siguiente tabla.

Tamaño de muestra o No. De datos Número de clases


Menos de 50 5a7
50 a 99 6 a 10
100 a 250 7 a 12
250 en adelante 10 a 20

El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para establecer el número de
clases en las que se van a agrupar los datos, existen otros para hacerlo.

c. Determinar la amplitud de clase para agrupar (C).

Rango
C=
k
d. Formar clases y agrupar datos.
Para formar la primera clase, se pone como límite inferior de la primera clase un valor un poco menor que
el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta
manera el límite superior de la primera clase, luego se procede a obtener los límites de la clase siguiente y
así sucesivamente.
OTROS TEMAS PARA ENTENDER LO UTIL DE TENER DATOS AGRUPADOS Y NO AGRUPADOS,ASÍ
COMO TAMBIÉN LOS DIFERENTES TIPOS DE FRECUENCIAS.

Distribución de frecuencia para datos no Agrupados:

Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de
ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades
originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de
frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente
reagrupados, siguiendo un orden lógico con sus respectivas frecuencias.

Distribución de frecuencia de clase o de datos Agrupados:

Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en
clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del
conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar
cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el
número total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos es mayor
de 20, entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo
de distribución cuando se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o
la ojiva.

La razón fundamental para utilizar la distribución de frecuencia de clases es proporcionar mejor comunicación
acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en
clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación
sea manejable con mayor facilidad.

Punto medio o Marca de clase

El centro de la clase, es el volar de los datos que se ubica en la posición central de la clase y representa todos
los demás valores de esa clase. Este valor se utiliza para el calculo de la media aritmética.

Frecuencia de clase

La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el número total
de valores de las variables que se encuentran presente en una clase determinada, de una distribución de
frecuencia de clase.

Frecuencia Relativa

La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribución de
frecuencia de clase entre el número total de datos(N) de la serie de valores. Estas frecuencias se designan
con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).

Frecuencias acumuladas

Las frecuencias acumuladas de una distribución de frecuencias son aquellas que se obtienen de las sumas
sucesivas de las fi que integran cada una de las clases de una distribución de frecuencia de clase, esto se
logra cuando la acumulación de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar
la ultima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias acumuladas pueden ser
menor que (fa que) y frecuencias acumuladas mayor que (faque).
Frecuencia acumulada relativa

La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las fa de las diferentes clases
que integran una distribución de frecuencia de clase entre el número total de datos (N) de la serie de valores,
estas frecuencias se designan con las letras far. Si las far se multiplican por 100 se obtienen las frecuencias
acumuladas relativas porcentuales y las mismas se designan así: far %

3.3 Medidas de tendencia central: Media aritmética, media geométrica y media


ponderada, Mediana, Moda, Medidas de dispersión, Varianza, Desviación
estándar, Desviación media, Desviación mediana, Rango.

Medidas de tendencia central.

Se les llama medidas de tendencia central a la media aritmética, la mediana, la media geométrica, la moda,
etc. debido a que al observar la distribución de los datos, estas tienden a estar localizadas generalmente en
su parte central. A continuación definiremos algunas medidas de tendencia central y la forma de calcular su
valor.

Media aritmética (x ). También se le conoce como promedio ya que es el promedio de las lecturas o
mediciones individuales que se tienen en la muestra, se determina con la fórmula siguiente:
n

− ∑x i
x = i =1
n donde:

x = media aritmética

xi = dato i

n = número de datos en la muestra

Ejemplos:

1. Se han tomado como muestra las medidas de seis cables usados en un arnés para lavadora, las
cuales son; 15.2 cm, 15.0, 15.1, 15.2, 15.1 y 15.0, determine su media aritmética.

Solución:

− 15.2 + 15.0 + 15.1 + 15.2 + 15.1 + 15.0


x= = 15.1cm
6
Media geométrica (G). Es la raíz en enésima del producto de los valores de los elementos de la muestra, es
usada cuando los valores de los datos de la muestra no son lineales, es decir que su valor depende de varios
factores a la vez, se determina de la siguiente forma:

G = n x1 * x2 * ...* xn Donde:

G = media geométrica

xi = dato i

n = número de datos en la muestra

Ejemplo:

1. Las siguientes temperaturas han sido tomadas de un proceso químico, 13.4oC, 12.8, 11.9, 13.6,
determine la temperatura promedio de este proceso.

Solución: G=
4
13.4 x12.8 x11.9 x13.6 = 4 27758.7968 = 12.9077 oC

Media aritmética ponderada ( xw ). Esta media se usa cuando el peso que tiene cada uno de los datos de la
muestra es diferente, se calcula de la siguiente manera:
k

∑ wi xi
xw = i =1
k

∑ wi
i =1
donde:

xw = media aritmética ponderada

xi = dato i

wi = peso del dato i

Media armónica (H). La media armónica se define como el recíproco del promedio de los recíprocos de cada
uno de los datos que se tienen en la muestra, y

se determina de la siguiente manera:

1 n
H = n
= n
1 / n∑1 / xi ∑1 / xi
i =1 i =1

Ejemplo: Determine la media armónica de los siguientes datos, 3.1, 2.8, 2.84, 3.05, 3.09

5
H = =
Solución: 1 / 3.1 + 1 / 2.8 + 1 / 2.84 + 1 / 3.05 + 1 / 3.09
5 5
= = = 2.9703
0.3226 + 0.3571 + 0.3521 + 0.3279 + 0.3236 1.6833

Mediana (xmed). La mediana es aquel valor que se encuentra en la parte central de los datos que se tienen en
la muestra una vez que estos han sido ordenados según su valor o magnitud. Para calcular la mediana se
presentan dos casos:

Ejemplo:

Los siguientes datos son las mediciones obtenidas de un circuito utilizado en un arnés de lavadora; se toman
como muestra siete circuitos y sus mediciones son: 11.3, 11.2, 11.5, 11.2, 11.2, 11.4, 11.5 cm.

Solución:Ordenando los datos de menor a mayor valor;

11.2, 11.2, 11.2, 11.3, 11.4, 11.5, 11.5

Moda (xmod). La moda se define como aquel valor o valores que más se repiten o que tienen mayor
frecuencia entre los datos que se han obtenido en una muestra, la muestra de una población nos genera la
distribución de los datos una vez que estos se han graficado y en esta gráfica es posible observar la moda o
modas de la misma, es por esto que una distribución de datos puede ser amodal (carece de moda), unimodal
(tiene una sola moda), bimodal (tiene dos modas) o polimodal (tiene más de dos modas).

Medidas de Dispersión.

Cuando se tiene una muestra de datos obtenida de una población cualquiera, es importante determinar sus
medidas de tendencia central así como también es básico el determinar que tan dispersos están los datos en
la muestra, por lo que se hace necesario determinar su rango, la varianza, la desviación estándar, etc., ya que
una excesiva variabilidad o dispersión en los datos indica la inestabilidad del proceso en análisis en la mayoría
de los casos.

3.5 Parámetros para datos agrupados.


TRATAMIENTO PARA DATOS AGRUPADOS.

Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases y a partir de
estas determinar las características de la muestra y por consiguiente las de la población de donde fue tomada.

Antes de pasar a definir cuál es la manera de determinar las características de interés (media, mediana,
moda, etc.) cuando se han agrupado en clases los datos de la muestra, es necesario que sepamos como se
agrupan los datos.

Pasos para agrupar datos.

*Determinar el rango o recorrido de los datos. Rango = Valor mayor – Valor menor

* Establecer el número de clases (k)en que se van a agrupar los datos


3.6 Distribución de frecuencias.
Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos
estadísticos, asignando a cada dato su frecuencia correspondiente.

Tipos de frecuencia

Frecuencia absoluta.-La frecuencia absoluta es el número de veces que aparece un determinado valor en un
estudio estadístico. Se representa por fi. La suma de las frecuencias absolutas es igual al número total de
datos, que se representa por N.

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de
datos. Se puede expresar en tantos por ciento y se representa por ni.

Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al
valor considerado.

Se representa por Fi.

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el


número total de datos. Se puede expresar en tantos por ciento.

3.7 Técnicas de agrupación de datos


3.8 Técnicas de muestreo.

Muestreo

Es el procedimiento mediante el cuál seleccionamos una muestra representativa de la población


objeto de estudio.

El diseño y la elección de la muestra de estudio

El paso siguiente que debe resolver el investigador es el del diseño y la elección de la muestra.
Ambas acciones está íntimamente unidas puesto que dependiendo del diseño que utilice el
investigador así será la elección de los sujetos de estudio. Los elementos, personas, fenómenos,
constituyen la muestra de la investigación. Estos elementos forman parte de un grupo de conceptos
básicos que conviene clarificar y que deben ser definidos en cada investigación.

Conceptos Básicos

 Universo

Es la serie real o hipotética de elementos que comparten


unas características definidas relacionadas con el problema
de investigación.

 Población

Es un conjunto definido, limitado y accesible del universo


que forma el referente para la elección de la muestra. Es el
grupo al que se intenta generalizar los resultados.

 Muestra

Conjunto de individuos extraído de la población a partir de


algún procedimiento específico. Los valores que obtenemos
del análisis estadístico de la muestra se denominan
estadígrafos o estadísticos.

 Elemento o individuo (muestral)

Es la unidad más pequeña en la que podemos descomponer


la muestra, la población o el universo. Esta unidad puede ser
una persona, un grupo, un centro, etc. La identificación de
este elemento está en función del problema de
investigación.

3.9 HISTOGRAMA
El histograma es una gráfica de barras que permite describir el comportamiento de un conjunto de datos en
cuanto a su tendencia central, forma y dispersión. El histograma permite que de un vistazo se pueda tener
una idea objetiva sobre la calidad de un producto, el desempeño de un proceso o el impacto de una acción
de mejora. La correcta utilización del histograma permite tomar decisiones no solo con base en la media, sino
también con base en la dispersión y formas especiales de comportamiento de los datos. Su uso cotidiano
facilita el entendimiento de la variabilidad y favorece la cultura de los datos y los hechos objetivos

CONSTRUCCION DE UN HISTOGRAMA.

Para decidir correctamente y detectar posibles anormalidades en los datos se procede a lo siguiente para
construir un histograma:

Paso 1. Determinar el rango de datos.La diferencia entre el dato máximo y el dato mínimo.

Paso 2. Obtener el numero de clases (NC) o barras.Ninguno de ellos es exacto, esto depende de cómo sean
los datos y cuantos sean . Un criterio usado es del numero de clases, debe ser aprox. Igual a la raíz cuadrada
del numero de datos.

Paso3. Establecer la longitud de clase (LC).Se establece de tal manera que el rango pueda ser cubierto en
su totalidad por NC. Una forma directa de obtener la LC es dividiendo el rango entre el numero de clases,
LC= R/NC.

Paso 4. Construir los intervalos de clase. Resultan de dividir el rango (original o ampliado) en NC e intervalos
de longitud LC.

Paso 5. Obtener la frecuencia de cada clase. Se cuentan los datos que caen en cada intervalo de clase.

Paso 6.Graficar el histograma.

Se grafican en barras, en las que su base es el intervalo de clase y la altura sean las frecuencias de las
clases

EJEMPLO :

A una fabrica de envases de vidrio, un cliente le está exigiendo que la capacidad de cierto tipo de botella sea
de13 ml., con una tolerancia de más menos 1 ml.. La fábrica establece un programa de mejora de calidad
para que las botellas que se fabriquen cumplan con los requisitos del cliente.

Muestreo = 11,12,13,12,13,14,14,15,11,12,13,12,14,15,11,12,16,16,14,13,14,14,13,15,15

• 1. Rango : 16 –11 = 5
•  25 = 5 Clase Intervalo Frecuencia Frec. Relativa
• 3. 5/5 = 1
1 11,12 3 0,12
2 12,13 5 0,25
3 13,14 5 0,25
4 14,15 6 0,24
5 15,16 6 0,24
20 1,00