Está en la página 1de 21

Concepto de estadística descriptiva

La estadística descriptiva implica la abstracción de varias


propiedades del conjuntos de observaciones, mediante el empleo de
métodos gráficos, tabulares o numéricos. Entre estas propiedades
están la frecuencia con que se dan varios valores en la observación,
la noción de un valor típico o usual, la cantidad de variabilidad en un
conjunto de datos observados y la medida de relaciones entre 2 o
mas variables.

El campo de la estadística descriptiva no tiene que ver con las


implicaciones o conclusiones que se puedan deducir del conjuntos de
datos. La estadística descriptiva sirve como método para organizar
datos y poner de manifiesto sus características esenciales con el
propósito de llegar a conclusiones.

La presentación de la información estadística se puede realizar de


las formas siguientes:

 Textual (en forma de texto).


 Cuadros.
 Gráficos.

1.1 Población  y  muestra aleatoria


Población
Una población es un conjunto total de elementos en un contexto. Se llama tamaño
de la población al número de individuos que la componen, siendo cada posible
observación un individuo; así pues, las poblaciones pueden ser finitas e infinitas.

Población finita: La que tiene unas dimensiones contables, definidas.


Población infinita: La que tiene un elemento incontable de elementos.

Para estudiar una población existen dos posibilidades.


 1-Estudiar todos sus elementos y sacar conclusiones.
 2.-Estudiar sólo una parte de ellos, una muestra, elegidos de tal forma que nos
digan algo sobre la totalidad de las observaciones de la población.

Muestra: Parte  del todo que se analiza para  sacar información.

Muestra aleatoria: Parte de un todo que fue seleccionada de tal manera que cada
uno de sus elementos se obtuvo completamente al  azar.
Ejemplo: 1.1
Considera que en tu clase de Probabilidad y Estadística hay 54 alumnos en total
(población),y que nos interesa conocer el número de asistencias en el tercer
periodo, de forma rápida y confiable. Entonces, tomaremos una muestra
aleatoria de solamente 5 alumnos de este, luego sumamos sus respectivas
asistencias y las dividiremos entre 5. El resultado obtenido será  muy parecido al 
resultado que obtendrías al dividir la suma de todas las  asistencias de la
población entre l  54 alumnos.

Existen  los siguientes tipos de muestra aleatoria.

 Simple
Elegido el tamaño de la muestra, los elementos que la compongan se han de
elegir aleatoriamente entre los N de la población.
Con calculadora: se utilizan los números aleatorios

  Sistemático
 Se ordenan previamente los individuos de la población; después se elige uno de
ellos al azar,
 a continuación, a intervalos constantes, se eligen todos los demás hasta
completar la muestra.

 Estratificado
 Se divide la población total en clases homogéneas, llamadas estratos; por
ejemplo, por grupos de edades , por sexo. Hecho esto la muestra se escoge
aleatoriamente en número proporcional al de  los componentes de cada clase o
estrato.

1.2 Obtención de datos  estadísticos


Son números que pueden ser comparados, analizados e interpretados y el campo del cual
son tomados  se identifica como población o universo.

¿Para  qué necesitamos recolectar  datos?


Proporciona la introducción imprescindible para un estudio de investigación.
Medir el desempeño en un servicio o proceso de producción.
Ayudar  en la formulación de alternativas para la toma de decisiones.
Satisfacer nuestra curiosidad.

Hay, por lo menos, tres maneras de obtener datos y son los siguientes:
 Utilizar los datos publicados por fuentes gubernamentales, industriales o
particulares.
 A través de  la experimentación.
 Realizando encuestas.

1.3. Medidas de tendencia central.

1- Media aritmética

La media aritmética es la suma de todos los datos dividida entre el número total d
datos. Se calculan dependiendo de cómo vengan ordenados los datos.

La media aritmética de un grupo de datos se calcula así:

Se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos
productos, y el resultado dividirlo por la suma de los datos.

2- Moda

La moda de un conjunto de datos es el dato que más veces se repite, es decir, aqu


que tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos
valores de la variable que tengan la mayor frecuencia absoluta, habría dos modas.
no se repite ningún valor, no existe moda.

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el prome


de las dos puntuaciones adyacentes.

 
3- La mediana 

La mediana es el valor que ocupa el lugar central entre todos los valores del conju
de datos, cuando estos están ordenados en forma creciente o decreciente. 

La mediana se representa por  Me.

Calculo de la mediana:

 1° Ordenamos los datos de menor a mayor.

- La mediana de un conjunto con un número impar de datos es, una vez ordenados


los datos, el dato que ocupa el lugar central.

- También podemos usar la siguiente fórmula para determinar la posición del dato
central:

(n + 1) /2  = mediana datos impares.

- La mediana de un conjunto con un número par de datos es, una vez ordenados, la


media de los dos datos centrales.

4- Rango

El rango da la idea de proximidad de los datos a la media. Se calcula restando el d


menor al dato mayor.

Este dato permite obtener una idea de la dispersión de los datos, cuanto mayor es
rango, más dispersos están los datos de un conjunto.

 Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el rango es m


amplio, es conveniente agruparlos y ordenarlos en intervalos o clases.

La amplitud o tamaño de cada intervalo se puede calcular dividiendo el valor del


rango por la cantidad de intervalos que se desean obtener.

1.5. Medidas de dispersión.

Las medidas de dispersión muestran la variabilidad de una


distribución, indicando por medio de un número, si las diferentes
puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor, mayor será la variabilidad, cuanto menor sea,
más homogénea será a la media. Así se sabe si todos los casos son
parecidos o varían mucho entre ellos.

Para calcular la variabilidad que una distribución tiene respecto de su


media, se calcula la media de las desviaciones de las puntuaciones
respecto a la media aritmética. Pero la suma de las desviaciones es
siempre cero, así que se adoptan dos clases de estrategias para
salvar este problema. Una es tomando las desviaciones en valor
absoluto (desviación media) y otra es tomando las desviaciones al
cuadrado (varianza).

Rango estadístico

El rango o recorrido estadístico es la diferencia entre el valor máximo


y el valor mínimo en un grupo de números aleatorios. Se le suele
simbolizar con R.

Requisitos del rango

Ordenamos los números según su tamaño.

Restamos al valor máximo el valor mínimo.

Medio rango o Rango medio

El medio rango o rango medio de un conjunto de valores numéricos es


la media del mayor y menor valor. En consecuencia, el medio rango
es:
Varianza

La varianza es una medida estadística que mide la dispersión de los


valores respecto a un valor central (media), es decir, es el cuadrado
de las desviaciones:

Desviación típica

El resultado de la varianza a veces no es fácil de interpretar, ya que


se mide en unidades cuadráticas. Para evitar ese problema se define
otra medida de dispersión, que es la desviación típica, o desviación
estándar, que se halla como la raíz cuadrada positiva de la varianza.
La desviación típica informa sobre la dispersión de los datos respecto
al valor de la media; cuanto mayor sea su valor, más dispersos
estarán los datos. Esta medida viene representada en la mayoría de
los casos por S, dado que es la inicial de su nominación en inglés.

Desviación típica muestral

Desviación típica poblacional

Covarianza

La covarianza entre dos variables es un estadístico resumen


indicador de si las puntuaciones están relacionadas entre sí. La
formulación clásica, se simboliza por la letra griega sigma (σ) cuando
ha sido calculada en la población. Si se obtiene sobre una muestra,
se designa por la letra "".
La fórmula suele aparecer expresada como:

Este tipo de estadístico puede utilizarse para medir el grado de


relación entre dos variables si ambas utilizan una escala de medida a
nivel de intervalo/razón (variables cuantitativas).

La expresión se resuelve promediando el producto de las


puntuaciones diferenciales por su tamaño muestral (n pares de
puntuaciones, n-1 en su forma insesgada).

Este estadístico, refleja la relación lineal que existe entre dos


variables. El resultado numérico fluctúa entre los rangos de +infinito
a -infinito. Al no tener unos límites establecidos no puede
determinarse el grado de relación lineal que existe entre las dos
variables, solo es posible ver la tendencia.

Coeficiente de Correlación de Pearson

El coeficiente de correlación de Pearson, r, permite saber si el ajuste


de la nube de puntos a la recta de regresión obtenida es
satisfactorio. Se define como el cociente entre la covarianza y el
producto de las desviaciones típicas (raíz cuadrada de las varianzas).

Propiedades

El coeficiente de correlación, r, presenta valores entre –1 y +1.

Cuando r es próximo a 0, no hay correlación lineal entre las variables.


La nube de puntos está muy dispersa o bien no forma una línea recta.
No se puede trazar una recta de regresión.

Cuando r es cercano a +1, hay una buena correlación positiva entre


las variables según un modelo lineal y la recta de regresión que se
determine tendrá pendiente positiva, será creciente.
Cuando r es cercano a -1, hay una buena correlación negativa entre
las variables según un modelo lineal y la recta de regresión que se
determine tendrá pendiente negativa: será decreciente.

1.5 Tabla  de  distribucion de frecuencias


Las  distribuciones de frecuencias  son la forma  en que repartimos las frecuencias.
La  frecuencia es el número de veces que se repite una condición específica en un
conjunto de datos.
Generalmente ,las distribuciones de frecuencia se obtienen de tablas o listados de
información, donde no son claras ni detalladas la o las frecuencias o repeticiones de
ciertas condiciones, por lo que se  debe elaborar una  tabla que resuma la primera
información para que sea más fácil obtener las frecuencias y poderlas distribuir.

Ejemplo 1.8
Alumno A B C D E F G H I J K L M N O P Q R S

Calificacione 6 8 9 5 6 7 9 10 8 6 5 8 6 9 6 7 9 6 5
s

TABLA ORIGINAL   DE LA MUESTRA  OBTENIDA.

Calificaciones 5 6 7 8 9 10 Son las calificaciones


existentes

Frecuencias 3 6 2 3 4 1  Son las veces que se repite


cada calificación.

TABLA  DE VALORES  DONDE SE  DISTRIBUYEN  LAS  FRECUENCIAS

Representación gráfica e interpretación      


La representación gráfica y su  interpretación consiste en transformar la tabla de valores
donde están  distribuidas las frecuencias en gráficos muy  conocidos y  tradicionales  en el
mundo  de la estadística, tales como:
          Diagrama de puntos de frecuencia
          Histograma
          Polígono de frecuencia
         Ojiva

Diagrama de puntos de frecuencias


El diagrama de puntos de frecuencia, se realiza colocando a las calificaciones en la parte 
horizontal y escribiendo verticalmente un punto por cada calificación (el  número de 
frecuencias indicado en la tabla de valores).
En el diagrama de puntos de frecuencias es más fácil identificar la frecuencia mayor  a
menor.

DIAGRAMA DE PUNTOS  DE FRECUENCIAS.

Histograma
Gráfico de barras verticales, donde cada barra nos da el valor de cada frecuencia de los
datos más relevantes y de interés. Cada barra tiene  un color, textura,  o imagen diferente
y es característica con respecto  a las demás.
Curva de  frecuencias
Los polígonos de frecuencias se realizan trazando los  puntos que
representan las frecuencias y uniéndolos mediante segmentos.

Ojiva
Gráfica de líneas que nos representa las frecuencias acumuladas de los datos; este gráfico es
creciente y siempre nos  señala en cada punto las frecuencias acumuladas.
OJIVA
“1.6. CUANTILES”
Los cuantiles son aquellos valores de la variable, que ordenados de menor
a mayor, dividen a la distribución en partes, de tal manera que cada una de ellas
contiene el mismo número de frecuencias.
Constituyen una generalización del concepto de mediana. Así como la
mediana divide a la serie estudiada en dos partes con el mismo número de
elementos cada una, si la división se hace en cuatro partes, o en diez partes, o en
cien partes, llegamos al concepto de cuantil.
Hay, principalmente, tres cuantiles importantes: cuartiles, deciles y percentiles:
Cuartiles
Son tres valores con las siguientes características:
Q1: Primer cuartil, que es el valor de la variable por debajo del cual queda 1/4 de
los elementos de la serie estudiada.
Q3: Tercer cuartil, que es el valor de la variable por debajo del cual quedan los 3/4
de los elementos que constituyen la serie.
Evidentemente el segundo cuartil coincide con la mediana. Como puede
comprobarse, no tendría ninguna utilidad definir el cuarto cuartil. El cálculo de los
cuartiles se realiza por el mismo procedimiento que el cálculo de la mediana, pues
hay únicamente una diferencia cuantitativa entre ambas medidas, pero tienen
significados paralelos

1.7 Graficos

1.7 Graficos
El objetivo de construir gráficos es poder apreciar los datos como un todo e identificar
sus  características sobresalientes. El tipo de gráfico a seleccionar depende del tipo de
variable que nos interese representar por esa razón distinguiremos en la presentación
gráficos para  variables categóricas y para variables numéricas. 

La representación gráfica de una distribución de frecuencias puede realizarse a través de:


 Gráfica de barras
 Gráfica de tortas

Gráfico de barras
Este gráfico es útil para representar
datos categóricos nominales u ordinales. A cada categoría o clase de la variable se le
asocia una barra cuya altura representa la frecuencia o la frecuencia relativa de esa
clase.  Las barras difieren sólo en altura, no en ancho.
La escala en el eje horizontal es arbitraria y en general, las barras se dibujan
equiespaciadas, por esta razón este tipo de gráfico sólo debe usarse para variables
categóricas.

Es importante que el eje vertical comience en cero, de modo que no se exageren 


diferencias entre clases. 
En un gráfico de barras, así como en cualquier tipo de gráfico se debe indicar el número
total de datos ya que el gráfico sólo muestra porcentajes o frecuencias relativas y la
fuente de la que se obtuvieron los mismos.

Gráfico  de tortas

En este gráfico, ampliamente utilizado, se representa


la frecuencia relativa de cada  categoría como una porción de un círculo,  en la que el
ángulo se corresponde con la frecuencia relativa correspondiente. Como en todo gráfico
es importante indicar el número  total de sujetos. Esta representación gráfica es muy
simple  y permite comparar la distribución de una variable categórica en 2 o más grupos.
REPRESENTACIÓN GRÁFICA DE UN ÚNICO CONJUNTO DE DATOS NUMÉRICOS

Histograma

Se trazan dos ejes de coordenadas


rectangulares. En el eje horizontal se representan los valores de la variable y en el eje
vertical una medida de frecuencia (frecuencia absoluta, frecuencia relativa o frecuencia
relativa porcentual. Indicamos en el eje horizontal los límites de los intervalos de clase.
Asociamos a cada clase una columna cuya base cubre el intervalo de clase y cuya altura
indica cuantos datos “caen” en une intervalo a través de la frecuencia o la frecuencia
relativa de la clase.
El gráfico se construye sin dejar espacio horizontal entre categorías, a menos que una
clase esté vacía (es decir tenga altura cero).  

INGENIERIA

Polígono de frecuencias
Alternativo al histograma de frecuencias
podemos representar la información a través de los llamados polígonos de frecuencias.
Estos se construyen a partir de los puntos medios de cada clase. La utilización de los
puntos medios o marcas de clase son llevados al escenario gráfico mediante la utilización
de los polígonos de frecuencias. Se construye uniendo los puntos medios de cada clase
localizados en las tapas superiores de los rectángulos utilizados en los histogramas de las
gráficas. Su utilidad se hace necesaria cuando desean destacarse las variables de
tendencia central, como son media, modas y medianas.

Tallo-hojas  espalda  con espalda COMPARACION  DE GRUPOS.


Los gráficos de tallo-hojas son útiles para comparar la distribución de una variable en dos
condiciones o grupos. El gráfico se denomina tallo-hojas espalda  con espalda porque
ambos grupos comparten los tallos.

1.8 Cajas y bigotes

1.8 Cajas y bigotes


Los diagramas de Caja-Bigotes  son una presentación visual que describe varias
características importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los
datos, sobre un rectángulo, alineado horizontal o verticalmente.

Construcción:
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos
muestran el recorrido intercuartílico. Este rectángulo está dividido por un segmento
vertical que indica donde se posiciona la mediana y por lo tanto su relación con los
cuartiles primero y tercero(recordemos que el segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores
mínimo y máximo de la variable. Las lineas que sobresalen de la caja se llaman bigotes.
Estos bigotes tienen tienen un límite de prolongación, de modo que cualquier dato o caso
que no se encuentre dentro de este rango es marcado e identificado individualmente.

Ejemplo 

Distribución de edades

Utilizamos la ya usada distribución de frecuencias ,que representan la edad de un


colectivo de 20 personas.

36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40

Ordenar los datos

Para calcular los parámetros estadístico, lo primero es ordenar la distribución.

2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 4 4 4 4
0 3 4 4 4 5 9 1 1 3 4 6 6 7 9 9 0 0 1 5

Calculo de los cuartiles


Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. 
Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y
el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la
variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la
mediana es la media aritmética de dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución.
En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39

Dibujar la caja y los bigotes

1.9 Diagrama de Pareto


1.9 Diagrama de Pareto

Es una herramienta que se utiliza para priorizar los problemas o las causas que los generan.
El diagrama de Pareto, también llamado curva 80-20,según este concepto, si se tiene un
problema con muchas causas, podemos decir que el 20% de las causas resuelven el 80 % del
problema y el 80 % de las causas solo resuelven el 20 % del problema,el diagrama de pareto
es una gráfica para organizar datos de forma que estos queden en orden descendente, de
izquierda a derecha y separados por barras. Permite, pues, asignar un orden de prioridades
.

Se recomienda el uso del diagrama de Pareto:

 Para identificar oportunidades para mejorar .



 Para identificar un producto o servicio para el análisis de mejora de la calidad. 

 Cuando existe la necesidad de llamar la atención a los problemas o causas de una
forma sistemática.
  
 Para analizar las diferentes agrupaciones de datos. 

 Al buscar las causas principales de los problemas y establecer la prioridad de las
soluciones 

 Para evaluar los resultados de los cambos efectuados a un proceso comparando
sucesivos diagramas
  obtenidos en momentos diferentes, (antes y después).

 Cuando los datos puedan clasificarse en categorías .

 Cuando el rango de cada categoría es importante.

Los propósitos generales del diagrama de Pareto:

 Analizar las causas 


 Estudiar los resultados 
 Planear una mejora continua
La Gráfica de Pareto es una herramienta sencilla pero poderosa al permitir identificar
visualmente en una solarevisión las minorías de características vitales a las que es importante
prestar atención y de esta manera utilizar todos los recursos necesarios para llevar a cabo una
acción de mejora sin malgastar esfuerzos ya que con el análisis descartamos las mayorías
triviales.

1.10 Uso de Software

La Hoja de Cálculo Excel/Calc puede convertirse en una poderosa herramienta


para crear entornos de aprendizaje que enriquezcan la representación (modelado),
comprensión y solución de problemas, en el área de la estadística y probabilidad.
Excel ofrece funcionalidades que van más allá de la tabulación, cálculo de
fórmulas y graficación de datos.

En estadística descriptiva representa todos los tipos de gráficos y calcula la


media, moda, mediana, recorrido, varianza y desviación típica.

La instalación del programa es muy sencilla, además Microsoft Excel incluye un


comando para el análisis de datos, dentro de las "herramientas para el análisis",
su uso es poco común, ya que no se tiene cuidado de instalar todas las
funciones dentro de las "herramientas", perdiendo la oportunidad de utilizar un
medio poderoso para el estudio dentro de la estadística.
Bibliografías

Ecured(-)https://www.ecured.cu/Estad%C3%ADstica_Descriptiva

Publicado 5th February 2013 por Equipo-


DINAMICOhttp://electroonica.blogspot.com/2013/02/12-obtencion-de-datos-
estadisticos.html

Publicado 5th February 2013 por Equipo-


DINAMICOhttp://electroonica.blogspot.com/2013/02/11-poblacion-y-muestra-
aleatoria.html

Éscanor Jaden, 20 jun. 2017


17:00https://sites.google.com/site/estadisticainfdes/unidad-de-aprendizaje-i-
estadistica/1-3-medidas-de-tendencia-central

Éscanor Jaden, 20 jun. 2017


17:00http://electroonica.blogspot.com/2013/02/1_5.html http://electroonica.blogspot
.com/2013/02/1_5.html

5th February 2013 por Equipo-


DINAMICOhttp://electroonica.blogspot.com/2013/02/1_5.html

Publicado por probabilidad y
estadistica en 14:06 http://proyestitr.blogspot.com/2013/02/1.html

Publicado 12th February 2013 por Equipo-


DINAMICOhttp://electroonica.blogspot.com/2013/02/17-graficos.html

Publicado 12th February 2013 por Equipo-


DINAMICOhttp://electroonica.blogspot.com/2013/02/18-cajas-y-bigotes.html

Publicado 11th February 2013 por Equipo-


DINAMICOhttp://electroonica.blogspot.com/2013/02/19-diagrama-de-pareto.html?
view=timeslide

Publicado 12th February 2013 por Equipo-


DINAMICOhttp://electroonica.blogspot.com/2013/02/110-uso-de-software.html

También podría gustarte