Está en la página 1de 36

Es el conjunto de procedimientos y técnicas

empleadas para recolectar, organizar y analizar


datos, los cuales sirven de base para tomar
decisiones en las situaciones de incertidumbre
que plantean las ciencias sociales o naturales. Los
conceptos estadísticos se han trabajado
intuitivamente desde la antigüedad, las primeras
culturas recopilaban datos poblacionales por
medio de censos como los realizados en Egipto
por Moisés y el empadronamiento que fue
efectuado por los romanos en Judea.
Estadística Descriptiva se refiere a la recolección,
presentación, descripción, análisis e interpretación
de una colección de datos, esencialmente consiste en
resumir éstos con uno o dos elementos de
información (medidas descriptivas ó medidas de
tendencia central) que caracterizan la totalidad de
los mismos. La estadística Descriptiva es el método
de obtener de un conjunto de datos conclusiones
sobre si mismos. Puede utilizarse para resumir o
describir cualquier conjunto ya sea que se trate de
una población o de una muestra.
La estadística es una ciencia de aplicación práctica casi universal en
todos los campos científicos:
En las ciencias naturales: Se emplea con profusión en la
descripción de modelos termodinámicos complejos (mecánica
estadística), en física cuántica, en mecánica de fluidos o en la teoría
cinética de los gases, entre otros muchos campos.
En las ciencias sociales y económicas: Es un pilar básico del
desarrollo de la demografía y la sociología aplicada.
En economía: Suministra los valores que ayudan a descubrir
interrelaciones entre múltiples parámetros macro y
microeconómicos.
En las ciencias médicas: Permite establecer pautas sobre la
evolución de las enfermedades y los enfermos, los índices de
mortalidad asociados a procesos morbosos, el grado de eficacia de
un medicamento, etc.
Varios estudios estadísticos comunes que aparecen con frecuencia en los
medios de comunicación son los siguientes:
Encuesta de Población Activa (EPA), elaborada por el Instituto Nacional
de Estadística (INE) con periodicidad trimestral, según recomendaciones de
la Organización Internacional del Trabajo (OIT), para obtener y clasificar
datos sobre la actividad de la población. Esta encuesta se realiza por
muestreo, y los resultados se ordenan por edad, sexo, nivel de estudios,
profesión y otros parámetros.
Índice de Precios al Consumo (IPC), que mide por medios estadísticos la
evolución experimentada por los precios de los bienes y servicios
consumidos por la población española. Se basa en la Encuesta de
Presupuestos Familiares (EPF), y selecciona varios centenares de artículos,
clasificados en ocho grupos, que se consideran representativos de la
evolución de los precios. Los artículos seleccionados componen lo que se
denomina canasta básica, considerada en la encuesta.
Producto Interior Bruto (PIB), que registra la producción nacional de un
país en bienes y servicios asociados a procesos considerados productivos.
Poder adquisitivo, que maneja combinadamente datos del Salario
Mínimo Interprofesional (SMI) y el IPC.
Al describir grupos de observaciones, con frecuencia es
conveniente resumir la información con un solo número.
Este número que, para tal fin, suele situarse hacia el centro
de la distribución de datos se denomina medida o
parámetro de tendencia central o de centralización.

Entre las medidas de tendencia central tenemos:


Media
Media ponderada
Media geométrica
Mediana
Moda
La media aritmética es el valor obtenido por la suma de
todos sus valores dividida entre el número de sumadores.
La media aritmética es, probablemente, uno de los
parámetros estadísticos más extendidos. Se le llama
también promedio o, simplemente, media.
La media ponderada se aplica cuando en un conjunto de
datos cada uno de ellos tiene una importancia relativa (o
peso) respecto de los demás datos. Se obtiene
multiplicando cada uno de los datos por su ponderación
(peso) para luego sumarlos, obteniendo así una suma
ponderada; después se divide ésta entre la suma de los
pesos, dando como resultado la media ponderada
La media geométrica de una cantidad arbitraria de
números (por decir n números) es la raíz n-ésima del
producto de todos los números, es recomendada para
datos de progresión geométrica, para promediar razones,
interés compuesto y números índices.
la mediana representa el valor de la variable de posición
central en un conjunto de datos ordenados.
En estadística, la moda es el valor con una mayor
frecuencia en una distribución de datos.

Hablaremos de una distribución bimodal de los datos


adquiridos en una columna cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia
absoluta máxima.

Una distribución trimodal de los datos es en la que


encontramos tres modas. Si todas las variables tienen la
misma frecuencia diremos que no hay moda.
Es una medida de forma de una distribución que permite identificar
y describir la manera como los datos tiende a reunirse de acuerdo
con la frecuencia con que se hallen dentro de la distribución.
Permite identificar las características de la distribución de datos sin
necesidad de generar el gráfico.
Como eje de simetría consideramos una recta paralela al eje de
ordenadas que pasa por la media de la distribución. Si una
distribución es simétrica, existe el mismo número de valores a la
derecha que a la izquierda de la media, por tanto, el mismo número
de desviaciones con signo positivo que con signo negativo. Decimos
que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de
la media es más larga que la de la izquierda, es decir, si hay valores
más separados de la media a la derecha. Diremos que hay asimetría
negativa (o a la izquierda) si la "cola" a la izquierda de la media es
más larga que la de la derecha, es decir, si hay valores más separados
de la media a la izquierda.
La curtosis mide el grado de agudeza o achatamiento de
una distribución con relación a la distribución normal, es
decir, mide cuán puntiaguda es una distribución.

TIPOS DE CURTOSIS
La curtosis determina el grado de concentración que
presentan los valores en la región central de la
distribución. Así puede ser:

Leptocúrtica: Existe una gran concentración.


Mesocúrtica: Existe una concentración normal.
Platicúrtica: Existe una baja concentración.
Las medidas de dispersión, también llamadas medidas de
variabilidad, muestran la variabilidad de una distribución,
indicando por medio de un número, si las diferentes
puntuaciones de una variable están muy alejadas de la
media. Cuanto mayor sea ese valor, mayor será la
variabilidad, cuanto menor sea, más homogénea será a la
media. Así se sabe si todos los casos son parecidos o varían
mucho entre ellos.
El rango o recorrido estadístico es la diferencia entre el
valor máximo y el valor mínimo en un grupo de números
aleatorios.
Requisitos del rango
 Ordenamos los números según su tamaño.
 Restamos el valor mínimo del valor máximo.

Ejemplo
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el
dato mayor es 9. Sus valores se encuentran en un rango
de:
La varianza es una medida estadística que mide la dispersión de los
valores respecto a un valor central (media), es decir, es el cuadrado
de las desviaciones

La varianza a veces no se interpreta claramente, ya que se mide en


unidades cuadráticas. Para evitar ese problema se define otra
medida de dispersión, que es la desviación típica, o desviación
estándar, que se halla como la raíz cuadrada positiva de la varianza.
La desviación típica informa sobre la dispersión de los datos respecto
al valor de la media; cuanto mayor sea su valor, más dispersos
estarán los datos. Esta medida viene representada en la mayoría de
los casos por S, dado que es su inicial de su nominación en inglés.
La covarianza entre dos variables es un estadístico resumen
indicador de si las puntuaciones están relacionadas entre sí. La
formulación clásica, se simboliza por la letra griega sigma (σ) cuando
ha sido calculada en la población. Si se obtiene sobre una muestra,
se designa por la letra

El coeficiente de correlación de Pearson, r, permite saber si el ajuste


de la nube de puntos a la recta de regresión obtenida es
satisfactorio. Se define como el cociente entre la covarianza y el
producto de las desviaciones típicas (raíz cuadrada de las varianzas).

También podría gustarte