Está en la página 1de 6

¿Qué estudia la estadística?

En la actualidad no es sorpresa para nadie el hecho de que las matemáticas se encuentren


presentes en prácticamente cualquier disciplina, ciencia o sector de nuestra sociedad. Por lo
general el estudio de las matemáticas se encuentra dividido en dos grandes ramas; las
matemáticas puras y las matemáticas aplicadas. La primera se encarga propiamente de estudiar
las propiedades, características y relaciones que definen y describen a múltiples entidades
abstractas.

¿Qué es la estadística descriptiva?

La estadística descriptiva es la rama de la estadística que recolecta, analiza y caracteriza un


conjunto de datos (peso de la población, beneficios diarios de una empresa, temperatura mensual,
…) con el objetivo de describir las características y comportamientos de este conjunto mediante
medidas de resumen, tablas o gráficos.

Estadística inferencial

La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales para
toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los
resultados obtenidos.

Población estadística

En estadística una población es un conjunto de objetos, individuos, elementos o eventos con


determinadas características. A menudo se obtiene una muestra de dicha población, es decir, un
subconjunto representativo. Luego de realizar un análisis estadístico a la muestra, los resultados se
extrapolan al resto de la población (inferencia estadística).

Muestra estadística

En estadística, una muestra es un subconjunto de casos o individuos de una población. En diversas


aplicaciones interesa que una muestra sea representativa y para ello debe escogerse una técnica
de muestra adecuada que produzca una muestra aleatoria adecuada (se obtiene una muestra
sesgada cuyo interés y utilidad es más limitado dependiendo del grado de sesgos que presente).

Muestreo aleatorio simple

Forman parte de este tipo de muestreo todos aquellos métodos para los que se puede calcular la
probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de
muestreo es el más aconsejable, aunque en ocasiones no es posible optar por él.

Tipos

Sin reposición de los elementos: Cada elemento extraído se descarta para la subsiguiente
extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la
vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla
seleccionada.
Con reposición de los elementos: Las observaciones se realizan con remplazo de los individuos, de
forma que la población es idéntica en todas las extracciones. En poblaciones muy grandes, la
probabilidad de repetir una extracción es tan pequeña que el muestreo puede considerarse con
reposición aunque, realmente, no lo sea.

Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir una extracción es
tan pequeña que el muestreo puede considerarse con reposición.

Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la extracción de
números aleatorios mediante ordenadores, calculadoras o tablas construidas al efecto.

Muestreo sistemático

Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse en el tiempo.


Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda). Luego
hay que calcular una constante, denominada coeficiente de elevación:

K= N/n

Muestreo con o sin reemplazo

El muestreo estadístico puede realizarse de varias maneras diferentes. Además del tipo de método
de muestreo que utilizamos, hay otra pregunta relacionada con lo que le sucede específicamente a
un individuo que hemos seleccionado al azar. Esta pregunta que surge cuando el muestreo es,
"Después de seleccionar un individuo y registrar la medición del atributo que estamos estudiando,
¿qué hacemos con el individuo?

Hay dos opciones:

Podemos reemplazar al individuo de nuevo en la piscina de la que estamos tomando muestras.

Podemos elegir no reemplazar al individuo.

Podemos ver muy fácilmente que estas conducen a dos situaciones diferentes. En la primera
opción, el reemplazo deja abierta la posibilidad de que el individuo sea elegido al azar una
segunda vez. Para la segunda opción, si estamos trabajando sin reemplazo, entonces es imposible
elegir a la misma persona dos veces. Veremos que esta diferencia afectará el cálculo de
probabilidades relacionadas con estas muestras.

Medidas de tendencia central

Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la


información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la
distribución de datos se denomina medida o parámetro de tendencia central o de centralización.

Cuando se hace referencia únicamente a la posición de estos parámetros dentro de la distribución,


independientemente de que esté más o menos centrada, se habla de estas medidas como
medidas de posición.1 En este caso se incluyen también los cuantiles entre estas medidas.

Entre las medidas de tendencia central tenemos:


 Media aritmética
 Media ponderada
 Media geométrica
 Media armónica
 Mediana
 Moda

Se debe tener en cuenta que existen variables cualitativas y variables cuantitativas, por lo que las
medidas de posición o medidas de tendencia se usan de acuerdo al tipo de variable que se está
observando, en este caso se observan variables cuantitativas.

Medidas de dispersión

Las medidas de dispersión muestran la variabilidad de una distribución, indicándolo por medio de
un número, si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la
media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

DATOS AGRUPADOS:

Aunque las medidas de tendencia central y de dispersión calculadas a partir de una tabla de
distribución de frecuencia no son tan precisas como las calculadas con los datos originales, y en
ocasiones no se cuenta con éstos o es impráctico procesarlos, por lo que deben aplicarse las
fórmulas aproximadas correspondientes a la medida que se desee, utilizando los datos de una
tabla de distribución en frecuencias.

DATOS NO AGRUPADOS

Los datos no agrupados son el conjunto de datos que no se ha clasificado y se es presentada en su


forma de aparición en una tabla de datos donde cada valor se representa de forma individual. Por
lo general este conjunto comprende una cantidad de elementos menor a 30 (n<30) con poca o
nula repetición.

DISTRIBUCION DE FRECUENCIA.

En estadística, se le llama distribución de frecuencias a la agrupación de datos en categorías


mutuamente excluyentes que indican el número de observaciones en cada categoría.1 Esto
proporciona un valor añadido a la agrupación de datos. La distribución de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el número existente en cada clase.

GRÁFICAS ESTADÍSTICAS

Las gráficas estadísticas nos permiten “familiarizarnos” con los datos que se han recopilado y
resumido. Se considera como una técnica inicial de ANÁLISIS

EXPLORATORIO DE DATOS que produce una representación visual. Las gráficas resultantes revelan
un patrón de comportamiento de la variable en estudio. Se ofrecen muchos tipos de gráficos para
describir el conjunto de datos. Dependiendo del tipo de datos y lo que se quiera representar, se
hará uso del método gráfico más adecuado.
ELEMENTOS DE UNA GRAFICA:

En general se deben tener en cuenta los siguientes elementos:

1. Titulo

2. Tabla o Distribución de Frecuencias

3. Escala

4. Cuerpo de la gráfica

5. Convenciones

6. Notas aclaratorias

7. Numeración.

DATOS CATEGÓRICOS

DIAGRAMA CIRCULAR

Es de especial utilidad para mostrar proporciones (porcentajes) relativas de una variable. Se crea
marcando una porción del círculo correspondiente a cada categoría de la variable.

DIAGRAMA DE BARRAS

Es una forma gráfica de representar datos cualitativos que se han resumido en una distribución de
frecuencias, de relativas o de porcentuales. Hay varios tipos de gráficos de barras, como son:

GRÁFICA SIMPLE DE BARRAS VERTICALES

Para respuestas categóricas cualitativas en el que solo interviene una barra para cada clase. Su
trazo se realiza ubicando en el eje horizontal de la gráfica los nombres que identifican cada una
de las clases. En el eje vertical se usa una escala de frecuencias, una de frecuencias relativas o una
de porcentuales. Luego, con una barra de un ancho fijo trazada sobre cada indicador de clase
llegamos a la altura que corresponde al tipo de frecuencia escogido. Las barras se separan a fin de
señalar que cada clase es una categoría independiente. Los espacios entre las barras deben
corresponder a la mitad del ancho de una barra.

GRÁFICA SIMPLE DE BARRAS HORIZONTALES

Se utiliza principalmente para facilitar la comparación entre las diferentes clases que componen
los datos categóricos. El trazo de la gráfica es muy similar a la gráfica de barras verticales, solo que
éstas van en forma horizontal y están ordenadas de la mayor a la menor frecuencia absoluta, de
frecuencia relativa o de porcentajes. De esta manera se logra una mejor visualización en las
preferencias.

GRÁFICA DE BARRAS COMPONENTES

Este tipo de gráfica se usa cuando las diferentes categorías de datos se componen de otras
clases , de tal forma que cada barra se pueda subdividir y representar cada una de estas clases .Así
mismo, entre las categorías y sus componentes se compara valores.
También se le conoce como barras agrupadas. Se puede hacer uso de barras

Horizontales o de barras verticales; su escogencia depende de lo que se pretenda ilustrar para


que facilite su visualización.

GRÁFICA DE BARRAS SECCIONADAS

Esta gráfica compara entre categorías el aporte de cada valor al total, dando lugar a una columna
apilada para cada clase. También se puede presentar de manera horizontal o vertical

DIAGRAMA DE PARETO

Es un tipo especial de diagrama de barras verticales, donde las respuestas categóricas se grafican
en orden descendente de frecuencias y se combinan con un polígono acumulado en la misma
escala. El diagrama de Pareto se usa ampliamente en el control estadístico de procesos y el
control estadístico de la calidad del producto.

Lo que se pretende con este tipo de grafico es describir en donde se presenta el mayor porcentaje
del problema y que factores lo afectan. Este concepto, se conoce como la regla de 80-20,
considera que el 80% de la actividad se debe al 20% de los factores. Al concentrarse en el 20% de
los factores, los gerentes pueden atacar el 80% del problema.

DIAGRAMA DE BARRAS

Tienen el mismo uso que los datos categóricos, solamente que intervienen dos variables, una que
representa el tiempo y la otra cantidad (Ingresos, ventas, IPC, Costos, No. De unidades producidas,
etc.). Dependiendo de lo que se quiera representar se ofrecen los diagramas de barras simples, de
componentes, bidireccionales y seccionados.

GRÁFICAS DE LINEA

Se ilustra mediante segmentos de línea los cambios en cantidades con respecto al tiempo. Son
especialmente útiles en el comercio y en los negocios.

DATOS NUMERICOS

HISTOGRAMAS

Una de las maneras más comunes de representar una distribución de frecuencia. Su grafica
consiste en un conjunto de barras, en la que la base de cada barra representa una clase o
intervalo, indicada en el eje horizontal, y la altura por su frecuencia, indicada en el eje vertical.
Generalmente las barras se trazan adyacentes una a la otra.

POLÍGONO DE FRECUENCIA .De segmentos de línea que conectan los puntos formados por la
intersección del punto medio de clase y la frecuencia de clase absoluta, relativa o porcentual.

OJIVA

Es un polígono acumulado de frecuencia absoluta, relativa o porcentual y por lo tanto representa


segmentos de línea que se origina al conectar los puntos formados por la intersección entre el
límite inferior de cada clase con la frecuencia acumulada. Es conocida como POLÍGONO DE
FRECUENCIA ACUMULADA MENOR QUE, ya que muestra el número o porcentaje de observaciones
menores a cierto valor. La ojiva es importante porque nos permite extrapolar información que la
distribución de frecuencia oculta y así como calcular estadísticos como la mediana, cuartiles,
decirles y percentiles, en forma aproximada. Para construir la ojiva se debe primero elaborar la
distribución de frecuencia menor que.

DIAGRAMA DE CAJA

Es una representación gráfica, basada en cinco números estadísticos: valor mínimo, Q1, la
mediana, Q3 y valor máximo. Se utiliza como una técnica de ANÁLISIS EXPLORATORIO DE DATOS y
tiene la ventaja de que no se requiere de la desviación estándar, ni de la media aritmética y así
como de resumir los datos en una distribución de frecuencia, situación que si necesita el
histograma, el polígono y la ojiva. Para su trazo, se lleva a cabo los siguientes pasos:

1. Crear una escala apropiada a lo largo del eje horizontal

2. Dibujar una caja entre el Q1 y el Q3

3. Dentro de la caja trazamos una línea recta vertical que representa la mediana

4. Finalmente, trazamos líneas horizontales de la caja hasta el valor mínimo y de la caja hasta el
valor máximo. A estas líneas horizontales fuera de la caja se les conoce como “bigotes”

También podría gustarte