Está en la página 1de 24

Estadística

Conceptos Básicos

Primera Parte: Estadística descriptiva


Segunda Parte: Diseño de experimentos
Primera Parte: Estadística
Descriptiva
Estudia los métodos para describir
como se comportan los datos según su
tendencia:

 Asociativa o centralización.
 Disociativa o dispersión.
Variable Estadística
Es una característica o atributo que se
observa en una unidad, individuo,
objeto y que es susceptible de
medición o clasificación. Las variables
estadísticas pueden ser:

 Cuantitativas o numéricas
 Cualitativas o categóricas
Variables Cuantitativas

• Variables Continuas: son el resultado de una


medición, ejemplo: 5,1 m, 7,6 kg, 2,48 l.

• Variables Discretas: son el resultado de un


proceso de conteo, ejemplo: 10 mujeres, 20
estudiantes.
Métodos Estadísticos
Descriptivos
• Métodos numéricos:
• Medidas de tendencia central
• Medidas de dispersión
• Medidas de forma o distribución
• Medidas de asociación
• Métodos gráficos:
• Distribución de frecuencias e histogramas
• Cajas y bigotes
• Tallos y hojas
• Diagrama de dispersión
• Diagrama de barras
• Polígono de frecuencias
• Líneas
• Pastel
Métodos
Numéricos

Medidas de Tendencia Central


También llamadas medidas de centralización o
asociación. Son las medidas que registran y
materializan el proceso de convergencia de un
conjunto de datos:
• Media aritmética
• Media ponderada
• Mediana
• Moda
• Media geométrica
• Cuartiles
Métodos
Numéricos

Medidas de Tendencia Central

• Media aritmética: es la suma de todos los valores de


una variable divididos por en número de valores
considerados:

X
X 
n
Métodos
Numéricos

Medidas de Tendencia Central

• Media ponderada: esta media atribuye distinto peso


o influencia a los elementos que la componen. Para
ellos cada elemento se multiplica por el peso que se
desea atribuirle, se suman después esos productos
así obtenidos y el resultado se divide por la suma de
los pesos:

X * f
X ponderada 
f
Métodos
Numéricos

Medidas de Tendencia Central

• Mediana: dado un conjunto de valores siempre es


posible ordenarlos, sea en forma ascendente o
descendente. Pues bien, se llama mediana al valor
que se encuentra situado exactamente en la mitad de
la serie ordenada. Si la serie tiene un número par de
observaciones o valores habrá 2 valores en la mitad
de la serie en vez de uno. En tal caso se toma como
la mediana la media aritmética de ambos valores.
Métodos
Numéricos

Medidas de Tendencia Central

• Moda: es el valor que más se repite en un conjunto


dado de observaciones.

• Media Geométrica: Dado un conjunto de elementos,


se define como media geométrica de los mismos la
raíz de orden igual al número de elementos del
producto de los mismos:

G   X 1 / n
G  n X 1* X 2 * .... * Xn
Métodos
Numéricos

Medidas de Tendencia Central

• Cuartiles: Son medidas que dividen los datos en K


partes iguales. Dado un conjunto de datos ordenados
de forma ascendente o descendente siempre es
posible dividir el conjunto original en un cierto
número de subconjuntos, de manera que cada
subconjunto tenga el mismo número de elementos.
Si K = 4  cuartiles
Si K = 10  deciles
Si K = 100 percentiles
Métodos
Numéricos

Medidas de Dispersión

Las medidas de dispersión más utilizadas son las


siguientes:
• Rango o recorrido: todo conjunto finito de datos
presenta un valor máximo y un valor mínimo. Pues
bien, se llama rango o recorrido de dicho conjunto de
datos a la diferencia entre el valor máximo y el valor
mínimo.
Métodos
Numéricos

Medidas de Dispersión

• Varianza: dado un conjunto de observaciones, se


llama varianza de dicho conjunto a la suma de las
diferencias entre cada observación y la media
aritmética de las mismas, elevadas al cuadrado y
dividido por n -1 observaciones.

 X  X 2

S 2
 (var ianza )
n 1
Métodos
Numéricos
Medidas de Dispersión
• Desviación típica o estandar: es la raíz cuadrada de la
varianza:
S  S2

• Coeficiente de variación: cociente entre la desviación


típica y la media aritmética. Mide el grado de variación
relativa de los datos:
S
CV  *100
X
Medidas de Forma o Métodos
Numéricos

Distribución
• Simetría: la simetría de una función de distribución se
mide por el coeficiente de sesgo de la misma. Este
coeficiente se suele calcular sobre la base de datos
estandarizados, esto es, el resultado de restar a cada
dato la media muestral y dividir el resultado por la
desviación típica muestral.
Si el coeficiente de sesgo estandarizado está entre -2 y
+2 la distribución es normal (condición necesaria pero
no suficiente).
Medidas de Forma o Métodos
Numéricos

Distribución
• Curtosis: mide el mayor o menor aplanamiento de la
curva de distribución, debe estar entre -2 y +2 para que
los datos se distribuyan normalmente:
Si el coeficiente de curtosis > 0  Leptocúrtica (más
apuntada que la curva normal).
Si el coeficiente de curtosis < 0  Platocúrtica (más
plana que la normal).
Si el coeficiente de curtosis = 0  Mesocúrtica.
Perfectamente normal.
Métodos
Numéricos
Medidas de Asociación
Permiten establecer el grado de asociación entre variables:

• Coeficiente de correlación de Pearson (r): para


variables cuantitativas.
• Coeficiente de correlación de Spearman (Φ): para
variables cualitativas.
Distribución de Métodos
Gráficos

Frecuencias e Histogramas
• Distribución de frecuencias: son cuadros o
tablas donde se agrupan los datos en clases o
categorías. Dentro de cada clase habrá un cierto
número de observaciones que se llaman
frecuencias.
Edad Frecuencia f Acumulada f Relativa
0-4 10 10 0,11
5–9 15 25 0,166
10 – 14 30 55 0,333
15 – 19 20 75 0,222
20 – 24 15 90 0,166

• Histograma: representación gráfica de una


distribución de frecuencias.
Métodos
Gráficos

• Scatterplot diagrama de dispersión.


• Box and Whisker Plot  diagrama de cajas y
bigotes.
• Stem and Leaf Plot  diagrama de tallos y
hojas.
• Skewness  coeficiente de asimetría
estandarizada.
Pruebas de Hipótesis
Las pruebas de hipótesis son un procedimiento
tradicional para determinar la significación
estadística de hipótesis preestablecidas.
Hipótesis estadística: es una afirmación o
proposición sobre el comportamiento de una
variable o el valor que toma una variable o sobre
el efecto (o respuesta) debido a un factor que se
somete a prueba con el fin de establecer su
validez o falsedad.
Pruebas de Hipótesis
Tipos de hipótesis:
• Hipótesis nula (H0): es una hipótesis que se
plantea en términos de no diferencia, plantea
que no se presentan cambios en las variables,
que lo que se observa es producto del azar. La
hipótesis nula normalmente se somete a prueba
con la esperanza de rechazarla.
• Hipótesis alterna (H1): niega la hipótesis nula en
términos de diferencias, lo que se observa no es
producto del azar sino que es real. Es la hipótesis
de trabajo.
Tipos de Error

• Error tipo 1: es el error que se comete cuando se


rechaza la hipótesis nula (H0), siendo H0
verdadera.
• Error tipo 2: es el error que se comete cuando
no rechazamos la hipótesis nula (H0), siendo H0
falsa.
• El nivel de significancia (α): es igual a la
probabilidad de que ocurra un error tipo 1, es
decir de rechazar la hipótesis nula H0, cuando H0
es verdadero.
• Ejemplo:
H0: el acusado es inocente.
H1: el acusado es culpable.
Si el fiscal rechaza H0, siendo H0 verdadera
entonces está cometiendo un error tipo 1. La
probabilidad de condenar al inocente se espera
que sea del 1 al 5% (α)
Si el valor de P de la prueba < 5% (α), entonces
se rechaza la hipótesis nula.
Nivel de Significancia (α)
• Es el porcentaje que se especifica para rechazar
la hipótesis nula.
• El nivel de significancia (α) es igual a la
probabilidad de que ocurra un error tipo 1, es
decir de rechazar la hipótesis nula H0, cuando H0
es verdadero.
• Normalmente (α) se trabaja entre 1 y 5%.
• Si el valor de P de la prueba < α entonces se
rechaza la hipótesis nula.

También podría gustarte