Está en la página 1de 36

Estadística

Introducción
¿Qué es la estadística?
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo de los últimos años.

¿En qué áreas se aplica la estadística?


Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología,
Educación, Psicología, Administración, Economía, Medicina, Ciencias Políticas,
entre otras.

Ejemplos de su aplicación son:

1) En Administración de Empresas: la estadística se utiliza para evaluar un producto


antes de comercializarlo.

2) En Economía: para medir la evolución de los precios mediante números índice o para
estudiar los hábitos de los consumidores a través de encuestas de presupuestos
familiares.

1
Estadística

Introducción
Esquema de las etapas de un estudio estadístico

AREA DE INTERES DATOS

ORGANIZAR Y RESUMIR

Tema de Investigación ESTADÍSTICA DESCRIPTIVA


(Tablas, Gráficos, Medidas
-Antecedentes Previos Descriptivas, etc.)
-Objetivos
INTERPRETACIÓN
-Preguntas de Investigación
-Posibles Hipótesis Muestra
¿Población o Muestra?
-Unidad de Análisis
-Población INFERENCIA ESTADÍSTICA
Población
-Variables
CONCLUSIONES

Probabilidad
INFORMACIÓN

2
Estadística

Resumen de algunos conceptos planteados en la


Introducción
• VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS.
• ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una
Población o una Muestra
• POBLACIÓN : Es el total de unidades de análisis que son tema de estudio.

• MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.

Población: Muestra

“Las personas que


trabajan en empresas de Muestra: 60 trabajadores de empresas de comunicación
Unidad de análisis: Trabajador de empresa de comunicación
comunicación”
Variables: sexo, edad, salario, Nº de horas de trabajo, etc.

3
Estadística

Variable: corresponde a la característica de la Unidad de Análisis

TIPOS DE VARIABLES
Variables Cuantitativas Variables Cualitativas
CONTINUA DISCRETA NOMINAL ORDINAL
Intervalo

Toma valores enteros Característica o cualidad


cuyas categorías no tienen
Ejemplos: Número de Hijos, Número de
un orden preestablecido.
empleados de una empresa, Número de
asignaturas aprobadas en un semestre, etc. Ejemplos: Sexo, Deporte
Favorito, etc.
Toma cualquier valor dentro de un intervalo
Característica o cualidad cuyas
Ejemplos: Peso; Estatura; Temperatura, etc. categorías tienen un orden
preestablecido.
Ejemplos: Calificación (S, N, A);
Grado de Interés por un tema, etc.

4
Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
Estadística

NOTACION
Variables Cuantitativas

OBSERVACIONES
* El Tipo de Gráfico seleccionado va a depender de la variable en estudio.
* El Gráfico debe contener un Título General y la identificación de cada eje
(variable en estudio y frecuencia).
* En ocasiones resulta más ilustrativo un gráfico que una tabla de
frecuencia.
* Al igual que las tablas, los gráficos deben ser auto-explicativos.

5
Estadística

-Media Aritmética (Promedio)


MEDIDAS DE TENDENCIA CENTRAL -Mediana
-Moda

Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor


Mediana
Media Aritmética o Promedio Si n es impar

Si n es par

Datos Moda
Cualitativos y Cuantitativos

6
7
8
9
10
Estadística

-Percentil (ejemplo: 25, 50, 75)


Percentiles, Deciles o Cuartiles -Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.

El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64. 11
12
Estadística

TIPOS DE 5. Diagrama de Caja


GRÁFICOS
Edad de las personas que se realizaron
angioplastía entre 1980 y 2000

- Permite identificar gráficamente la


mediana, los cuartiles 1 y 3
(percentiles 25 y 75), mínimo y
máximo de una variable.
- Sólo es útil para variables
cuantitativas.
-El eje x permite identificar la
poblacion en estudio.
- El eje y representa los valores de la
variable en estudio.
13
14
15
16
Estadística

-Rango
MEDIDAS DE DISPERSIÓN -Varianza
-Desviación Estándar

Datos Cuantitativos Varianza


Rango

Desviación Típica o Estándar

Comparación entre Variables


Coeficiente de Variación
Se refiere al comportamiento de las variables cuantitativas en un
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que
se les mide Estatura, Peso, Edad: Entre estas variables ¿cuál
presenta mayor variación? 17
18
19
Estadística

-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento

Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.

Si CA=0 si la distribución es simétrica alrededor de la media.


Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría Si CA>0 si la distribución es asimétrica a la derecha

- Si CAp=0 la distribución se dice normal (similar


a la distribución normal de Gauss) y recibe el
Coeficiente de Apuntamiento nombre de mesocúrtica.
- Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.

20
Estadística

-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento

Ejemplos Histogramas con distinta asimetría y apuntamiento

21
Estadística

-Asimetría
Otras medidas o Coeficientes
-Kurtosis o Apuntamiento

Ejemplos

Datos Histograma Medidas descriptivas

1 4 4 Media 3,9

1 4 4 Mediana 4

1 4 5 Moda 4

2 4 5 Desviación estándar 1,67

2 4 6 Varianza de la muestra 2,78

2 4 6 kurtosis -0,43

2 4 6 Coeficiente de asimetría -0,02

3 4 6 Rango 6

3 4 7 Mínimo 1

4 4 7 Máximo 7
Cuenta 30

22
Estadística

Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento


para datos Agrupados (tabla de frecuencias)

Tabla de frecuencia (para variable cuantitativa) 2) La Desviación típica para datos


agrupados esta dada por:
n1 f1
n2 f2

nk fk 3) El Coeficiente de Asimetría para


datos agrupados esta dado por:

Sea cj la marca de clase (o centro de clase) y fj la


frecuencia relativa de la clase j, donde j=1, 2,…, k.

1) La Media para datos agrupados es igual a


la suma de los productos de las marcas de clase 4) El Coeficiente de apuntamiento para
por sus frecuencias relativas, de la forma: datos agrupados esta dada por:

23
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Problema
Interesa estudiar cual es el Tabla 1 Actividad
principal medio de transporte Transporte Estudia Pensionado Trabaja
preferido por un grupo de
personas a la hora de dirigirse Autobus 5 7 0
al centro comercial. Bicicleta 3 3 2
Caminar 2 5 2
Para esto se consultó a cada
Coche 5 4 5
persona sobre la actividad a la
que se dedicaba y el medio de Metro 6 7 4
transporte preferido.

Transporte Nº %
Autobus 12 20,0 Actividad Nº %

Bicicleta 8 13,3
Estudia 21 35,0

Caminar 9 15,0
Pensionado 26 43,3

Coche 14 23,3
Trabaja 13 21,7

Metro 17 28,3
TOTAL 60 100

TOTAL 60 100

24
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas
Tabla 2 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60

Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)

25
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas y % respecto de tipo de Transporte
Tabla 3 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100

26
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas y % respecto de tipo de Actividad
Tabla 4 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100

27
Estadística

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos

Recordemos que: Hasta ahora hemos estudiado las medidas tendencia


central (Media, Mediana, Moda) y dispersión
(Varianza y Desviación Estándar) para una
Variable Cuantitativa (x).

Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y)

Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional,


es decir que cuando x aumenta y también aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional,
es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociación entre x e y.
28
Estadística

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL
- Correlación Cuantitativos

Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal
entre dos variables Cuantitativas

Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que


cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es
perfecta.
Si r es cero: no existe asociación entre x e y.

29
Estadística

EJEMPLO : Representación gráfica de las variables x e y

r=1 r=-1

30
Estadística

Datos Cuantitativos

REGRESION LINEAL SIMPLE


Objetivo 1 Objetivo 2
Determinar si dos variables están Estudiar si los valores de una
asociadas y en qué sentido se da variable pueden ser utilizados para
la asociación. predecir el valor de la otra

Determinar si existe relación Estudiar la dependencia de una


entre las variables x e y: variable respecto de la otra:
Coeficiente de Correlación Modelo de Regresión
Términos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)
31
Estadística

Datos Cuantitativos
REGRESION LINEAL SIMPLE

Notación
Variable Respuesta: y
Variable Explicativa: x
Modelo de Regresión Lineal Simple: yi=α+βxi+ei
Intercepto: α
Pendiente: β
Error: e
Modelo Estimado
(recta de regresión) Método de Estimación: Mínimos Cuadrados

Residuos o Errores

32
Estadística

REGRESION LINEAL SIMPLE

MODELO DE REGRESIÓN LINEAL SIMPLE


yi=α+βxi+ei

DATOS MODELO ESTIMADO

ESTIMADORES ERRORES

33
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

34
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

Interpretación de los resultados


- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla
media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.
35
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

De acuerdo al coeficiente de
determinación, el modelo ajustado
a los datos es adecuado (R2
cercano a 1)

36

También podría gustarte