Está en la página 1de 79

INTRODUCCIÓN A LA

ESTADÍSTICA

1
¿Por qué USAR Estadística?

Es una herramienta para describir e inferir


datos provenientes de un estudio, buscando
explicar un fenómeno.

2
Indispensable en la investigación!!

BUSCAR CAUSAS
-¿Qué influye en la
cantidad de animales
en una zona?
-¿Porque hay más
turistas en una zona?

DESCRIBIR DATOS: COMPARAR DATOS RELACIONAR DATOS


-¿Cuál es el -¿hay diferencia entre -¿Por qué cuando sube este
PROMEDIO? las diferentes baja el otro?
-¿Qué tan preciso son muestras? -¿Por qué ambos
nuestros estimados? -¿todas las muestras incrementan o disminuyen?
son iguales?

3
DESCRIPCIÓN DE LA
MUESTRA

Cabello:
Promedio=30 cm
± 15 cm

Cadera:
Promedio=90 cm
± 5 cm

Estatura:
Promedio=160 cm
± 5 cm

4
CHICAS DEL COMPARACIÓN DE LAS CHICAS DEL
NOA NOA MUESTRAS PARDO

Cabello: Cabello:
30 ± 15 cm 25 ± 10 cm

Cadera: Cadera:
90 ± 5 cm 95 ± 5 cm

Estatura: Estatura:
160 ± 5 cm 150 ± 5 cm

5
RELACIONAR LA
MUESTRA

Cabello:
25 ± 10 cm
Horas de ejercicio?

Genético?

Presencia de implantes? Cadera:


95 ± 5 cm
Consumo de carbohidratos?

Consumo de proteínas?
Estatura:
Consumo de grasas?
150 ± 5 cm

6
BUSCAR LAS CAUSAS QUE
ORIGINAN LOS RESULTADOS
DE LA MUESTRA

Cabello:
25 ± 10 cm
Horas de ejercicio?

Genético?

Presencia de implantes? Cadera:


95 ± 5 cm
Consumo de carbohidratos?

Consumo de proteínas?
Estatura:
Consumo de grasas? 150 ± 5 cm

7
MUESTRA

INFERIR LOS RESULTADOS POBLACIÓN

8
POBLACIÓN
MUESTRA

INFERIR LOS RESULTADOS

9
Tipos de estadística
COMPARAR DATOS
DESCRIBIR DATOS: -¿hay diferencia entre
-¿Cuál es el las diferentes
PROMEDIO? muestras?
-¿Qué tan preciso son -¿todas las muestras
nuestros estimados? son iguales?

RELACIONAR DATOS BUSCAR CAUSAS


-¿Por qué cuando sube este -¿Qué influye en la cantidad
baja el otro? de animales en una zona?
-¿Por qué ambos -¿Porque hay más turistas
incrementan o disminuyen? en una zona?

ESTADISTICA DESCRIPTIVA ESTADISTICA INFERENCIAL


Describir la muestra Generalizar e inferir hacia la población

10
Uso de la estadística

Sólo cuando se muestrea!!!

11
ESTUDIOS DE FAUNA SILVESTRE -TRANSECTOS
-CAMARA TRAMPA
-CPUE, ETC
POBLACIÓN mu
estr
eo

MUESTRA

12
ESTUDIOS BOTÁNICOS
-PARCELAS O FAJAS

POBLACIÓN
mu
estr
eo

MUESTRA

13
ESTUDIOS ICTIOLÓGICOS -RED DE ESPERA
-CENSO POR BOYADA
POBLACIÓN -CPUE, ETC

mu
estr
eo

MUESTRA

14
ESTUDIOS SOCIALES -ENTREVISTA IND/GRUPO

POBLACIÓN
mu
estr
eo

MUESTRA

15
ESTUDIOS EPIDEMIOLÓGICOS -GOTA GRUESA

mu
estr
eo

MUESTRA

POBLACIÓN

16
ESTUDIOS CRECIMIENTO EN
PISCIGRANJA
mu
estr
eo

MUESTRA
POBLACIÓN

17
ESTUDIOS DE TAMAÑOS DE
PIEDRAS
mu
estr
eo

MUESTRA
POBLACIÓN

18
ESTUDIOS DE TAMAÑOS DE
HOJAS
mu
estr
eo

MUESTRA

POBLACIÓN

19
CUAL ES LA FINALIDAD?

20
DESCRIBIR
DESVIACIÓN ESTÁNDAR

MEDIA
DESVIACIÓN ESTÁNDAR

INFERIR

21
La estadística será muy útil sólo si…

• Existe una pregunta que se pueda responder


• Hay un buen diseño de muestreo
• Se elige bien la prueba estadística
• Se interpreta correctamente los resultados

22
Antes de usar la estadística es importante
conocer la terminología

23
Terminología necesaria

• Muestra, unidad de muestreo, variable


• Muestra Independiente, relacionada
• Réplica
• Tipo de variable: contínua, discreta, ordinales y nominales
(categórica)
• Prueba de Hipótesis: nula y alterna
• Paramétrica y no paramétrica

24
Muestra y unidad de muestreo

Muestra es el conjunto de
observaciones:

Unidad de muestreo es
de donde se obtiene
todas las observaciones

25
¿DENSIDAD?

POBLACIÓN
T1 mu
estr
eo

T2

T1
T2
T5 RÉPLICAS O
REPETICIONES T3
T4
T4 T5

MUESTRA
UNIDAD DE MUESTREO
T3 = TRANSECTO
26
¿DENSIDAD?
P POBLACIÓN
1
mu
estr
eo
P
5

P
4 P1
P RÉPLICAS O P2
2 REPETICIONE P3
S
P4
P P5
3
UNIDAD DE MUESTREO MUESTRA
= PARCELA
27
¿INDICE DE
ABUNDANCIA?
POBLACIÓN
R mu
1 estr
eo
R
2
R
5

R1

RÉPLICAS O R2
REPETICIONE R3
R S
R4
3
R5
R
4
UNIDAD DE MUESTREO MUESTRA
= RED
28
-PERCEPCION DE ABUNDANCIA

POBLACIÓN mu
estr
eo

P1
P2
P3
P4
RÉPLICAS O
REPETICIONE P5
S P6
P7
P8
UNIDAD DE MUESTREO MUESTRA
= PERSONA
29
Tipos de muestras

• Muestras
independientes
RN
PUCACURO

RN PACAYA
SAMIRIA
DIFERENTES POBLACIONES

30
• Muestras
relacionadas

RN
PUCACURO

CRECIENTE

VACIANTE
LA MISMA POBLACIÓN EN DIFERENTES TIEMPOS

31
Réplicas y pseudoréplicas

T1
UNIDAD DE MUESTREO
= TRANSECTO
T2

T1

RÉPLICAS O T2
T5
REPETICIONE T3
S
T4
T4 T5

PSEUDOREPLICAS
Ausencia de independencia EN LAS
OBSERVACIONES!!
T3

32
Variable

Variable Característica
que queremos medir.

• Densidad poblacional
• Talla
• Número de hijos
• Peso (masa)
• Ingresos económicos
• Lugar donde vive
• Percepción política
• Sexo
• Raza
• Etc.

33
Tipos de variables

• Contínuas

• Discretas

• Ordinales

• Nominales o Atributos o Categóricos

34
Variable contínua

• Son todos los valores decimals (naturaleza decimal)


Ejemplos: longitud, áreas, volúmenes, masa, angulos,
temperaturas, tiempo, densidad poblacional, ingreso
económico de profesores, sueldo de padres de familia.
1.2
2.3
4.5

35
Variable discreta

• Son todos los valores enteros


Ejemplos son número de crías, número de especies,
número de individuos, número de personas, número de
colegio, edad de estudiantes/maestros.

1
2
4

36
Variable ordinal

• No son medidos pero son ordenados por su


magnitud

¿Como calificarías el nivel de enseñanza que recibistes?


a) Pobre b) justo c) Bueno d) Muy bueno e) Excelente
1 2 3 4 5

¿Como crees que está el colegio?


a) malo b) regular c) bueno
1 2 3

37
Variable nominal

• Son palabras dispuestas sin ningún orden,


usualmente son dos o pocas alternativas.
• Son presentados como frecuencias!!!
Género: hombre – mujer
Lugar de nacimiento: Lima, Callao, Iquitos
Color de ojos: celeste, marron, negro Lugar frecuencia
Gestación: si - no Lima 56
Callao 34
Iquitos 15
Lugar de nacimiento:
Lima, Callao, Iquitos Total 105

38
TIPOS DE PRUEBAS ESTADÍSTICAS
SEGÚN LA DISTRIBUCIÓN

39
Parametricos vs No Paramétricos

Asunciones Asunciones
• Muestreo al azar • No tiene asunciones
• Varianzas iguales
• Distribución normal

Distribución normal Distribución asimétrica 40


Que pruebas se usan para saber si mis datos
son normales?
• Kolmogorov smirnov (P>0.05)
• Shapiro Wilk (P>0.05)
• Chequeando el SD!!

41
• Que hacemos si queremos usar pruebas
paramétricas y nuestros datos no tienen
una distribución normal??

42
Transformaciones

43
Transformaciones
Datos asimétricos Datos con “ceros” Datos en proporciones

Logaritmos (diferentes Logaritmos mas una Arcseno


bases) constante. Log (x+c)

Raíz cuadrada Raíz cuadrada


Raíz cuártica

44
Pruebas estadísticas

• Comparación de medias/medianas
• Correlación/Regresión
• Multivariados

45
Pruebas de diferencias o Comparación de
medias/medianas
Chi- Kolmogrov-
cuadrado smirnov Kruskal-Wallis
T-student
independiente Mann-
Whitney
ANOVA Friedman
Independiente

T-student
Wilcoxon
relacionado

ANOVA
relacionado
46
Pruebas de correlación

Chi- Spearman Pearson


cuadrado

Kendall

47
Pruebas de regresión

Logística Lineal Cuadrática

Polinomial Múltiple

48
Pruebas multivariadas

ACP Cluster o NMDS


Análisis de
Agrupamient Escalamiento
Componentes multidimensional
principales o No métrico
(covarianza) (cualitativo)
ACP Cluster o ANCOVA
Análisis de
Componentes Agrupamient
principales o MANOVA
(correlación)
(cuantitativo)

49
Como se elige una prueba
estadística?

50
Sólo es necesario conocer tres
informaciones!!!!
¿Cuantas muestras son?
¿Qué tipo de variable es?
¿Son muestras independiente o relacionadas?

51
Muestras independ.
PRUEBAS DE DIFERENCIAS
Número de Tipo de No Paramétricos Muestras
muestras datos Paramétricos relacionadas
1 Categórico X2
Discreto/Ordinal Wilcoxon
Contínuo (normal) T-student
2 Categórico X2
Discreto/Ordinal Mann Wilcoxon
Whitney
Contínuo (normal) T-student-ind T-student-rel
>3 Categórico X2 X2
Discreto/Ordinal Kruskal Friedman
Wallis
Contínuo (normal) ANOVA-ind ANOVA-rel

52
PRUEBAS DE RELACION, CAUSA-
EFECTO
Prueba Número de Tipo de No Paramétricos Paramétricos
muestras datos
Correlación 2 Categórico X2
Discreto/ordinal Kendall,
Spearman
Contínuo (normal) Pearson
Regresión 2 Categórico Regresión logística
Discreto/ordinal Regresión logística
Contínuo (normal) Regresión lineal,
cuadrática,
polinomial

53
PRUEBAS MULTIVARIADAS

Prueba Tipo de Objetivo


Variables

ACP (Análisis de Discretas, Reducir el número de variables,


Componentes Ordinales hasta encontrar la (s) más
Principales) Continuas importante (s).

Escalamiento Contínuas, Ordenas las muestras u objetos


multidimensional no Discretas con base a la similitud de sus
métrico elementos.

ANOSIM Contínuas, Probar si los grupos previamente


Discretas, definidos son estadísticamente
Ordinales significativos.

Análisis de Discretos, Crear grupos de los elementos de


agrupamiento Contínuas la muestra con características
(Clusters) similares e independientes.
54
Los estimados de la variable….

• Medidas de tendencia central y


• Medidas de precisión
• Medida de exactitud

Nuestros resultados siempre tendrán un margen de


error, porque trabajamos con muestras!!!!!

Por ello es importante dar a conocer cuanto de error


tenemos!!!
55
Diferentes tipos de estimados

BAJA EXACTITUD ALTA EXACTITUD ALTA EXACTITUD


ALTA PRECISION BAJA PRECISION ALTA PRECISION

56
% de presencia de
Dengue en
Colegios Estatales
en Piura

Colegio Colegio Colegio


20 30 34
1 1 1
Colegio Colegio Colegio
2 22 2 28 2 36

Colegio Colegio Colegio


3
21 35 3
29 35 3
37 35
Colegio Colegio Colegio
22 32 34
4 4 4
Colegio Colegio Colegio
23 37 36
6 5 5

57
La estadística descriptiva

• Medidas de tendencia Valor representativo de la


central muestra.
La mitad de nuestro
datos

• Medidas de Precisión Valores cercanos entre


las unidades de muestreo

Valor cercano al valor


• Medidas de exactitud real (que no sabemos)

58
Medidas de tendencia central:
Media, Mediana y Moda
Moda
Mediana
Media Moda es el valor que ocurre con mayor frecuencia

Mediana es el valor medio cuando los datos son

ordenados de mayor a menor

Media es calculado por la sumatoria de datos y

dividiendo por el numero de elementos

En biología usualmente no se usa Moda

59
Simétrico
Simétrico
Unimodal
Bimodal

Asimétrico Asimétrico
Unimodal Unimodal

60
Área verde en
Colegios Estatales
P. jacquacu
0.40
0.22
0.27
0.17
0.06
0.22
0.22
0.14
0.20
0.20
0.36
Datos 0.14
Media 0.22
Mediana 0.21
¿Cual de las dos medidas
Describe mejor nuestros
datos?

61
Altura de árboles
¿Cual de las dos medidas describe mejor la
1
1
ALTURA de árboles en el colegio?
1
1
1
1
1
1
1
Conjunto 1
de datos 1
1
1
1
50 metros

1
1
1
1
20

20 metros
50
Media 4.4
Mediana 1
1m

62
Medidas de Precisión

RANGO
Muestra A
Menos preciso (34)

Muestra B

Mas preciso (18)

Latidos por minuto

63
Medidas de Precisión

Muestra A
Mas preciso (16)

Muestra B

Menos preciso (20)

A, rango= 19 - 3 = 16
B, rango= 22 - 2 = 20

Solo toma en cuenta el valor más alto y el más bajo!!!

64
Quartiles: (mini rangos)
Rango intercuartílico
25 % de 25 % de 25 % de 25 % de
observaciones observaciones observaciones observaciones

Valor Primer quartil Q2 Tercer quartil Valor


mínimo Q1 mediana Q3 máximo
Observaciones en orden
creciente

50% de la muestra

65
• Quartiles: (mini rangos)
Muestra A

Mas preciso
Rango (16)
Menos preciso
Q1=8.5 Q3=14.5 Quartiles (6)
Q3-Q1=14.5-8.5
=6
Muestra b
Menos preciso
Rango (20)
Mas preciso
Quartil (2)
Q1=10.5 Q3=12.5
Q3-Q1=12.5-10.5
=2

66
Desviación estándar (√varianza)

Es el límite hasta donde las medidas son


“normales”. Encima de ello son grandes,
debajo de esto son chicos.
Describe la variabilidad de una muestra

67
68
Coeficiente de variación

Es el mismo valor pero en 394±147 (media±desviación estándar)


porcentaje con respecto a la
media!!! 394±37.3% (Media±CV)

69
Cuando se usa?
Para comparar dos
medidas de diferentes
escalas Hojas DAP
3.5 45.6
3.6 40.2
4.1 39.4
4.6 38.6
5.1 39.1
5.2 35.6
5.3 45.8
4.1 48.7
3.9 41.7
4.6 39.5
Datos 5.1 52.1 ¿Cual de las dos medidas
(Hojas o Diámetro Altura
Desviación estándar 0.659 4.999 Pecho -DAP)es más variable
Coeficiente de variación 14.77% 11.79% o menos precisa?

70
Índice de diversidad de Shannon :

Frecuencia homogénea en categorías tiene Alta diversidad


Frecuencia heterogénea en categorías tiene baja diversidad

Colores de ojos Frecuencia Colores de ojos Frecuencia


Negro 12 Negro 34
Marrón 12 Marrón 7
Celeste 12 Celeste 5
Azul 12 Azul 2
Shannon H´ 2.0 Shannon H´ 1.29
H´max= log k 2 H´max= log k 2
Proporción o J 1.0 Proporción o J 0.64

71
Confiabilidad de la media estimada

• Error estándar Es el error cometido al estimar la media poblacional


POBLACIÓN mediante la media muestral.
No mide variabilidad de una muestra!!!!

MUESTRA

72
Un mito
• Dos valores de error estandar
que se solapan o superponen 35

no muestran diferencias 30
H=10.049, P=0.007; Dunn, P<0.05 2013 vs2015

significativas 25

• No es cierto!!! (Brown 1979, 20

Altura(m)
15

Payton et al 2003) 10

• No realizar pruebas de 5

significancia al ojimetro!! 0

2013 2014 2015

73
• Intérvalo de confianza
El 95% de límite de confianza significa que si tomas muestras repetidas de una
población y calculas para cada muestra el promedio y su límites de confianzas, entonces
el intervalo de confianza al 95% de tus muestras podria incluir la media paramétrica o
poblacional

74
Resumen
GRÁFICO PARA ESTADÍSTICA DESCRIPTIVA

• Grafico de barras con líneas de error


Boxplot
Barras y torta/pastel
Datos nominales u
ordinales
Tablas

79

También podría gustarte