Está en la página 1de 27

Fundamentos de estadı́stica

Sección 1: Estadı́stica Descriptiva

1 / 27
Objetivos

Brindar los conocimientos necesarios para introducir en las principales


herramientas estadı́sticas
Proveer de habilidades para la aplicación en áreas de interés

2 / 27
Instructores

Docente: Caroll Antonio Siero Pereira


Economista graduado de la Universidad Centroaméricana (UCA)
Especialista en Econometrı́a, Finanzas e investigación en temas de
polı́ticas sociales y medición de pobreza

Asistentes: Raúl Enrique Godı́nez & Axsell Moisés López


Estudiantes del 5to año de la carrera de Ingenierı́a en Economı́a y
Negocios

3 / 27
Logı́stica

Sesiones: Lunes, jueves y viernes 8:00 am -1:00 pm


Material de la clase disponible en https://sites.google.com/
view/faoestadistica/p%C3%A1gina-principal
Formulario https://forms.gle/uNXWHUo3DFpeCZ1n7
Software a utilizar: Rstudio para el lenguaje R
Bibliografı́a de apoyo (disponible en la página)
Mann, P. S. (2007). Introductory statistics. John Wiley & Sons.
Dommenget, D. (2008). An Introduction to Statistical Analysis in
Climate Research. Leibniz-Institut für Meereswissenschaften.
Walpole, R. E., Myers, R. H., & Myers, S. L. (1999). Probabilidad y
estadı́stica para ingenieros. Pearson Educación.
Navidi, W. (2006). Estadı́stica para ingenieros (No. 519.5 N325).
McGraw Hill Interamericana.

4 / 27
Agenda

Parte 1: Introducción teórica


Receso
Parte 2: Aplicaciones en R
Introducción a R
Estudio de caso resuelto en R

5 / 27
Contenido

1 Muestras estadı́sticas y tipo de datos


Variables cuantitativas, cualitativas, discretas y continuas
Corte transversal, series de tiempo y datos panel

2 Análisis y organización de muestras estadı́sticas


Medidas de tendencia central y localización
Medidas de dispersión
Medidas de simetrı́a y forma
Distribución de frecuencias acumulativas
Gráfico de caja y bigote (Detección a priori de outliers)

3 Introducción a R

6 / 27
Tipos de variables

Variable

Cuantitativa Cualitativa

Discreta Continua

Figura 1: Tipos de variables

7 / 27
Tipos de datos
Corte transversal: Información de diferentes elementos recolectados
en el mismo punto del tiempo.
Example
La temperatura de diferentes ciudades del paı́s en un dı́a en especı́fico.

Series de tiempo: Información de un mismo elemento ero en


diferentes puntos del tiempo.
Example
La temperatura de un ciudad a lo largo de un año

Datos panel: Información de diferentes elementos recolectados a lo


largo del tiempo
Example
La temperatura de diferentes ciudades a lo largo del año
8 / 27
Medidas de tendencia central y localización

Media aritmética: Es el valor central de un conjunto de datos no


agrupados. La media se define como:
Pn
xi
x = i=1 (1)
n
Mediana: Es el valor del término de en medio en un conjunto de
datos ordenados creciente o decrecientemente.
Moda: Es el valor con mayor frecuencia en los datos

9 / 27
Ejemplo 1

La siguiente tabla muestra el rendimiento de trigo de 10 parcelas iguales.

Cuadro 1: Rendimiento en kilos


Parcela 1 2 3 4 5 6 7 8 9 10
Rendimiento 60 40 50 45 60 55 65 50 65 55

Si el área de cada parcela es 242 yardas cuadradas, calcule el rendimiento


promedio.

60 + 40 + 50 + 45 + 60 + 55 + 65 + 50 + 65 + 55
= 54.5 (2)
10

10 / 27
Ejemplo 2

La siguiente es la distribución de alturas de 85 plantas:

Tamaño 30 33 36 39 42 45
No. de plantas 8 13 20 29 10 5

Encuentre la media, la moda y la mediana de los datos

(30 ∗ 8) + (33 ∗ 13) + (36 ∗ 20) + · · · + (45 ∗ 5)


M edia =
85
= 37.23

11 / 27
Ejemplo 2

12 / 27
Cuartiles: Son tres medidas de resumen que dividen un conjunto de
datos clasificados en cuatro partes iguales:
El primer cuartil es el valor del término medio entre las observaciones
que son menores que la mediana
El segundo cuartil es igual que la mediana de un conjunto de datos.
El tercer cuartil es el valor del término medio entre las observaciones
que son mayores que la mediana.

13 / 27
Cuartiles

Cada una de estas porciones contiene el


25% de las observaciones de un conjunto de
datos dispuestos en orden creciente

Figura 2: Distribución por cuartiles

14 / 27
Percentiles

Cada una de estas porciones contiene el 1% de las


observaciones de un conjunto de datos dispuestos en
orden creciente

Figura 3: Distribución por percentiles

Aproximación del valor de un percentil

(n + 1)P
Lp = (3)
100

15 / 27
Ejemplo 3

Se tienen 800 observaciones de húmedad media en un dı́a y usted desea


trabajar con el 25 por ciento más alto de la muestra, ¿A partir de cuál
observación debe seleccionar los datos?
75
(800 + 1) = 601
100

16 / 27
Medidas de dispersión

Varianza
Varianza poblacional

(x − x)2
P
2
σ = (4)
N
Varianza muestral
(x − x)2
P
s2 = (5)
n−1


Desviación estándar poblacional σ = σ 2

Desviación estándar muestral s = s2

17 / 27
Ejemplo 4

Se presenta un conjunto de datos con 8 dı́as de la temperatura media en


un dı́a de un determinado lugar del paı́s. Este conjunto de datos pertenece
a una muestra de la temperatura de un mes. Calcule la desviación estándar
y la varianza de los datos.

Dı́a 1 2 3 4 5 6 7 8
Temperatura 27 30 28 31 32.5 27.7 30.2 29.4

18 / 27
Ejemplo 4

Datos (X − X)2
27 6.125625
30 0.275625
28 2.175625
31 2.325625
32.5 9.150625
27.7 3.150625
30.2 0.525625
29.4
P 0.005625
23.735
s2 3.39071429
s 1.84138923

19 / 27
Coeficiente de asimétrı́a de Fisher
E(X − x)3
S= (6)
σ3
Kurtosis
E(X − x)4
K= (7)
[E(X − x)2 ]2

20 / 27
Medidas de simetrı́a y forma

Figura 4: Ejemplos de simetrı́a y forma


21 / 27
Figura 5: Relación con las medidas de tendencia central

22 / 27
Distribución de frecuencias acumulativas

Tipos de clima Frecuencia


Frecuencia Porcentaje
en paı́ses del mundo acumulativa
Desierto 7 6.9 % 7
Desierto árido 5 4.9 % 12
Árido 6 5.9 % 18
Tropical 32 31.4 % 50
Mediterraneo 10 9.8 % 60
Maritimo 4 3.9 % 64
Templado 34 33.3 % 98
Ártico 4 3.9 % 102
Total 102 100 %

23 / 27
Gráfico de caja y bigote

El diagrama de caja es un diagrama de una muestra de datos que presenta


sus principales cuantiles. El cuadro en sı́ muestra el primer cuartil y el
tercer cuartil (su distancia se llama intercuartil o IQR).

Se agrega una lı́nea dentro del cuadro para indicar el valor mediano. Es
habitual añadir lı́neas verticales denominadas bigotes para mostrar la
variabilidad más allá de los cuartiles superior e inferior.

24 / 27
Figura 6: Gráfico de caja y bigotes de la temperatura de Managua en 15 dı́as

25 / 27
Segunda parte

Introducción a R y aplicación de ejercicios en R


Disponible en la página web

26 / 27
Gracias por su atención

27 / 27

También podría gustarte