Está en la página 1de 46

Clase 1: Estadı́stica Descriptiva

Jaime Mosquera
jaime.mosquera@udea.edu.co

Departamento de Ingenierı́a de Sistemas

4 de Febrero de 2020

1 / 46
La Estadistica

2 / 46
¿Qué es la Estadı́stica?

La Estadı́stica se puede definir como la ciencia que estudia cómo debe


emplearse la información y cómo dar una guı́a de acción en
situaciones prácticas que entrañan incertidumbre.

Se usa para realizar inferencia con los datos. Esto permite tomar
decisiones y formular predicciones..

Se ocupa de los métodos y procedimientos para recoger, clasificar,


resumir, hallar comportamientos y analizar los datos, siempre y cuando
la variabilidad e incertidumbre sea una causa intrı́nseca de los mismos.

3 / 46
¿Qué es la Estadı́stica?

Clasificación

Estadı́stica Descriptiva: organiza, describe y representa un grupo de


datos utilizando métodos numéricos y gráficos que resumen y
presentan la información contenida en ellos.

Estadı́stica Inferencial: Apoyándose en el cálculo de probabilidades y


a partir de datos muestrales, efectúa estimaciones, decisiones,
predicciones u otras generalizaciones sobre un conjunto mayor de
datos.

4 / 46
Definiciones básicas

5 / 46
Población y Muestra

Población: es un conjunto finito o infinito de elementos (personas,


animales o cosas) que presentan caracterı́sticas comunes, sobre los
cuales se quiere efectuar un estudio determinado.

Muestra: es un subconjunto de la población, seleccionado de tal


forma, que sea representativo de la población en estudio,
obteniéndose con el fin de investigar alguna o algunas de las
propiedades de la población de la cual procede.

6 / 46
Población y Muestra

7 / 46
Otros conceptos

Parámetro: medida de resumen tomada sobre la población.

Estimador: medida de resumen tomada sobre la muestra.

Variable: es un simbolo, por ejemplo:


X , Y , A, B, ...

que puede tomar cualquier modalidad (valor) de un conjunto determinado.

8 / 46
Variable

9 / 46
Variable - Ejemplos

Ordinales:

Medalla obtenida: oro, plata, bronce.

Grado escolar: 1◦, 2◦, 3◦, ...

Frecuencia con la que viaja en vacaciones:

Nunca, Raramente, Ocasionalmente, Frecuentemente, Siempre

10 / 46
Variable - Ejemplos

Nominales:

Color de la camisa: rojo, verde, negro, blanco, ...

Sexo del usuario: masculino – femenino

Profesión: ingeniero, profesor, periodista, ...

11 / 46
Presentación tabular de la información

12 / 46
Dos tipos de tabla

Tablas de frecuencia.

Tablas de contingencia.

Concepto clave:

Clase
Grupo bajo el cual se clasifican los datos. Puede ser una categorı́a
(cualitativas) o un intervalo (cuantitativas).

13 / 46
Tablas de frecuencia

Cuando se tienen bastantes datos, estos se pueden agrupar en forma


de tabla de frecuencia.

En estas tablas se presentan la frecuencia de los datos.

Si los datos son categóricos, se agrupan en las categorı́as definidas.

Si los datos son cuantitativos, se agrupan por intervalos.

14 / 46
Otros conceptos

Frecuencia absoluta (fi ): número de datos que pertenece a cada


clase.

fi = # de datos de la clase i (conteo)


Frecuencia relativa (fRi ): fracción o proporción de datos que
pertenece a la clase i. Es la frecuencia absoluta dividida el número
total de datos (n).

fi
fRi =
n
Frecuencia relativa porcentual (fRi %): porcentaje de datos que
pertenece a la clase i. Es la frecuencia relativa multiplicada por 100.

15 / 46
Tablas de frecuencia

Ejemplo, variable cualitativa

Jorge es un estudiante de ingenierı́a de sistemas que está desarrollando un


proyecto acerca de la conformidad de un programa comercial. Para ello,
toma una muestra de 30 empresas que utilizan el programa, a las cuales se
les hace una encuesta donde se les pregunta SI están conformes o NO con
la aplicación del programa.

16 / 46
Tablas de frecuencia
Ejemplo, variable cualitativa

Los resultados obtenidos se muestran a continuación.

Si No No No No No
No No No Si No Si
Si Si No No No No
No No Si No Si No
No No No No No Si

Entonces:
Construir una tabla de frecuencias para esta situación.
La compañı́a encargada de evaluar los programas consideran que esta
dando malos resultados si hay más del 15 % de empresas inconformes.
¿Qué puede concluir Jorge respecto a dicho programa?
17 / 46
Tablas de frecuencia

Clase fi fRi fRi %


8
Si 8 30 26.67
22
No 22 30 73.33
Total 30 1 100

De la tabla podemos concluir que 8 de las 30 empresas están


conformes con el programa.

Jorge puede concluir que el programa esta dando malos resultados


porque se presentó un 73 % de empresas inconformes en la muestra.

18 / 46
Tablas de frec., variable cuantitativa

Otros conceptos

Frecuencia acumulada (Fi ): Suma de las frecuencias anteriores


hasta la frecuencia i.
i
X
Fi = fj
j=1

Frecuencia relativa acumulada (FRi ): Es la frecuencia acumulada


dividida el número total de datos (n).

Fi
FRi =
n

19 / 46
Otros conceptos

Frecuencia relativa porcentual (fRi %): porcentaje de datos que


pertenece a la clase i. Es la frecuencia relativa multiplicada por 100.

Marca de clase: Punto medio de los extremos del intervalo

a+b
(a, b] → mi =
2

20 / 46
Tablas de frec., variable cuantitativa

Proceso de Agrupamiento en Intervalos (Clases):

1. Identificar el valor mı́nimo (xmin ) y máximo (xMax ) de los datos.

2. Calcular el rango de los datos:

R = xMax − xmin

3. Determinar la cantidad de intervalos [a; b):

k = 1 + 3.32 · log10 (n) (Regla de Sturges)

21 / 46
Tablas de frec., variable cuantitativa

Proceso de Agrupamiento en Intervalos (Clases):

4. Calcuar la amplitud del intervalo. Redondear al entero superior:


R
A=
k
5. Establecer intervalos.

6. Realizar el conteo de datos para cada intervalo (frecuencia absoluta).


7. Calcular las otras frecuencias y la marca de clase.

22 / 46
Ejemplo, variable cuantitativa

Datos correspondientes al número de bicicletas prestadas durante varias


semanas por una estación del sistema de bicicletas públicas:

Vamos a construir la tabla de frecuencias y a realizar algunas


interpretaciones.

23 / 46
Ejemplo, variable cuantitativa

Solución:

Rango:
R = xMax − xmin = 79 − 12 = 67
Número de intervalos:

k = 1 + 3.32 log1 0(57) = 6.83 ≈ 7

Amplitud

R 67
A= = = 9.57 ≈ 10
k 7

24 / 46
Ejemplo, variable cuantitativa

Tabla de frecuencias correspondiente:

25 / 46
Ejemplo, variable cuantitativa

Respondamos,

¿Cuántas veces se prestaron de 20 a 30 ciclas?


¿Qué porcentaje de las veces se prestaron entre 70 y 80 ciclas?
¿Qué significa F3 = 34?

26 / 46
Ejercicio (tarea)

En una central de procesamiento de datos se revisan los tiempos de


respuesta a diversos usuarios (39), los datos se muestran a continuación
(tiempo en segundos):

25 31 42 22 36 31 45 50 52 35 33 32 37
28 20 28 35 28 39 43 48 51 40 37 36 29
31 25 39 23 26 40 47 44 55 30 28 38 28

Construir la tabla de frecuencia y escribir algunas conclusiones.

27 / 46
Tablas de contingencia

Exclusivas de varaibles cualitativas.

Son tablas cruzadas: las filas son las clases de una variable, y las
columnas las clases de otra.

En realidad, también es una tabla de frecuencias.

28 / 46
Ejemplo, variable cualitativa

Con el fin de determinar que materias opcionales, en deportes, se podrı́an


proponer a los estudiantes de una universidad, se hizo necesario hacer un
estudio acerca de la actividad fı́sica que ellos realizan en su tiempo libre,
para ello, hizo una encuesta entre 156 estudiantes de varias carreras y se
les preguntó acerca de su deporte preferido para practicar en tiempo libre.
Los resultados se muestran en la siguiente tabla de contingencia:

29 / 46
Ejemplo, variable cualitativa

30 / 46
Ejemplo, variable cualitativa

Interpretemos,

El 24.36 % de la personas que fueron encuestadas fueron mujeres que


prefieren practicar el baloncesto.

El 3.85 % de los participantes son hombres y se inclinan por el


atletismo; el 1.92 % de los participantes son mujeres y prefieren el
futbol, el cual es el porcentaje más bajo de la muestra.

El deporte que más practican independientemente del género, es el


baloncesto con un 33.33 %.

31 / 46
Técnicas Gráficas para Explorar Datos

32 / 46
Variable Cuantitativa

33 / 46
Diagrama de puntos

Variable cuantitativa

Ejemplo de los préstamos


de biciletas

Recomendados para muestras


pequeñas, la gráfica permite ver
rápidamente la tendencia y
variabilidad de los datos.
Cada punto representa un dato.
Su valor se lee en el eje x.
10 20 30 40 50 60 70 80
Bicicletas prestadas

34 / 46
Histograma

Variable cuantitativa
Ejemplo de los préstamos de biciletas

20
Representación gráfica de las
tablas de frecuencia.

15
Se recomienda para muestras

Frecuencia absoluta
grandes.

10
Es un gráfico formado por
barras.

5
Eje x: Variable numérica.
Eje y : Frecuencia (absoluta o
relativa)
0

10 20 30 40 50 60 70 80
# de bicicletas prestadas

35 / 46
Polı́gono de frecuencia

Variable cuantitativa
Ejemplo de los préstamos de biciletas

20
15
Frecuencia absoluta
Se forman puntos con los
valores de la marca de clase y la

10
frecuencia.
Estos puntos se unen con
segmentos de recta.
5
0

10 20 30 40 50 60 70 80
# de biciletas prestadas

36 / 46
Ojiva

Es un polı́gono de frecuencias de
la frecuencia acumulada
(absoluta o relativa).

Eje x: Marcas de clase


Eje y : frecuencia

37 / 46
Variable Cualitativa

38 / 46
Diagrama de barras

Variable cualitativa

Eje x: Variable categórica.

Eje y : Frecuencia (absoluta o relativa), conteo o variable numérica.

Los ejes son inercambiables.

39 / 46
Diagrama de barras

Por ejemplo, cosideremos la cantidad de total biciletas que se prestaron


cada dı́a:

40 / 46
Diagrama de barras

400
300 Número total de bicicletas prestadas cada día de la semana
# de bicicletas

200
100
0

Lun Mar Mie Jue Vie Sáb

Día

41 / 46
Diagrama de barras
Retomemos el ejemplo de la encuesta de conformidad con el programa
comercial:
Conformidad con el programa comercial
20
Frecuencia absoluta

15
10
5
0

No Si

Respuesta

42 / 46
Diagrama circular

Variable cualitativa

Es una representación circular.

También se conoce como Torta.

Las tajadas representan la frecuencia (absoluta o relativa).

Los colores representan la modalidad (valores) de la variable


categórica.

43 / 46
Diagrama circular

Retomemos el ejemplo de la encuesta de conformidad con el programa


comercial:

44 / 46
Diagrama circular
Por ejemplo, cosideremos la cantidad de biciletas que se prestaron cada dı́a:

Figura: % de bicicletas prestadas cada dı́a de la semana.


45 / 46
Gracias

46 / 46

También podría gustarte