Está en la página 1de 52

Estadística y Probabilidad Básica

Odette Pantoja Díaz


Contacto: 0984170055
Conformación de equipos de trabajo
Capítulo 1: ESTADÍSTICA DESCRIPTIVA

1.1 Distribuciones de Frecuencia


1.2 Medidas de Tendencia Central
1.3 Medidas de Dispersión
Capítulo 1
Introducción a la Estadística Descriptiva
1. Introducción

Estadística es “el método que permite organizar, sintetizar , presentar,


analizar, cuantificar e interpretar una gran cantidad de datos, de tal
forma que se pueden tomar decisiones, realizar generalizaciones y
obtener conclusiones válidas sobre los fenómenos o líneas de
investigación en estudio.”

Rodriguez y Pierdant, 2015


1. Introducción

Se encarga mediante la
aplicación de métodos
Estadística Descriptiva y técnicas de obtener,
organizar, presentar y
describir los datos.

Su objetivo es generalizar
Inferencial o deducir a partir del
estudio de muestras.
2. Conceptos Generales

• Recolección de datos: herramientas y métodos que se utilizan para


obtener resultados y luego transformarlos a información
• Dato: números, variables, elementos que pueden ser comparados e
interpretados
• Número: representación de una unidad
• Numeral: Símbolos asignados a objetos o perteneciente o relativo al
número, sirve para identificar y categorizar.
• Variable: representación de una característica que esta sujeta a un
cambio. Puede ser cuantitativa y cualitativa
2. Conceptos Generales

• Población: Conjunto finito o infinito de individuos que tienen ciertas


características
• Parámetro: Característica o especificación de un tipo de dato que se
quiere receptar con respecto a la población.
• Censo: Conteo o recuento de la población.
• Encuesta: método o herramienta para la recolección de datos
• Muestra: subconjunto de la población que posee al menos una
característica en común.
3. Método para realizar una investigación
Formulación del
Problema

Diseño del
Nuevo Problema
Experimento

Nuevo Recolección de
Conocimiento Datos

Inferencia
Proceso de datos y
estadística y
descripción
conclusiones
4. Tipo de Variables

Variables

Punto de Vista Punto de vista


Metodológico Estadístico

Variable Variable Variable


dependiente Cuantitativa Cualitativa

Variable
Discretas Nominales
Independiente

Continuas Ordinales
5. Herramientas para la comparación de datos

• Porcentajes: es la relación que se establece entre el subconjunto “n”


del conjunto “N”, multiplicando esta relación por 100. Se representa
con el símbolo % y no pueden promediarse, sumarse o combinarse
cuando se han obtenido de bases diferentes.
• Ej: porcentaje de hombres y mujeres del aula.

Rodríguez, J. & Pierdant, A. (2007). Estadística para la Administración .México: Patria.


5. Herramientas para la comparación de datos

• Proporciones: es la igualdad de dos razones, cuyo objetivo es


establecer la relación entre una parte con respecto al todo. Se
expresan como:

La forma de leer la proporción es: 2 es a 4 como 8 es a 16, y en toda proporción el


producto de los medios es igual al producto de los extremos (2 x 16 = 32) y (4 x 8 = 32).
5. Herramientas para la comparación de datos

• Razones: o también llamadas relaciones de dos cantidades, es el


resultado de la comparación de éstas. Las cantidades pueden
compararse de dos formas:

• Razón aritmética: consiste en saber cuantas veces excede una a la otra.


Ej1: 14 – 11 ó 14 · 11 (se lee 14 es a 11),

Ej2: en equidiferencia a–b=c–d ó a·b::c·d (se lee a es a b como c es a d)


• Razón geométrica: consiste en encontrar cuantas veces contiene una a la otra.
Ej: Razón de hombres a mujeres
5. Herramientas para la comparación de datos

• Coeficientes: se conoce también como índices o tasas; en éstos, el


numerador indica el número de veces que un evento específico
ocurre durante un periodo particular, y el denominador expresa el
número de veces que el evento está sujeto a riesgo de que ocurra.
• Ej: delincuencia, natalidad, mortalidad, nupcialidad, graduados, afiliación.
• Incrementos: es el análisis de un comportamiento que tienen los
fenómenos a través del tiempo a partir del comportamiento de las
variables asociadas con ellos, lo que permite determinar los cambios
en estos.
• Ej: Inflación
6. Distribución de Frecuencias

• Los datos analizados en estadística descriptiva se presentan


comúnmente en texto, cuadros estadísticos y en gráficas.
• Los cuadros estadísticos pueden ser catalogados por tablas de
contingencia o tablas de condensación de datos llamados
Distribución de Frecuencias

“Distribución de frecuencia es la presentación en forma tabular de las


frecuencias que ocurren de cada característica en las que ha sido
dividida una variable”
6. Distribución de Frecuencias

Procedimiento para la elaboración de una Tabla de Distribución de Frecuencias Continuas:

1. Determinación del número de intervalos o clases


a) Criterio del Investigador (EJ: de 10 a 100, de 100 a 1.000, o 1.000 a 10.000)
b) Método de Sturges
𝑘 = 1 + 3,322 log 𝑛 ; 𝑑𝑜𝑛𝑑𝑒 𝑛 = # 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑎 𝑐𝑜𝑛𝑑𝑒𝑛𝑠𝑎𝑟, k=# de intervalos

2. Determinar el ancho del intervalo (ti)


𝑑𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 −𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝑟𝑎𝑛𝑔𝑜
𝑡𝑖 = =
𝑘 𝑘
Nota: cuando t no es entero, se puede utilizar con décimas o redondear al inmediato superior
6. Distribución de Frecuencias

3. Construir los intervalos de clase


No Exactos (ficticios)
a) Fijar el limite inferior del primer intervalo de clase
𝑙𝑖𝑛𝑓 = 𝑑𝑎𝑡𝑜 𝑐𝑜𝑛 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 𝑑𝑒𝑙 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
b) Fijar el limite superior del intervalo de clase
𝑙𝑠𝑢𝑝 = 𝑙𝑖𝑛𝑓 + 𝑡𝑖 − 𝑢 ; 𝑢 = la unidad menor del límite del intervalo con
valor (1)
Ej: ti = 0,7; entonces u=0,1. Si ti= 0,07; u=0,01
c) Calcular el limite inferior y superior del segundo intervalo de clase
𝑙𝑖𝑛𝑓 = 𝑙sup 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 + 𝑢 ; 𝑙𝑠𝑢𝑝 = 𝑙𝑖𝑛𝑓 + 𝑡𝑖 − 𝑢

d) Repetir la operación para el resto de Intervalos de Clase


Longitud del intervalo de clase
=0.7 de unidad.
6. Distribución de Frecuencias
linf = 4.2-0.05 = 4.15

Exactos (Reales): lsup = 4.15+0.7 =


• En los intervalos exactos, la elaboración del límite inferior y superior debe tomar en cuenta el 4.85
error mínimo y máximo permitido del dato
• El error se considera como la unidad menor siguiente del límite del intervalo con valor (5)
• Ej: ti = 0,7; entonces el error será +/- 0,05. Si ti 0,07; el error será +/- 0,005

a) Fijar el limite inferior del primer intervalo de clase


𝑙𝑖𝑛𝑓 = 𝑑𝑎𝑡𝑜 𝑐𝑜𝑛 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 𝑑𝑒𝑙 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑑𝑎𝑡os − e

b) Fijar el limite superior del intervalo de clase


𝑙𝑠𝑢𝑝= 𝑙𝑖𝑛𝑓 + 𝑡𝑖
c) El limite inferior para los siguientes intervalos de clase es igual al limite superior de la
clase que lo precede.
d) Se repite el cálculo del limite superior como lo indica el literal b)
6. Distribución de Frecuencias

4. Determinar la marca de la clase (mi)


𝑙𝑖𝑛𝑓 + 𝑙𝑠𝑢𝑝
𝑚𝑖=
2
5. Determinar la frecuencia absoluta del intervalo (fi): clasificación de
datos para cada intervalo
6. Determinar la frecuencia relativa (fr)
𝑓𝑖
𝑓𝑟 =
𝑛
7. Determinar la frecuencia acumulada absoluta (Fi) y frecuencia
acumulada relativa (Fr)
Ejercicio

• Construya una tabla de Distribución de Frecuencias de una variable


continua de los datos provenientes de las calificaciones de los
estudiantes del examen de estadística.
Datos Ordenados
5,0
Ordenar los números de menor a mayor 5,4
5,7
5,8
6,1
6,4
6,5
6,6
6,7
6,8
6,9 n= 27 elementos
7,0
7,1
Elemento menor: 5
7,2
7,3 Elemento mayor: 9,7
7,4
7,5
7,7
7,8
7,9
8,0
8,1
8,2
8,5
8,7
8,9
9,7
1. Determinación del número de intervalos o clases

a) Método de Sturges

𝑘 = 1 + 3,322 log 𝑛 ; 𝑑𝑜𝑛𝑑𝑒 𝑛 = # 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑎 𝑐𝑜𝑛𝑑𝑒𝑛𝑠𝑎𝑟, k=# de intervalos

𝑘 = 1 + 3,322 log 27 = 5,75 ≈ 6

2. Determinar el ancho del intervalo (ti)

𝑑𝑎𝑡𝑜 𝑚𝑎𝑦𝑜𝑟 −𝑑𝑎𝑡𝑜 𝑚𝑒𝑛𝑜𝑟 𝑟𝑎𝑛𝑔𝑜


𝑡𝑖 = = = (9,7-5) /6 = 0,78 ≈ 0,8
𝑘 𝑘
3. Construir los intervalos de clase

No Exactos (ficticios)
a) Fijar el limite inferior del primer intervalo de clase

𝑙𝑖𝑛𝑓 = 𝑑𝑎𝑡𝑜 𝑐𝑜𝑛 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 𝑑𝑒𝑙 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑙𝑖𝑛𝑓 =5

b) Fijar el limite superior del intervalo de clase


𝑙𝑠𝑢𝑝 =5+(0,8-0,1)
𝑙𝑠𝑢𝑝 = 𝑙𝑖𝑛𝑓 + 𝑡𝑖 − 𝑢 ; 𝑢 = la unidad menor del límite del intervalo con valor (1)
𝑙𝑠𝑢𝑝 =5,7
Ej: ti = 0,7; entonces u=0,1. Si ti= 0,07; u=0,01

c) Calcular el limite inferior y superior del segundo intervalo de clase 𝑙𝑖𝑛𝑓 =5,7+0,1
𝑙𝑖𝑛𝑓 =5,8
𝑙𝑖𝑛𝑓 = 𝑙sup 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 + 𝑢 ; 𝑙𝑠𝑢𝑝 = 𝑙𝑖𝑛𝑓 + 𝑡𝑖 − 𝑢
𝑙𝑠𝑢𝑝 =5,8+(0,8-0,1)
d) Repetir la operación para el resto de Intervalos de Clase 𝑙𝑠𝑢𝑝 =6,5


3. Construir los intervalos de clase

No Exactos (ficticios)

𝑙𝑖𝑛𝑓 =5

𝑙𝑠𝑢𝑝 =5+(0,8-0,1)
𝑙𝑠𝑢𝑝 =5,7

𝑙𝑖𝑛𝑓 =5,7+0,1
𝑙𝑖𝑛𝑓 =5,8

𝑙𝑠𝑢𝑝 =5,8+(0,8-0,1)
𝑙𝑠𝑢𝑝 =6,5


Construir los intervalos de clase

Exactos (Reales):

a) Fijar el limite inferior del primer intervalo de clase


𝑙𝑖𝑛𝑓 =5-0,05 = 4,95
𝑙𝑖𝑛𝑓 = 𝑑𝑎𝑡𝑜 𝑐𝑜𝑛 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 𝑑𝑒𝑙 𝑐𝑜𝑛𝑗𝑢𝑛𝑡𝑜 𝑑𝑒 𝑑𝑎𝑡os − e

b) Fijar el limite superior del intervalo de clase


𝑙𝑠𝑢𝑝 =4,95+0,8
𝑙𝑠𝑢𝑝= 𝑙𝑖𝑛𝑓 + 𝑡𝑖 𝑙𝑠𝑢𝑝 =5,75

c) El limite inferior para los siguientes intervalos de clase es igual al limite superior de la clase
que lo precede. 𝑙𝑖𝑛𝑓 =5,75
a) Se repite el cálculo del limite superior como lo indica el literal b) 𝑙𝑠𝑢𝑝 =5,75+0,8
𝑙𝑠𝑢𝑝 =6,55


Construir los intervalos de clase

Exactos (Reales):

𝑙𝑖𝑛𝑓 =5-0,05 = 4,95

𝑙𝑠𝑢𝑝 =4,95+0,8
𝑙𝑠𝑢𝑝 =5,75

𝑙𝑖𝑛𝑓 =5,75
𝑙𝑠𝑢𝑝 =5,75+0,8
𝑙𝑠𝑢𝑝 =6,55
4. Determinar la marca de la clase (mi)
𝑙𝑖𝑛𝑓 + 𝑙𝑠𝑢𝑝
𝑚𝑖=
2

4. Determinar la frecuencia absoluta del intervalo


(fi): clasificación de datos para cada intervalo

5. Determinar la frecuencia relativa (fr)


𝑓𝑖
𝑓𝑟 =
𝑛

6. Determinar la frecuencia acumulada absoluta (Fi)


y frecuencia acumulada relativa (Fr)
4. Determinar la marca de la clase (mi)
𝑙𝑖𝑛𝑓 + 𝑙𝑠𝑢𝑝
𝑚𝑖=
2

4. Determinar la frecuencia absoluta del intervalo


(fi): clasificación de datos para cada intervalo

5. Determinar la frecuencia relativa (fr)


𝑓𝑖
𝑓𝑟 =
𝑛

6. Determinar la frecuencia acumulada absoluta (Fi)


y frecuencia acumulada relativa (Fr)
4. Determinar la marca de la clase (mi)
𝑙𝑖𝑛𝑓 + 𝑙𝑠𝑢𝑝
𝑚𝑖=
2

4. Determinar la frecuencia absoluta del intervalo


(fi): clasificación de datos para cada intervalo

5. Determinar la frecuencia relativa (fr)


𝑓𝑖
𝑓𝑟 =
𝑛

6. Determinar la frecuencia acumulada absoluta (Fi)


y frecuencia acumulada relativa (Fr)
4. Determinar la marca de la clase (mi)
𝑙𝑖𝑛𝑓 + 𝑙𝑠𝑢𝑝
𝑚𝑖=
2

4. Determinar la frecuencia absoluta del intervalo


(fi): clasificación de datos para cada intervalo

5. Determinar la frecuencia relativa (fr)


𝑓𝑖
𝑓𝑟 =
𝑛

6. Determinar la frecuencia acumulada absoluta (Fi)


y frecuencia acumulada relativa (Fr)
CONCLUSIONES
• Los porcentajes de Frecuencia Acumulada Relativa indican que el 55,5% de los estudiantes obtuvo notas inferior a 7,35.
• Solo el 3,8% obtuvo calificaciones superiores a 8,95 (frecuencia relativa).
• El 11,1% de los estudiantes se encuentra en el rango más bajo de calificaciones (frecuencia relativa).
6. Distribución de Frecuencias

Procedimiento para la elaboración de una Tabla de Distribución de


Frecuencias Discretas:

La construcción sigue los pasos establecidos para una variable continua


con la ventaja de que no se requiere la columna de intervalos de clase,
ni marca de la clase.
Ejemplo

• Una compañía aseguradora de automóviles tienen contratados 26


agentes de ventas , que se les paga sus ganancias por comisiones
cada semana, las ganancias recibidas de la semana pasada se
muestran a continuación. Crear una tabla de distribución de
frecuencias.
1. Ordenar de menor a mayor

2. Conformación de la tabla de frecuencias


7. Gráficas

Las gráficas son una herramienta analítica de gran ayuda visual para el
investigador o el analista, ya que permiten realizar la comparación
entre magnitudes, tendencias y relaciones entre los valores que
adquiere una o más variables.

Las gráficas, también son de gran utilidad como medios de divulgación


del análisis estadístico, ya que las relaciones visuales se captan con
facilidad y resulta sencillo interpretarlas y recordarlas.
7. Gráficas

ELEMENTOS DE UNA GRAFICA:

En general se deben tener en cuenta los siguientes elementos:


1.1 Título de la gráfica
1.2 Ejes
1.3 Etiquetas de los ejes
1.4 Escala
1.5 Altura de la barra
1.6 Rótulos de graduación
1.7 Imagen de la gráfica
1.8 Líneas de división
1.9 Área de trazado
1.10 Marcas de datos
1.11 Serie de datos
1.12 Leyenda
7. Gráficas

DIAGRAMA CIRCULAR

Es de especial utilidad para


mostrar proporciones
(porcentajes) relativas de
una variable.

Se crea marcando una porción del


círculo correspondiente a cada
categoría de la variable.
7. Gráficas

DIAGRAMA DE BARRAS
Es una forma gráfica de representar datos cualitativos que se
han resumido en una distribución de frecuencias, de relativas
o de porcentuales. Hay varios tipos de gráficos de barras,
como son :

GRÁFICA SIMPLE DE BARRAS VERTICALES


Para respuestas categóricas cualitativas en el que solo
interviene una barra para cada clase. Su trazo se realiza
ubicando en el eje horizontal de la gráfica los nombres
que identifican cada una de las clases.
En el eje vertical se usa una escala de frecuencias, una de
frecuencias relativas o una de porcentuales.
Luego, con una barra de un ancho fijo trazada sobre cada
indicador de clase llegamos a la altura que corresponde al tipo
de frecuencia escogido.
Las barras se separan a fin de señalar que cada clase es
una categoría independiente.
Los espacios entre las barras deben corresponder a la
mitad del ancho de una barra.
7. Gráficas

GRÁFICA SIMPLE DE BARRAS


HORIZONTALES

Se utiliza principalmente para facilitar la


comparación entre las diferentes clases
que componen los datos categóricos. El
trazo de la gráfica es muy similar a la
gráfica de barras verticales, solo
que éstas van en forma horizontal y
están ordenadas de la mayor a la menor
frecuencia absolutas, de frecuencia
relativas o de porcentajes. De
esta manera se logra una mejor
visualización en las preferencias.
7. Gráficas

GRÁFICA DE BARRAS COMPONENTES

Este tipo de gráfica se usa cuando las


diferentes categorías de datos se
componen de otras clases , de tal forma
que cada barra se pueda subdividir y
representar cada una de estas clases .Así
mismo, entre las categorías y sus
componentes se comparan valores.
También se le conoce como barras
agrupadas. Se puede hacer uso de barras
horizontales o de barras verticales; su
escogencia depende de lo que se
pretenda ilustrar para que facilite
su visualización.
7. Gráficas

GRÁFICA DE BARRAS
SECCIONADAS

Esta gráfica compara entre


categorías el aporte de cada valor
al total ,dando lugar a
una columna apilada para cada
clase.
También se puede presentar de
manera horizontal o vertical
7. Gráficas

DIAGRAMA DE PARETO
Es un tipo especial de diagrama de barras verticales,
donde las respuestas categóricas se grafican en orden
descendente de frecuencias y se combinan con un
polígono acumulado en la misma escala. El diagrama
de Pareto se usa ampliamente en el
control estadístico de procesos y el control
estadístico de la calidad del producto.
Lo que se pretende con este tipo de gráfico es
describir en donde se presenta el mayor porcentaje
del problema y que factores lo afectan.
Este concepto, se conoce como la regla de 80-20,
considera que el 80% de la actividad se debe al 20%
de los factores.
Al concentrarse en el 20% de los factores, los
gerentes pueden atacar el 80% del problema.
7. Gráficas

GRÁFICAS DE LINEA

Se ilustra mediante segmentos de


línea los cambios en cantidades
con respecto al tiempo. Son
especialmente útiles en el
comercio y en los negocios.
7. Gráficas

HISTOGRAMAS

Una de las maneras más comunes de


representar una distribución de
frecuencia.
Su gráfica consiste en un conjunto de
barras, en la que la base de cada barra
representa una clase o intervalo,
indicada en el eje horizontal, y la altura
por su frecuencia, indicada en el eje
vertical.
Generalmente las barras se trazan
adyacentes una a la otra.
7. Gráficas

POLÍGONO DE FRECUENCIA

De segmentos de línea que


conectan los puntos formados por
la intersección del punto medio de
clase y la frecuencia de clase
absoluta, relativa o porcentual.
7. Gráficas

OJIVA
Es un polígono acumulado de frecuencia absoluta,
relativa o porcentual y por lo tanto representa
segmentos de línea que se origina al conectar los
puntos formados por la intersección entre el límite
inferior de cada clase con la frecuencia acumulada.
Es conocida como POLÍGONO DE FRECUENCIA
ACUMULADA MENOR QUE, ya que muestra el
número o porcentaje de observaciones menores a
cierto valor.
La ojiva es importante por que nos permite
extrapolar información que la distribución de
frecuencia oculta y así como calcular estadísticos
como la mediana, cuartiles, deciles y percentiles, en
forma aproximada.
Para construir la ojiva se debe primero elaborar la
distribución de frecuencia menor que.
7. Gráficas
DIAGRAMA DE CAJA

Es una representación gráfica, basada en cinco números


estadísticos: valor mínimo, Q1 , la mediana, Q3 y valor máximo.
Se utiliza como una técnica de ANÁLISIS EXPLORATORIO DE
DATOS y tiene la ventaja de que no se requiere de la desviación
estándar, ni de la media aritmética y así como de resumir los
datos en una distribución de frecuencia, situación que si
necesita el histograma, el polígono y la ojiva.
Para su trazo, se llevan a cabo los siguientes pasos:
1. Crear una escala apropiada a lo largo del eje horizontal
2. Dibujar una caja entre el Q1 y el Q3
3. Dentro de la caja trazamos una línea recta vertical que
representa la mediana
4. Finalmente, trazamos líneas horizontales de la caja hasta el
valor mínimo y de la caja hasta el valor máximo. A estas líneas
horizontales fuera de la caja se les conoce como “bigotes”

También podría gustarte