Está en la página 1de 35

Probabilidad y

Estadística

Profesora: Fabiola Gesell Gamboa


Modificaciones: Pablo Chávez Merino
Tomar
¿Qué es la Concluir decisiones
estadística? Análizar
Organizar
Recolectar

https://www.youtube.com/watch?v=0_ybaigJd1s
Estadística
Población Muestra
Llamaremos población al Parte o subconjunto
conjunto de todos los representativo de la
Estadística elementos de interés población
descriptiva para un problema
determinado (individuos,
objetos u observaciones),
que al menos tengan una
característica en común.
Si es posible
obtener la
información
de todas las
unidades de
observación,
Estadística se está en
presencia de
descriptiva un Censo.

A los elementos que a estudiar, se les


llama Unidad de observación.
 Las características asociadas a un conjunto de
unidades observables de una población o muestra se
le llama variable.
Estadística
descriptiva
 Cualquier valor cualitativo o cuantitativo
asociado a una variable se le llama “dato” u
“observación”
Estadística
descriptiva
Datos cuantitativos
Datos continuos

Son aquellos que, al menos


teóricamente, pueden tomar
cualquier valor intermedio entre dos
valores dados (intervalo), ejemplo:
Estadística temperatura del horno de secado.
Datos discretos
descriptiva
Son aquellos que surgen por el
procedimiento de conteo, tomando
valores enteros (ejemplo: nº de
piezas que pasan por un punto del
proceso).
Datos cualitativos
Datos nominales
Son números o letras que
representan categorías donde no
interesa el orden
Ejemplo:
Datos ordinales
0 = defectuoso
Estadística 1 = no defectuoso
descriptiva Son números o letras que
representan categorías donde el
orden interesa
Ejemplo:
1: altamente defectuoso
2: medianamente defectuoso
3: no defectuoso
Actividad: Pensar en una investigación y hacer un listado
de preguntas que podría realizar que den como
resultados una variable de cada tipo:
Estadística - 2 Ordinales:
descriptiva - 2 nominales:
- 2 discretas:
- 2 continuas:
Esta tabla resume las frecuencias las ocurrencias para las categorías en
un conjunto de datos, es la agrupación de datos en categorías o clases;
la estructura de la tabla depende del tipo de variable (cualitativa o
Tabla de cuantitativa) que queramos ordenar y presentar.

frecuencias Frecuencia Frecuencia


Frecuencia Frecuencia
Variable Categoría o
Clase p
absoluta
n_i
relativa
f_i
Absoluta
acumulada
N_i
relativa
acumulada
F_i
cualitativa y 1 n1 f1 N1 F1

cuantitativa 2
3
n2
n3
f2
f3
N2
N3
F2
F3
discretas ⋮ ⋮ ⋮ ⋮ ⋮
i ni fi Ni Fi
datos<=10 ⋮ ⋮ ⋮ ⋮ ⋮
k nk fk Nk Fk
Frecuencia Frecuencia
Intervalo de Frecuencia Frecuencia
Absoluta relativa Marca de clase
clase absoluta relativa
acumulada acumulada m_i
[ Li-1 , Li [ n_i f_i
N_i F_i

[L0 , L1[ n1 f1 N1 F1 m1
[L1 , L2[ n2 f2 N2 F2 m2
Tabla de [L2 , L3[ n3 f3 N3 F3 m3
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
frecuencia [Li-1 , Li[ ni fi Ni Fi mi

para datos ⋮
[Lk-1 , Lk]

nk

fk

Nk

Fk

mk

cuantitativos Li-1: es el límite inferior del i-ésimo intervalo de clase.


continuos Li : es el límite superior del i-ésimo intervalo de clase.
𝒏𝒊 : cantidad de veces que se repite un suceso al realizar un número
determinado de experimentos aleatorios
𝒇𝒊 : es el cociente entre la frecuencia absoluta de algún valor de
la población/muestra y el total de valores que componen la
población/muestra
Frecuencia Frecuencia
Intervalo de Frecuencia Frecuencia
Absoluta relativa Marca de clase
clase absoluta relativa
acumulada acumulada m_i
[ Li-1 , Li [ n_i f_i
N_i F_i

[L0 , L1[ n1 f1 N1 F1 m1
[L1 , L2[ n2 f2 N2 F2 m2
Tabla de [L2 , L3[ n3 f3 N3 F3 m3
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
frecuencia [Li-1 , Li[ ni fi Ni Fi mi

para datos ⋮
[Lk-1 , Lk]

nk

fk

Nk

Fk

mk

cuantitativos
𝑵𝒊 : es la suma de las frecuencias absolutas del i-ésimo intervalo de clase y
continuos las anteriores a ellas y la llamamos “frecuencia absoluta acumulada”

Fi: es la suma de las frecuencias relativas del i-ésimo intervalo de clase y las
anteriores a ellas y la llamamos “frecuencia relativa acumulada”

mi: es el punto medio del i-ésimo intervalo de clase, llamada “marca de


clase”
Ejemplo: La siguiente tabla muestra un resumen del estudio sobre los
tipos de siniestros a automóviles que han ocurrido entre los meses de
enero y marzo en el gran Concepción
Tabla de
frecuencias
para Datos
cualitativos
La siguiente tabla muestra un resumen del estudio sobre
tipo de automóviles que circularon en quince minutos en la
intersección de las calles “Carrera” y “Paicaví”
Tabla de
frecuencias
para Datos
cualitativos

Actividad: Complete la tabla


Ejemplo Consideremos los datos para la variable “nivel de satisfacción” de la
atención al cliente en una sucursal de la compañía Telefónica del Norte.

Frecuencia Frecuencia
Tabla de Categorías
absoluta relativa (%)

frecuencias Satisfecho
No responde
15
10
25,4%
16,9%
para Datos Ni satisfecho ni insatisfecho
Insatisfecho
6
28
10,2%
47,5%
cualitativos Total 59 100,0%

¿Qué le llama la atención de los datos que contiene esta tabla?


Ejercicio: Los cuatro programas principales de televisión con mayor
audiencia fueron La ley y el orden (LyO), CSI, Sin rastro y Esposas
desesperadas (ED) (Nielsen Media Research, 1 de enero de 2007). A
continuación se proporcionan los datos que incluyen los programas
preferidos en una muestra de 50 espectadores.

Distribución
de frecuencias

a)Identifique la población y la variable en estudio. Clasifique la variable.

b)Construya la tabla de frecuencia e interprete n3 N2 f2 F3


Ejemplo (Cuantitativo discreto): Éstos fueron obtenidos de una prueba de
aptitudes de 150 preguntas a 50 personas entrevistadas recientemente
para un puesto en Haskens Manufacturing. Los datos indican el número de
preguntas respondidas correctamente.

Distribución
de frecuencias
para datos
cuantitativos
Los pasos para elaborar una distribución de frecuencias se pueden resumir en los
siguientes:

1.Obtener el rango (𝑅 = 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜 − 𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜)

2. Determinar el número de clases (𝑘), existen dos reglas bastante usadas para
determinar el número apropiado de clases son:
Distribución •2𝑘 > n (donde n representa el total de observaciones)
• 𝒌 ≈ 𝟏 + 𝟑, 𝟑 𝒍𝒐𝒈(𝒏) (regla de Sturges)
de frecuencias 𝑅
3. Determinar la amplitud (A): A = 𝑘
•Comprobar amplitud con
𝑣𝑎𝑙𝑜𝑟 𝑚í𝑛𝑖𝑚𝑜 + 𝐴 ∗ 𝑘 >= 𝑉𝑎𝑙𝑜𝑟 𝑚á𝑥𝑖𝑚𝑜

4. Completar la tabla con: Intervalos de clases, frecuencias absolutas (𝒏𝒊), frecuencias


relativas (𝒇𝒊), las frecuencias absolutas acumuladas (𝑵𝒊), las frecuencias relativas
acumuladas (𝑭𝒊) y las marcas de clases (𝒎𝒊)
La representación gráfica de una tabla o distribución
de frecuencias es una herramienta que permite
visualizar rápidamente los resultados de un conjunto
de datos.

Gráficas para
describir
datos
Es la gráfica más simple y es usada para representar
variables cualitativas o variables discretas.
Construcción
En el eje horizontal (X) se representan las clases y en el
eje vertical (Y) la frecuencia (“frecuencia absoluta”,
“relativa” o “relativa porcentual”). Sobre cada clase se
levanta una barra igual a su frecuencia.
Gráfico de Gráfico de barras

barras 16 15
Calidad bolsas de azúcar

14

12

Nª DE OBSERVACIONES
10

6 5
4
4
2
2

0
Sin defecto bajo medio alto
CLASES
Este tipo de gráficos se utilizada cuando
queremos representar la distribución de
frecuencias de una variable cualitativa o
cuantitativa continua mediante una
circunferencia.
Gráfico
circular o de
torta
Ejemplo (cuantitativo continuo): El informe Nielsen Home Technology
Report proporciona información sobre tecnología en el hogar y su uso. Los
datos siguientes registran las horas de uso de computadoras personales
durante una semana para una muestra de 50 personas.

Distribución
de frecuencias
para datos
cuantitativos
Actividad.

a) Construya la tabla de frecuencia asociada e interprete lo relevante.


Esta gráfica es usada para representar la
distribución de frecuencias de una variable
cuantitativa continua cuyos datos han sido
ordenados en intervalos de clase.

Histograma
Es un icono gráfico para representar la información, a
través de una figura que se relaciona con la variable que
se está analizando se presenta la distribución.

Pictograma
Necesitamos determinados valores numéricos
que permiten cuantificar ciertas “características” de la
distribución, llamando a estos valores “estadísticos” o
“estadígrafos”, si son calculados a partir de los datos de
una muestra y “parámetros” si son calculados desde los
datos de una población. Existen 4 grandes familias que
Estadígrafos veremos:
1. Medidas de tendencia central
2. Medidas de posición
3. Medidas de dispersión
4. Medidas de forma
Localizan el centro de la distribución, portando
información respecto al valor promedio de un conjunto
de datos.
Medidas de
tendencia Los estadígrafos más utilizados son:
 Media:
central  Mediana
 Moda
Son utilizadas cuando se quiere dividir el
conjunto de datos en partes iguales. Según el número de
particiones pueden ser:

 Cuartiles (Ki) Existen tres cuartiles que dividen el


conjunto de datos en 4 partes iguales, cada uno reúne
Medidas de un 25%.
posición  Quintiles (Qi) Dividen el conjunto de datos en 5 partes
iguales, por lo tanto hay 4 quintiles con 20% cada uno.
(Cuantiles)
 Deciles (Di) Dividen el conjunto de datos en 10 partes
iguales, por lo tanto hay 9 deciles con 10% cada uno.
 Percentiles (Pi) Dividen el conjunto de datos en 100
partes iguales, por lo tanto hay 99 quintiles con 1%
cada uno.
Las medidas de tendencia central no bastan para
conocer el comportamiento de una distribución de
frecuencias, puesto que no proporcionan información
respecto de la “variabilidad” de los datos. Muchas veces,
el desconocimiento de esta medida nos conduce a tomar
decisiones erróneas al usar las medidas de tendencia
central.
Medidas de Las “medidas de dispersión” cuantifican la dispersión de
dispersión los datos en torno a un valor central, por lo general es la
media.
 Varianza
 Desviación estándar
 Rango
 Coeficiente de variación
- Varianza
- Desviación
estándar
- Rango
- Coeficiente
de variación
Las “medidas de forma” buscan cuantificar aspectos
formales de una distribución de frecuencias basados en
comparar el comportamiento en las colas de las
distribución con respecto a las zonas centrales de la
misma. Entregan in indicio de la forma de distribución.
Medidas de
forma Los coeficiente son dos:

 Coeficiente de asimetría
 Curtosis
Las “medidas de asimetría o sesgo” cuantifican el grado
de asimetría de la distribución en torno a una medida de
tendencia central.

Asimetría
𝑛 3
𝑛 𝑥𝑖− 𝑥ҧ
𝐴𝑠 = ෍
(𝑛 − 1)(𝑛 − 2) 𝑠
𝑖=1
Se tienen los siguientes 3 casos:
 Si As < 0 la distribución es asimétrica hacia la izquierda (negativa).
Los datos están concentrados a la derecha
 Si As = 0 la distribución es simétrica.
Los datos presentan una concentración centrada
 Si As > 0 la distribución es asimétrica hacia la derecha (positiva).
Asimetría Los datos están concentrados a la izquierda
Las “medidas de curtosis” cuantifican el grado de
apuntamiento o aguzamiento de la de frecuencias con
respecto de una distribución simétrica unimodal de
forma acampanada (coeficiente de curtosis, K). Es decir,
que indica cuan alta o baja está la curva de los datos. La
fórmula de calculo es:

Curtosis 𝑛 4
𝑛(𝑛 + 1) 𝑥𝑖− 𝑥ҧ 3 𝑛−1 2
𝑘= ෍ −
(𝑛 − 1)(𝑛 − 2)(𝑛 − 3) 𝑠 (𝑛 − 2)(𝑛 − 3)
𝑖=1
Se tienen los siguientes 3 casos:
 Si k > 0 la distribución es leptocúrtica , los datos están
más concentrados cerca de la media.
 Si k = 0 la distribución es normal o mesocúrtica
 Si k < 0 la distribución es platicúrtica, los datos se
distribuyen más alejados de la media
Curtosis

También podría gustarte