Resumen Estadística

POBLACIÓN
MUESTRA
UNIDAD ELEMENTAL
VARIABLE
Una variable es una característica de la población que es objeto de estudio.
DATO
Un dato es un valor que toma la variable de estudio, y puede ser expresada como un dato cualitativo o
cuantitativo.
ESCALAS DE MEDICIÓN
La escala de medición indica la manera más apropiada de resumir y analizar los datos.
La escala nominal comprende los datos que no tienen un orden. Los números se utilizan simplemente para
clasificar un objeto, persona o característica. Ejemplo: Estado del producto.
La escala ordinal comprende los datos con un mínimo de 3 valores posibles. Los datos presentan las
propiedades de la escala nominal. Existe un orden o jerarquía entre los datos. Ejemplo: Nivel socioeconómico.
La escala de intervalo comprende datos de tipo numérico. Los datos presentan las propiedades de la escala
ordinal. Las diferencias entre los datos tienen significados.
La escala de razón comprende datos de tipo numérico. Los datos presentan las propiedades de la escala de
intervalo. Las proporciones entre los datos tienen significados.
CLASIFICACIÓN DE VARIABLES
Las variables cualitativas están asociados a una categoría, atributo o cualidad. Se clasifican en nominales y
ordinales. Estas variables también son conocidas como categóricas.
Las variables cualitativas nominales son las que establecen 2 o más categorías, entre las cuales no existe un
orden o jerarquía. Ejemplo: Tipo de producto.
Las variables cualitativas ordinales son las que establecen categorías que guardan entre si un orden o jerarquía.
Ejemplo: Nivel de aceptación del producto.
Las variables cuantitativas toman un valor numérico y se clasifican en discretas y continuas.
Las variables cuantitativas discretas son aquellas cuyos valores son enumerativos o resultan del proceso de
contar. Ejemplo: Número de veces que una máquina empaquetadora de granos de café tuvo mantenimiento en
la empresa cafetera SUGAR S.A.
Las variables cuantitativas continuas son aquellas que toman un número infinito de valores, generalmente se
les asocia a procesos de medición. Ejemplo: Producción de caña de azúcar (en millones de toneladas) durante el
periodo de 2010 a 2013.
PARÁMETRO Y ESTADÍSTICO
Un parámetro es una medida de resumen que se obtiene con los datos de toda la población y describe una
característica de esta.
Un estadístico o estadígrafo es una medida de resumen que se obtiene con los datos de la muestra. Se
caracteriza porque cambia de valor de muestra a muestra, no es constante
ORGANIZACIÓN DE DATOS CUALITATIVOS
TABLA DE FRECUENCIAS
GRÁFICOS ESTADÍSTICOS
ORGANIZACIÓN DE DATOS CUANTITATIVOS
DISCRETOS
TABLA DE FRECUENCIAS
GRÁFICOS DE LÍNEAS O BASTONES
ORGANIZACIÓN DE DATOS CUANTITATIVOS
CONTINUOS
TABLA DE FRECUENCIAS : Se emplean para
representar la distribución de un conjunto de datos cuando la variable de estudio es cuantitativa continua o
cuando la variable de estudio es cuantitativa discreta con muchos datos y la mayoría son diferentes
Paso 1: Calcule el rango (R):
R=Xmax−Xmin
donde: Xmax= Representa el máximo valor en el conjunto de datos. Xmin= Representa el mínimo valor en el
conjunto de datos.
Paso 2: Calcule el número de clases o intervalos (k) utilizando la regla de Sturges:
k=1+3.3logn
donde:
n = Tamaño de muestra
log n = logaritmo en base 10 de n
Paso 3: Calcule la amplitud del intervalo de clase (c):
c=R/k
Si la amplitud del intervalo es un número entero, entonces se trabaja con el número calculado, sino se
redondea por exceso de acuerdo con el número de decimales del conjunto de datos.
Para el redondeo, debe tener en cuenta lo siguiente:
Si los datos son números enteros, entonces la amplitud del intervalo será un número entero; si los datos tienen
un decimal, entonces la amplitud del intervalo tendrá un decimal y así sucesivamente.
Paso 4: Calcule los límites de los intervalos.
[y0 = Xmin, y1 = y0 +c>
[y1 = y0 +c, y2 = y1 + c>
[yk-1 = yk-2 + c, yk = yk-1 + c>
Obtenga las columnas de las frecuencias correspondientes
HISTOGRAMA. Y EL POLÍGONO DE FRECUENCIAS
DIAGRAMA DE TALLO-HOJA
SEMANA 2
MEDIDAS DE RESUMEN
MEDIDAS DE POSICIÓN
Las medidas de tendencia central
Media o promedio aritmético (datos no agrupados)-diagrama de tallo y hoja-como siempre se hace el promedio
Datos agrupados: (TABLA DE FRECUENCIA)sumatoria del producto de xi con fi todo entre n
xi: Son los diferentes valores (en el caso discreto) o las marcas de clase (en el caso continuo)- PROMEDIO DE
EXTREMOS
fi: Son las frecuencias absolutas
•Mediana (Cálculo de la mediana
para datos no agrupados)
𝑛=𝑖𝑚𝑝𝑎𝑟:
𝑀𝑒=(𝑥𝑛+1)/2
𝑛=𝑝𝑎𝑟
𝑀𝑒=(𝑥𝑛/2+(𝑥(𝑛/2) +1)) /2
•Moda(Cálculo de la moda
para datos no agrupados)
Mo = Valor de la variable que más se repite.
MEDIA PONDERADA (𝑿 𝒑)
xi = Es el i-ésimo valor que toma la variable.
•wi = Es la ponderación del i-ésimo valor que toma la variable
MEDIA TOTAL (𝑿 𝑻)
•ni = Tamaño de la muestra i
•𝑥 𝑖 = Media aritmética de la muestra i
•k = Número de muestras
MEDIDAS DE TENDENCIA NO CENTRAL:
•Cuartiles(Qk): Los cuartiles son 3 valores (Qk; k = 1, 2, 3) que
dividen al conjunto de datos en 4 partes iguales. Estos son:
•Deciles(Dk): Los deciles son 9 valores (Dk; k = 1, 2, …, 9) que
dividen al conjunto de datos en 10 partes iguales.
•Percentiles(Pk): Los percentiles son 99 valores (Pk; k = 1, 2,…,
99) que dividen al conjunto de datos en cien partes iguales.
SEMANA 3
MEDIDAS DE DISPERSIÓN
1. Varianza (s2)
La varianza mide la dispersión de los datos con respecto a la media. Si los datos se encuentran cerca de la
media entonces la varianza será pequeña, en caso contrario la varianza será grande. La unidad de medida de la
varianza es la unidad de medida de los datos elevada al cuadrado.
2. Desviación Estándar (s)
La desviación estándar es la raíz cuadrada de la
varianza, y también nos proporciona información sobre
la dispersión de los datos con respecto a la media. La
diferencia es que la unidad de medida de la desviación
estándar es la unidad de medida de los datos.
Observación 𝑠2 es la notación de la varianza muestral y
𝜎2 es la notación de la varianza poblacional.
Varianza poblacional
COEFICIENTE DE VARIACIÓN
DIAGRAMA DE CAJA: distribución de una variable cuantitativa

Para construir un diagrama de cajas se procede de la siguiente
manera:
Ordenar los datos de menor a mayor.
Calcular los cuartiles: Q1, Q2 (Me) y Q3.
Calcular el rango intercuartílico: RI= Q3 – Q1.
Calcular Q1-1.5RI y Q3 +1.5RI. Los datos fuera del intervalo [Q1 -1.5RI ; Q3 +1.5RI] son considerados datos
atípicos (outliers). Es posible que en un conjunto de datos no se encuentren este tipo de datos. En el gráfico de
cajas, los datos atípicos son representados mediante asteriscos.
Ubicar el dato con menor valor y el dato con mayor valor en el
intervalo [Q1 -1.5RI ; Q3 +1.5RI].
a)¿En cuál de las 3 semanas, el nivel de ventas en las diferentes
tiendas fue menos variable en el 50% central? Justifique. En la
semana 2, porque la caja es más pequeña o porque presenta
menor rango intercuartilico.
b)Explique el significado del asterisco correspondiente a la
semana 2. En la semana 2, se observa una tienda con un nivel de
ventas muy superior a todas.
c)¿Qué distribución presentan las ventas en la semana 3? En la semana 3, las ventas presentan una asimetría
positiva porque se observa más variabilidad con respecto a los niveles de ventas más grandes.
VALORES ESTÁNDARIZADOS
Si se desean comparar valores de variables que tienen
diferentes unidades de medida, se pueden estandarizar
las variables de la siguiente manera:
𝑍=(𝑋−𝑥 )/𝑠
donde la nueva variable Z tiene media cero y varianza 1.
Los valores estandarizados indican la posición relativa de
las unidades estadísticas dentro de su grupo.
TEOREMA DE CHEBYSHEV
MEDIDAS DE ASIMETRÍA
MEDIDA DE CURTOSIS
ANALISIS DE CORRELACIÓN Y REGRESIÓN
El análisis de correlación y la regresión lineal simple son métodos estadísticos que permiten estudiar la relación
lineal entre 2 variables.
El análisis de correlación permite cuantificar la relación lineal entre 2 variables, mientras que el análisis de
regresión lineal permite obtener un modelo que permite predecir el valor de una variable, conocida como
variable respuesta, a partir de otra, conocida como variable regresora
ANÁLISIS DE CORRELACIÓN
COVARIANZA:
DIAGRAMA DE DISPERSIÓN: Relación
entre dos variables
𝑆𝑖
𝑟=
−1 ,
𝑙𝑎
�
�
𝑒𝑙
𝑎𝑐 𝑖
ó𝑛 𝑒𝑠 𝑝𝑒𝑟𝑓𝑒𝑐𝑡𝑎 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎
Si -1 <r ≤−0.8,𝑙𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎
𝑖𝑛𝑡𝑒𝑛𝑠𝑎
Si -0.8< r ≤−0.2,𝑙𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎
𝑛𝑜𝑟𝑚𝑎𝑙
Si -0.2< r <0,𝑙𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎 𝑑é𝑏𝑖𝑙
𝑆𝑖 𝑟=0,𝑛𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠
𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠
Si 0 < r ≤0.2,𝑙𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 𝑑é𝑏𝑖𝑙
Si 0.2< r ≤0.8,𝑙𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎
𝑛𝑜𝑟𝑚𝑎𝑙
Si 0.8 <r <1,𝑙𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 𝑖𝑛𝑡𝑒𝑛𝑠𝑎
𝑆𝑖 𝑟=1,𝑙𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑝𝑒𝑟𝑓𝑒𝑐𝑡𝑎 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎
SEMANA 4:
PROBABILIDADES: CONCEPTOS BÁSICOS
Experimentos:
Determinsta: se conoce el resultado
Aleatorio€: no se conoce el resultado (La teoría de la probabilidad estudia el comportamiento de los
experimentos aleatorios)
La teoría de la probabilidad permite medir la probabilidad de ocurrencia asociada a cada uno de los posibles
resultados del experimento aleatorio
Espacio muestral: Universal-conjunto de eventos elementales
Evento: cualquier subconjunto del espacio muestral
El espacio muestral (u) se denomina evento seguro porque siempre ocurre.
El evento nulo (o) se denomina evento imposible porque nunca ocurre.
Complemento de un evento:
𝑃(𝐴∪𝐴𝑐)=𝑃(Ω)
𝑃𝐴+𝑃(𝐴𝑐)=1
LEYES DE MORGAN
(A ∩ B)c = Ac ∪ Bc
(A ∪ B)c = Ac ∩ Bc
PROBABILIDAD
Definición clásica
La probabilidad de un evento se define como el cociente entre el número de resultados favorables al evento y
el número de resultados posibles en el experimento. El problema se presenta cuando Ω es infinito o cuando los
eventos elementales no son equiprobables.
Frecuentista o empírica
La probabilidad de un evento se define como el límite de las frecuencias relativas del evento. El problema se
presenta al momento de determinar el número de pruebas a realizar, o cuando el experimento no puede
repetirse más de una vez.
Axiomática
Engloba a las anteriores y solventa los problemas mencionados. Es la que estudiaremos y se debe a
Kolmogorov.
TEOREMA DE PROBABILIDAD TOTAL Y BAYES

PRINCIPIO DE MULTIPLICACIÓN Y EVENTOS INDEPENDIENTES
Este principio es útil para calcular la probabilidad de ocurrencia de n eventos simultáneamente.
Para n eventos Ai; i=1, 2, …, n cualesquiera, se cumple:
𝑷(𝑨𝟏∩𝑨𝟐∩𝑨𝟑∩⋯∩𝑨𝒏)=𝑷(𝑨𝟏)𝑷(𝑨𝟐/𝑨𝟏) 𝑷(𝑨𝟑/𝑨𝟐∩𝑨𝟏) …𝑷(𝑨𝒏/𝑨𝒏−𝟏∩⋯∩𝑨𝟐∩𝑨𝟏)
EVENTOS INDEPENDIENTES
Se dice que 2 eventos A y B son independientes entre sí cuando la ocurrencia de uno de los eventos no afecta
en nada a la probabilidad de ocurrencia del otro evento.

Resumen Estadística

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Resumen Estadística

Cargado por

Copyright:

Formatos disponibles

POBLACIÓN

DIAGRAMA DE CAJA: distribución de una variable cuantitativa

TEOREMA DE PROBABILIDAD TOTAL Y BAYES

También podría gustarte