Está en la página 1de 6

ESTADÍSTICA GENERAL (CÓD 745)

Objetivo de la materia: Aplicar métodos y Técnicas para Estadística descriptiva y Cálculo de Probabilidades.
Evaluación: Ocho (8) Objetivos; 2 Integrales (objetivos 2 al 8) y 1 Trabajo Práctico (Objetivo 1). Mínimo para
aprobación: 5 Objetivos.
Material Instruccional: Estadística Aplicada a los negocios y a la economía (Webster); Estadística (Spiegel);
Probabilidad (Meyer)

Objetivo 1: Tratamiento de datos estadísticos


Población: Recolección completa de todas las observaciones de interés para el investigador
Parámetro: Medida descriptiva de la población total de todas las observaciones
Muestra: Parte representativa de la población que se selecciona para ser estudiada
Estadístico: Medida descriptiva de una muestra que sirve para estudiar el parámetro
Variable: Característica de la población o la muestra que se está observando
- Cuantitativa: Las que se pueden expresar de manera numérica
- Cualitativa: Las que se expresan de manera no numérica
- Contínua: Las que toman cualquier valor dentro de un rango dado (ej. mediciones)
- Discreta: Las que están limitadas a ciertos valores (por lo general números enteros)
Estadística Descriptiva: Proceso de recolectar, agrupar y presentar datos de manera que puedan describirse
fácilmente dichos datos.
Estadística Inferencial: Utiliza la muestra para sacar alguna inferencia o conclusión sobre la población de la
cual hace parte la muestra.
Error de muestreo: Diferencia entre el parámetro desconocido de la población y el estadístico de la muestra
utilizado para calcular el parámetro.
Sesgo muestral: Tendencia a favorecer la selección de ciertos elementos de la muestra en lugar de otros.
Medición en Escalas Nominal: Nombre o clasificaciones que se utilizan para datos en categorías distintas y
separadas. Ej.: Crecimiento Agresivo, Reembolso Total, Cambio.
Medición en Escalas Ordinal: Las que clasifican las observaciones en categorías con un orden significativo.
Ej.: Alto, Medio, Bajo.
Medición en intervalos: Medidas en escala numérica en la que el valor de cero es arbitrario pero que la
diferencia entre valores es importante. Ej.: la temperatura.
Medición en escala de razón: Medida numérica en la que cero es un valor fijo en cualquier escala y la
diferencia entre valores es importante.
Distribución de Frecuencias: Forma de organizar datos dividiéndolos en clases y registrando el número de
casos por cada clase.
Reglas:: 1. Determinar el nº mayor y menor de los datos sueltos para calcular el rango (diferencia entre
ambos); 2. Dividir el rango entre el nº de clases deseada; 3. Determinar el nº de observaciones por cada
clases (frecuencia).
Punto Medio o Marca de la clase (M): Promedio de los límites de cada clase.
Intervalo de Clase (IC): Rango de valores dentro de una clase.
Tamaño, Longitud o Amplitud de clase: Diferencia entre límites superior e inferior de cada clase.
Frecuencia Acumulada “más que”: Se forma restando las frecuencias de las clases anteriores.
Frecuencia Acumulada “menos que”: Se forma sumando las frecuencias de las clases anteriores.
Frecuencia Relativa: Refleja la frecuencia de la clase en relación con el total de observaciones.
Frecuencia Relativa Porcentual: Refleja la frecuencia de la clase como porcentaje en relación al total de
observaciones
Ojiva: Polígono de frecuencias acumuladas “menos que”.
Tabla de Contingencia: Sirve para examinar o comparar dos variables a la vez
Histograma: Gráfico que muestra las clases en el eje horizontal y las frecuencias en el eje vertical a través de
rectángulos unidos entre si .
Diagrama de Barras: Muestra dos o más valores en el eje horizontal
Polígono de Frecuencia: Es un gráfico de línea de las frecuencias dibujada respecto a la marca de clase.
Diagrama Circular: Muestra las proporciones (porcentajes) relativos de una variable
Diagrama de Máximos, Mínimos y cierres: Muestra valores a través de una línea vertical (mín y máx) u una
pequeña marca horizontal (cierre)
Objetivo 2: Medidas de Tendencia Central, de Dispersión y de Sesgo

1
Para datos no agrupados
Media: Medida de tendencia central que normalmente era considerada como promedio.
Media Poblacional (μ): Suma de todas las X 1 + X 2 + X 3 + ... + X N ΣX i
observaciones divididas entre la cantidad de µ= =
observaciones. N N

Media Muestral ( X ): Suma de todas las X 1 + X 2 + X 3 + ... + X n Σ X i


observaciones de la muestra entre la cantidad de X = =
observaciones de la muestra n n

Media Ponderada: ( XW ) Es el cálculo de la media


que incluye la importancia de cada observación. Se ∑ XW
calcula sumando todas las observaciones XW =
multiplicadas por su ponderación y dividas por la ∑W
sumatoria de todas las ponderaciones.

Media geométrica (MG): Representa el cambio


promedio con el tiempo y siempre será menor que la
media aritmética salvo en caso de que todos los
MG = n X1 X 2 X 3 ... X n
incrementos porcentuales sean iguales. Se calcula
tomando la raíz enésima del producto de n números.

Media Armónica (H): Es el recíproco de la media N 1


H = Σ
aritmética de los recíprocos de los números. 1 o mejor 1 1 1
Σ = X = Σ
X H N N X

Mediana o Media Posicional: Observación de la


mitad después de que se han colocado los datos en
una serie ordenada.
n +1
Posición de la mediana: Cantidad de observaciones Posición de la mediana =
2
más 1 divididas entre dos. Si el conjunto de datos
contienen un número par de observaciones es
necesario promediar los dos valores medios

Moda: Es la observación que más se repite

Medidas de dispersión: Miden que tanto se dispersan las medidas alrededor de su media

Rango: Diferencia entre la observación más alta y la Rango = observació n más alta −observació n más baja
más baja
Poblacional
( X 1 − µ ) 2 + ( X 2 − µ ) 2 + ... + ( X N − µ ) 2 Σ ( Xi − µ ) 2
σ2 = =
N N
Varianza σ 2 o S 2 : Promedio de las observaciones
Muestral:
respecto a su media elevadas al cuadrado
( X 1 − X ) 2 + ( X 2 − X ) 2 + ... + ( X N − X ) 2 Σ(X i −
S 2= =
n −1 n −1

Poblacional σ= σ2
Desviación Estándar σ o S : Es la raíz cuadrada
de la varianza
Muestral: S = S 2

2
Para datos agrupados.
Media: X g = Media de datos agrupados
ΣfM Σf M f
Xg = = = Frecuencia o número de observaciones en
n Σf cada clase
M = Punto medio de cada clase
n = Tamaño de la muestra = suma de todas las
frecuencias
Clase mediana: Es la clase cuya frecuencia
acumulada es ≥ n/2
Mediana:. Lmd = Límite inferior de la clase que contiene la mediana
n − F  F = Frecuencia acum. de la clase que antecede a la clase
Mediana = Lmd +  2  (C ) de la mediana
 f md  f md = Frecuencia de la clase de la mediana
 
(C ) = Intervalo de clase de la clase de la mediana.
Clase modal: La clase que tiene mayor frecuencia
Moda: Observación más frecuente. Se calcula Lmo = Límite inferior de la clase modal
usando como base la clase Modal Da = Diferencia entre la frecuencia de la clase modal y la
 Da  clase anterior
Moda = Lmo +   (C ) Db = Diferencia entre la frecuencia de la clase modal y la
 D a − Db 
clase sigiente
(C ) = Intervalo de clase de la clase modal.
X = Media de datos agrupados
f= Frecuencia o número de observaciones en
Varianza: Desviación estándar:
2 2 2 cada clase
Σ f M −n X S = S
S 2= M = Punto medio de cada clase
n −1 n = Tamaño de la muestra = suma de todas las
frecuencias
Cuartiles: Son las medidas que dividen un conjunto 1er. Cuartil = Q1= percentil 25 = P25
de datos en 4 partes iguales (son 3 en total Q1, Q2,
2do. Cuartil = Q2 =percentil 50 = P50
Q3). Se calculan igualando los cuartiles al
equivalente en percentiles 3er. Cuartil = Q3 = percentil 75 = P75
Deciles: Son las medidas que dividen un conjunto 1er. Decil = percentil = 10 = P10
de datos en 10 partes iguales(son 9 en total) Se 2do. Decil = percentil = 20 = P20
calculan igualando los cuartiles al equivalente en :
percentiles 9no. Decil = percentil = 90 = P90
Percentiles: Son las medidas que dividen un
conjunto de datos en 100 partes iguales (son 99 en L p = Sitio del percentil deseado en una serie ordenada
total) n = Número de observaciones
P P = Percentil deseado
Lp = (n +1)
100
Cálculo del Percentil en datos agrupados Cálculo del Decil o cuartil
 p 
( n 100 ) − F  Se coloca el percentil equivalente al decil o al cuartil
Percentil = Lmd +  (C ) deseado.
 f md 

 

Rango o recorrido: Diferencia entre la observación Rango de todas las observaciones = Dato mayor –
mayor y la menor de todas las observaciones. Dato menor
Rango de clase: Diferencia entre la observación Rango de clase = Límite mayor – Límite menor
mayor y la menor de la clase
Rango o recorrido intercuartílico: Diferencia entre
Rango intercuartílico = Q3 - Q1 = P75 – P25
el primer cuartil y el tercer cuartil

3
Teorema de Chevyshev:
Para todo conjunto de datos por lo menos
 1    1 
1− 100 de las observaciones están dentro de 1 −  K 2  . 100
K 2    
K desviaciones estándar de la media, en donde K
es cualquier número mayor a 1.
f (x)

Distribución Normal: Distribución de datos


continuos (no discretos) que produce una curva
simétrica en forma de campana. En ella la media la
mediana y la moda son todas iguales
0 5 10 15 20 x (minutos)
Media
Mediana
Moda

Regla empírica: Si se incluyen todas las Observaciones a + 1 desviación estándar de la


observaciones que están a una desviación media: 68.3%
estándar de la media (por encima y por debajo), Observaciones a + 2 desviaciones estándar de la
éstas serán el 68,3% de todas las observaciones, media: 95.5%
sin importar cual sea la media ni cual la desviación Observaciones a + 3 desviaciones estándar de la
estándar. media: 99.7%

Distribución Sesgada: Es una distribución que al


tener una curva cuya moda está hacia la izquierda,
produce un sesgo hacia la derecha y viceversa.

Coeficiente de Sesgo de Pearson: Sesgo a la Derecha


3 ( X −mediana )
P =
S
Si P < 0 los datos están sesgados a la izquierda.
Si P > 0 los datos están sesgados a la derecha Sesgo a la Izquierda

Coeficiente de Variación: Medida que determina el


grado de dispersión de un conjunto de datos Fórmula:
relativo a su media, sobre todo cuando se S
consideran dos o más distribuciones que tienen CV = (100 )
medias significativamente diferentes o que están X
en medidas diferentes.

Objetivo 3: Principios de Probabilidad


Objetivo 6: Distribuciones discretas importantes (Binomiales,
Hipergeométricas, de Poisson)
Distribución de Poisson: Distribución discreta que
mide el número de ocurrencias sobre algún
intervalo de tiempo o espacio. Ej. Número de
clientes que pueden llegar durante algún período
de tiempo.

Objetivo 7: Distribución Normal

4
Distribución Normal: Distribución de
datos continuos (no discretos) que
produce una curva simétrica en forma de
f (x)
campana. En ella la media la mediana y
la moda son todas iguales se utiliza para
reflejar variables como estaturas, pesos,
distancias y otras medidas que son
divisibles infinitamente. La forma y
posición están determinadas por la
media μ y la desviación estándar σ. Más 0 5 10 15 20 x (minutos)
del 50% de las observaciones están por Media
Mediana
encima de la media y 50% están por Moda
debajo. Igualmente el 50% de las
observaciones están a la derecha de la
media y 50% a la izquierda de la media.
Desviación normal o Z : Es el número
de desviaciones estándar a las que una
observación está por encima o por X −µ
Z =
debajo de la media. La distribución σ
normal se CONVIERTE a una forma Z =Desviación normal
estándar utilizando la fórmula de X = Variable aleatoria
conversión o Fórmula Z. para facilitar μ = Media
los cálculos Luego de aplicada la σ= Desviación estándar
fórmula Z la media μ = 0 y la desviación
estándar σ = 1
Cálculo de probabilidades con la
desviación normal: Si se conoce el área en porcentaje
Para hallar la probabilidad de que un (probabilidad)
evento X ocurra, se utiliza la fórmula Z y 1.- Se convierte a cifra decimal y se le resta
se obtiene el valor de Z (Este valor 0,5: Si la cifra es negativa estará a la
representa el área que se encuentra izquierda de la media y si es positiva a la
bajo la curva de la distribución, desde la derecha.
media hasta el punto X ; equivale a la 2.- El porcentaje que resulte se ubica en el
probabilidad). Como el 99.7% de los interior de la Tabla de Distribución normal
datos están a + 3 desviaciones estándar para obtener a cual valor Z corresponde.
de la media, el valor máximo que puede 2.- Despejando X de la fórmula Z queda
tomar Z es 3.99. La tabla de la X = Z .σ +µ
distribución normal muestra las distintas 3.- Se sustituyen los valores dados y resulta
áreas (probabilidades) relacionadas con la variable buscada.
los valores de Z.
Procedimiento:
Aproximación normal a distribución
1.- Se calcula la media y la desviación
binomial:
estándar con las fórmulas:
Si en una distribución binomial la
µ = nπ σ = n(π)(1 −π)
cantidad de ensayos (n) es muy grande
la solución puede hallarse con un 2.- Se coloca el valor X como media de un
aproximado a la distribución normal. La intervalo de 1(ejem. Si n= 20 entonces el
aproximación es suficientemente intervalo es 19,5 < 20 < 20,5 y se calcula la
probabilidad como distribución normal.
precisa si n.π ≥ 5 y (1- π) ≥ 5.

Objetivo 8: Otras Distribuciones Continuas importantes

5
Distribución Exponencial: Distribución de datos
continuos (no discretos) que mide el paso del t = Lapso de tiempo
tiempo entre eventos con distribución de Poisson. μ = Tasa promedio de ocurrencia
−µ t e= Base de logaritmo natural: 2,71828
P( X ≤ x) = 1 − e