Está en la página 1de 10

Percentil

En Excel, use la función =PERCENTIL.EXC (datos; k/100)


Valores altos de la variables es el complemento (más caros, más..)
Valores bajos de la variables es el percentil del mismo (más baratos, menos..)

2
Varianza σ

La varianza mide el grado de dispersión o variación de los valores de una variable con respecto
a su media aritmética.
En Excel, use la función =VAR.S(datos)

Desviación estándar σ S

Se define como la raíz cuadrada positiva de la varianza. En Excel, use la función


=DESVEST.M(datos)

Características de la varianza y la desviación estándar


 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos.
 La varianza es expresada en unidades cuadráticas a las unidades de los datos,
mientras que la desviación estándar es expresada en las mismas unidades de los
datos.

Coeficiente de variación (CV)


Al coeficiente de variación también se le denomina una medida de dispersión relativa.
El coeficiente de variación (CV) de un conjunto de datos indica el porcentaje que es la
desviación estándar en comparación con la media.
Se calcula en variables medidas en escala de razón.

La fórmula para su cálculo es:


Coeficiente de variación poblacional CV = σ/u x 100%
Coeficiente de variación muestral CV = s/ x (media x 100%
En Excel, use la función =DESVEST.M(datos)/PROMEDIO(datos)

Medida de asimetría As

Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la
me- dia, se dice que la distribución es simétrica.

Si los datos que son menores a la media son más frecuentes que aquellos por encima de la
media o viceversa, se dice que la distribución es asimétrica.
Coeficiente de asimetría de Fisher As

En Excel, use la función =COEFICIENTE.ASIMETRIA(datos).

Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una con-
centración de datos en los valores

Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores

Unidad 3. Probabilidades
Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones,
genera más de un posible resultado que no puede ser determinado de antemano. Se denota
por ε.
Espacio muestral
Es el conjunto de todos los posibles resultados que genera un experimento aleatorio. Se
denota por Ω o S.
Cada elemento del espacio muestral se denomina punto muestral.
Evento
Es todo subconjunto de un espacio muestral. Se denota mediante letras mayúsculas, por
ejemplo, A, B, C, ... o X1, X2, X3.
Probabilidad
Es una medida de la posibilidad de ocurrencia de un evento.

Probabilidad
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por tanto,
la pro- babilidad es una medida del grado de incertidumbre asociado con un evento.
Los valores de la probabilidad siempre se asignan en una escala de 0 a 1.

Una probabilidad cercana a 0 indica que es difícil que el evento ocurra, mientras que, una
probabili- dad cercana a 1 indica que es casi seguro que el evento ocurra.
Definición clásica de probabilidad
La definición clásica propone que, si el espacio muestral es numerable y cada punto muestral
tiene la misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento
A definido sobre Ω es:
P(A)= n(A)/n(Ω) = número de casos favorables al evento A / número de casos totales.

Álgebra de eventos
Sea E un experimento aleatorio y Ω el espacio muestral asociado. Si A y B son dos eventos
definidos en Ω, se define:
Complemento de un evento
C
P(A ) = 1 - P(A) AC se expresa como: “El evento A no ocurre”

A U B se expresa como: “Al menos uno de los eventos A o B ocurre”.

A intersección B se expresa como: “Ambos eventos, A y B ocurren a la vez”.

Distribución Normal

2
La variable aleatoria X sigue una distribución normal con parámetros: media u y varianza σ .
2
Se denota X - N (u, σ )

En Excel, use las siguientes funciones:

P(X < x) =DISTR.NORM.N(x; media; desviación estándar; acumulado)

k = INV.NORM(α, media, desviación estándar), tal que P(X < k) = α

Por ejemplo,si X- N(u=50, σ2 =400)


P(X < 60) =DISTR.NORM.N(60; 50; 20; 1) = 0,69146

Calcular k tal que P(X < k) = 0,95. k = INV.NORM(0.95; 50; 20) = 82,897
Distribución Normal Estándar

media 0, varianza 1

Ejemplos generales:

P(x<480)

¿Qué porcentaje de los vasos servidos contendrá más de 224 ml?


P(x>224)= 1- P(x<224) = 1 - 0,9452 = 0,0548. El 5,48% de los vasos contendrá más de 224 ml.

¿Cuál es la probabilidad que un vaso contenga entre 191 y 209 ml?


P(191<X<209)= P(X<209) - P(X<191) = 0,7257 – 0,2743 = 0,4515

P(X≧105) = 1 - P(X<105)

Unidad 4. Estadística Inferencial

Unidad elemental: Es el objeto sobre el cual se hace la medición. También llamada unidad de
observación, unidad de análisis, unidad estadística o elemento. Por ejemplo, en estudios de
po- blaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.
También podría ser por ejemplo una empresa, un colegio o un día, dependiendo de los
objetivos y de la in- formación que se quiere recolectar.

Población muestreada: Es el conjunto de todas las unidades elementales posibles que podrían
extraerse en una muestra; es decir, es la población de donde se extrae la muestra.

Unidad de muestreo: Es la unidad donde realizamos la muestra.

Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los
individuos que pertenecen a la población objetivo. En vez de eso, la unidad de muestreo es
cada familia y la unidad elemental es cada individuo que vive en una familia.

Marco muestral: Es una lista de las unidades de muestreo que están disponibles para elección.
Generalmente la unidad elemental es la unidad de muestreo, pero no siempre.

Muestreo no probabilístico: El muestreo no probabilístico es una técnica de muestreo donde


las muestras se recogen en un proceso que no brinda a todos los individuos de la población
iguales oportunidades de ser seleccionados. A diferencia del muestreo probabilístico, no es un
producto de un proceso de selección aleatoria. Los sujetos en una muestra no probabilística
generalmente son seleccionados en función de su accesibilidad o a criterio personal e
intencional del investiga- dor.

La desventaja es que esta muestra no es representativa. Por lo tanto, los resultados de la


investi- gación no pueden ser utilizados en generalizaciones respecto de toda la población.

Muestreo probabilístico: Los métodos de muestreo probabilísticos son aquellos que se basan
en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la
misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,
todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas.
Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la
muestra extraída y son, por tanto, los más recomendables ya que con este tipo de muestreos
se pueden realizar inferencias o generalizaciones sobre la población.

Tamaño de muestra

Para determinar el tamaño de la muestra se debe tener en cuenta lo siguiente:


el parámetro a estimar: media o proporción.
el nivel de confianza.
la desviación estándar S o la proporción muestral, según lo que se quiere estimar.
el margen de error o error de estimación o error máximo permisible.

Nivel de confianza
Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al
verdadero valor del parámetro. El nivel de confianza lo fija el investigador, lo más usual es
95%.

Con este nivel de confianza se obtiene el valor Z, usando la función =INV.NORM.ESTAND


(probabilidad) que corresponde a un percentil de una distribución Normal Estándar.

99%= 2.58

Variabilidad

Cuando una población es más homogénea la varianza es menor y el número de entrevistas


necesarias será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a
partir de datos de estudios previos, muestra piloto o estudios anteriores similares.

Margen de error

Es la diferencia entre un estadístico y el parámetro correspondiente.


Muestreo estratificado
Prueba de hipótesis

Hipótesis estadística

Es una afirmación que se hace acerca de la distribución o parámetros de una o más


poblaciones. Por ejemplo:

El ingreso mensual medio de una familia es de 1920 soles, es decir, μ = 1920.

El porcentaje de artículos defectuosos producidos en una fábrica por una máquina es menor al

2%, es decir, p < 0,02.

Es importante recordar lo siguiente:

Hipótesis nula (H0)

Hipótesis alterna (H1) van todas las desigualdades


Es la hipótesis que debe ser aceptada si se rechaza la hipótesis nula.

Prueba de hipótesis para una media poblacional con varianza desconocida

Para calcular los valores críticos en Excel, use la función =INV.T (área a la izquierda, n -1)
Prueba de hipótesis para una proporción poblacional

Para calcular los valores críticos en Excel, use la función =INV.NORM.ESTAND(área a la


izquierda)

También podría gustarte