ESTADISTICA

Percentil
En Excel, use la función =PERCENTIL.EXC (datos; k/100)

Valores altos de la variables es el complemento (más caros, más..)
Valores bajos de la variables es el percentil del mismo (más baratos, menos..)
2
Varianza σ
La varianza mide el grado de dispersión o variación de los valores de una variable con respecto
a su media aritmética.
En Excel, use la función =VAR.S(datos)
Desviación estándar σ S
Se define como la raíz cuadrada positiva de la varianza. En Excel, use la función

=DESVEST.M(datos)
Características de la varianza y la desviación estándar

 La varianza y la desviación estándar son números reales no negativos.
 Se pueden calcular para variables medidas en escala de intervalo o razón.
 Se ven afectadas por valores extremos.
 La varianza es expresada en unidades cuadráticas a las unidades de los datos,
mientras que la desviación estándar es expresada en las mismas unidades de los
datos.
Coeficiente de variación (CV)

Al coeficiente de variación también se le denomina una medida de dispersión relativa.
El coeficiente de variación (CV) de un conjunto de datos indica el porcentaje que es la
desviación estándar en comparación con la media.
Se calcula en variables medidas en escala de razón.
La fórmula para su cálculo es:

Coeficiente de variación poblacional CV = σ/u x 100%
Coeficiente de variación muestral CV = s/ x (media x 100%
En Excel, use la función =DESVEST.M(datos)/PROMEDIO(datos)
Medida de asimetría As
Si los datos se distribuyen con igual frecuencia y alejamiento por debajo y por encima de la
media, se dice que la distribución es simétrica.
Si los datos que son menores a la media son más frecuentes que aquellos por encima de la
media o viceversa, se dice que la distribución es asimétrica.
Coeficiente de asimetría de Fisher As
En Excel, use la función =COEFICIENTE.ASIMETRIA(datos).
Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una con-
centración de datos en los valores
Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores
Unidad 3. Probabilidades
Experimento aleatorio
Es un proceso que, al ser realizado u observado repetidas veces, bajo las mismas condiciones,
genera más de un posible resultado que no puede ser determinado de antemano. Se denota
por ε.
Espacio muestral
Es el conjunto de todos los posibles resultados que genera un experimento aleatorio. Se
denota por Ω o S.
Cada elemento del espacio muestral se denomina punto muestral.
Evento
Es todo subconjunto de un espacio muestral. Se denota mediante letras mayúsculas, por
ejemplo, A, B, C, ... o X1, X2, X3.
Probabilidad
Es una medida de la posibilidad de ocurrencia de un evento.
Probabilidad
La probabilidad es una medida numérica de la posibilidad de que ocurra un evento. Por tanto,
la probabilidad es una medida del grado de incertidumbre asociado con un evento.
Los valores de la probabilidad siempre se asignan en una escala de 0 a 1.
Una probabilidad cercana a 0 indica que es difícil que el evento ocurra, mientras que, una
probabilidad cercana a 1 indica que es casi seguro que el evento ocurra.
Definición clásica de probabilidad
La definición clásica propone que, si el espacio muestral es numerable y cada punto muestral
tiene la misma posibilidad de ocurrencia, entonces la probabilidad de ocurrencia de un evento
A definido sobre Ω es:
P(A)= n(A)/n(Ω) = número de casos favorables al evento A / número de casos totales.
Álgebra de eventos
Sea E un experimento aleatorio y Ω el espacio muestral asociado. Si A y B son dos eventos
definidos en Ω, se define:
Complemento de un evento
C
P(A ) = 1 - P(A) AC se expresa como: “El evento A no ocurre”
A U B se expresa como: “Al menos uno de los eventos A o B ocurre”.
A intersección B se expresa como: “Ambos eventos, A y B ocurren a la vez”.
Distribución Normal
2
La variable aleatoria X sigue una distribución normal con parámetros: media u y varianza σ .
2
Se denota X - N (u, σ )
En Excel, use las siguientes funciones:
P(X < x) =DISTR.NORM.N(x; media; desviación estándar; acumulado)
k = INV.NORM(α, media, desviación estándar), tal que P(X < k) = α
Por ejemplo,si X- N(u=50, σ2 =400)

P(X < 60) =DISTR.NORM.N(60; 50; 20; 1) = 0,69146
Calcular k tal que P(X < k) = 0,95. k = INV.NORM(0.95; 50; 20) = 82,897
Distribución Normal Estándar
media 0, varianza 1
Ejemplos generales:
P(x<480)
¿Qué porcentaje de los vasos servidos contendrá más de 224 ml?

P(x>224)= 1- P(x<224) = 1 - 0,9452 = 0,0548. El 5,48% de los vasos contendrá más de 224 ml.
¿Cuál es la probabilidad que un vaso contenga entre 191 y 209 ml?

P(191<X<209)= P(X<209) - P(X<191) = 0,7257 – 0,2743 = 0,4515
P(X≧105) = 1 - P(X＜105)
Unidad 4. Estadística Inferencial
Unidad elemental: Es el objeto sobre el cual se hace la medición. También llamada unidad de
observación, unidad de análisis, unidad estadística o elemento. Por ejemplo, en estudios de
poblaciones humanas, con frecuencia ocurre que la unidad elemental es cada individuo.
También podría ser por ejemplo una empresa, un colegio o un día, dependiendo de los
objetivos y de la in- formación que se quiere recolectar.
Población muestreada: Es el conjunto de todas las unidades elementales posibles que podrían
extraerse en una muestra; es decir, es la población de donde se extrae la muestra.
Unidad de muestreo: Es la unidad donde realizamos la muestra.
Por ejemplo, podríamos querer estudiar a las personas, pero no tenemos una lista de todos los
individuos que pertenecen a la población objetivo. En vez de eso, la unidad de muestreo es
cada familia y la unidad elemental es cada individuo que vive en una familia.
Marco muestral: Es una lista de las unidades de muestreo que están disponibles para elección.
Generalmente la unidad elemental es la unidad de muestreo, pero no siempre.
Muestreo no probabilístico: El muestreo no probabilístico es una técnica de muestreo donde

las muestras se recogen en un proceso que no brinda a todos los individuos de la población
iguales oportunidades de ser seleccionados. A diferencia del muestreo probabilístico, no es un
producto de un proceso de selección aleatoria. Los sujetos en una muestra no probabilística
generalmente son seleccionados en función de su accesibilidad o a criterio personal e
intencional del investigador.
La desventaja es que esta muestra no es representativa. Por lo tanto, los resultados de la

investi- gación no pueden ser utilizados en generalizaciones respecto de toda la población.
Muestreo probabilístico: Los métodos de muestreo probabilísticos son aquellos que se basan
en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la
misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,
todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas.
Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la
muestra extraída y son, por tanto, los más recomendables ya que con este tipo de muestreos
se pueden realizar inferencias o generalizaciones sobre la población.
Tamaño de muestra
Para determinar el tamaño de la muestra se debe tener en cuenta lo siguiente:

el parámetro a estimar: media o proporción.
el nivel de confianza.
la desviación estándar S o la proporción muestral, según lo que se quiere estimar.
el margen de error o error de estimación o error máximo permisible.
Nivel de confianza
Es la probabilidad de que el intervalo construido en torno a un estadístico contenga al
verdadero valor del parámetro. El nivel de confianza lo fija el investigador, lo más usual es
95%.
Con este nivel de confianza se obtiene el valor Z, usando la función =INV.NORM.ESTAND

(probabilidad) que corresponde a un percentil de una distribución Normal Estándar.
99%= 2.58
Variabilidad
Cuando una población es más homogénea la varianza es menor y el número de entrevistas

necesarias será más pequeño. Generalmente es un valor desconocido y hay que estimarlo a
partir de datos de estudios previos, muestra piloto o estudios anteriores similares.
Margen de error
Es la diferencia entre un estadístico y el parámetro correspondiente.

Muestreo estratificado
Prueba de hipótesis
Hipótesis estadística
Es una afirmación que se hace acerca de la distribución o parámetros de una o más

poblaciones. Por ejemplo:
El ingreso mensual medio de una familia es de 1920 soles, es decir, μ = 1920.
El porcentaje de artículos defectuosos producidos en una fábrica por una máquina es menor al
2%, es decir, p < 0,02.
Es importante recordar lo siguiente:
Hipótesis nula (H0)
Hipótesis alterna (H1) van todas las desigualdades

Es la hipótesis que debe ser aceptada si se rechaza la hipótesis nula.
Prueba de hipótesis para una media poblacional con varianza desconocida
Para calcular los valores críticos en Excel, use la función =INV.T (área a la izquierda, n -1)
Prueba de hipótesis para una proporción poblacional
Para calcular los valores críticos en Excel, use la función =INV.NORM.ESTAND(área a la

izquierda)

ESTADISTICA

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

ESTADISTICA

Cargado por

Copyright:

Formatos disponibles

Percentil

En Excel, use la función =PERCENTIL.EXC (datos; k/100)

Se define como la raíz cuadrada positiva de la varianza. En Excel, use la función

Características de la varianza y la desviación estándar

Coeficiente de variación (CV)

La fórmula para su cálculo es:

En Excel, use la función =COEFICIENTE.ASIMETRIA(datos).

A U B se expresa como: “Al menos uno de los eventos A o B ocurre”.

A intersección B se expresa como: “Ambos eventos, A y B ocurren a la vez”.

En Excel, use las siguientes funciones:

P(X < x) =DISTR.NORM.N(x; media; desviación estándar; acumulado)

k = INV.NORM(α, media, desviación estándar), tal que P(X < k) = α

Por ejemplo,si X- N(u=50, σ2 =400)

¿Qué porcentaje de los vasos servidos contendrá más de 224 ml?

¿Cuál es la probabilidad que un vaso contenga entre 191 y 209 ml?

Unidad 4. Estadística Inferencial

Unidad de muestreo: Es la unidad donde realizamos la muestra.

Muestreo no probabilístico: El muestreo no probabilístico es una técnica de muestreo donde

La desventaja es que esta muestra no es representativa. Por lo tanto, los resultados de la

Para determinar el tamaño de la muestra se debe tener en cuenta lo siguiente:

Con este nivel de confianza se obtiene el valor Z, usando la función =INV.NORM.ESTAND

Cuando una población es más homogénea la varianza es menor y el número de entrevistas

Es la diferencia entre un estadístico y el parámetro correspondiente.

Es una afirmación que se hace acerca de la distribución o parámetros de una o más

El ingreso mensual medio de una familia es de 1920 soles, es decir, μ = 1920.

2%, es decir, p < 0,02.

Es importante recordar lo siguiente:

Hipótesis nula (H0)

Hipótesis alterna (H1) van todas las desigualdades

Prueba de hipótesis para una media poblacional con varianza desconocida

Para calcular los valores críticos en Excel, use la función =INV.NORM.ESTAND(área a la

También podría gustarte