Está en la página 1de 31

Unidad 2: Paso 3 - Actividad sobre Estimaciones

Wilson Antonio Quintana Gamboa. Cód. 88035478

Adriana Ximena Ovalle. Cód.

Diana Mayerli Martínez. Cód.

Edwin Fabián Ortiz. Cód. 88032095

Miller Antonio Silva. Cód. 10306757

Grupo: 551112_3

Tutor:

Andrés Fernando Mosquera Díaz

Mg. en Enseñanza de las matemáticas.

Universidad Nacional Abierta y a Distancia (UNAD)

Escuela De Ciencias De La Educación

Licenciatura En Matemáticas

Inferencia Estadística 551112a_761

Abril de 2020
ACTIVIDADES A DESARROLLAR

Consultar la definición, propiedades, cuando o para qué se utiliza de las siguientes


palabras:

 Medidas descriptivas numéricas

Medidas descriptivas numéricas


Son valores numéricos calculados a partir de la muestra y que nos resumen la
información contenida en ella.
a. Medidas de tendencia central (datos no agrupados y agrupados)
Las medidas de tendencia central se utilizan para caracterizar una variable sin agrupar
datos.
Media Aritmética
Media Aritmética o promedio, es quizá la medida de localización más usada.
La media de un conjunto de datos x 1+ x2 + x 3 +…+ x ₙ se calcula mediante la expresión:
x 1+ x 2 + x 3+ …+ x n
x=
n
Mediana
La Mediana es el valor que divide el conjunto de datos recopilados en dos partes
porcentualmente iguales. Para calcular la mediana, primero se ordena el conjunto de
datos de menor a mayor y luego, se ubica entre ellos el dato central.
Se representa con
Si el número el número de datos es impar, la mediana es exactamente el dato central.
Si el número de datos es par, la mediana es el promedio de los dos datos centrales.
Moda
La moda es un conjunto de datos no agrupados es el dato de mayor frecuencia, es decir,
el que más se repite. Se simboliza con x.
Bimodal: cuando en un conjunto hay dos datos con la frecuencia más alta.
Polimodal: cuando en un conjunto hay varios datos en los cuales la frecuencia alta se
repite.
La moda no existe: cuando no hay ningún dato que se repita.
En un polígono de frecuencias, la moda corresponde al punto más alto.
b. Medidas de dispersión absoluta (datos no agrupados y agrupados)

Rango
El rango es la diferencia entre el mayor y el menor de los datos de una muestra,
brindando un intervalo en el cual se puede “ubicar” los datos.

Si el dato es un número grande, indica que los datos presentan mucha dispersión;
mientras que, si el rango es un valor pequeño, la dispersión de la muestra es pequeña.

Se denota como R.
Para datos ordenados se calcula como:
R=x(n)−x (1)
Donde:
x(n): Es el mayor valor de la variable.
x(1): Es el menor valor de la variable.
Varianza
La varianza de un conjunto de valores es una medida de variación igual al cuadrado de
la desviación estándar.
Varianza muestral:s ² el cuadrado de la desviación estándar s.
Varianza poblacional: s ² el cuadrado de la desviación estándar poblacional s.
Se dice que la varianza muestral s ² es un estimador sin sesgo de la varianza poblacional
s ², lo que significa que los valores de s2tienden a igualar el valor des ² , en lugar de
tender, de manera sistemática, a sobreestimar o subestimar s ² .
Por ejemplo: considere una prueba de cociente intelectual (CI) diseñada de tal forma
que tiene una varianza de 225. Si usted repite el proceso de elegir aleatoriamente 100
sujetos, aplicarles la prueba y calcular la varianza muestrals ² en cada caso, las varianzas
muéstrales que obtendrá tenderá a concentrarse alrededor de 225, que es la varianza de
la población.
c. Medidas de Dispersión relativa
Coeficiente de varianza, es la medida que sirve para comparar las dispersiones de dos o
más distribuciones, establece la relación entre la desviación estándar y la media
aritmética y se expresa generalmente en porcientos.
S
C.V= .100
X
 Parámetros y parámetro objetivo en el experimento

Parámetros
Parámetro, es un valor, medida o indicador representativo de la población que se
selecciona para ser estudiado.
Desde la estadística, parámetro es un número que se obtiene a partir de los datos de una
distribución estadística. Parámetro es una característica de la población, como la media
y la varianza (o desviación típica) en la distribución normal o la probabilidad de éxito
en la binomial son parámetros. Si conocemos su valor (o si somos capaces de
aproximarlo con suficiente precisión) podremos responder a cualquier pregunta sobre la
distribución.
 Estimación, estimación puntual, estimación real y estimador del parámetro
objetivo
Estimación
Desde la estadística, estimación es un proceso mediante el que establecemos que valor
debe tener un parámetro según deducciones que realizamos que realizamos a través de
estadísticos.
Estimación implica “usar el valor de una estadística derivada de una muestra para
estimar el valor de un parámetro correspondiente a población”; la muestra establece
que la información puede ser proyectada a través de diversos factores, formal o
informalmente, son procesos para determinar una gama muy probablemente y descubrir
la información que falta. Cuando una estimación resulta ser incorrecta, se denomina
“overestimate” si la estimación superó el resultado real y una subestimación si la
estimación se quedó corto del resultado real.
Estimación puntual
Estimación puntual, es establecer un valor concreto (un punto) para el parámetro.
Desde la estadística, estimación puntual es la mejor suposición para el valor del
parámetro.
El objetivo de la estimación puntual es aproximar el valor del parámetro desconocido
(tiempo medio de ejecución de un algoritmo, altura media de las mujeres de una
población, diferencia del resultado medio entre dos tratamientos médicos, proporción de
gente que mejora con un tratamiento médico…)
Para ello se utiliza la información de la muestra  ( x 1 , x 2 , x 3 , … , x n ), a través de
un estimador.
Algunos estimadores frecuentes son:
Media muestral, para estimar la media teórica de una variable “X”.
x 1+ …+ x n
x=
n
Proporción muestral, para estimar una proporción “p”:
¿ x1 +…+ xn
p
n
Siendo, x 1 , … , x nuna muestra aleatoria simple de la variable X ∈ B ( 1 , p ) ,  es decir, son
unos o ceros.
Varianza muestral: para estimar la varianza teórica de una población, se puede usar la
varianza de una muestra:

2 ( x 1−x )2+ …+(x n −x)2


s=
n
Y también la llamada
Cuasi-varianza muestral:

2 ( x 1−x )2+ …+( x n−x )2


Sn−1 = ,
n−1
Que corresponde a la varianza de la muestra, pero dividiendo por n−1, en lugar de
dividir por “n”. En el capítulo de estadística descriptiva, ya comentamos que el R, por
defecto, al calcular la desviación típica de una muestra, mediante el comando “sd”,
calcula directamente la cuasi-varianza y luego obtiene la raíz cuadrada.
La evaluación del estimador sobre la muestra fija da lugar a una estimación puntual.
 Media poblacional, varianza y desviación estándar
Media poblacional es el valor esperado o esperanza matemática de una variable
aleatoria. La media poblacional se usa para significar qué valor numérico de una media
muestral es numéricamente cercano al parámetro media poblacional, para una
muestra adecuada y suficientemente grande.
En estadística media poblacional (la esperanza matemática) de una variable aleatoria
“x”, es el númeroE [ X ] que formaliza la idea de valor medio de un fenómeno aleatorio.
Cuando la variable aleatoria es discreta, la esperanza es igual a la suma de la
probabilidad de cada posible suceso aleatorio multiplicado por el valor de dicho suceso.
Por lo tanto, representa la cantidad promedio que se "espera" como resultado de un
experimento aleatorio cuando la probabilidad de cada suceso se mantiene constante y el
experimento se repite un elevado número de veces. Cabe decir que el valor que toma la
esperanza matemática en algunos casos puede no ser "esperado" en el sentido más
general de la palabra (el valor de la esperanza puede ser improbable o incluso
imposible).
Por ejemplo, el valor esperado cuando tiramos un dado equilibrado de 6 caras es 3,5.
Podemos hacer el cálculo:
1 1 1 1 1 1
E [ X ] =1 . +2 . +3 . + 4 . +5 . +6 . =¿
6 6 6 6 6 6
1+2+3+4 +5+6
E [ X ]=
6
1+2+3+4 +5+6 21
E [ X ]= = =3,5.
6 6
Varianza

La varianza es la media aritmética del cuadrado de las desviaciones


respecto a la media  de una distribución estadística.

La varianza se representa por .

Varianza para datos agrupados

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones


que son equivalentes a las anteriores.

Varianza para datos agrupados

Ejercicios de varianza

Calcular la varianza de la distribución:

9, 3, 8, 8, 9, 8, 9, 18
Calcular la varianza  de la distribución de la tabla:

Propiedades de Varianza

1. La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones


sean iguales.

2. Si a todos los valores de la variable se les suma un número la varianza no varía.

3. Si todos los valores de la variable se multiplican por


un número la varianza queda multiplicada por el cuadrado de dicho número.

4. Si tenemos varias distribuciones con la misma media y conocemos sus


respectivas varianzas se puede calcular la varianza total.

Si todas las muestras tienen el mismo tamaño:

Si las muestras tienen distinto tamaño:

Observaciones sobre la varianza


1. La varianza, al igual que la media, es un índice muy sensible a las puntuaciones
extremas.

2. En los casos que no se puede hallar la media tampoco será posible hallar
la varianza.

3. La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones están elevadas al cuadrado.

Desviación estándar
Desviación Estándar, conocida también como desviación típica, se genera a partir de
la varianza.
Desviación Estándar, es una medida que se usa para cuantificar la variación o
dispersión de un conjunto de datos numéricos.
El monto diferido entre datos y promedio se mide como un resultado o positivo o i
agula a cero; es igual de aplicable si los datos son mayores o menores del promedio.
Se da a partir de la observación de los cambios en los datos, acorde a su desarrollo en la
aplicación de su fórmula.
Es la raíz cuadrada de la varianza. Se utiliza para conocer la desviación que presentan
los datos en su distribución respecto a la media aritmética de dicha distribución; muestra
una visión más acorde con la realidad en el momento de tomar una decisión. Símbolo: σ
o S.
Desviación estándar muestral √2 s 2=s
Desviación estándar poblacional √2 σ 2=σ
Es una media cuadrática de lo que se apartan los datos de su medida y por tanto se mide
en las mismas unidades que la variable.
σ = raíz cuadrada de la varianza
En resumen, la desviación típica es la raíz cuadrada positiva de la media aritmética del
cuadrado de la diferencia entre los datos y la media de los valores, expresando con esto
una medida de distorsión con respecto a los elementos originales permitiendo aclarar
dudas y hacer proyecciones a futuro más exactas en base a esos datos.

 Estimación, estimación puntual, estimación real y estimador del parámetro


objetivo
 Estimación de intervalo y sesgo

Estimación por intervalo consiste en determinar un par de valores a y b, tales que


constituidos en intervalos (a , b); y para una probabilidad 1−a prefijada (nivel de
confianza) se verifique en relación al parámetro o a estimar se cumpla

p ( θϵ { a ,b } )=1−a O en otros términos p ( a ≤θ ≤ b ) =1−a

Sesgo

Se denomina sesgo de un estimador a la diferencia entre la esperanza (valor esperado)


del estimador y el verdadero valor del parámetro a estimar. Es deseable que un
estimador sea insesgado o centrado, esto es, que el sesgo sea nulo para que la esperanza
del estimador sea igual al valor del parámetro que se desea estimar.

En notación matemática, dada la muestra una muestra


x 1 , … .. xn y un estimador T ( x1 , … .. x n ) del parámetro poblacional θ , el sesgo es E ( T )−0

El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad


relacionada con esta es la de la consistencia: un estimador puede tener un sesgo pero el
tamaño de este converge a cero conforme crece el tamaño muestral.

Dada la importancia de la falta de sesgo, en ocasiones, en lugar de


estimadores naturales se utilizan otros corregidos para eliminar el sesgo. Así ocurre, por
ejemplo, con la varianza muestral.

 Error cuadrático medio de estimadores puntuales, estimador puntual de un


parámetro y estimador insesgado

El error cuadrático medio de un estimador se define como ECM( θ^ ) =E ¿.

Esto es la esperanza de la desviación al cuadrado del estimador con respecto de interes.

Si θ^ 1 , θ^ 2 son dos estimadores alternativos de θ y ECM ( θ^ 1 ) < ECM (θ^ 2)

Entonces θ^ 1 se dice que es eficiente en el sentido de ECM comparando con θ^ 2 . si los

dos son insesgados, entonces θ^ 1 es más eficiente.

Entre todos los posibles estimadores de θ ,a aquel que tenga el menor ECM es el
llamado estimador de mínimo error cuadrático medio.
ECM =Var(θ^ ¿+ sesg o 2 Es decir que el ECM es igual a la suma de la varianza más el
sesgo al cuadrado.
Estimador puntual de un parámetro
Una estimación puntual de un parámetro poblacional es cuando se utiliza un único valor
para estimar ese parámetro, es decir, se usa un punto en concreto de la muestra para
estimar el valor deseado.
Cuando estimamos un parámetro de forma puntual, podemos saber con certeza, cuál es
ese valor. Imaginemos una población de 30 personas de las que seleccionamos una
muestra de 20 para las que conocemos sus edades. Estimar de forma puntual la media de
edad, sería tan sencillo como sumar esos 20 datos y dividirlos entre el total de
la muestra estadística.
Estimador insesgado
Un estimador es insesgado cuando la esperanza matemática del este es igual al
parámetro que se desea estimar. Por tanto, la diferencia entre el parámetro a estimar y la
esperanza de nuestro estimador tendría que ser 0.
 Sesgo de un estimador puntual, error estándar del estimador

Sesgo de un estimador puntual


Error estándar del estimador
Un mismo estimador ofrece distintos valores para distintas muestras del mismo tamaño
extraídas de la misma población. Por lo tanto deberíamos tener una medida de la
variabilidad del estimador respecto del parámetro que se trata de estimar. Esta
variabilidad se mide en términos de la desviación estándar del estimador, la cual recibe
el nombre de error estándar.
El error estándar de un estimador T de un parámetro es la desviación estándar del
estimador.
Así por ejemplo, si tomamos  como estimador de , entonces el error estándar está

dado por .

 Teoremas de esperanza
Teoremas de esperanza
La esperanza matemática, también llamada valor esperado, es igual al sumatorio de las
probabilidades de que exista un suceso aleatorio, multiplicado por el valor del suceso
aleatorio. O, dicho de otra forma, el valor medio de un conjunto de datos. Teniendo en
cuenta, eso sí, que el término esperanza matemática está acuñado por la teoría de la
probabilidad. Mientras que en matemáticas, se denomina media matemática al valor
promedio de un suceso que ha ocurrido. En distribuciones discretas con la misma
probabilidad en cada suceso la media aritmética es igual que la esperanza matemática.

Valor esperado de una variable aleatoria discreta, calculándose de la siguiente forma:


n
E ( x )=∑ x 1 . P( x i)
i=1

E ( x )=x 1 . P ( x1 ) + x 2 . P ( x 2 ) +…
Para una variable aleatoria absolutamente continua, la esperanza se calcula mediante la
integral de todos los valores y la función de densidad f ( x ) :

La definición general de esperanza se basa, como toda la teoría de la probabilidad, en el


marco de la teoría de la medida y se define como la siguiente integra

 Error de estimación y colas de la densidad de probabilidad

Error de estimación: es el valor absoluto de la diferencia entre una estimación


particular y el valor del parámetro. En realidad por cada valor estimado del parámetro se
tiene un error de estimación por lo general diferente. Sin embargo, es posible fijar un
intervalo dentro del cual se encontrarán la mayoría de los valores de error de estimación
para un estimador y parámetro dados.

El error estándar de estimación mide la desviación en una muestra valor poblacional. Es


decir, el error estándar de estimación mide las posibles variaciones de la media muestral
con respecto al verdadero valor de la media poblacional.
Por ejemplo, si se desea conocer la edad promedio de la población de un país (media
poblacional) se toma un pequeño grupo de habitantes, a los que llamaremos «muestra».
De ella se extrae la edad promedio (media muestral) y se asume que la población tiene
esa edad promedio con un error estándar de estimación que varía más o menos.

Habría que reseñar que es importante no confundir la desviación estándar con el error
estándar y con el error estándar de estimación:

a. La desviación estándar es una medida de la dispersión de los datos; es decir, es


una medida de la variabilidad de la población.
b. El error estándar es una medida de la variabilidad de la muestra, calculada en
base a la desviación estándar de la población.
c. El error estándar de estimación es una medida del error que se comete al tomar la
media muestral como estimación de la media poblacional.

¿Cómo se calcula?

El error estándar de estimación se puede calcular para todas las medidas que se obtiene
en las muestras (por ejemplo, error estándar de estimación de la media o error estándar
de estimación de la desviación estándar) y mide el error que se comete al estimar la
verdadera medida poblacional a partir de su valor muestral

A partir del error estándar de estimación se construye el intervalo de confianza de la


medida correspondiente.

La estructura general de una fórmula para el error estándar de estimación es la siguiente:

Error estándar de estimación = ± Coeficiente de confianza × Error estándar


 Límites de confianza superior e inferior

Los intervalos de confianza nos permiten aproximar, una vez calculado el valor de la
variable en la muestra, entre qué rango de valores se encuentra el valor real inaccesible
de la variable en la población, con un grado de incertidumbre que podemos determinar.
Además, los intervalos de confianza aportan información añadida que se pierde cuando
únicamente se valora la probabilidad de significación estadística, ya que nos permiten
estudiar la precisión de la estimación.

Formula intervalo de confianza para la media a nivel de confianza 1−α

σ
limite inferior : x́−z α
1−
2 √n

σ
limite superior : x́+ z α
1−
2 √n

O simplificada

σ
x́ ± z α
1−
2 √n

x́=¿ Media de una muestra

z=¿ Es el valor de la curva estándar normal para la confianza que se requiere.

σ =¿ Desviación estándar

α =¿ Nivel de significación o de riesgo

n=¿ Tamaño de la muestra

 Coeficiente de confianza

Un intervalo de confianza es un rango de valores, derivado de los estadísticos de la


muestra, que posiblemente incluya el valor de un parámetro de población desconocido.
Debido a su naturaleza aleatoria, es poco probable que dos muestras de una población
en particular produzcan intervalos de confianza idénticos. Sin embargo, si usted
repitiera muchas veces su muestra, un determinado porcentaje de los intervalos de
confianza resultantes incluiría el parámetro de población desconocido.

 Método del pivote

El método del pivote para estimar intervalos de confianza es uno de los principales.
Consiste en identificar una función pivote p=(T , θ) la distribución de la cual es
independiente de θ y conocida. El pivote es función de θ y de una estimación puntual
del parámetro.

Después elegimos un nivel de confianza 1-α y buscamos el intervalo de confianza [a,b]


tal que a y b cumplen que:

Pθ ( a< p ( T , θ ) <b )=1−α

Tendremos que manipular y resolver esta desigualdad para encontrar los valores a y b.

Podemos ver los intervalos de confianza calculados mediante el método de los


momentos en varios ejemplos de intervalo de confianza.

Distribución normal con varianza conocida – Intervalo para la media μ

Tenemos una muestra aleatoria X=(X1,…,Xn) de una normal N(μ,σ2) con la varianza
σ2 desconocida y queremos estimar el valor de la media μ.

La media es un estimador razonable. Tipificando su distribución obtenemos el pivote:

Entonces el intervalo de confianza 1-α es:

Distribución normal con media y varianza desconocida – Intervalo para la media μ

Tenemos una muestra aleatoria X=(X1,…,Xn) de una normal N(μ,σ2) con la media μ y
la varianza σ2 desconocida. Vamos a buscar el intervalo de confianza de la media μ.

Aplicando fórmulas estadísticas obtenemos el pivote:


Por simetría de la t-student y aislando μ obtenemos el intervalo de confianza:

Distribución normal con media y varianza desconocida – Intervalo para la


varianza σ2

Supongamos una distribución normal N(μ,σ2) y una muestra aleatoria de la variable


X=(X1,…,Xn) con la media μ y la varianza σ2 desconocida. Vamos a buscar el
intervalo de confianza de la varianza σ2.

El pivote es:

Aplicando normas de la χ2 y aislando obtenemos:

Distribución uniforme (Un(0,θ)) – Intervalo para θ

Sea X=(X1,…,Xn) una muestra aleatoria de una uniforme (Un(0,θ)). Obtengamos un


intervalo de confianza para θ.

X(n) es el máximo de los elementos de la muestra. Sabiendo que X(n) es el estimador


de máxima verosimilitud tenemos el pivote:

Operando obtenemos el intervalo de confianza:


 Intervalos de confianza en una muestra grande

Acá nos focalizamos en el caso donde el estimador puntual es la media muestral y el


parámetro es la media poblacional.

Pensemos que disponemos de una muestra, la cual nos provee , nuestra mejor
estimación de la media poblacional.

Que nos dice el TCL para la media muestral: Estadística 2015 - Cátedra Prof. Tamara

σ 2x
(
Burdisso X́ N μ x ,
n )
¿Cómo se lee un intervalo de confianza al 95%?

El 95% de las muestras o más precisamente el 95% de los intervalos construidos en base
a las muestras, contendrán la verdadera media poblacional, dentro del intervalo
correspondiente a la media muestral +/- 2 errores estándar(SE).

¿Cómo se construye un intervalo de confianza?

En general construimos un intervalo de confianza alrededor de la media muestral


utilizando la siguiente expresión

Donde

X = la media muestral

Z c= es el valor Z asociado a una confianza C%.

σ x́ = el error estándar de la media.

Lo usual para el nivel de confianza es C%= 90%, 95%, 99%

Intervalo de confianza exacto al 95%


Un intervalo de confianza aprox. para la media al 95% está dado por

¿Cómo se construye el intervalo exacto al 95%?

Supongamos que tomamos muchas muestras y construimos intervalos de confianza al


95% para cada una de las muestras.

estimación puntual ±1.96∗SE

 Procedimiento de muestreo y diseño experimental

Procedimiento de muestreo

Al proceso de selección de los elementos o unidades de una muestra se le denomina


muestreo. El muestreo “sirve para clasificar y determinar el tamaño… a obtener una
muestra, reducir costos y obtener una mayor exactitud… además de ahorrar tiempo y
dinero se evitan los errores operativos y de medición que conlleva un censo” (Sáenz,
Gorjón, Gonzalo y Díaz, 2012, p. 145). Silva (2011) presenta el siguiente esquema para
realizar un muestreo, es decir, configurar la muestra:

1. Definir claramente la unidad de análisis (criterios de inclusión y exclusión) y


precisar claramente el tamaño que tiene la población
2. Determinar si se hará un muestreo o, por el contrario, se estudiará toda la
población
3. Determinar el tipo adecuado de muestreo
4. Calcular el tamaño muestral
5. Identificar el marco poblacional de donde se extraerá la muestra (realizar una
lista en donde se identifique cada unidad poblacional
6. Extraer o seleccionar físicamente la muestra

Diseño experimental

Se entiende por diseño experimental, el proceso de planeamiento de un experimento, tal


que se tomen datos apropiados con la mayor realidad posible, los cuales deben ser
analizados mediante métodos estadísticos que deriven conclusiones válidas y objetivas.
Podemos decir que la filosofía del diseño experimental es la obtención de información
con una alta fidelidad sobre el mensaje de la naturaleza a un costo mínimo.

Los diseños experimentales deben tener algunas características como:

1. Simplicidad. La selección de los tratamientos y la disposición experimental


deberá hacerse de la forma más simple posible.
2. Grado de precisión. El experimento deberá tener la capacidad de medir
diferencias entre tratamientos con los grados de precisión que desee el
investigador. Para cumplir con este propósito se deberá partir de un diseño y un
número de repeticiones adecuados.
3. Ausencia de error sistemático. Se debe planear un experimento con el propósito
de asegurar que las unidades experimentales que reciban un tratamiento no
difieran sistemáticamente de aquellas que reciben otro tratamiento, procurando
de esta manera obtener una estimación insesgada del efecto de tratamientos.
4. Rango de validez de las conclusiones. Este deberá ser tan amplio como sea
posible. Los experimentos que contribuyen a aumentar el rango de validez del
experimento son los experimentos replicados y los experimentos con estructuras
factoriales.

Cálculo del grado de incertidumbre. En todo experimento existe algún grado de


incertidumbre en cuanto a la validación de las conclusiones. El experimento deberá
ser concebido de modo que sea posible calcular la probabilidad de obtener los
resultados observados debido únicamente al azar

 Método de seleccionar los tamaños muéstrales

Determinar el tamaño de la muestra que se va a seleccionar es un paso importante en


cualquier estudio de investigación de mercados, se debe justificar convenientemente de
acuerdo al planteamiento del problema, la población, los objetivos y el propósito de la
investigación.

Para determinar el tamaño de una muestra se debe tener en cuenta:

1. Tamaño de la población. Una población es una colección bien definida de objetos


o individuos que tienen características similares. Hablamos de dos tipos: población
objetivo, que suele tiene diversas características y también es conocida como la
población teórica. La población accesible es la población sobre la que los
investigadores aplicaran sus conclusiones.
2. Margen de error (intervalo de confianza). El margen de error es una estadística que
expresa la cantidad de error de muestreo aleatorio en los resultados de una
encuesta, es decir, es la medida estadística del número de veces de cada 100 que se
espera que los resultados se encuentren dentro de un rango específico.
3. Nivel de confianza. Son intervalos aleatorios que se usan para acotar un valor con
una determinada probabilidad alta. Por ejemplo, un intervalo de confianza de 95%
significa que los resultados de una acción probablemente cubrirán las expectativas
el 95% de las veces.
4. La desviación estándar. Es un índice numérico de la dispersión de un conjunto de
datos (o población). Mientras mayor es la desviación estándar, mayor es la
dispersión de la población.

Cálculo del tamaño de la muestra desconociendo el tamaño de la población:

La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la


población es la siguiente:
En donde
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)

Cálculo del tamaño de la muestra conociendo el tamaño de la población

La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la


población es la siguiente:

En donde, N = tamaño de la población Z = nivel de confianza, P = probabilidad de


éxito, o proporción esperada Q = probabilidad de fracaso D = precisión (Error máximo
admisible en términos de proporción).

 Intervalos de confianza de muestra pequeña para medias de distribuciones


normales con varianza(s) desconocida(s),

El objetivo es el cálculo de un intervalo de confianza para la media de dicha variable.

Supongamos una muestra aleatoria X ₁ , X ₂, … , X n; de tamaño n de valores de la


variable aleatoria que sigue una distribución Normal de media μ y de varianza σ ²,
ambas desconocidas. Para calcular un intervalo de confianza, en este caso, partimos de
la variable aleatoria:

Que sigue una distribuciónt de Student con n−1 grados de libertad. En la fórmula


anterior, S hace referencia a la cuasidesviación típica muestral.
Tenemos que buscar dos valores de esta distribución tales que:

Al operar algebraicamente, se obtiene que

Por lo que el intervalo de confianza que buscamos es

La función de R t.test calcula intervalos de confianza en este contexto. Esta función


también se utiliza para resolver contrastes de hipótesis, como veremos en la práctica 6.
La sintaxis de la función t.test es la siguiente:

t . test (x , conf .level=0.95)


Donde:
X: Vector numérico con los valores de la variables de interés
conf.level: Valor numérico que indica el nivel de confianza, en tanto por uno, al que se
construirá el intervalo. Si omitimos este parámetro en la llamada a la función, los
intervalos de confianza se calculan a un nivel de confianza del 95%.
 Intervalos de confianza para una media poblacional e intervalos de confianza
para variación poblacional

Intervalos de confianza para una media poblacional

Se determina intervalos de confianza de colas iguales. Es decir, aquellos tales que, si el


coeficiente de confianza es 1−α, dejan en cada uno de los extremos la mitad de la
probabilidad α /2.

Se supone que los n datos proceden de una población N ( μ , σ ) , y lo que se pretende


determinar es el intervalo de confianza para la media μ.
En esta situación, tanto si la varianza poblacional α 2 es conocida como si no lo es, el
estimador natural de μ ,es la media muetral x́.

σ Conocida:

El intervalo buscado será

σ Desconocida:

En este caso de que la varianza poblacional sea desconocida, el intervalo de confianza


para la media resulta:

En donde S2 es la cuasivarianza muestral.

Intervalos de confianza para variación poblacional

Dada una muestra aleatoria simple X 1 … , X n de una población N(μ , σ ¿, se va a


determinar el intervalo de confianza para σ 2, distinguiendo dos casos según sea
desconocid o no la media de la poblacion μ .

μ desconocida :

El intervalo de confianza buscado será:

Con S2 la cuasivarianza muestral.

μ conocida:

En este caso, el intervalo de confianza será:


Realizar los siguientes ejercicios con el paso a paso y concluyendo:

1. Se toma una muestra aleatoria de ocho casas en la ciudad de Londres, los precios de
venta de estas casas son (en miles de libras):
92 83 112 127 109 96 102 90
a. Hallar la media, varianza y desviación típica.

Muestra aleatoria de ocho casas en la ciudad de Londres

Casa 1 2 3 4 5 6 7 8

Precio (Miles de
92 83 112 127 109 96 102 90
libras)

1. Media

92+83+112+127+ 109+96+102+90
M edia =
8

811
M edia =
8

M edia =101,375

La media es 101,375 en miles de libras

2. La varianza

( Precio−lamedia )2=¿

( 92−101,37 )2=(−9,37 )2

( 83−101,37 )2=(−18,37 )2

( 112−101,37 )2=( 10,63 )2

( 127−101,37 )2=( 25,63 )2

( 109−101,37 )2=( 7,63 )2

( 96−101,37 )2=(−5,37 )2

( 102−101,37 )2=( 0,63 )2

( 90−101,37 )2=(−11,37 )2

V =Varianza .
V = (−9,37 )2 + (−18,37 )2 + ( 10,63 )2 + ( 25,63 )2 + ( 7,63 )2+ (−5,37 )2 + ¿ ¿
8

( 0,63 )2+ (−11,37 )2


=¿
8

87,79+337,45+112,99 +656,89+58,21+28,83+0,39+129,27
V= =¿
8

1411,87
V= =176,48.
8

La Varianza es 176,48 en miles de libras.

3. Desviación Típica ¿ σ.
2
σ =√ σ 2 σ =√2 varianza

σ =√2 176,48=13.28

La desviación típica es 13,28 en miles de libras.

b. Halle la proporción muestral de casas con nivel porcentual mayor a 107.

2. La Dirección General de Tráfico quiere conocer la velocidad a la que circulan los


automóviles en un tramo determinado de una carretera. Para una muestra de 7
automóviles, el radar señalo las siguientes velocidades en kilómetros por hora:
79 73 68 77 86 71 69
a. Calcule la media y la varianza
68+69+71+73+77+ 79+ 86
x́=
7
523
x́=
7

x́=74,71

Se halla la media al sumar todos los datos y dividir el resultado por entre el número de
datos.

Para el resultado de la varianza tomamos los datos como una muestra

S2=∑ ¿ ¿¿

x́=74,71

S2=¿ ¿

45,0241+32,6041+13,7641+2,9241+5,2441+18,4041+ 127,4641
S2 =
6

245,4287
S2 =
6

S2=40,90

S=6,8

b. Suponiendo que la distribución es normal, hallar un intervalo de confianza del


95% para la velocidad media de los automóviles que circulan por dicho tramo

σ
x́ ± z
√n
x́=74,71

σ =6,8

n=7

z=1,96
74,71 ±1,96 ( 6,8√7 )
6,8
74,71 ±1,96 ( 2.64 )
74,71 ±1,96(2.57)

74,71 ±5,03

74,71+5,03 74,71−5,03

79,74 69,68

Rta: (79.74, 69,68) aproximadamente el 95% del intervalos.

3. En la secretaría de cierta universidad se ha comprobado que la nota media de los


candidatos para la admisión a la maestría a Matemáticas sigue una distribución
normal con desviación típica de 0,45. Se toma una muestra aleatoria de 25
solicitudes y se obtiene una media muestral de calificaciones igual a 2,1

n=25

s=0,45

x́=2,1

a=95 %

a
Z=1−
2

95 %
Z=1−
2

Z=0,525

a. Calcule un intervalo de confianza del 95 % para la media poblacional

s
I . C .=x́ ± Z α /2 ×
√n
0,45
I . C .=2,1± 0,52595 % /2 ×
√ 25

0,45 0,45
Limi inf =2,1−0,525× Limi ¿ 2,1+ 0,525×
√ 25 √25

Limi inf =2.05275 Limi ¿ 2.14725

I . C .=( 2.05275; 2.14725 )

Con una significancia del 95 % la cantidad promedio de calificaciones en la secretaría


de cierta universidad para la admisión a la maestría a Matemáticas, se encuentra entre
2.05275 y 2.14725

b. Calcule un intervalo de confianza del 99 % para la media poblacional

a
Z=1−
2

99 %
Z=1−
2

Z=0,505

s
I . C .=x́ ± Z α /2 ×
√n
0,45
I . C .=2,1± 0,50595 % /2 ×
√ 25

0,45 0,45
Limi inf =2,1−0,505× Limi ¿ 2,1+ 0,505×
√ 25 √25

Limi inf =2.05455 Limi ¿ 2.14545

I . C .=( 2.05455; 2.14545 )

Con una significancia del 99 % la cantidad promedio de calificaciones en la secretaría


de cierta universidad para la admisión a la maestría a Matemáticas, se encuentra entre
2.05455 y 2.145
4. Para analizar la eficacia de la aplicación de un tratamiento, se someten al mismo a
64 pacientes. Finalizado el período de aplicación se observó que remitió la
enfermedad en 50 casos. Con un nivel de confianza del 92%, estime el porcentaje de
efectividad del tratamiento objeto de estudio.

Tenemos que:

x pacientes que remitieron


p=
n total de pacientes

50
p= =0.78125
64

Valor tabulado en N (0,1) para α =0.08 ( p=1−α =0.92 )

Z α=¿ ±1.75 ¿

Siendo la proporción muestral p=0.78125 , el intervalo de confianza es

p∗(1− p)
p ± Zα
√ n

0.78125∗(1−0.78125)
0.78125 ±1.75
√ 64
=¿

0.78125 ± 0.09043

Separamos resultados

0.78125+0.09043 0.78125−0.09043

0.87168 ×100 % 0.69082×100 %

87.168 % 69.082 %

Con un margen de error de un 8% podemos afirmar que el tratamiento será posible


entre el 69.082% y el 87.168% de los casos

5. En una muestra de 13 elementos, obtenidos aleatoriamente de una población normal


e infinita, sabemos que los límites del intervalo confidencial de estimación de la
media poblacional, con un nivel de riesgo del 5% son, respectivamente, 1’28 y
18’72.
a. Halle la media de la muestra
La media muestral siempre ocupa el valor central o medio del intervalo de confianza.

Así:

18 ´ 72−1 ´ 28
X́ =
2

X́ =8 ´ 72

b. Halle la desviación típica insesgada de la muestra

En la estimación de la media poblacional con varianza desconocida y siendo la muestra

de tamaño pequeño, el intervalo de confianza es:

S´ S´
( X́−t
n−1 ,
α
2
.
√n
, X́ +t
n−1 ,
α.
2 √n
)=( 1 ´ 28 ,18 ´ 72 )

'
Las tablas de la tde Student proporcionan el valor: t n−1 , α =t 12,0´ 05 /2=2 178792
2

Tomando uno cualquiera de los extremos del intervalo de confianza obtenemos:

S´ S´
X́ +t α . =8 ´ 72+2' 178792 . =18 ´ 72 ⟹
n−1 ,
2 √n √ 13

S´ 10 . 13
2' 178792 . =10 ⟹ S ´ = ' √ =16´ 548
√ 13 2 178792

REFERENCIAS BIBLIOGRÁFICAS
Sáez, A. (2010). Métodos Estadísticos con R y R Commander, Universidad de Jaen,
Recuperado de

https://cran.r-project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf

Gómez, M. (2005). Inferencia estadística. Editorial Ediciones Díaz de  Santos.


Recuperado de

http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/detail.action?
docID=10156663&p00=inferencia+estadistica

Sánchez, J. (2017). Introducción a la Inferencia. Recuperado de

 http://hdl.handle.net/10596/10539

Alvarado, J. (2008).Fundamento de inferencial estadística. Bogotá. Editorial Pontifica


Universitaria Javeriana. Recuperado de:

 https://books.google.com/books?isbn=9587160940

También podría gustarte