Muestreo Como Base de La Estadística Inferencial

REPÚBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA DEFENSA

UNIVERSIDAD NACIONAL EXPERIMENTAL POLITÉCNICA
DE LA FUERZA ARMADA NACIONAL BOLIVARIANA
UNEFA-NÚCLEO APURE
UNIDAD ACADÉMICA
E.A.D. DE INVESTIGACIÓN
CARRERA: _INGENIERIA EN SISTEMAS
ESTADISTICA
INFERENCIAL
Facilitador (a): Participante:

Prof. José Castillo Rosmer Guerrero
C.I.V.- 29.894.467
San Fernando de Apure, Enero 2021
1
ÍNDICE
Pág.
Introducción…………………………………………………………… 3
La teoría del muestreo como base de la estadística inferencial…….. 4
Muestreo al azar o simple…………………………………………….. 8
Distribución T de Student…………………………………………….. 10
Distribución muestral de la media aritmética………………………… 13
Diferencia de medias …………………………………………………. 14
El error estándar………………………………………………………. 19
Conclusión……………………………………………………………. 21
Referentes bibliográficos……………………………………………… 22
2
INTRODUCCIÓN
La estadística es considerada como una colección de hechos numéricos expresados

de una manera sumatoria, y que han sido recopilados a partir de otros datos numéricos. Se
considera como el cálculo visual y analítico de los diferentes tipos de muestras que se
encuentran en una población, es una técnica especial apta para el estudio cuantitativo y es
considerada como una de las ciencias de gran utilidad en lo económico, social y natural.
Los últimos años la necesidad de estudiar la estadística ha crecido de manera considerable
en las últimas décadas, por ser un área de gran importancia utilizada en todos los campos
laborales. El estudio de la misma presenta en ocasiones grandes dificultades de aprendizaje
pero el tener un grado necesario de dominio sobre la estadística facilita al Ingeniero
desenvolverse sin mayor complejidad en su vida profesional ya que es un punto
fundamental para realizar sus trabajos sobre todo al momento de calcular probabilidades de
ocurrencia de problemas.
Además es muy fluida por los diferentes trabajos que se le presenta como
profesional en esta área de la Ingeniería ya sea para presentar informes finales o temporales
hablando de lo cuantitativo, así como también tener la necesidad de saber con qué personal
se trabaja cual es la relación social que tiene cada individuo y en toda estas relaciones está
presente la estadística. En este sentido se presenta a continuación una pequeña pero
significativa investigación de corte Bibliográfico, evaluando informaciones recogidas de
textos y documentos Web. En la misma se plasman términos y representaciones referidas a
la Estadística Inferencial, apoyada en ejemplos plasmados de forma sencilla de tal forma
que sean de fácil comprensión para cualquier persona que se tome la molestia de leerlo.
Igualmente se espera que en un futuro sirva de referencia a investigaciones afines.
3
La teoría del muestreo como base de la estadística inferencial.
La estadística inferencial es una parte de la estadística que comprende los métodos y

procedimientos que por medio de la inducción determina propiedades de una población
estadística, a partir de una parte de esta. Su objetivo es obtener conclusiones útiles para
hacer deducciones sobre una totalidad, basándose en la información numérica de la
muestra.
Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los

fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para
modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio.
Estas inferencias pueden tomar la forma de respuestas a preguntas sí/no (prueba de
hipótesis), estimaciones de unas características numéricas (estimación), pronósticos de
futuras observaciones, descripciones de asociación (correlación) o modelamiento de
relaciones entre variables de Sam (análisis de regresión). Otras técnicas de modelamiento
incluyen análisis de varianza, series de tiempo y minería de datos.
En este sentido la estadística inferencial basa sus estudios en:
Toma de muestras o cuantitativo muestreo, que se refiere a la forma adecuada de

considerar una muestra que permita obtener conclusiones estadísticamente válidas y
significativas.
Estimación de parámetros o variables estadísticas, que permite estimar valores

poblacionales a partir de muestras de mucho menor tamaño.
Contraste de hipótesis, que permite decidir si dos muestras son estadísticamente

diferentes, si un determinado procedimiento tiene un efecto estadístico significativo, etc.
Diseño experimental.
Inferencia bayesiana.
Métodos no paramétricos.
Igualmente se basa en los métodos de
4
Planteamiento del problema: un problema de inferencia estadística suele iniciarse
con una fijación de objetivos o algunas preguntas del tipo:
¿Cuál será la media de esta población respecto a tal característica?
¿Se parecen estas dos poblaciones?
¿Hay alguna relación entre...?
En el planteamiento se definen con precisión la población, la característica a

estudiar, las variables, entre otros.
Elaboración de un modelo: en caso de establecer un modelo teórico, se replantea el

procedimiento y se llega a una conclusión lógica. Los posibles modelos son distribuciones
de probabilidad.
Extracción de la muestra: se usa alguna técnica de muestreo o un diseño

experimental para obtener información de una pequeña parte de la población.
Tratamiento de los datos: en esta fase se eliminan posibles errores, se depura la

muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos
posteriores, como la media muestral, la varianza muestral.
Los métodos de esta etapa están definidos por la estadística descriptiva.
Estimación de los parámetros: con determinadas técnicas se realiza una predicción

sobre cuáles podrían ser los parámetros de la población.
Contraste de hipótesis: los contrastes de hipótesis son técnicas que permiten

simplificar el modelo matemático bajo análisis. Frecuentemente el contraste de hipótesis
recurre al uso de estadísticos muestrales.
Conclusiones: se critica el modelo y se hace un balance. Las conclusiones obtenidas

en este punto pueden servir para tomar decisiones o hacer predicciones.
El estudio puede comenzar de nuevo a partir de este momento, en un proceso cíclico

que permite conocer cada vez mejor la población y características de estudio.
5
Ahora bien, al referirnos al Muestreo se debe considerar que una población es el
conjunto de individuos sobre los que hacemos cierto estudio, y que una muestra es un
subconjunto de la población. Resulta entonces evidente que los resultados de una
determinada encuesta tendrán un mayor grado de fiabilidad si dicha encuesta se realiza
sobre la población completa. Sin embargo, en la mayoría de las ocasiones esto no es
posible, debido a múltiples razones, como por ejemplo:
Imposibilidad material Hacer una encuesta a los casi 40 millones de Venezolanos es

imposible, o hacer un estudio sobre la fecha de caducidad de un producto. Si lo hacemos
con todos los productos ¿que vendemos luego? o la Imposibilidad temporal Hacer un
estudio sobre la duración de una bombilla. ¿Cuánto debemos esperar para saberlo?
Por tanto, es habitual que se tenga que manejar con muestras, de modo que es
importante saber elegir bien una muestra de la población, una muestra que represente bien a
dicha población y que nos permita con un alto grado de fiabilidad inferir o predecir las
características de la población. Hay muchas maneras de elegir una muestra de una
población, Pero antes de pasar a analizar dichas formas de extracción de muestras, lo que si
hemos de dejar claro es que todas las muestras han de cumplir varias condiciones
indispensables. Es evidente que para que el estudio a realizar sea fiable, hay que cuidar
mucho la elección de la muestra, para que represente en la medida de lo posible a la
población de la que se extrae. Si la muestra está mal elegida, diremos que no es
representativa. En este caso, se pueden producir errores imprevistos e incontrolados. Dichos
errores se denominan sesgos y diremos que la muestra está sesgada.
Por otra parte, una de las condiciones para que una muestra sea representativa es
que el sistema que se utiliza para elegirla sea aleatorio, es decir, que todos los individuos de
la población tengan las mismas posibilidades de ser elegidos, mientras que si la elección de
la muestra es subjetiva, es probable que resulte sesgada. Las distintas maneras de elegir una
muestra de una población se denominan muestreos y básicamente hay dos tipos de
muestreos:
1. Muestreo no probabilístico: El investigador no elige la muestra al azar, sino

mediante determinados criterios subjetivos. Los individuos de la población no tienen la
6
misma probabilidad de ser incluidos en la muestra. En este tipo de muestreo suele ser muy
escasa la representatividad y por tanto, poco válidas las inferencias que pueden hacerse.
2. Muestreo probabilístico o aleatorio: Es el que se realiza teniendo en cuenta que

cada miembro de la población tiene la misma probabilidad de ser elegido en la muestra.
Con este tipo de muestreo, las muestras suelen ser más representativas, es posible conocer
los errores cometidos y pueden hacerse inferencias estadísticas. En este caso podemos
distinguir varios tipos:
a) Muestreo aleatorio simple: Aquel en el que cada individuo de la población tiene

las mismas posibilidades de salir en la muestra.
b) Muestreo sistemático: En el que se elige un individuo al azar y a partir de él, a

intervalos constantes, se eligen los demás hasta completar la muestra.
c) Muestreo estratificado: Se divide la población en clases o estratos y se escoge,

aleatoriamente, un número de individuos de cada estrato proporcional al número de
componentes de cada estrato.
d) Muestreo por conglomerados: Si no disponemos de la relación de los

elementos de la población, o de los posibles estratos, no podemos aplicar los muestreos
anteriores.
Aquí entra el llamado muestreo por conglomerados, donde en lugar de elegir

individuos directamente, se eligen unidades más amplias donde se clasifican los elementos
de la población, llamados conglomerados. En cada etapa del muestreo en lugar de
seleccionar elementos al azar seleccionamos conglomerados. Los conglomerados deben ser
tan heterogéneos como la población a estudiar, para que la represente bien. Luego se
elegirían algunos de los conglomerados al azar, y dentro de ´estos, analizar todos sus
elementos o tomar una muestra aleatoria simple. No se debe confundir estrato y
conglomerado. Un estrato es homogéneo (sus elementos tienen las mismas características),
mientras que un conglomerado es heterogéneo (debe representar bien a la población). En
cualquier caso hemos de asumir que un error en el muestreo ocasionar que los resultados
7
que proporcione la muestra no coincidan o estén alejados de los valores reales de la
población. Pueden darse dos tipos de errores:
- Error aleatorio muestral. Para reducir este error hay que aumentar
el tamaño de la muestra.
- Error sistemático o Sesgo. Va asociado al proceso de selección de la
muestra y se reduce mejorando esta selección.
Muestreo al azar o simple
Un muestreo al azar es un tipo de muestreo fácil de llevar a cabo. Consiste en

enumerar los elementos de la población y seleccionar al azar los elementos que integrarán
la muestra. En este tipo de muestreo probabilístico cada miembro de la población tiene la
misma posibilidad de ser seleccionado. La muestra al azar tiene diferentes formas de
realizarse. Entre las principales se encuentran las siguientes:
Muestreo aleatorio simple: Es un proceso en el que cada integrante del público

objetivo y cada muestra posible, tienen la misma posibilidad de ser elegidos.
Muestreo estratificado: Este tipo de muestreo tiene el objetivo de separar al

público objetivo en segmentos exclusivos y homogéneos. Posteriormente se realiza una
muestra aleatoria simple en cada estrato.
Muestreo por conglomerados: En este procedimiento, los elementos del público

objetivos son elegidos al azar naturalmente por agrupaciones. Estos, se seleccionan de
forma individual.
Muestreo sistemático: En este tipo de muestreo al azar se realiza una selección

aleatoria del primer elemento de la muestra, posteriormente se eligen los otros, a través de
intervalos fijos o sistemáticos, hasta obtener el tamaño de la muestra requerido.
El primer paso en el muestreo al azar consiste en seleccionar a la población

objetivo, posteriormente, identifica el marco de muestreo para tu población objetivo.
Evalúa el marco de muestreo y se hacen los ajustes necesarios. Asigna un número único a
cada elemento del público objetivo. Define el tamaño de la muestra, selecciona al azar el
8
número específico de elementos de la población, ventajas de realizar una muestra al azar,
las principales ventajas de realizar una muestra al azar son las siguientes:
a) A diferencia de otros métodos, si se realiza de forma correcta, permite reducir

cualquier sesgo.
b) Es muy fácil seleccionar un tamaño de muestra pequeño de una población más

grande.
c) No es necesario ser un experto y tener conocimientos técnicos para realizar este

proceso, solo basta con hacer una pregunta que permita reunir la información necesaria.
Algunas desventajas de realizar un muestreo al azar son:
a) Puede ser un método de recolección de datos muy costoso.
b) No debe realizarse en estudios para los que se necesitan hacer entrevistas

personales.
c) Es difícil de realizar cuando el tamaño de muestra es muy grande.
En un muestreo al azar simple, utilizamos algún procedimiento al azar para elegir a

los sujetos de la población que van a formar parte de la muestra. Por su parte Hernández
(2012) plantea que: Si se va a extraer una muestra de tamaño n del total N unidades o
elementos de la población, el muestreo simple al azar es el método de muestreo que
garantiza que cualquier subconjunto de n elementos diferentes de la población tiene la
misma probabilidad o chance que cualquier otro de ser escogido como la muestra de n
elementos, por medio de este tipo de muestreo cualquier elemento de la población cuenta
con la probabilidad de ser elegido como parte de la muestra del estudio que se está
realizando.
Ejemplo
Hernández (2012) ejemplifica de manera muy clara este tipo de muestreo:
Supongamos que se desea conocer el número de horas semanales que ven televisión
los estudiantes de un colegio determinado. Para este fin se puede tomar una muestra al azar
9
de 200 estudiantes del total de 1400 estudiantes del colegio. Se puede utilizar como marco
muestral una lista con los nombres de los estudiantes, la cual es fácil de conseguir. La lista
se puede numerar consecutivamente de 0001 hasta 1400, para identificar a cada estudiante
con un número entre 1 y 1400. Para el autor, la muestra correspondiente a 200 estudiantes
se puede seleccionar a partir de los siguientes métodos;
Por medio de una rifa con una urna de 1400 fichas: luego de lanzar en una urna
1400 fichas identificadas con números del 0001 a 1400, se seleccionan 200 de ellas sin
mirar.
Mediante tabla de números al azar: Se utilizan tablas especiales de números al

azar que aparecen en los libros de estadística.
Paquetes estadísticos como SPSS u hojas de cálculo como Excel: Cuando se trata
de muestras grandes por lo general es mejor utilizar paquetes estadísticos como el SPSS u
una hoja de Excel.
Distribución t de Student
En probabilidad y estadística, la distribución t (de Student) es una distribución de

probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño. Esto aparece de manera natural al
realizar la prueba t de Student para la determinación de las diferencias entre dos varianzas
muestrales y para la construcción del intervalo de confianza para la diferencia entre las
partes de dos poblaciones cuando se desconoce la desviación típica de una población y esta
debe ser estimada a partir de los datos de una muestra. Presenta las condiciones de ser
utilizada en muestras pequeñas de 30 o menos elementos. La desviación estándar de la
población no se conoce. Tiene como características la distribución t-Student es menor en la
media y más alta en los extremos que una distribución normal. Tiene mayor parte de su
área en los extremos que la distribución normal.
Caracterización
La distribución t de Student es la distribución de probabilidad del cociente:
10
Donde Z N (0,1) es decir, Z es una variable aleatoria distribuida según una normal
típica (de media nula y varianza 1).
es decir V es una variable aleatoria que sigue una distribución χ² con V

grados de libertad.
Z y V son variables aleatorias independientes.
Si μ es una constante no nula, el cociente es una variable aleatoria que

sigue la distribución t de Student no central con parámetro de no-centralidad μ
Propiedades de la distribución t de Student
Las propiedades de la distribución t de Student son las siguientes:
Es una distribución simétrica. El valor de la media, la mediana y la moda coinciden.

Matemáticamente,
Es una distribución unimodal. Los valores que son más frecuentes o que tienen más
probabilidad de aparecer (moda) están alrededor de la media. Cuando nos alejamos de la
media, la probabilidad de aparición de los valores y su frecuencia descienden.
Si tenemos una muestra de tamaño n, entonces tendremos una distribución t con (n-
1) grados de libertad.
En otras palabras, la distribución tendrá el mismo número de observaciones en

ambos lados del valor central.
La función de densidad no depende de los grados de libertad para ser simétrica.
Características
Es simétrica, con μ = 0. Su forma es muy parecida a la N(0,1), aunque menos

apuntada.
Puede tomar cualquier valor entre -∞ y +∞.
11
A medida que aumentan los grados de libertad, la distribución se aproxima más a
una distribución normal.
La curva es asintótica al eje de abscisas.
Se emplea en estadística inferencial en las pruebas de contraste.
Distribución F de Fischer.
Usada en teoría de probabilidad y estadística, la distribución F es una distribución

de probabilidad continua. También se le conoce como distribución F de Snedecor (por
George Snedecor) o como distribución F de Fisher-Snedecor (por Ronald Fisher). Esta
razón F fue creada por Ronald Fisher (1890-1962), matemático británico, cuyas teorías
estadísticas hicieron mucho más precisos los experimentos científicos. Sus proyectos
estadísticos, primero utilizados en biología, rápidamente cobraron importancia y fueron
aplicados a la experimentación agrícola, médica e industrial. Fisher también contribuyó a
clarificar las funciones que desempeñan la mutación y la selección natural en la genética,
particularmente en la población humana. El valor estadístico de prueba resultante se debe
comparar con un valor tabular de F, que indicará el valor máximo del valor estadístico de
prueba que ocurría si H0 fuera verdadera, a un nivel de significación seleccionado.
Características de la distribución F
Existe una distribución F diferente para cada combinación de tamaño de muestra y

número de muestras. Por tanto, existe una distribución F que se aplica cuando se toman
cinco muestras de seis observaciones cada una, al igual que una distribución F diferente
para cinco muestras de siete observaciones cada una. A propósito de esto, el número
distribuciones de muestreo diferentes es tan grande que sería poco práctico hacer una
extensa tabulación de distribuciones. Por tanto, como se hizo en el caso de la distribución t,
solamente se tabulan los valores que más comúnmente se utilizan. En el caso de la
distribución F, los valores críticos para los niveles 0,05 y 0,01 generalmente se
proporcionan para determinadas combinaciones de tamaños de muestra y número de
muestras.
12
Ejemplo
Encontrar el valor de F, en cada uno de los siguientes casos:
El área a la derecha de F, es de 0.25 con = a= 4 y c=9.
Solución:
Como el área que da la tabla es de cero a Fisher, se tiene que localizar primero los
grados de libertad dos que son 9, luego un área de 0.75 con 4 grados de libertad uno
Distribución muestra de la media aritmética
En cada una de las distintas muestras que pueden ser extraídas de una población se
pueden calcular estadísticos como la media aritmética o la proporción de elementos que
presentan cierta característica; por ejemplo, la media de estaturas o la proporción de
licenciados universitarios. Cuando los elementos son escogidos de manera aleatoria, los
estadísticos pueden tomar distintos valores en cada una de las muestras, cada uno de ellos
con distinta probabilidad. En los ejemplos del inicio de esta sección ya vimos que los
valores de la media en diferentes muestras aleatorias se encontraban con mayor
probabilidad cerca del valor de la media poblacional, y que era menos probable que se
encontrasen muy alejados de ella. La probabilidad de cada uno de los posibles valores que
puede tomar un estadístico en muestras extraídas al azar viene dada por una función
matemática denominada distribución muestral, que depende del estadístico en cuestión. Se
habla así, por ejemplo, de la distribución muestral de la media aritmética o de la
distribución muestral de la proporción.
13
Una distribución muestral es una función de probabilidad, ya que asigna a cada
posible valor de un estadístico su probabilidad de aparecer en una muestra extraída al azar.
En realidad, esta definición es estrictamente cierta solo cuando la variable toma valores
discretos; por ejemplo, cuando procede de un contaje y sus posibles valores son 0, 1, 2, 3,
etc. Cuando el valor del estadístico muestral es una variable continua, la distribución
muestral correspondiente se denomina función de densidad de probabilidad. La
probabilidad en este caso corresponde gráficamente a un área bajo la curva de esa función,
delimitada por un cierto intervalo de la variable. Analíticamente, esa área se calcula como
la integral de la función entre los límites del intervalo de la variable, que en la práctica se
obtiene con un ordenador o se consulta en una tabla. El área total bajo la curva, que se
extiende a todos los posibles valores de la variable, es siempre uno, que corresponde a la
probabilidad de un suceso seguro.
La siguiente gráfica muestra la curva de una función de densidad de probabilidad

para una variable x, y en ella se señala la probabilidad de que esa variable se encuentre
entre los valores 1 y 2, que corresponde al área bajo la curva marcada en azul:
Diferencias de Medias Poblacionales
En ocasiones interesa definir un intervalo de valores tal que permita establecer

cuáles son los valores mínimo y máximo aceptables para la diferencia entre las medias de
dos poblaciones. Pueden darse dos situaciones según las muestras sean o no
independientes; siendo en ambos casos condición necesaria que las poblaciones de origen
sean normales o aproximadamente normales:
Muestras independientes
Si puede suponerse que las varianzas de ambas poblaciones son iguales, el intervalo
de confianza para la diferencia de medias poblacionales está centrado en la diferencia de las
medias muestrales, siendo sus límites superior e inferior:
14
t/2 es el valor crítico correspondiente al grado de confianza 1- de la distribución t de
Student con n1+ n2-2 grados de libertad y es una
estimación de la desviación típica común a ambas poblaciones obtenida a partir de las
varianzas de las dos muestras. En la práctica si n1 y n2 son moderadamente grandes, el
valor crítico t/2 se aproxima, como ya se ha visto anteriormente, a los valores de la
distribución normal. Si las varianzas poblacionales no pueden suponerse iguales los límites
del intervalo de confianza son:
El valor crítico t/2 corresponde a una distribución t cuyos grados de libertad se

calculan en base a ambos tamaños muestrales y a las desviaciones típicas de cada grupo
según la corrección propuesta por Dixon y Massey:
EJEMPLOS
Ejemplo 1
Con los datos de la encuesta Enctran.sav obtener la estimación puntual y los

intervalos de confianza del 95 y del 99% para la media de la población de la variable
Coste.
En el cuadro de diálogo Explorar, que se obtiene con la secuencia Analizar >

Estadísticos descriptivos > Explorar, se selecciona como variable dependiente la variable
Coste. En Estadísticos comprobamos que está activada la opción Descriptivos y que el
intervalo para el medio definido es el del 95%.
Al aceptar se obtiene el siguiente cuadro de resultados:
15
La estimación puntual del valor esperado del coste es 5236,40 Pta. Esta estimación
tiene un error típico de 365,97. Los límites inferior y superior del intervalo de confianza del
95% son 4511,34 y 5951,46, respectivamente. Este resultado se interpreta como que de los
intervalos obtenidos con este método el 95% contendrán el verdadero valor esperado del
coste. Una medida del grado de precisión con el que se está estimando el valor esperado es
la amplitud del intervalo, que en este caso es igual a 1450,12 y la mitad de la amplitud, que
es 725,06, es el error máximo de estimación que puede garantizarse con una probabilidad
de 0,95. Este error máximo es igual a donde t/2 , es el valor crítico para =0,05 de la
distribución t e Student, en este caso con 113 grados de libertad, y es el error típico de la
estimación.
Para obtener el intervalo del 99% de confianza modificamos el valor del grado de
confianza en el cuadro Explorar: Estadísticos Fijándolo en el 99%.
Los límites del intervalo de confianza del 99% son 4277,54 y 6195,27; la confianza de que
este intervalo contenga el verdadero valor esperado del coste es 0,99. La amplitud de este
intervalo es 2217,73 que es mayor que la amplitud del intervalo del 95%, por lo tanto,
1108,865, es el error máximo de estimación que puede garantizarse con una probabilidad
de
0,99. Como puede verse, a medida que aumenta el grado de confianza del intervalo
disminuye la precisión de la estimación.
Ejemplo 2.
16
Para la misma variable Coste verificar si se puede aceptar el supuesto de que el valor
esperado del Coste es superior a 6000.
Con la secuencia Analizar > Comparar medias > Prueba T para una media se abre el cuadro
de diálogo Prueba T para una muestra en el cual se selecciona la variable Coste y se indica
como Valor de prueba 6000. Esto quiere decir que las hipótesis que se están contrastando
son Se trata por tanto de un contraste a una sola cola.
estadístico de prueba toma el valor t=-2,086, que en las tablas de la distribución

t de Student con 113 grados de libertad deja por debajo un área de 0,0195. Esto quiere decir
que se rechaza la hipótesis nula en favor de la alternativa para niveles de significación
superiores a 0,0195. Obsérvese que 0,0195 es la mitad del nivel de significación para la
prueba de dos colas que aparece en el cuadro de resultados.
Por otra parte si las hipótesis hubieran sido se rechazaría la hipótesis nula en favor de la
alternativa para niveles de significación superiores a 0,039. El intervalo del 95% de
confianza para la media calculado en el apartado anterior no contenía el valor 6000; lo que
equivale a decir que para un nivel de significación del 5% se rechaza la hipótesis nula. Por
el contrario, el intervalo del 99% contenía el valor 6000 y, por lo tanto, para un nivel de
significación del 1% no se rechazaría la hipótesis nula.
Ejemplo 3.
17
Verificar si existe diferencia significativa entre el coste esperado en transporte de los
alumnos que viven en Barcelona y el de los que viven fuera.
Con la secuencia Analizar> Comparar medias > Prueba T para muestras independientes se
abre el cuadro de diálogo Prueba T para muestras independientes en el cual se selecciona la
variable Coste y se indica como Variable de agrupación Resid. En la opción Definir grupos
se asigna al Grupo 1 el valor 1 (vive en Barcelona) y al Grupo 2 el valor 2 (no vive en
Barcelona). Aceptando se obtienen entre otros los siguientes resultados:
Las hipótesis que se están contrastando son frente Para

realizar este contraste previamente se debe comprobar si es aceptable la hipótesis de
varianzas poblacionales iguales para los dos grupos . El estadístico F de la
prueba de Levene* no permite aceptar la igualdad de varianzas poblacionales, por lo cual el
valor del estadístico de prueba es t=-3,750 que para cualquier nivel de significación lleva a
rechazar la hipótesis de igualdad de medias. El signo negativo del estadístico t indica que el
coste del transporte es significativamente superior para los que viven fuera de Barcelona.
Ejemplo 4.
Con los datos de la encuesta Encinf.sav contrastar si existe diferencia significativa
entre las puntuaciones medias asignadas a las aulas de informática en cuanto a la Dotación
y Software.
Las puntuaciones que se quiere comparar han sido generadas dos a dos por los
mismos individuos; se trata por tanto del caso de muestras relacionadas. Las hipótesis que
se contrastan son
18
Con la secuencia Analizar > Comparar medias >Prueba T para muestras relacionadas se
abre el cuadro de diálogo en el cual se selecciona la pareja de variables Dotación-Software.
Al aceptar se obtienen los siguientes resultados:
El análisis sólo ha considerado los casos que no presentan ningún valor missing en
el par de puntuaciones, quedando únicamente 106 casos válidos de los 114. El promedio de
las diferencias entre las puntuaciones asignadas a la dotación y al software es de -1,12 con
un error típico igual a 0,19. El estadístico de prueba t es igual a -5,93 y se distribuye según
una t de Student con 105 grados de libertad. Con este valor de t se rechaza la hipótesis nula
para cualquier nivel de significación. Los resultados proporcionan también el intervalo de
confianza para la diferencia de las dos medias poblacionales con el 95% de nivel de
confianza. Como puede observarse el intervalo no contiene el valor 0, de lo que se deduce
también que no se puede aceptar que las puntuaciones medias sean significativamente
iguales.
El error Estándar.
El error estándar es la desviación estándar de la distribución muestral de un

estadístico muestral. El término se refiere también a una estimación de la desviación
estándar, derivada de una muestra particular usada para computar la estimación. Cada
estadística tiene un error estándar asociado. Una medida de la precisión de la estadística
puede deducir que el error estándar de 0 representa que la estadística tiene ningún error
aleatorio y el más grande representa menos preciso de las estadísticas. Error estándar no es
constantemente informado y no siempre fácil de calcular.
En aplicaciones prácticas, el verdadero valor de la desviación estándar (o del error)
es generalmente desconocido. Como resultado, el término "error estándar" se usa a veces
para referirse a una estimación de esta cantidad desconocida. En tales casos es importante
19
tener claro de dónde proviene, ya que el error estándar es sólo una estimación.
Desafortunadamente, esto no es siempre posible y puede ser mejor usar una aproximación
que evite usar el error estándar, por ejemplo usando la estimación de máxima verosimilitud
o una aproximación más formal derivada de los intervalos de confianza. Un caso bien
conocido donde se pueda usar de forma apropiada puede ser en la distribución t de Student
para proporcionar un intervalo de confianza para una media estimada o diferencia de
medias.
En otros casos, el error estándar puede ser usado para proveer una indicación del
tamaño de la incertidumbre, pero su uso formal o semi-formal para proporcionar intervalos
de confianza o test debe ser evitado a menos que el tamaño de la muestra sea al menos
moderadamente grande. Aquí el concepto "grande" dependerá de las cantidades particulares
que vayan a ser analizadas. Las estadísticas también se comportan de una manera aleatoria,
similar a la de las mediciones individuales, y esto se mide con el error estándar. Cuando se
informa la media de una muestra, no se informa el promedio "verdadero" sino una
estimación. La estadística muestral puede resultar levemente superior o inferior al valor
verdadero desconocido. El error estándar de la media mide la diferencia que puede existir
entre la media verdadera y la estadística que se informa.
Por ejemplo, si se desea conocer la edad promedio de la población de un país
(media poblacional) se toma un pequeño grupo de habitantes, a los que llamaremos
“muestra”. De ella se extrae la edad promedio (media muestral) y se asume que la
población tiene esa edad promedio con un error estándar de estimación que varía más o
menos.
20
CONCLUSION
Luego de haber realizado la presente investigación se puede concluir que la
Estadística Inferencial está fundamentada en los resultados obtenidos del análisis de una
muestra de población, con el fin de inferir el comportamiento o característica de la
población, de donde procede, por lo que recibe también el nombre de Inferencia Estadística.
Debido a lo señalado se considera que el objetivo de la inferencia en la investigación
científica radica en conocer las clases numerosas de objetos, personas o eventos a partir
otros relativamente pequeñas compuestas por los mismos elementos. Por otra parte que el
uso de muestras para estimar valores de una población ofrece diversas ventajas. En
términos generales se puede afirmar que el muestreo permite una reducción considerable de
los costos materiales del estudio, una mayor rapidez en la obtención de la información y el
logro de resultados con máxima calidad. Igualmente que las variables aleatorias, como las
estadísticas, pueden ser discretas o continuas.
. En este sentido, es importante señalar que los espacios muestrales pueden basarse
en consideraciones teóricas o en una estimación subjetiva de la posibilidad. Se pueden
basar también en la experiencia. Así mismo, la estadística matemática y en particular los
métodos de muestreo, han jugado un papel de gran importancia y utilidad en el desarrollo
de dicha auditoría en las empresas cooperativas, precisamente por su carácter de rapidez y
economía. Cómo se seleccionó la muestra, cómo se realizó la inferencia (extrapolación de
las conclusiones obtenidas sobre la muestra, al resto de la población), y qué grado de
confianza se tuvo en ello, fueron los principales problemas que se enfrentaron.
Ahora bien, El muestreo, es un procedimiento por el que se infieren los valores
verdaderos de una población, a través de la experiencia obtenida con una muestra de esta.
El uso de muestras para estimar valores de una población ofrece diversas ventajas. En
términos generales se puede afirmar que el muestreo permite una reducción considerable de
los costos materiales del estudio, una mayor rapidez en la obtención de la información y el
logro de resultados con máxima calidad. Todo esto nos reafirma que La fundamentación
teórica realizada, permite afirmar que el muestreo estadístico puede ser considerado como
una herramienta altamente calificada que ayuda a los auditores a formar juicios, tomando
como premisa la preparación para el manejo y dominio de ciertos términos estadísticos.
21
Bibliografía
Hernández (2012) Estadística inferencial. Documento en línea. Disponible en

https://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student. Consultado 12-
01-2020
Instituto Tecnológico chihuahua. Muestreo Documento en línea. Disponible en.
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap03c.html.
Consultado 18- 01-2021
Matemática, física y más, block educativo. [Documento en línea] disponible en
https://matemovil.com/funcion-de-probabilidad-de-una-variable-aleatoria-discreta/
consultado 08-10-2020
Paula rodo, conomipedia. . Documento en línea. Disponible
enhttps://economipedia.com/definiciones/distribucion-t-de-student.html. Consultado
12- 01-2020
Portafolio estudiantil de Probabilidad y Estadística, Esperanza matemática Portal
Wikipedia [Documento en línea] disponible
enhttps://es.wikipedia.org/wiki/Esperanza_matem%C3%A1tica Consultado 08-01-
2020
Rivera, Luz. Usos de la Estadística. CREMC 2000 – 2001 Derechos Reservados.
Última Edición: Marzo 9, 2001.
Vázquez. K. Muestreo. [Documento en línea] disponible en https
ucin_muestral_de_estadsticos.html#:~:text=Se%20habla%20as%C3%AD%2C
%20por%20ejemplo,una%20muestra%20extra%C3%ADda%20al%20azar.
Variables aleatorias, block educativo: [Documento en línea] disponible en
https://es.wikiversity.org/wiki/Variable_aleatoria_discreta#:~:text=Se%20denomina
%20variable%20aleatoria%20discreta,%2C75%20%C3%B3%205%2C87.
Consultado 08-10-2020
Variables aleatorias independientes block educativo: [Documento en línea]
disponibleenhttps://es.wikipedia.org/wiki/Variables_aleatorias_independientes_e_id
%C3%A9nticamente_distribuidas Consultado 08-10-2020
22

Muestreo Como Base de La Estadística Inferencial

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Muestreo Como Base de La Estadística Inferencial

Cargado por

Copyright:

Formatos disponibles

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA DEFENSA

Facilitador (a): Participante:

San Fernando de Apure, Enero 2021

La teoría del muestreo como base de la estadística inferencial…….. 4

Muestreo al azar o simple…………………………………………….. 8

Distribución muestral de la media aritmética………………………… 13

Diferencia de medias …………………………………………………. 14

La estadística es considerada como una colección de hechos numéricos expresados

La estadística inferencial es una parte de la estadística que comprende los métodos y

Se dedica a la generación de los modelos, inferencias y predicciones asociadas a los

En este sentido la estadística inferencial basa sus estudios en:

Toma de muestras o cuantitativo muestreo, que se refiere a la forma adecuada de

Estimación de parámetros o variables estadísticas, que permite estimar valores

Contraste de hipótesis, que permite decidir si dos muestras son estadísticamente

Igualmente se basa en los métodos de

¿Cuál será la media de esta población respecto a tal característica?

¿Se parecen estas dos poblaciones?

¿Hay alguna relación entre...?

En el planteamiento se definen con precisión la población, la característica a

Elaboración de un modelo: en caso de establecer un modelo teórico, se replantea el

Extracción de la muestra: se usa alguna técnica de muestreo o un diseño

Tratamiento de los datos: en esta fase se eliminan posibles errores, se depura la

Los métodos de esta etapa están definidos por la estadística descriptiva.

Estimación de los parámetros: con determinadas técnicas se realiza una predicción

Contraste de hipótesis: los contrastes de hipótesis son técnicas que permiten

Conclusiones: se critica el modelo y se hace un balance. Las conclusiones obtenidas

El estudio puede comenzar de nuevo a partir de este momento, en un proceso cíclico

Imposibilidad material Hacer una encuesta a los casi 40 millones de Venezolanos es

1. Muestreo no probabilístico: El investigador no elige la muestra al azar, sino

2. Muestreo probabilístico o aleatorio: Es el que se realiza teniendo en cuenta que

a) Muestreo aleatorio simple: Aquel en el que cada individuo de la población tiene

b) Muestreo sistemático: En el que se elige un individuo al azar y a partir de él, a

c) Muestreo estratificado: Se divide la población en clases o estratos y se escoge,

d) Muestreo por conglomerados: Si no disponemos de la relación de los

Aquí entra el llamado muestreo por conglomerados, donde en lugar de elegir

Muestreo al azar o simple

Un muestreo al azar es un tipo de muestreo fácil de llevar a cabo. Consiste en

Muestreo aleatorio simple: Es un proceso en el que cada integrante del público

Muestreo estratificado: Este tipo de muestreo tiene el objetivo de separar al

Muestreo por conglomerados: En este procedimiento, los elementos del público

Muestreo sistemático: En este tipo de muestreo al azar se realiza una selección

El primer paso en el muestreo al azar consiste en seleccionar a la población

a) A diferencia de otros métodos, si se realiza de forma correcta, permite reducir

b) Es muy fácil seleccionar un tamaño de muestra pequeño de una población más

c) No es necesario ser un experto y tener conocimientos técnicos para realizar este

Algunas desventajas de realizar un muestreo al azar son:

a) Puede ser un método de recolección de datos muy costoso.

b) No debe realizarse en estudios para los que se necesitan hacer entrevistas

c) Es difícil de realizar cuando el tamaño de muestra es muy grande.

En un muestreo al azar simple, utilizamos algún procedimiento al azar para elegir a

Hernández (2012) ejemplifica de manera muy clara este tipo de muestreo:

Mediante tabla de números al azar: Se utilizan tablas especiales de números al

En probabilidad y estadística, la distribución t (de Student) es una distribución de

La distribución t de Student es la distribución de probabilidad del cociente:

es decir V es una variable aleatoria que sigue una distribución χ² con V

Z y V son variables aleatorias independientes.

Si μ es una constante no nula, el cociente es una variable aleatoria que

Propiedades de la distribución t de Student

Las propiedades de la distribución t de Student son las siguientes:

Es una distribución simétrica. El valor de la media, la mediana y la moda coinciden.

En otras palabras, la distribución tendrá el mismo número de observaciones en

La función de densidad no depende de los grados de libertad para ser simétrica.