Está en la página 1de 23

República Bolivariana de Venezuela

Universidad Nacional Experimental “Simón Rodríguez”

Coordinación Académica y Administrativa

Núcleo: Palo Verde – Extensión: LA GUAIRA

Administración

Estadistica II

Distribu
ción en
el
muestr
Profesor: Participantes:

eo
MSc. Alays Díaz Astrid Ortiz C.I: 17.959.999

Maiquetía, mayo de 2021.


Índice

Teoría del muestreo en la estadística Inferencial................................................5

Tipos de muestreo..............................................................................................6

Muestreo no probabilístico:............................................................................6

- Muestreo discrecional:..............................................................................6

- Muestreo por cuotas.................................................................................6

Muestreo probabilístico o aleatorio:...............................................................6

- Muestreo sistemático:................................................................................8

- Muestreo estratificado:.............................................................................8

- Muestreo por conglomerados:..................................................................8

Errores en el muestreo...................................................................................9

Calculo del tamaño muestral..............................................................................9

Distribución X2.................................................................................................10

Distribución “T” de Student.............................................................................12

Distribución “F” de Fisher...............................................................................13

Distribución muestral de la media aritmética...................................................15

Distribución de diferencia de medias................................................................16

Error estándar.................................................................................................17
Introducción.

Cuando hablamos de muestreo nos referimos al proceso por el que generamos las
muestras. Una muestra es una parte (un subconjunto) de la población, y se desea que la
muestra sea lo más representativa posible de la población de la que procede. Sin embargo,
por muy cuidadosa que sea la selección de la muestra difícilmente será una representación
exacta de la población. Esto significa que su tendencia central, variabilidad, etc.,
aproximarán las de la población, pero habrá cierta diferencia, que interesa sea lo menor
posible.

Un concepto clave de muestreo es el de representatividad: Los procedimientos de


muestreo tienen por objeto generar muestras lo más representativas posible de las
poblaciones dados los objetivos de la investigación y las circunstancias que afectan al
muestreo.

Desde un punto de vista teórico, el concepto de muestreo es fundamental para la


Inferencia Estadística. El hecho de que las muestras no sean exactamente representativas de
las poblaciones significa que las inferencias presentan cierto margen de incertidumbre. Para
cuantificarlo y definir técnicas inferenciales es necesario conocer cómo se comportan los
estadísticos obtenidos en las muestras, esto es, cómo son las distribuciones muestrales de los
estadísticos habitualmente utilizados para la inferencia.

Las muestras singulares generadas para investigación con sujetos suelen utilizarse
para obtener algunos estadísticos (Media, proporción, varianza, etc.) con los que se realiza el
proceso de inferencia. En cambio, las muestras simuladas por ordenador suelen ser utilizadas
para obtener distribuciones muestrales y realizar inferencia. Esto es de interés cuando se dan
circunstancias especiales que no aconsejan utilizar los procedimientos habituales.

Las distribuciones muestrales son las distribuciones de estadísticos de muestras que


pertenecen a la misma población. Por ejemplo, la distribución muestral de la Media es la
distribución de las Medias de muestras de un mismo tamaño extraídas de la misma
población.
Es muy importante resaltar antecedentes importantes concernientes al muestro, tales
como el informe de la Oficina de Estadística de las Naciones Unidas incluye una lista de las
encuestas realizadas en 46 países miembros. Entre los temas que se mencionan en este
informe se tienen: producción agrícola, uso potencial del suelo, el desempleo y la fuerza de
trabajo, producción industrial, precios al mayoreo y menudeo, condiciones de salud de la
población. los ingresos y gastos de las familias, destinos vacacionales, causas de divorcio,
deudas bancarias, existencias de ganado vacuno, entre otros.

En lo que se refiere al uso de las encuestas como complemento del censo, se tienen la
experiencia de los Estados Unidos en el año de 1940 en que, en una muestra de un 5%, se
incluyeron preguntas sobre ocupación, tamaño de la familia, fertilidad, entre otras variables.

En el año de 1950 se repitió el ejercicio. pero con una muestra que contemplaba al
20% de la población; y de esta muestra, se seleccionó una submuestra del 3.3% para
investigar cuestiones relacionadas con el matrimonio y la fertilidad.

Este procedimiento se repitió en los censos de 1960 y 1970, Y salvo excepciones para
ciertas variables en que se requería información por persona, el censo se realiza en base a
muestreo. Otros campos en donde el muestreo de encuestas ha tenido gran aceptación son: la
investigación de mercados, estimación de audiencia en programas de radio y televisión,
reacción del público sobre la aceptación de nuevos productos, preferencias electorales,
control de calidad, etc.

A grandes rasgos, las encuestas según su contenido y desglose se pueden clasificar


en: descriptivas y analíticas. En el caso de las primeras, su único objetivo es obtener
información general sobre ciertos grupos de interés: mujeres, que son aficionadas a algún
deporte, total de hombres y mujeres en ciertos grupos de edades, etc. Mientras que, en una
encuesta analítica, se hacen comparaciones entre varios subconjuntos de una misma
población, a fin de establecer hipótesis sobre las diferencias en su comportamiento.

De esta manera, en una encuesta, en donde se recabe información cualitativa sobre


aspectos relacionados con el estado nutricional de la población, por ejemplo, a partir del uso
de métodos estadísticos adecuados se pueden probar hipótesis de comportamiento y realizar
inferencias con alto sentido analítico
Distribución en el muestreo

Teoría del muestreo en la estadística Inferencial


Una población es el conjunto de individuos sobre los que hacemos cierto estudio, y
que una muestra es un subconjunto de la población. Es evidente que los resultados de una
determinada encuesta tendrán un mayor grado de fiabilidad si dicha encuesta se realiza sobre
la población completa. Sin embargo, en la mayoría de las ocasiones esto no es posible,
debido a múltiples razones, como, por ejemplo:

 Imposibilidad material Hacer una encuesta de millones de personas es imposible, o


hacer un estudio sobre la fecha de caducidad de un producto. Si lo hacemos con
todos los productos ¿que vendemos luego?
 Imposibilidad temporal Hacer un estudio sobre la duración de una bombilla. ¿Cuánto
debemos esperar para saberlo? Por tanto, es habitual que tengamos que manejarnos
con muestras, de modo que es importante saber elegir bien una muestra de la
población, una muestra que represente bien a dicha población y que nos permita con
un alto grado de fiabilidad inferir o predecir las características de la población.

Hay muchas maneras de elegir una muestra de una población, Pero antes de pasar a
analizar dichas formas de extracción de muestras, lo que si hemos de dejar claro es que
todas las muestras han de cumplir varias condiciones indispensables.

Es evidente que para que el estudio a realizar sea fiable, hay que cuidar mucho la
elección de la muestra, para que represente en la medida de lo posible a la población de la
que se extrae. Si la muestra está mal elegida, diremos que no es representativa. En este caso,
se pueden producir errores imprevistos e incontrolados. Dichos errores se denominan sesgos
y diremos que la muestra está sesgada.

Una de las condiciones para que una muestra sea representativa es que el sistema que
se utilice para elegirla sea aleatorio, es decir, que todos los individuos de la población tengan
las mismas posibilidades de ser elegidos, mientras que, si la elección de la muestra es
subjetiva, es probable que resulte sesgada.

5
Tipos de muestreo
Las distintas maneras de elegir una muestra de una población se denominan
muestreos y básicamente hay dos tipos de muestreos:

Muestreo no probabilístico: El investigador no elige la muestra al azar, sino


mediante determinados criterios subjetivos. Los individuos de la población no tienen
la misma probabilidad de ser incluidos en la muestra. En este tipo de muestreo suele
ser muy escasa la representatividad y, por tanto, poco válidas las inferencias que
pueden hacerse.
Los tipos de muestreo no probabilístico son: muestreo de conveniencia, muestreo
discrecional y muestreo por cuotas, explicados a continuación:
- Muestreo de conveniencia. El investigador decide qué individuos de la población
pasan a formar parte de la muestra en función de la disponibilidad de los mismos
(proximidad con el investigador, amistad, etc.).
- Muestreo discrecional: La selección de los individuos de la muestra es realizada
por un experto que indica al investigador qué individuos de la población son los que
más pueden contribuir al estudio. Este muestreo es adecuado si dentro de la población
que queremos estudiar, existen individuos que no queremos que se nos escapen por
utilizar un método totalmente aleatorio o de conveniencia.
- Muestreo por cuotas. Si se conocen las características de la población a estudiar, se
elegirán los individuos respetando siempre ciertas cuotas por edad, género, zona de
residencia, entre otras que habrán sido prefijadas.

Muestreo probabilístico o aleatorio: Es el que se realiza teniendo en cuenta que


cada miembro de la población tiene la misma probabilidad de ser elegido en la
muestra. Con este tipo de muestreo, las muestras suelen ser más representativas, es
posible conocer los errores cometidos y pueden hacerse inferencias estadísticas. En
este caso podemos distinguir varios tipos:

- Muestreo aleatorio simple (al azar): Aquel en el que cada individuo de la


población tiene las mismas posibilidades de salir en la muestra.

6
Este tipo de muestreo se caracteriza por su simplicidad y fácil comprensión, aunque
también posee algunas limitaciones, ya que no siempre es posible disponer de una lista de
todos los individuos que componen la población, generalmente cuando son poblaciones
grandes. Si se seleccionan muestras pequeñas mediante este método pueden aparecer errores
aleatorios, no representando la muestra adecuadamente a la población. Un ejemplo de
muestreo aleatorio simple sería la elección de los individuos a través de la elección realizada
totalmente al azar de un cierto número de DNI.

Hay dos tipos de muestreo aleatorio simple: el muestreo con reemplazo y sin
reemplazo. En el muestreo con reemplazo, después de que un elemento ha sido seleccionado
de entre el marco de la muestra se devuelve y es elegible para ser seleccionado de nuevo.

En el muestreo sin reemplazo, después de que un elemento se selecciona del marco de


la muestra, se retira de la población y no regresa a la base del muestreo. Este tipo de
muestreo suele ser más eficiente pues no permite que el mismo elemento de la población
entre a la muestra más de una vez.

También es importante saber que, aunque existen muchos aspectos positivos y


fortalezas del muestreo al azar, también podemos encontrar ciertos aspectos que no son tan
favorables, por ello, debemos evaluar si para el tipo de estudio que se pretende realizar
conviene utilizar este tipo de muestreo. A continuación, las fortalezas y desventajas:

7
- Muestreo sistemático: En el que se elige un individuo al azar y a partir de ´el, a
intervalos constantes, se eligen los demás hasta completar la muestra.
El muestreo sistemático es muy similar al muestreo aleatorio simple. La diferencia se
obtiene en que en este tipo de muestreo se divide el total de la población de estudio
entre el tamaño de la muestra, obteniendo una constante de muestreo (k). La primera
unidad que formará parte de la muestra debe estar entre 1 y k y se elige al azar; a
partir de esta unidad se van seleccionando sistemáticamente uno de los k individuos
siguiendo un orden determinado. Por ejemplo, si obtenemos un valor de k=10 y
seleccionamos al azar el número 6, deberíamos elegir todas las historias clínicas que
finalizaran en «6»: «006», «016», «026» .... Es un método de muestreo muy sencillo
de realizar y que cuando la población esta ordenada siguiendo una tendencia
conocida, asegura una cobertura de unidades de todos los tipos. La principal
limitación es que si la constante se asocia al fenómeno de interés puede cometerse un
sesgo.

- Muestreo estratificado: Se divide la población en clases o estratos y se escoge,


aleatoriamente, un número de individuos de cada estrato proporcional al número de
componentes de cada estrato.
Esta división suele realizarse según una característica que pueda influir sobre los
resultados del estudio. Por ejemplo, en el caso de seleccionar una muestra para
evaluar la altura, dada la heterogeneidad entre hombres y mujeres, la variable de
género podría ser una variable de estratificación. Si la estratificación se realiza
respecto un carácter se denomina muestreo estratificado simple, y si se realiza
respecto dos o más características se denomina muestreo estratificado compuesto.

- Muestreo por conglomerados: Si no disponemos de la relación de los elementos


de la población, o de los posibles estratos, no podemos aplicar los muestreos
anteriores. Aquí entra el llamado muestreo por conglomerados, donde en lugar de
elegir individuos directamente, se eligen unidades más amplias donde se clasifican los
elementos de la población, llamados conglomerados. En cada etapa del muestreo en
lugar de seleccionar elementos al azar seleccionamos conglomerados.

8
Errores en el muestreo
Además, debemos asumir que un error en el muestreo ocasionaría que los
resultados que proporcione la muestra no coincidan o estén alejados de los valores
reales de la población. Pueden darse dos tipos de errores:
 Error aleatorio muestral: Para reducir este error hay que aumentar el tamaño de la
muestra.
 Error sistemático o Sesgo. Va asociado al proceso de selección de la muestra y se
reduce mejorando esta selección.

Calculo del tamaño muestral


Para determinar el tamaño muestral necesario para que los resultados de un estudio
sean extrapolables a toda la población se deben considerar diferentes situaciones, en función
del objetivo de nuestro estudio: determinación de parámetros y contraste de hipótesis. En la
determinación de parámetros nuestro objetivo será determinar mediante una muestra valores
de nuestra población de interés, por ejemplo, determinar la proporción de pacientes con
insuficiencia renal aguda; mientras que en el contraste de hipótesis nuestro objetivo estará
encaminado a evaluar el resultado obtenido en nuestra muestra con respecto a hipótesis
previas establecidas, por ejemplo, si la respuesta de un tratamiento nuevo es igual a la
asociada a un tratamiento ya conocido. Veamos dos de las situaciones más comunes en el
cálculo del tamaño muestral.

9
Supongamos que se desea hacer inferencia sobre un valor de la población como puede
ser una proporción (por ejemplo: la prevalencia de diabetes en la población) o una media
(ejemplo: la media de colesterol en la población).

Para estimar una proporción Para estimar una proporción debemos tener una idea
aproximada del parámetro que queremos medir. Se puede obtener a partir de estudios pilotos
o una revisión de la literatura. Generalmente, ante la imposibilidad de disponer de
información de referencia se utiliza el valor de 0,5 (50%), proporción con la que se obtiene el
tamaño muestral máximo necesario (llamado el criterio de la máxima indeterminación).
Cuando queremos estimar una proporción, debemos elegir la precisión (e) que se quiere
obtener para determinar el parámetro que queremos medir, de manera que ésta sea la
oscilación mínima del valor a estimar, o lo que es lo mismo, decir su intervalo de confianza.
El tamaño muestral necesario para la estimación de una proporción se obtendría como:

Cuanto mayor es la precisión deseada, mayor es el tamaño muestral necesario para la


estimación del parámetro. En el caso que la población que se desea estudiar sea finita y con
un tamaño conocido (N) se utiliza la fórmula:

2
Distribución X
En realidad, la distribución ji-cuadrada es la distribución muestral de s2. O sea, que si
se extraen todas las muestras posibles de una población normal y a cada muestra se le calcula
su varianza, se obtendrá la distribución muestral de varianzas.

10
Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el
estadístico X2. Si se elige una muestra de tamaño n de una población normal con

varianza  , el estadístico:

Tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados


de libertad y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada
está dado por:

Donde n es el tamaño de la muestra, s2 la varianza muestral y   la varianza de la


población de donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con
la siguiente expresión:

Esta distribución posee ciertas propiedades, las cuales mencionaremos a continuación:

1. Los valores de X2 son mayores o iguales que 0.


2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un
número infinito de distribuciones X2.
3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la
derecha; esto es, están sesgadas a la derecha.
5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).
6. El valor modal de una distribución X2 se da en el valor (n-3).

11
La siguiente figura ilustra tres distribuciones X2. Note que el valor modal aparece en el valor

(n-3) = (gl-2).

La función de densidad de la distribución X2 esta dada por:

Distribución “T” de Student


La distribución t de Student o distribución t es un modelo teórico utilizado para
aproximar el momento de primer orden de una población normalmente distribuida cuando el
tamaño de la muestra es pequeño y se desconoce la desviación típica.

En otras palabras, la distribución t es una distribución de probabilidad que estima el


valor de la media de una muestra pequeña extraída de una población que sigue una
distribución normal y de la cual no conocemos su desviación típica.

Dada una variable aleatoria continua L, decimos que la frecuencia de sus


observaciones puede aproximarse satisfactoriamente a una distribución t con g grados de
libertad tal que:

A diferencia de la distribución normal que depende de la media y la varianza, la


distribución t solo depende de los grados de libertad, del inglés, degrees of freedom. En otras
palabras, controlando los grados de libertad, controlamos la distribución.

La distribución t se utiliza cuando queremos estimar la media de una población


normalmente distribuida a partir de una muestra pequeña, cuando el tamaño de la muestra es

12
inferior a 30 elementos, es decir, n < 30, y, a partir de 30 observaciones, la distribución t se
parece mucho a la distribución normal y, por tanto, utilizaremos la distribución normal.

No se conoce la desviación típica o estándar de una población y tiene que ser


estimada a partir de las observaciones de la muestra.

La siguiente figura presenta la gráfica de varias distribuciones t. La apariencia general


de la distribución t es similar a la de la distribución normal estándar: ambas son simétricas y

unimodales, y el valor máximo de la ordenada se alcanza en la media   = 0. Sin embargo, la


distribución t tiene colas más amplias que la normal; esto es, la probabilidad de las colas es
mayor que en la distribución normal. A medida que el número de grados de libertad tiende a
infinito, la forma límite de la distribución t es la distribución normal estándar.

Entre las propiedades de la distribución “T” de Student tenemos:

1- Cada curva t tiene forma de campana con centro en 0.


2- Cada curva t, está más dispersa que la curva normal estándar z.
3- A medida que aumenta, la dispersión de la curva t correspondiente disminuye.
4- A medida que , la secuencia de curvas t se aproxima a la curva normal estándar, por
lo que la curva z recibe a veces el nombre de curva t con gl = ∞

13
Distribución “F” de Fisher
La distribución F o distribución de Fisher-Snedecor es la que se usa para comparar
las varianzas de dos poblaciones diferentes o independientes, cada una de las cuales sigue
una distribución normal.

La distribución que sigue la varianza de un conjunto de muestras de una sola


población normal es la distribución ji-cuadrada (Χ2) de grado n-1, si cada una de las
muestras del conjunto tiene n elementos.

Para comparar las varianzas de dos poblaciones diferentes, es necesario definir un


estadístico, es decir una variable aleatoria auxiliar que permita discernir si ambas poblaciones
tienen o no igual varianza.

Dicha variable auxiliar puede ser directamente el cociente de las varianzas muestrales
de cada población, en cuyo caso, si dicho cociente es cercano a la unidad, se tiene evidencia
que ambas poblaciones tienen varianzas semejantes.

La variable aleatoria F o estadístico F propuesto por Ronald Fisher (1890 – 1962) es


el que se usa más frecuentemente para comparar las varianzas de dos poblaciones y se define
de la siguiente manera:

Siendo s2 la varianza muestral y σ2 la varianza poblacional. Para distinguir cada uno


de los dos grupos poblacionales, se utilizan los subíndices 1 y 2 respectivamente.

Se sabe que la distribución ji-cuadrada con (n-1) grados de libertad es la que sigue la
variable auxiliar (o estadístico) que se define a continuación:

14
Por lo tanto, el estadístico F sigue una distribución teórica dada por la siguiente
fórmula:

Siendo U la distribución ji-cuadrada con d1 = n1 – 1 grados de libertad para la


población 1 y V la distribución ji-cuadrada con d2 = n2 – 1 grados de libertad para la
población 2.

El cociente definido de esta forma es una nueva distribución de probabilidad, conocida como
distribución F con d1 grados de libertad en el numerador y d2 grados de libertad en el
denominador.

Distribución muestral de la media aritmética


La probabilidad de cada uno de los posibles valores que puede tomar un estadístico en
muestras extraídas al azar viene dada por una función matemática denominada distribución
muestral, que depende del estadístico en cuestión. Se habla así, por ejemplo, de la
distribución muestral de la media aritmética o de la distribución muestral de la proporción.

Una distribución muestral es una función de probabilidad, ya que asigna a cada


posible valor de un estadístico su probabilidad de aparecer en una muestra extraída al azar.

A partir de las muestras seleccionadas de una población pueden construirse variables


aleatorias alternativas, de cuyo análisis se desprenden interesantes propiedades estadísticas.
Las dos formas más comunes de estas variables corresponden a las distribuciones muestrales
de las medias y de las proporciones.

15
Dada una población constituida por un número n de elementos, cuya media
aritmética es m y donde la desviación típica viene dada s, pueden formarse n2 muestras con
reemplazamiento distintas, formadas por dos elementos de la población.

Para cada una de estas muestras es posible una media muestral, que denotaremos con
el símbolo  . Un ejemplo de la tabla de muestras de tamaño 2, tomada de la población {1, 3,
5}, con sus medias aritméticas reflejadas, sería:

A partir de la variable estadística original x de la población se puede construir una


nueva variable estadística  , que tendría como valores las medias de las muestras tomadas de
la población. La media aritmética de esta distribución muestral de las medias se denota por 
, y su desviación típica por  .

Distribución de diferencia de medias


Suponga que se tienen dos poblaciones distintas, la primera con media   1 y

desviación estándar  1 , y la segunda con media  2  y desviación estándar  2.  Más aún, se
elige una muestra aleatoria de tamaño n1 de la primera población y una muestra
independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral
para cada muestra y la diferencia entre dichas medias. La colección de todas esas diferencias
se llama distribución muestral de las diferencias entre medias o la distribución muestral del

estadístico 

16
Diferencia de proporciones

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse


utilizando proporciones o porcentajes. A continuación, se citan algunos ejemplos:

 Educación: ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que
las de los que aprueban inglés?
 Medicina: ¿Es menor el porcentaje de los usuarios del medicamento A que presentan
una reacción adversa que el de los usuarios del fármaco B que también presentan una
reacción de ese tipo?
 Administración: ¿Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales?
 Ingeniería: ¿Existe diferencia entre la proporción de artículos defectuosos que genera
la máquina A a los que genera la máquina B?

Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos


proporciones muestrales, la distribución muestral de diferencia de proporciones es
aproximadamente normal para tamaños de muestra grande (n1p1 5, n1q1 5,n2p2 5 y
n2q2 5). Entonces p1 y p2 tienen distribuciones muestrales aproximadamente normales,
así que su diferencia p1-p2 también tiene una distribución muestral aproximadamente
normal.

17
Error estándar
El Error estándar es el término utilizado para referirse a una estimación de la
desviación estándar, derivado de una muestra especial utilizada para calcular la estimación en
las estadísticas. En la más común, error estándar es un proceso de estimación de la
desviación estándar de la distribución de muestreo asociada con el método de estimación

Cada estadística tiene un error estándar asociado. Una medida de la precisión de la


estadística puede deducir que el error estándar de 0 representa que la estadística tiene ningún
error aleatorio y el más grande representa menos preciso de las estadísticas. Error estándar no
es constantemente informados y no siempre fáciles de calcular.

La media muestral es el estimador usual de una media poblacional. Sin embargo,


diferentes muestras escogidas de la misma población tienden en general a dar distintos
valores de medias muestrales. El error estándar de la media (es decir, el error debido a la
estimación de la media poblacional a partir de las medias muestrales) es la desviación
estándar de todas las posibles muestras (de un tamaño dado) escogidos de esa población.
Además, el error estándar de la media puede referirse a una estimación de la desviación
estándar, calculada desde una muestra de datos que está siendo analizada al mismo tiempo.

18
En aplicaciones prácticas, el verdadero valor de la desviación estándar (o del error) es
generalmente desconocido. Como resultado, el término "error estándar" se usa a veces para
referirse a una estimación de esta cantidad desconocida. En tales casos es importante tener
claro de dónde proviene, ya que el error estándar es sólo una estimación.
Desafortunadamente, esto no es siempre posible y puede ser mejor usar una aproximación
que evite usar el error estándar, por ejemplo, usando la estimación de máxima verosimilitud o
una aproximación más formal derivada de los intervalos de confianza. Un caso bien conocido
donde se pueda usar de forma apropiada puede ser en la distribución t de Student, para
proporcionar un intervalo de confianza para una media estimada o diferencia de medias. En
otros casos, el error estándar puede ser usado para proveer una indicación del tamaño de la
incertidumbre, pero su uso formal o semi-formal para proporcionar intervalos de confianza o
test debe ser evitado a menos que el tamaño de la muestra sea al menos moderadamente
grande. Aquí el concepto "grande" dependerá de las cantidades particulares que vayan a ser
analizadas.

El error estándar de la media es expresado como:

Donde:
σ es la desviación estándar de la población
n es el tamaño (número de observaciones) de la muestra.

El error estándar de la regresión es el valor que muestra la diferencia entre los valores
reales y los estimados de una regresión. Es utilizado para valorar si existe una correlación
entre la regresión y los valores medidos. Muchos autores prefieren este dato a otros como el
coeficiente de correlación lineal, ya que el error estándar se mide en las mismas unidades que
los valores que se estudian. La fórmula sería:

19
20
Conclusión

Al realizar cualquier investigación social o de mercados, la mayor parte de las veces


se rebasa la capacidad de los investigadores/as para llegar a toda la población o universo de
estudio, por lo que se suele optar por métodos de muestreo que sirvan para acotar ese
universo y así poder realizar la investigación dentro de nuestras posibilidades.

El uso de estos métodos de muestreo, como su propio nombre indica, nos ayuda a
obtener información fiable de la población a partir de una muestra de la que extraer
inferencias estadísticas con un margen de error medido en términos de probabilidades.

En otras palabras, en una investigación por muestreo podremos estudiar el


comportamiento y las opiniones de toda una población analizando únicamente una parte de
esta, teniendo en cuenta que siempre existirá un margen de error a la hora de realizar dichos
cálculos.

En las Ciencias Sociales y Humanas, el diseño de muestras resulta fundamental a la


hora de realizar cualquier investigación pues, en comparación con otras ciencias, no es
posible ejercer control exhaustivo de las variables y la conducta humana tiene facetas donde
hay alta variabilidad.

Sin embargo, todavía hoy sigue siendo una de las áreas más débiles dentro de la
Estadística, dado que son pocas las personas que están especializadas en esta materia.

Cabe destacar que entre el muestreo probabilístico existen diferencias marcadas, ya


que la principal característica de los muestreos probabilísticos radica en la garantía dentro de
ellos de que cada unidad de muestreo posee una probabilidad conocida de ser finalmente
seleccionada, y su selección final depende de mecanismos aleatorios, lo cual permite plantear
inferencias sobre los parámetros poblacionales reales, a partir de estadísticos de niveles de
confianza y márgenes de error previamente establecidos por el investigador.

Dicho de otro modo, el muestreo probabilístico permite realizar generalizaciones


desde los resultados obtenidos a través la muestra hacia el conjunto del universo poblacional.
Este es precisamente un objetivo fundamental en el método de encuesta, puesto que lo que se
pretende obtener con este tipo de investigación es describir el comportamiento de un
fenómeno social en un conjunto de población estudiado.

Mientras que, por su parte los muestreos no probabilísticos parten con la premisa de


la ausencia de aleatoriedad, intencional o no, en la selección de casos a entrevistar. El que la
ausencia de aleatoriedad sea o no intencional no es una cuestión menor.

Si el proceso de estimación de la muestra no cumple criterios probabilísticos, la


inferencia de resultados es imposible, lo cual supone sin duda un quebranto de primer orden
en la representatividad de los resultados investigadores.

Puede ocurrir que sea el propio investigador, en el diseño de la investigación, el que


desee explícitamente que no todos los sujetos de una población tengan las mismas
probabilidades de formar parte de la muestra finalmente entrevistada.

En resumen, el muestreo es sencillamente el procedimiento que se emplea a extraer


una pequilla parte de una población dentro de un universo a esta se le llama espacio muestral
dentro de un universo. El muestreo probabilístico y no probabilístico es una herramienta de
ayuda para la investigación de algo general o también de algo particular.

El muestro es una herramienta útil y veraz, hay diferentes tipos de muestreo, cada
una adaptable para cada vez que sea necesaria su utilidad. En algunos casos no es posible
conocer qué margen de error vamos a tener en un estudio, cuando empleamos muestreo no
probabilístico.

Debido a lo mencionado con anterioridad, destacamos que, el realizar la selección de


la técnica de muestreo, el método para procesar los datos de acuerdo a los diferentes tipos de
distribución reseñados en esta investigación, se garantizará la mayor exactitud posible ante
una investigación, bien sea de población en el ámbito social, como de vivienda, sector
agrícola o de producción de cualquier tipo. Todo esto, es de suma importancia para la
sociedad y para el correcto funcionamiento de una población, pues, de esta manera se
mantiene control y registro incluso de las necesidades básicas del hombre.
Bibliografía

 Siebel, M.R. Schiller, J. Srinivasan, R.A. (2014). Probabilidad y estadística. Mc


Graw Hill Education.

 Revistas Eden. Canal D. Técnicas de muestreo: Los sesgos mas frecuentes.


(diciembre 2006). Recuperado en:
https://www.revistaseden.org/files/9-CAP%209.pdf

 Question pro. Editores del sitio web. Muestreo aleatorio simple. (enero de 2020)
Recuperado en: https://www.questionpro.com/blog/es/muestreo-aleatorio-simple/

 Economipedia. Rodó P. Distribución T de Student. (noviembre de 2019). Recuperado


en: https://economipedia.com/definiciones/distribucion-t-de-student.html

 Link fang. Editores de la web. Error estándar. (marzo de 2020). Recuperado en:
https://es.linkfang.org/wiki/Error_est%C3%A1ndar

También podría gustarte