Trabajo MAESTRIA EN GAS Estadistica Aplicada A La Ingeneria

UNIVERSIDAD DE ORIENTE
CENTRO DE ESTUDIOS DE POSTGRADO

NÚCLEO DE MONAGAS
MAESTRÍA EN INGENIERÍA DE GAS
ESTADÍSTICA APLICADA A LA INGENIERÍA
MATURÍN – MONAGAS -VENEZUELA
GENERALIDADES DE LAS DISTRIBUCIONES

ESTADÍSTICAS Y CONTRUCCIÓN Y MANEJO
DE LOS MUESTREOS
Facilitador:
Ing. Carlos De La Cruz, M.Sc.
Desarrollado por:
Ing. Arturo Vidal. C.I: 17.653.550
MATURIN, MARZO 2021

INTRODUCCION
La estadística es la parte de las Matemáticas que estudia cómo recopilar y resumir gran
cantidad de información para extraer conclusiones. Un Investigador de distintos campos de
estudios al llevar a cabo un experimento de un proceso y sistema en particular, deberá
conocer con exactitud los distintos métodos estadísticos recolección de datos, análisis,
interpretación, enseñando que la estadística es una disciplina que nos enseña a realizar un
juicio coherentes y la toma de decisión, en presencia de incertidumbres .
La Probabilidad y la Estadísticas son dos campos que están relacionados entre sí. La
probabilidad se emplea como herramienta que permite evaluar la confiabilidad de las
conclusiones acerca de la población cuando tenga un espacio muestral. Cuando utilizamos
probabilidad, se obtiene la frecuencia de un suceso determinado mediante la realización de
un experimento aleatorio, del que se conocen todos los resultados posibles bajos
condiciones estables. La estadística estudia todos los datos representativos para la toma de
decisiones o para explicar condiciones regulares e irregulares de algún fenómeno de
estudio. Los expertos de estadística usan la probabilidad de dos forma: cuando la
población es conocida se usa la probabilidad para describir un resultado muestral en
particular; cuando la población es desconocida y solo se dispone de una muestra de la
población, la probabilidad se usa para hacer inferencia estadísticas.
La distribución de la probabilidad asocia a cada uno de los valores y los representa a través
de tablas o de una función planteada como formula. Hace que lo aleatorio no sea un
capricho y modela (describe, acota) los posibles valores de un estadístico muestral que se
puede corroborar o rechazar. Las distribuciones trabajaremos en este caso son: Z (Zc), t de
Student (tc), Shi cuadrado (χ²c) y f de Fisher (Fc).
Es importante mencionar la importancia de la Población y Muestra en los procesos

estadísticos. La Población es el universo, conjunto o totalidad de elementos sobre los que se
investigará o se harán estudios. En cambio la Muestra es una parte o subconjunto de
elementos que se seleccionan previamente de una población para realizar un estudio.
Normalmente se selecciona la muestra de una población para su estudio, debido a que
estudiar a todos los elementos de una población resultaría muy extenso y poco práctico. La
forma en que una muestra se selecciona recibe el nombre de plan de muestra o diseño
experimental, y determina la cantidad de información de la muestra a tomar. Saber el plan
muestral en una situación en particular permitirá medir la confianza de los resultados.
Todo experimento a desarrollar tiene que llevar una planificación estricta, y esto se justifica
siempre, ya que es importante asegurar que se pueden hacer las comparaciones,
estimaciones y/o pruebas de hipótesis con los tratamientos seleccionados, se debe asegurar
que el experimento sea del tamaño apropiado, si se usan menos repeticiones que las
necesarias podrían no detectarse diferencias entre tratamientos que si existen, se debe
asegurar que habrá un buen estimado del error experimental, y se debe asegurar que el
análisis estadístico de los datos experimentales se puede realizar sin complicación.
GENERALIDADES DE LA DISTRIBUCIÓN ESTADÍSTICA
Es importante iniciar con describir la importancia del diseño de experimentos, el cual

consiste en planear y realizar un conjunto de pruebas con el objetivo de generar datos que,
al ser analizados estadísticamente, proporcionen evidencias objetivas que permitan
responder las interrogantes planteadas por el experimentador sobre determinada situación.
La estadística inferencial es distinta a la estadística descriptiva, ya que esta mezcla

estadística con probabilidad. Se llama estadística inferencial o inferencia estadística a la
rama de la estadística encargada de hacer deducciones, es decir, inferir probabilidad,
propiedades, conclusiones y tendencias, a partir de una muestra del conjunto. Su papel es
interpretar, hacer proyecciones y comparaciones, lo que pudiéramos definir con
distribución estadística.
La estadística inferencial emplea usualmente mecanismos que le permiten llevar a cabo

dichas deducciones, tales como pruebas de estimación puntual (o de intervalos de
confianza), pruebas de hipótesis, pruebas paramétricas (como de media, de diferencia de
medias, proporciones, etc.) y no paramétricas (como distribución estándar o Z (Zc), t de
Student (tc), Chi cuadrado (χ²c) y F de Fisher (Fc).). También le son útiles los análisis de
correlación y de regresión, las series cronológicas, el análisis de varianza, entre otros.
Por ende, la estadística inferencial es sumamente útil en el análisis de poblaciones y

tendencias, para hacerse una idea posible de las acciones y reacciones de la misma de cara a
condiciones específicas. Esto no significa que se las pueda predecir fielmente, ni que
estemos en presencia de una ciencia exacta, pero sí de una aproximación posible al
resultado final.
A diferencia de la inferencial, la estadística descriptiva no se preocupa por conclusiones,

interpretaciones ni hipótesis a partir de lo reflejado por la muestra, sino por los métodos
idóneos para la organización de la información que contiene y poner en evidencia sus
características esenciales, es decir, se trata de la estadística objetiva, comprometida con
la presentación de los datos (textual, gráfica o por cuadros) y las operaciones matemáticas
que pueden aplicarse para obtener mayores márgenes de datos, nuevas informaciones o
frecuencias y variabilidades exactas.
QUÉ ES PROBABILIDAD ESTADÍSTICA
Es simplemente que tan posible es que ocurra un evento determinado que estamos
evaluando, cuando no estamos seguros del resultado de un evento, podemos hablar de la
probabilidad de ciertos resultados: qué tan común es que ocurran. Al análisis de los eventos
gobernados por la probabilidad se le llama estadística. La teoría de la probabilidad tiene su
origen en el estudio de los juegos de azar, que impulsaron los primeros estudios sobre
cálculo de probabilidades en el siglo XVI.
POBLACION Y MUESTRA
La población de un estudio estadístico es el conjunto de elementos objeto de estudio. Cada

elemento se denomina individuo. Cuando el número de individuos de la población es muy
grande, tomamos una parte de ésta, denominada muestra, que es un subconjunto de la
población y tiene que ser representativa de la misma para desarrollar el experimento. Lo
podemos representar de la manera siguiente:
MANEJO DE MUESTREO
La forma en que una muestra se selecciona recibe el nombre de plan muestral o diseño
experimental, y determina la cantidad de información de la muestra seleccionada, el
muestreo es una herramienta de la investigación científica, cuya función básica es
determinar que parte de una población con la finalidad de hacer inferencias sobre dicha
población.
La muestra debe lograr una representación adecuada de la población, en la que se

reproduzca de la mejor manera los rasgos esenciales de dicha población que son
importantes para la investigación. Para que una muestra sea representativa, y por lo tanto
útil, debe de reflejar las similitudes y diferencias encontradas en la población, es decir
ejemplificar las características de esta. En pocas palabras, en estadística se conoce como
muestreo a la técnica para la selección de una muestra a partir de una población.
Para que una muestra pueda considerarse significativa de una población, debe cumplirse
que:
1. El tamaño de la muestra y el de la población estén proporcionados

2. Los elementos no presenten distorsiones importantes
3. La muestra sea representativa de la población
Existen diversos métodos para seleccionar las muestras, que han de regirse siempre por el
principio aleatorio (aleatorización): todos los elementos de la población deben tener una
misma probabilidad de ser elegidos para la muestra. Los dos procedimientos más sencillos
de muestreo son:
Muestreo aleatorio simple, que consiste en seleccionar n elementos en una población de

tamaño N, de forma que no existe reemplazamiento y todas las muestras que se pueden
formar tienen la misma probabilidad de ser elegidas
Muestreo aleatorio sistemático, en el que se asigna un número a cada elemento de la
población y se aplica después un procedimiento de selección al azar utilizando este número.
En técnicas de muestreo aleatorio simple, la probabilidad de elegir una muestra es la
inversa de las combinaciones sin repetición de N elementos tomados en grupos de n:
La probabilidad de que se elija un elemento determinado de la población para la muestra

viene dada por:
En la técnica de muestreo aleatorio sistemático, se numeran primero los elementos de la

población, de 1 a N, y se determina un coeficiente de elevación dado por:
, siendo n el tamaño de la muestra. Después, se toma al azar un número i, que se

llama origen, tal que 1 £ i £ h, y se forma la muestra con los elementos de numeración: i, i
+ h, i + 2h,..., i + (n - 1) h. El muestreo aleatorio sistemático exige que la variable sometida
a estudio no presente ninguna ordenación previa.
QUÉ DEBEMOS TENER EN CUENTA PARA QUE UNA MUESTRA SEA

REPRESENTATIVA Y ASÍ OBTENER UN BUEN MANEJO DE MUESTREOS
Esta tiene que contener las características relevantes de la población en las mismas
proporciones en que están incluidas en tal población.
En caso de que la población se distribuya normalmente, la distribución muestral de medias
se distribuye también normalmente, incluso para pequeños valores de N (es decir, N < 30).
Cuando el número de variables (ítems) es excesivo con relación al tamaño de la muestra (N
pequeño), una sugerencia de Marsh y O'Neill (1984) es reducir el número de variables
agrupándolas de dos en dos. Según estos autores las respuestas a dos ítems (o incluso más)
se suman y constituyen una nueva variable. De esta manera el número de sujetos aumenta
en proporción al número de variables. Las variables agrupadas tienen que ser
razonablemente homogéneas, y esta homogeneidad debe ser comprobada empíricamente
mediante la correlación ítem-total, que no debe ser inferior a .30 según estos autores.
Existe un teorema de mucha importancia práctica, que especifica la regularidad estadística

de los promedios (medias aritméticas) obtenidos de las mediciones numéricas en las
unidades experimentales analizadas en muestras de tamaño n. Es el Teorema de Límite
Central, que dice:
‘’En muestras de tamaño n, tomadas de una población en la que la regularidad estadística
no sigue una distribución normal (puede ser de cualquier forma), que tiene una media
poblacional µ y varianza poblacional s2, entonces si n es grande, el proceso de tomar
muchas muestras y en cada una de ellas tomar su media, el promedio muestral produce una
regularidad estadística de los valores de la media que se modela con la distribución normal
con media µ y varianzas2 / n’’.
El tamaño de la muestra por ende dependerá del grado de alejamiento de la distribución de

“muchas medias muéstrales”. Si el alejamiento es muy fuerte, distribuciones asimétricas
con mayores probabilidades en los extremos, o con varias modas, un tamaño de muestra de
30 o más ya produce la distribución normal. Sin embargo, si la distribución de la población
es normal con muestras de tamaño 10 o más se tiene la normalidad. Si la distribución de
población no es normal, pero no se aleja mucho de ella, es simétrica o casi, con la media
casi igual a la moda y la mediana, entonces con muestras de tamaño 15 ó 20 dependiendo
de qué tan cercana es la distribución de la población a la distribución normal.
Es por ello que con carácter general, o al menos en los modelos de probabilidad clásicos, se
admite una aproximación aceptable al modelo normal siempre que n sea mayor o igual que
30, a pesar de que esta cifra es insuficiente en determinados casos y excesiva en otros; por
lo que se debe ser prudente en su aplicación.
En aquellas muestras de tamaño mayor a 30, o llamadas grandes muestras, las

distribuciones de muestreo de muchos estadísticos son aproximadamente normales (como
ya se mencionó), siendo la aproximación tanto mejor cuando n es mayor. Para muestras de
tamaño menor que 30, denominadas pequeñas muestras, esta aproximación no es buena y
empeora al decrecer n. El nombre de “pequeñas muestras” quizá no es el más apropiado,
por lo que comúnmente también se le llama “teoría exacta del muestreo”, porque sus
resultados son válidos tanto para grandes como para pequeñas muestras.
En la distribución muestral, cuanto mayor es el tamaño de la muestra, menor es el error de

muestreo. Pero al revés (en particular n < 30), los errores de muestreo se acentúan .Así
también, muestras con tamaños o n más grande conformarán distribuciones más estrechas y
“apuntadas” aún. Con pocas observaciones, la distribución tiende a aplanarse, esto se
evidencia con tamaños de muestra menores a 120 y es completa cuando el tamaño de
muestra es menor a 30.
MUESTREO PROBABILÍSTICO ALEATORIO ESTRATIFICADO Y POR

CONGLOMERADOS
En poblaciones estadísticas no homogéneas, a menudo es conveniente dividir la población
en estratos o sub poblaciones de composición más homogénea, de manera que la
operación de muestreo pueda realizarse, con garantías, por el método simple o el
sistemático. La suma de todos los estratos debe conformar la población de cada estrato de la
población (Ni) se obtendrá un estrato de muestra (ni).
Si todos los estratos tienen el mismo tamaño, se habla de muestreo aleatorio estratificado
constante, o de igual afijación. Entonces, si se divide la muestra en L estratos, el tamaño de
cada muestra vendrá dado por:
El muestreo se denomina estratificado proporcional, o de afijación proporcional, cuando la

muestra de cada estrato es proporcional al tamaño del estrato. Es decir:
Muestreo por conglomerados
la unidad muestral está formada por un grupo de elementos, y no por un elemento

individual. Se usa para concentrar las muestras en zonas geográficas, unidades de población
(municipios, familias, colegios), entre muchos.
Ventajas del muestreo por conglomerados
 Precisión y confiabilidad predefinida, resulta más barato

 Eficiente cuando la población es muy grande y dispersa.
 Estudiar Universos donde no se conozca el marco de las unidades elementales,
solamente se requiere el marco de conglomerados
 El uso de conglomerados facilita la supervisión de las entrevistas y la
administración del trabajo decampo
 Para mayor enseñanza el conglomerado debe ser de igual tamaño
Desventajas del muestreo por conglomerados

 El error estándar es mayor que en el muestreo aleatorio simple o estratificado
Aspectos técnicos que plantea este muestreo

1. Construcción de Conglomerados: deben estar constituidos por unidades lo más
heterogéneas posibles; sin embargo, los conglomerados deben ser homogéneos entre
ellos
2. Una vez seleccionado un conglomerado se mide la respuesta de todos los individuos
que lo constituyen
3. Si los conglomerados se toman con muestreo aleatorio simple, a la hora de realizar las
estimaciones lo único que hay que tener en consideración es identificar el
conglomerado como individuo
CÓMO DETERMINAR EL TAMAÑO DE UNA MUESTRA
El tamaño de la muestra que se va a seleccionar es un paso importante en cualquier estudio

de investigación de mercados, se debe justificar convenientemente de acuerdo al
planteamiento del problema, la población, los objetivos y el propósito de la investigación.
La muestra debe ser representativa para lograr esa representatividad es diseñar de manera
adecuada un muestreo aleatorio (azar) donde la selección no se haga en una sola dirección
que favorezca la inclusión de ciertos elementos en particular sino que todos los elementos
tenga las misma oportunidades.
De qué depende el tamaño muestral
El tamaño muestral dependerá de decisiones estadísticas y no estadísticas, pueden incluir

por ejemplo la disponibilidad de los recursos, el presupuesto o el equipo que estará en
campo.
Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:
1. Tamaño de la población: Una población es una colección bien definida de objetos o

individuos que tienen características similares. Hablamos de dos tipos: población objetivo,
que suele tiene diversas características y también es conocida como la población teórica. La
población accesible es la población sobre la que los investigadores aplicaran sus
conclusiones.
2. Margen de error (intervalo de confianza): El margen de error es una estadística que
expresa la cantidad de error de muestreo aleatorio en los resultados de una encuesta, es
decir, es la medida estadística del número de veces de cada 100 que se espera que los
resultados se encuentren dentro de un rango específico.
3. Nivel de confianza: son intervalos aleatorios que se usan para acotar un valor con una
determinada probabilidad alta. Por ejemplo, un intervalo de confianza de 95% significa que
los resultados de una acción probablemente cubrirán las expectativas el 95% de las veces.
4. La desviación estándar: es un índice numérico de la dispersión de un conjunto de datos (o
población). Mientras mayor es la desviación estándar, mayor es la dispersión de la
población
La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de la
población es la siguiente:
Donde:
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)
La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la

población es la siguiente:
Donde:
N = tamaño de la población
Z = nivel de confianza
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción).
DISTRIBUCIÓN MUESTRAL
A partir de las muestras seleccionadas de una población pueden construirse variables
aleatorias alternativas, de cuyo análisis se desprenden interesantes propiedades estadísticas.
Las dos formas más comunes de estas variables corresponden a las distribuciones
muéstrales de las medias y de las proporciones. También podemos decir que la distribución
muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas
de una población. Su estudio permite calcular la probabilidad que se tiene, dada una
sola muestra, de acercarse al parámetro de la población.
ERROR TÍPICO DE LA MEDIA
La desviación estándar de todas las posibles muestras (de un tamaño dado) escogidos de esa
población. Además, el error típico de la media puede referirse a una estimación de la
desviación estándar, calculada desde una muestra de datos que está siendo analizada al
mismo tiempo. Es una medida de dispersión y mide la dispersión del estadístico muestral;
explicando la variación de dicho estadístico muestral por las fluctuaciones del muestreo.
Según el teorema del límite central, si de cualquier población se extraen muestras aleatorias
del mismo tamaño N, al aumentar el número de muestras sus medias se distribuyen
normalmente, con media μ y una desviación típica, o error típico σX = σ / √N.
El error típico de la media (desviación típica de la distribución muestral de las medias) se

puede expresar de dos maneras:
(1)
(2)
En la ecuación (1) la desviación típica del numerador se supone calculada dividiendo por
N-1 la suma de cuadrados(o la suma de las puntuaciones diferenciales, X- Ẋ, elevadas
previamente al cuadrado). En la ecuación (2) la desviación típica se ha calculado dividiendo
por N, como es normal hacerlo cuando se calcula la desviación típica como dato descriptivo
de la muestra. Ambas ecuaciones son equivalentes y dan el mismo resultado. Es claro que
el error típico de la media será menor que la desviación típica de cualquier muestra: el
cociente siempre será menor que el numerador. Esto quiere decir que las medias de las
muestras son más estables y tienden a oscilar menos que las puntuaciones individuales;
dicho de otra manera, las medias de muestras de la misma población se parecen entre sí
más que los sujetos (u objetos) de una muestra entre sí.
 Observando las ecuaciones también se aprecia que el error típico de la media será más
pequeño en la medida en que N sea grande: si se aumenta el denominador, disminuirá el
cociente. Es natural que al aumentar el número de sujetos (N) el error sea menor: la
media de la muestra se aproximará más a la media de la población. Si N es muy grande,
el error tiende a cero; y si N no comprende a una muestra sino a toda la población, el
error sería cero: en este caso la media de la población coincide con la media de la
muestra y no hay error muestral (o variación esperable de muestra a muestra)
 Por otra parte si la desviación típica de la muestra es grande, el error típico estimado de
la media será también mayor: sise aumenta el numerador, el cociente será mayor
HIPÓTESIS
La hipótesis, que es una suposición hecha a partir de unos datos que sirve de base para
iniciar una investigación o una argumentación a través de la recolección
de información y datos, aunque no esté confirmada, sirve para responder de forma
alternativa a un problema con base científica. Para un trabajo de investigación y
experimentación existen dos tipos de hipótesis: Nula, que es una suposición que se
utiliza para negar o afirmar un suceso en relación a algún o algunos parámetros de una
población o muestra, e hipótesis Alternativa: se establece por contradicción con la
hipótesis nula.
Dentro de las generalidades es importante mencionar que la distribución Normal o de

Gauss, sin duda es la más importante en el cálculo de probabilidad. Su importancia se
debe fundamentalmente a la frecuencia con la que distintas variables asociadas a
fenómenos naturales y cotidianos siguen, aproximadamente, esta distribución.
Caracteres morfológicos (como la talla o el peso), o psicológicos (como el cociente
intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen
una distribución normal.
DISTRIBUCIÓN DE PROBABILIDAD
La distribución de probabilidad indica toda la gama de valores que pueden representarse

como resultado de un experimento si éste se llevase a cabo. Constituye una herramienta
fundamental para la prospectiva, puesto que se puede diseñar un escenario de
acontecimientos futuros considerando las tendencias actuales de cualquier evento a
estudiar. Toda distribución de probabilidad es generada por una variable (porque puede
tomar diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar), por lo
que este es uno de los conceptos más importantes de la teoría de probabilidades (variable
aleatoria).
Se puede inferir de igual manera que la distribución de probabilidad o distribución de una

variable aleatoria X relaciona el conjunto de valores posibles de X (rango de X), con la
probabilidad asociada a cada uno de estos valores y los representa a través de una tabla o
por medio de una función planteada como una fórmula. Por ejemplo, sea la variable
aleatoria dada por el estadístico media muestral X, entonces al conocer su distribución de
probabilidad podremos saber cuáles son los valores que puede tomar X y cuáles son más
probables. En otras palabras, la distribución de probabilidad de la media muestral X señala
qué valores se espera que tome X, de acuerdo con los supuestos asumidos. De esta forma,
la distribución de probabilidad hace que lo aleatorio no sea un capricho, y modela
(describe, acota) los posibles valores de un estadístico muestral, con lo que al observar una
realización específica de un estadístico se pueden corroborar o rechazar supuestos (prueba
de hipótesis), o bien, hacer estimaciones poblacionales.
Las distribuciones de probabilidad que más se usan en intervalos de confianza y pruebas de

hipótesis son las distribuciones: Z, t de Student, Chi-cuadrada y F de Fisher, Para
determinar cual usar de debe definir el Estadístico de Prueba, que no es más que un número
que permite tomar una decisión sobre la hipótesis planteada. Es calculado usando los datos
experimentales. Debe ser comparado con un valor teórico o tabular.
Con la información anterior podemos definir lo siguiente:
Distribución de Z
Se aplica cuando la población estudiada sigue una distribución normal y la población es lo

suficientemente grande (≥ 30). Esta distribución de caracteriza porque los valores se
distribuyen formando una campana de Gauss, en
donde se verifica que es el valor medio de la distribución y es
donde se verifica que es el valor medio de la distribución y es

precisamente donde se sitúa el centro de la curva (de la campana de Gauss), y σ es
cualquier valor entre –∞ y +∞, si su función de densidad viene dada por:
Esta distribución tiene un

parámetro que es la media,
la moda y la mediana coinciden y es una función simétrica respecto a la media.
Prueba t de Student
Se aplica cuando la población estudiada sigue una distribución normal y la población es
pequeña (< 30). Sea X una variable aleatoria que se distribuye como y sea Y
otra variable aleatoria que se distribuye como tal que X e Y son independientes,
entonces podemos definir otra variable aleatoria:
Es simétrica, ya que está centrada en el punto (0,0). Con esto podemos observar el
siguiente gráfico comparativo de comportamiento entre la distribución Normal y T de
Student:
Distribución F de Fisher
Se aplica cuando se trabaja a razón de las varianzas (Análisis de varianza). Sea una variable
aleatoria que se distribuye como con n grados de libertad y, otra variable
aleatoria que s e distribuye como con m grados de libertad, tal que las dos variables son
independientes, entonces se puede definir una nueva variable
aleatoria:
Distribución Chi Cuadrado (Ji Cuadrado)

Evalúa diferencias entre las frecuencias observadas y esperadas (bondad de ajustes), para
determinar independencia estadística y homogeneidad (compara distribución de
poblaciones). Sea variables aleatorias que se distribuyen como normales
N(0,1), y se define una nueva variable entonces se dice que

X se distribuye como una Chi-Cuadrado o Ji-cuadrado con n grados de libertad, donde n es
el número de variables aleatorias normales independientes elevadas al cuadrado que se han
sumado. Esta se representa como:
Las distribuciones normales y T de Student sirven para hacer inferencias sobre las medias;
por su parte, la distribución Chi-cuadrada será de utilidad para hacer inferencias sobre
varianzas y la distribución F se empleará para comparar varianzas. Es por esto que la
distribución F de Fisher es la de mayor relevancia en diseño de experimentos, dado que el
análisis de la variabilidad que se observa en un experimento se hace comparando varianzas.
Observando:
Deducimos
La distribución Z (normal) como la T de Student son simétricas y centradas en cero,
mientras que las distribuciones ji-cuadrada y F son sesgadas y sólo toman valores positivos.
Las cuatro distribuciones están relacionadas entre sí, ya que las distribuciones T de Student,
Chi-cuadrada y F de Fisher se definen en términos de la distribución normal estándar. No
se puede dejar de mencionar que Los parámetros que definen por completo las
distribuciones T de Student, Chi-cuadrada y F, reciben el nombre de Grados de Libertad,
expresión introducida por Ronald Fisher, dice que, de un conjunto de observaciones, y
están dados por el número de valores que pueden ser asignados de forma arbitraria, antes de
que el resto de las variables tomen un valor automáticamente, producto de establecerse las
que son libres; esto, con el fin de compensar e igualar un resultado el cual se ha conocido
previamente.
CONSTRUCCIÓN DE LA DISTRIBUCIÓN DE PROBALIDAD
1. Observación del problema y planteamiento del experimento, con sus respectivas

preguntas
2. Se plantean las hipótesis a estudiar (nula y alternativa)
3. Se inicia el desarrollo del experimento a estudiar con el cálculo del estadístico a
usar, para saber con que distribución se debe trabajar, según la población que se
tenga
Enunciado A
Se aplica un muestreo estratificado en los pozos del distrito PDM con reductor 5/8” dentro
de los cuales se aplica un muestreo aleatorio simple y se selecciona 48 pozos. Se tiene
como premisa que todo pozo con un Qg ≥ 10000 MPCND es un pozo con alto caudal de
gas
TABLA N°1 Pozos Qg Pozos Qg TABLA N°2
SBA-59 59 SBA-15 59
SBA-17 11,11
SBA-85 11,11
SBA-20 9,89
SBA-22 9,89 SBA- 12,34
SBA-52 12,34 144
SBA-93 13,83 SBA- 13,83
168
SBA-159 7,60
SBA-30 7,60
SBA-182 7,84 SBA-92 7,84
SBA-18 3,49 SBA-79 3,49
SBA-33 5,69 SBA-7 5,69
SBA- 5,67
SBA-51 5,67 129
SBA-66 5,11 SBA- 5,11
SBA-72 12,74 155
SBA-65 8,77 SBA- 12,74
199
SBA-92 10,34 SBA-39 8,77
SBA-189 13,36 SBA-42 10,34
SBA-54 11,61 SBA-87 13,36
SBA-25 11,61
SBA-18 12,98
SBA-92 12,98
SBA-73 5,69 SBA-9 5,69
SBA-89 10,05 SBA- 10,05
SBA-70 5,56 166
SBA-152 10,19 SBA- 5,56
125
Estimaciones puntuales (estadísticos). SBA-12 10,19
SBA-98 13,65
∑ Xi
526 ,41 SBA-31 17,02
X X = ni = 48 SBA-52 8,99
Media muestral = 10,97
SBA- 10,49
160
SBA-82 17,90
Xi )
2
SBA-95 12,12 (∑
Varianza muestral S S
2 2
∑ Xi 2− ni
=
ni−1
277118 , 02
S2 6504 , 44−
= 48 = 15,56
√S
2
Desviación Estándar S S= = 3,95
S 3 ,95
Coeficiente de Variación %C.V= X * 100 = 10,97 *100 =36
¿
Proporción muestral p (de pozos con alto caudal de gas)

¿
XQg¿10 MMPCND 31
p = n
¿
= 48 =0,65
Distribución Normal o Distribución Z
Es definida por la media y la

desviación estándar N ( μ , σ ) y la
función que define es la siguiente:
( )
2
1 1 x−μ
e
f ( x ) = σ √2 π 2 σ
¿ ¿ −1
∫ f ( x ) ∫−¿ σ √12π e ( )
2
2 x−μ
Si integramos −¿ = σ dx =1
En función a esto entonces se puede decir que:

Entonces dado que la grafica es función de la media (µ) y la desviación estándar ( σ ),
mediante la aplicación de la integral se puede conocer que porcentaje de la población tiene
una determinada media, por ejemplo.
Dado los 48 pozos mencionados y sabiendo que la media muestral es de 10,97 y la

desviación estándar es de 3,95 entonces que porcentaje de los pozos tiene caudal de gas
menor a 12 MMPCND
( )
12 2 12
∫ σ √12 π
Si aplicamos la integral −¿ e
−1 x−m
2 σ . dx =
∫ 3 ,951√2π
−¿
e
2 (
−1 12−10, 97
3 ,95 )
=0,602
Entonces 60,2 % de los procesos de los pozos tiene un caudal menor a 12 MMPCND.
Ahora bien si teneos una distribución normal de media cero (µ=0) y desviación estándar 1 (
σ =1) la función se simplifica de la siguiente manera.
1
( ) 1 2
−1 x−M −x
e f ( x )=
f ( x ) = σ √2 π 2 σ = √2 π e 2
Y obtenemos la siguiente distribución.

Esta es la distribución normal estándar y para esta distribución existe una tablas con todas
las áreas calculadas bajo la curva, conocida como tabla de puntos críticos de la distribución
normal estándar (M=0, σ =1) esto simplifica los cálculos debido a que no es necesario
calcular la integral porque los valores ya están tabulados.
Sin embargo como se expreso antes, esta distribución funciona para una media de 0 y una
varianza de 1. Entonces ¿Que pasa cuando la muestra no tiene estas 2 características? Para
ello es necesario hacer el procedimiento de “tipificación” este procedimiento permite
transformar una distribución con cualquier valor de μy σ una distribución normal
estándar en otras palabras, permite realizar estimaciones de una distribución normal con
cualquier valor de media y desviación estándar a través de una distribución normal
estándar.
Ejemplo:
Dada la muestra de los 48 pozos seleccionados ¿Qué porcentaje de los pozos tiene un
caudal de gas mayor a 9 MMPCND?
9−10,97
=−0,49
Entonces Z = 3,95
Nota importante: la tabla de puntos críticos de la distribución estándar solo puede calcular
valores para Z positivos.
Para calcular un área para un Z negativo
Entonces p ( z≥−0 , 49 ) = p ( Z≤0 , 49 )

De la tabla p ( Z≤0 , 49 ) =0,687
El 68% de los pozos tienen un caudal de gas mayor a 9 MMPCND
Intervalos de confianza para la media.
Intervalo entre 2 valores simétricos respecto a media que dentro de si encierra un porcentaje
determinado.
Por definición es encontrar 2 valores simétricos tales que la μ se encuentre entre ellos con
una probabilidad de 1- ¿ . O dicho de otra manera, a partir de la media muestral ( X ) puedo
general un intervalo de confianza dentro del cual tenemos cierta seguridad que estará la
media población y dado que la estimación del intervalo de confianza e hace a partir de la
media muestral ( X ) entonces la desviación estándar para la muestra viene dada por :
S
S ( x ) = √n entonces.
Para encontrar X 1 y X 2 se debe tipificar la variable y tendríamos:
X 1−X X 1−X
σ σ
−Z ¿ Z¿
2 = √n y 2 = √n
Entonces:
S S
Z¿ Z¿
X1 = X- 2 . √n y X2 = X + 2 . √n
S
Z¿
Donde al expresión 2 . √ n Se considera como el error.
Por lo que I. C = ( X 1 , X 2 )
I.C = (x - error ; x + error )
S S
Z¿ Z¿
I.C = X- 2 . √n ; X + 2 . √n
A medida que n sea mayor, el error será menor.
Ejemplo:
Dada la muestra de 45 pozos del enunciado A calcular el intervalo de confianza la media (
μ ).
Z¿
Para encontrar 2 , buscamos en la tabla de Z tal que su valor critico sea 97,5 % o
0,975.
Z¿
Una vez calculado este valor no es necesario calcular - 2 debido a que es el mismo
valor pero negativo
Calcular el error.
S 3,95
Z¿
Error= 2 . √ n = 1,96. √ 48 = 1,18
Entonces el intervalo de confianza viene dado por:
I.C = (x - error ; x + error )

I.C = (10,97−1,18 ; 10,97+1,18)
IC= (9,79 ; 12,15)
Por un 95 % de confianza se estima que el caudal promedio de los pozos se encuentre entre
9,79 y 12,15 MMPCND.
Tamaño de la muestra.
A partir de la expresión que llamaremos error, podemos determinar el tamaño de la muestra

tal que tenga un error “E” determinado de la siguiente manera:
Z ¿ . S2
S
2
Z¿
E2
E= 2 . √n n=
Ejemplo: Para una desviación estándar de 3,95 ¿Cual debe ser el tamaño de la muestra para
que con un 95% de confianza , el error sea de 0,5 ?.
S =3,95
E=0,5
Z¿
2 = 1,96
Calculado en la parte anterior de la tabla de puntos críticos para la distribución Z.
2 2
Entonces: n = ( 1,96 ) . ( 3,95 ) = 239,8 ¿ 240
2
( 0,5 )
Para tener error de 0,5 se debe contar con una muestra de 240 pozos.
Intervalo de confianza para la proporción.
Eventualmente se desea estimar una proporción p de elementos que posee una

característica determinada.
A través de una muestra se puede determinar una proporción muestral y por medio de una
distribución normal se puede construir un intervalo de confianza para la proporción
poblacional.
La proporción muestral viene dada por.

¿
x
p= n
Donde x : es el número de elementos con las características.

n : es el número de elementos de la muestra.
¿
Si suponemos que la proporción muestral p sigue una distribución normal de media p y
varianza p (1−p ) , entonces el intervalo de confianza será:

n
Z¿ ¿
I.C ( p^ - 2 * √ p^ ( 1− p^ ) ; ^p + Z 2 * √ p^ ( 1− p^ ) )
n n
Z¿
Donde 2 * √ p^ ( 1− p^ )
n
Se conoce como error de estimación.
Ejemplo:
Se quiere estimar la proporción p de los pozos con alto caudal de gas con un intervalo de
confianza de 90%
Como se estableció en el enunciado A se considera para este caso que los pozos con alto
caudal de gas son aquellos que Qg ¿ 10MMPCND .
Entonces.
30
p^ = 48 = 0,625
Z¿
2 = Z para 95% = Z para 0,95
De la tabla obtenemos
Z 0,94950 = 1,64
Z 0,95053 =1,65
Entonces Z 0,95 ¿ 1,645
Z¿
2 √ p^ ( 1− p^ ) = 1,645 √ 0,625(1−0,625) =0,12
n n
IC= (0,625−0,12 ; 0,625+0 ,12)
IC= (0,505 ; 0,745 )
En términos porcentuales se tiene que con un 90% de confianza la proporción de los pozos
con alto caudal de gas entre 50,5 y 74,5%.
Tamaño de la muestra
Al igual que con el intervalo de confianza de la media con el intervalo de confianza de la

proporción es posible determinar un tamaño de muestra para un error “E” determinado de
al siguiente manera.
Z¿ Z¿
2 √ p^ ( 1− p^ ) n = 22 . ^p (1− ^p )
2
n E
Ejemplo.
^
Usando la proporción muestral determinada en el calculo anterior ( P=0,625 ) Determinada
el tamaño de la muestra con un 90% de confianza y un error máximo de 0,05.
^p=0,625
Z¿
2 = Z 0,95 ¿ 1,645 (Determinado de la tabla de puntos críticos para la distribución
normal).
2
n=(1,645 ) . 0,625 . (1−0 , 625 )
=93,8 ¿ 94
2
0,05
La muestra debe ser de 94 pozos para que con un 90% de confianza, el error máximo sea de
0,05.
Distribución T – Student
Es una distribución centrada en cero que depende de la media población y los grados de
libertad que tienen que ver con los tamaños muéstrales involucrados.
Al igual que la distribución normal es usada para hacer inferencia sobre la media población
para la muestra de tamaño menor o igual a 30 (n≤30 ) .

Intervalos de confianza para la media
Al igual que para la distribución normal se trata de encontrar dos valores dentro de los
cuales se encuentre la madia población con una probabilidad de 1- ¿
Entonces dada una muestra de tamaño de n de una población con media μ y varianza de
σ 2 desconocido, podemos deducir el intervalo de interés a partir del siguiente estadístico.
x −μ
S
t= √ n
Que sigue una distribución t – Student con n-1 grado de libertad con los cuales se pueden
¿
determinar dos valores críticos t 2 y -t ¿/2 mediante la tabla de esta distribución tal que.
-t ¿/2 ¿ x−m ¿ t ¿/2

s
√n
De acá obtenemos lo siguiente:
s s
X - t ¿/2 √n ¿ μ ¿ X + t ¿/2 √n
El intervalo de confianza viene dado por :

s s
I.C = (X - t ¿/2 √ n ; X + t ¿/2 √ n ) .
s
Donde: t ¿/2 √ n es conocido como error estándar.
Enunciado B
Se aplica un muestreo estratificado en los pozos del distrito PDM con reductor 1/2” dentro
de los cuales se aplica un muestreo aleatorio simple y se seleccionan 25 pozos.
TABLA 3 TABLA 4
Pozos Qg Pozos Qg
SBA- 22 5,80 SBA- 64 10,66
SBA-46 4,40 SBA-95 11,87
SBA- 195 15,14 SBA- 152 14,74
SBA-203 7,47 SBA-108 6,36
SBA-89 18,11 SBA-97 12,46
SBA-15 9,50 SBA-20 12,53
SBA-32 8,53 SBA-25 9,73
SBA- 28 10,65 SBA- 9 11,29
SBA -135 4,51 SBA -142 8,58
SBA – 93 5,30 SBA – 161 4,68
SBA- 48 9,48 SBA- 130 7,98
SBA – 10 9,80 SBA – 52 8,70
SBA- 88 13,96
Estimación puntual (estadísticos)
Xi 242 ,6
X= ∑ ni
Media muestral = 25 = 9,33
Xi 58689 , 9
2 ( ∑ )2
Varianza muestral S = Σ Xi = ni = 2653,8 - 25 = 12,8
ni−1 25−1
Desviación Estándar Muestral S= √ S2 = √ 12,8 = 3,58

S 3,58
Coeficiente de variación % CV = X *100 = 9,33 * 100 = 38,3%
Ejemplo.
Dada la muestra del enunciado B, determinar un intervalo de confianza del 95% para la
media ( μ ) .
g-1 = n -1 = 25 – 1 =24
Vamos a la tabla y ubicamos el valor crítico de la t para ¿/2 0,025 y 24 grados de libertad
t ¿/2 = 2,064
s 3,54
t ¿/2 . √ n = 2,064 - √25 = 1,48
Intervalos de confianza viene dado por:
S S
Z¿ Z¿
I.C = X - 2 . √n ; X + 2 . √n
I .C = (9,33−1,48 ; 9,33+1,48)
IC= (7,85 ; 10,81)
Con un 95% de confianza la media poblacional esta entre 7,85 y 10,81 MMPCND
Distribución Ji Cuadrado
A diferencia de la distribución normal y la distribución t – Student que son simétricas y
centradas en cero esta distribución es sesgada y solo toma valores positivos, sin embargo al
igual que la distribución t Student, es función de los grados de libertad y su utilidad se basa
en hacer inferencias sobre la varianza
2
Intervalo de confianza para la varianza ( σ )
2
Si tenemos una variable una distribución es normal de media ( μ) y varianza ( σ )
desconocidos, el estadístico (n−1 )S 2 ¿ σ2 ¿ (n−1 )S 2

X
2
¿/2 n−1 X 1- ¿/2 ; n−1
2
Donde X ¿/2 n−1 y X 1- ¿/2 ; n−1 son puntos críticos de la distribución Ji

2 2
cuadrada con n -1 grado de libertad.
Ejemplo:
Dada la muestra del enunciado B determinar con un intervalo de confianza del 95% para la
desviación estándar de los pozos del distrito punta de mata.
X 1- ¿/2 ; n−1 = X
2 2
0,025 ; 24 =39,364
X 1- ¿/2 ; n−1 = X
2 2
0,975; 24 = 12,401
2
I.C ( σ ) = [ ( 25−1 ) 12 ,8 ; ( 25−1 ) 12 ,8 ]
39,364 12,401
I.C ( σ ) = ( 7,80 ; 24,77 ) Para la Varianza
I.C ( σ ) = ( √ 7,80 ; √ 24 ,77)

I.C ( σ ) = ( 2,79 ; 4,98 ) Para la desviación estándar
Planteamiento de una Hipótesis Estadística
Es una afirmación sobre los valores de los parámetros de una población que es susceptible a
probarse a partir de una muestra representativa de dicha población.
Generalmente la hipótesis es nula se representa con una igualdad y es la que se intenta

comprobar, si esto no es posible, entonces se cumpla la hipótesis alternativa que puede ser
unilaterable o bilaterable dependiendo de lo que se quiere demostrar.
Ho = “Supuesto 1”
HA ¿ “Supuesto 1” { hipótesis alternativa bilateral
HA ¿¿ “Supuesto 1” { hipótesis alternativa unilateral
La hipótesis se confirma o se rechaza a partir de un estadístico que será función de la
variable involucrada.
Ho= μ= ital Valor Ho= μ= ital Valor Ho = μ= ital Valor
Ho= μ¿¿ Ho = μ≠ ital Valor Ho= μ¿ ital Valor ¿
Prueba para una proporción

Viene dada por el estadístico:
Zo=x - n . po donde: x : número de elemento con características

√ npo ( 1− po ) n: número total de elementos de la muestra
po : Proporción de la hipótesis
Ejemplo:
La proporción de pozos con alto caudal en el Distrito de PDM es de 70% (usar el

enunciado A)
po =70 % = 0,70
Ho= p =0,70
Ho= p ¿ 0,70
Calculamos el estadístico de prueba21
Zo=x - n . po = 31 - 48.0, 70 = -0,82

√ npo ( 1− po ) √ 48 . 0 ,70 ( 1−0 ,70 )
-Z 0,025 = Z 0,975 = 1,96

O también si |Zo| ¿¿ Z ¿/2 Se cumple la hipótesis nula.
|Zo| ¿ Z ¿/2 se rechaza la hipótesis.
|−0,82| ¿¿ 1,96
entonces se cumple la hipótesis nula la proporción de los pozos con alto
caudal de gas es de 70%
Prueba para la media ( μ)

Viene dada por el estadístico
to = x - μ o donde μ o = media de la hipótesis.

S
√n
Ejemplo.
El caudal de gas promedio para los pozos del Dtto PDM es igual al 14MMPND. (Usando
el enunciado B).
Donde:
μ o = 14
Ho = μ =14
Ho = μ ¿ 14
to= 9,33 -14 = -6,52

3,58
√25
t ¿/2 ; n−1 = t 0,025 ; 24= 2,064
Se rechaza la hipótesis nula. El caudal promedio de los pozos del Dtto PDM es diferente de
14 MMPCND.
Prueba para la varianza
Viene dado por el estadístico.
2
Xo 2 = ( n−1 ) S
σ o
2 σ = varianza de la hipótesis
Ejemplo:
Las tasas de gas de los pozos del Dtto de PDM, presentan una varianza menor a 9 (usando
el enunciado B).
σ o
2
=9
2
Ho = σ =14
Ho = σ
2
¿¿ 14
χ o
2
= ( 25−1 ) . 12,8 = 34,1
9
2
χ ¿ ; ni= χ 0,05 ; 25 = 36,415
Dado que el valor del estadístico esta en la zona de rechazo, se descarta la hipótesis nula y
se acepta la alternativa. Las tasas de gas de los pozos del Dtto de PDM. No tiene una
2
varianza de 9 MMPCND .
Comparación de dos tratamientos.
Comparación de proporciones.
Viene dado por el estadístico.
Zo= ^p 1− ^p 2 Donde ^p = X1 + X2
( n11 + n12 )
√ p^ ( 1− p^ )− n1 + n2
X = es el número de elementos con la característica
Ejemplo.
Enunciado C.
Se tiene una muestra de 40 pozos del furrial cuyo valor de media es de 12,4 ( X = 12,4 ) y
desviación estándar es 48.1. se sabe además que el numero de pozos de la muestra con un
caudal mayor a 10 MMPCND es de 28.
Se desea conocer si la proporción de los pozos con alto caudal de gas del Dtto PDM. Es
igual al del Dtto Furrial (usar enunciado Ay C).
Ho = p1 = p2
HA= p1 ¿ p2
^p 1 = 0,65
28 31+28
=0,7 =0 , 67
^p 2 = 40 p^ = 48+40
0 , 65−0,7
Zo= =−0 ,50
(
1 1
√0 ,67 ( 1−0 ,67 ) 48 + 40 )
|Zo| ¿¿ Z ¿/2 se confirma la hipótesis nula
|Zo| ¿ Z ¿/2 se rechaza la hipótesis nula
Z ¿/2 = Z 0,0975 = 1,96
|Z| = |−0,50|=0,50 ¿¿ 1,96

Se confirma la hipótesis nula, ambos distritos poseen la misma proporción de pozos con
alto caudal de gas.
Comparación de dos medias
Con varianza desconocida pero iguales.
Sp = ( nx−1 ) S^ x + ( ny−1 ) S^ y
2 2 2
to = X −Y y
Sp
√ 1 1
+
nx ny n 1+n 2−2
Se rechaza Ho si |to|¿t¿/2¿
t ¿/2 es el punto critico en la distribución T student con nx +ny−2 grados de libertad .
Ejemplo:
Se quiere saber si la taza de gas promedio ( μ ) de los pozos del Dtto PDM (enunciado A)
es igual a la de los pozos del Dtto. Furrial ( Enunciado C).
X =10,97
Y = 12,4
Ho= μ1=μ2
HA = μ1≠μ2
( 48−1 ) 15 , 56+ ( 40−1 ) . 23 , 14

2 =18 , 99
Sp = 48+40−2
10 , 97−12 , 4
=−1 , 53
to=
4 , 36
1 1
+
√
48 40
t ¿/2 para X ≥45≈Z ¿/2

t ¿/2 - t 0,025 ¿ Z0,975
Z 0,975=1,96
Entonces
|to| ¿¿ t ¿/2
|−1,53| ¿¿ 1,96
Se confirma la hipótesis nula, la tasa de gas promedio de ambos Dttos son iguales.
Sin suponer varianzas iguales
Viene dado por el estadístico
to = X −Y
√ Sx 2 Sy 2
+
nx ny
Cuyos grados de libertad se calculan de la siguiente manera
υ=
( Sx 2 Sy 2
+
nx ny )−2
( ) ( )
2 2
Sx 2 Sy 2
+
nx ny
nx +1 nx +1
Igual que antes se rechaza Ho si |to| ¿ t ¿/2

Ejemplo.
Enunciado D
Se tiene una muestra de 18 pozos de Dtto furrial cuyo valor de media muestral es 14,2 (
X = 14,2) y desviación estándar de 3,98.
Se quiere saber si ambas Dttos poseen la misma media poblacional, es decir el mismo
caudal promedio de gas (comparación con el enunciado B)
Ho : μ1=μ2
HA : μ1≠μ2
υ=
( 18 )
15 , 84 2 12 , 82
+
25
=−2
(18 ) +( 25 )
2 2 2 2
15 , 84 12, 8 1, 938
−2=36
= 0 ,0508
18 +1 25+1
14 , 2+9 , 33
=4 , 16
to= √ 15 , 84 12, 8
18
+
25
t ¿/2 = t 0,025 ; 36 = 2,03
Entonces.
|to| ¿ t ¿/2
|4,16| ¿ 2,03
Por lo tanto se rechaza la hipótesis nula. El caudal promedio de gas de ambos Dttos son
estadísticamente diferentes.
Prueba para igualdad de varianzas
Se utiliza para verificar si dos varianzas de población es son distintas, son iguales entre si o
no.
2 2 2 2
Ho= σx =σy O Ho= σx /σy =1
2 2 2 2
HA= σx ≠σy HA= σx /σy ¿ 1
Y se comprueba mediante el siguiente estadístico.
Sx 2
2
Fo = SY
Sigue una distribución F con n -1 grado de libertad en el numerador y ny -1 grado de

libertad en el denominador.
Ejemplo
Determinar si las varianzas en el caudal de gas de los pozos de los Dttos Furrial y PDM.
Son estadísticamente iguales (hacer comparación entre el enunciado A y D)
Pozos Dtto PDM Pozos Dtto Furrial

X̄ =9,33 X̄=14,2
2
S̄ =12 ,8 S̄ 2 =15 , 84
2
S̄ =12 ,8 S̄=3 ,98
n = 25 n = 18
2
σ PDM
2
Ho= σ Furrial =1
σ 2 PDM
2
HA= σ Furrial ¿ 1
12,8
=0,81
Fo = 15,84
F ¿/2 ; nx – 1; ny – 1 = F 0,025 ; 24;17 = 2,56
1 1
F 1 - ¿/2 ; nx -1 ; ; ny-1 = F0,975 ; 24; 17 = F 0,025;17;24 = 2,38 =0,42
Se acepta la hipótesis nula. La varianza en el caudal de gas en los pozos de los Dtto PDM Y
Furrial son estadísticamente iguales.
Análisis a través del software estadístico STATGRAPHICS.
Organización de datos
Parámetros estadísticos puntuales.
Parámetros estadísticos puntuales

Prueba de hipótesis e intervalo de confianza para una muestra
Prueba para una proporción

Prueba para una media
Prueba para una varianza

Prueba de hipótesis e intervalo de confianza para dos muestras
Comparación de dos proporciones

Comparación de dos medias suponiendo varianzas desconocidas iguales
Comparación de dos medias sin suponer varianzas iguales

Prueba para la igualdad de varianzas
REFERENCIAS BIBLIOGRAFICAS
1. Gutiérrez H. Ramón de la Vera Salazar, (2012) Análisis y Diseño del

Experimento Pp.13- 22
2. Mendenhall W. Beaver R. y Beaver B. (2010) Introducción a la Probabilidad y

Estadística Pp. 219-393
3. Montgomeri Douglas , Diseño y análisis de experimento Pp. 26- 34
4. Santaló Luis (1975) Probabilidad e inferencia estadística Pp. 9-33-91-92-105-

112

Trabajo MAESTRIA EN GAS Estadistica Aplicada A La Ingeneria

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Trabajo MAESTRIA EN GAS Estadistica Aplicada A La Ingeneria

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE ORIENTE

CENTRO DE ESTUDIOS DE POSTGRADO

GENERALIDADES DE LAS DISTRIBUCIONES

MATURIN, MARZO 2021

Es importante mencionar la importancia de la Población y Muestra en los procesos

Es importante iniciar con describir la importancia del diseño de experimentos, el cual

La estadística inferencial es distinta a la estadística descriptiva, ya que esta mezcla

La estadística inferencial emplea usualmente mecanismos que le permiten llevar a cabo

Por ende, la estadística inferencial es sumamente útil en el análisis de poblaciones y

A diferencia de la inferencial, la estadística descriptiva no se preocupa por conclusiones,

QUÉ ES PROBABILIDAD ESTADÍSTICA

La población de un estudio estadístico es el conjunto de elementos objeto de estudio. Cada

La muestra debe lograr una representación adecuada de la población, en la que se

1. El tamaño de la muestra y el de la población estén proporcionados

Muestreo aleatorio simple, que consiste en seleccionar n elementos en una población de

La probabilidad de que se elija un elemento determinado de la población para la muestra

En la técnica de muestreo aleatorio sistemático, se numeran primero los elementos de la

, siendo n el tamaño de la muestra. Después, se toma al azar un número i, que se

QUÉ DEBEMOS TENER EN CUENTA PARA QUE UNA MUESTRA SEA

Existe un teorema de mucha importancia práctica, que especifica la regularidad estadística

El tamaño de la muestra por ende dependerá del grado de alejamiento de la distribución de

En aquellas muestras de tamaño mayor a 30, o llamadas grandes muestras, las

En la distribución muestral, cuanto mayor es el tamaño de la muestra, menor es el error de

MUESTREO PROBABILÍSTICO ALEATORIO ESTRATIFICADO Y POR

El muestreo se denomina estratificado proporcional, o de afijación proporcional, cuando la

la unidad muestral está formada por un grupo de elementos, y no por un elemento

Ventajas del muestreo por conglomerados

 Precisión y confiabilidad predefinida, resulta más barato

Desventajas del muestreo por conglomerados

Aspectos técnicos que plantea este muestreo

El tamaño de la muestra que se va a seleccionar es un paso importante en cualquier estudio

De qué depende el tamaño muestral

El tamaño muestral dependerá de decisiones estadísticas y no estadísticas, pueden incluir

Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:

1. Tamaño de la población: Una población es una colección bien definida de objetos o

La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la

P = probabilidad de éxito, o proporción esperada

D = precisión (error máximo admisible en términos de proporción).

ERROR TÍPICO DE LA MEDIA

El error típico de la media (desviación típica de la distribución muestral de las medias) se

Dentro de las generalidades es importante mencionar que la distribución Normal o de

La distribución de probabilidad indica toda la gama de valores que pueden representarse

Se puede inferir de igual manera que la distribución de probabilidad o distribución de una

Las distribuciones de probabilidad que más se usan en intervalos de confianza y pruebas de

Con la información anterior podemos definir lo siguiente:

Se aplica cuando la población estudiada sigue una distribución normal y la población es lo

donde se verifica que es el valor medio de la distribución y es

donde se verifica que es el valor medio de la distribución y es

Esta distribución tiene un

aleatoria que se distribuye como con n grados de libertad y, otra variable

Distribución Chi Cuadrado (Ji Cuadrado)

poblaciones). Sea variables aleatorias que se distribuyen como normales

N(0,1), y se define una nueva variable entonces se dice que

CONSTRUCCIÓN DE LA DISTRIBUCIÓN DE PROBALIDAD

1. Observación del problema y planteamiento del experimento, con sus respectivas

Desviación Estándar S S= = 3,95

Proporción muestral p (de pozos con alto caudal de gas)

Distribución Normal o Distribución Z

Es definida por la media y la

En función a esto entonces se puede decir que:

Dado los 48 pozos mencionados y sabiendo que la media muestral es de 10,97 y la

Y obtenemos la siguiente distribución.

Para calcular un área para un Z negativo