83% encontró este documento útil (6 votos)

2K vistas51 páginas

Distribuciones de Probabilidad

Q: Explain how the variance of heads is determined when tossing four coins.

The variance of the number of heads when tossing four coins is 1. It is determined by calculating the average of the squared deviations from the mean. The variance is given by V(X) = (0-2)^2*(1/16) + (1-2)^2*(4/16) + ... + (4-2)^2*(1/16) = 1 .

Q: What is the Erlang distribution, and how does it relate to the Poisson process?

The Erlang distribution is a continuous probability distribution with two parameters, k and θ, and is used to model the time until the k-th event occurs in a Poisson process. It is effectively the sum of k independent exponentially distributed random variables, which is indicative of a process with a constant average rate. The distribution is particularly applied to describe the waiting time until the k-th Poisson event .

Q: What is the significance of a 1.46 chi-squared statistic with a 5% significance level and 7 degrees of freedom?

A chi-squared statistic of 1.46 with a 5% significance level and 7 degrees of freedom indicates there is insufficient evidence to reject the null hypothesis of the tested expected distribution. Since the calculated statistic is much lower than the critical value of 14.07 for 7 degrees of freedom at this significance level, it suggests a good fit to the distribution being tested .

Q: What is the expected number of heads when four coins are tossed, and how is it calculated?

The expected number of heads when four coins are tossed is 2. This is calculated by finding the expected value (or mathematical expectation) of a discrete random variable. The expectation is calculated as the sum of each possible number of heads multiplied by their respective probabilities. For four coin tosses, this is: E(X) = 0*(1/16) + 1*(4/16) + 2*(6/16) + 3*(4/16) + 4*(1/16) = 2 .

Q: How is a probability distribution for continuous variables different from that for discrete variables?

A probability distribution for continuous variables is expressed as the integral of a density function over a given interval because continuous variables can take on an infinite number of values within a specified range. Consequently, probability distributions for continuous variables are theoretical and obtained empirically through experimentation or observation. Unlike discrete distributions, they do not assign probabilities to specific values but rather to intervals .

Q: How does the standardization process transform a normal distribution, and why is it used?

The standardization process transforms a normal distribution into a standard normal distribution by converting the normal variable X into a Z-score. This is done by subtracting the mean from X and dividing by the standard deviation. This transformation is used because it allows the use of standard normal distribution tables to easily calculate probabilities, as a standard normal distribution has a mean of 0 and a variance of 1 .

Q: What is the role of the Kolmogorov-Smirnov test in statistical analysis?

The Kolmogorov-Smirnov (KS) test is used to determine if a sample comes from a population with a specific distribution. Unlike the chi-squared test, it does not require grouping data into intervals and can be applied to small sample sizes. The KS test compares the cumulative distribution function of the sample with the cumulative distribution function of the reference distribution and calculates the maximum deviation. If this deviation is lower than a critical value, the sample is considered to conform to the specified distribution .

Q: What justifies the use of the chi-squared test for uniformity testing?

The chi-squared test for uniformity testing is justified by assessing how well observed frequencies match expected frequencies under a uniform distribution hypothesis. For k intervals equally spaced, the expected frequency in each is the total number of observations divided by k. If the observed deviations fall within the critical region of the chi-squared distribution with appropriate degrees of freedom, the null hypothesis of uniform distribution is rejected, which indicates a significant deviation from uniform .

Q: How is the relationship between the gamma and Erlang distributions used in data analysis?

The gamma distribution, a generalization used to model times between Poisson events, encompasses the Erlang distribution when its shape parameter k is an integer. This relationship is used in data analysis for simulating and analyzing events that follow Poisson processes, like arrival times in queuing systems, allowing the use of the Erlang distribution as a specific case of the gamma distribution to model such processes .

Q: What properties do a cumulative distribution function (CDF) need to satisfy?

A cumulative distribution function (CDF) needs to satisfy the following properties: it must return a value between 0 and 1 (0 ≤ F(x) ≤ 1); it must be non-decreasing, meaning if a < b, then F(a) ≤ F(b); F(-∞) must equal 0 and F(∞) must equal 1. These conditions ensure the CDF is a valid representation of cumulative probability .

Este documento trata sobre distribuciones de probabilidad. Explica que una distribución de probabilidad indica los posibles resultados de un experimento aleatorio y sus probabilidades asociadas. Describe distribuciones discretas como la binomial, Poisson y geométrica, así como distribuciones continuas como la uniforme, exponencial y normal. También cubre conceptos estadísticos clave como la función de distribución, esperanza matemática y varianza para variables aleatorias discretas y continuas.

Cargado por

Martin Cortes Cosme

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

Distribución Poisson,
Distribución binomial,
Distribución geométrica,
Distribución uniforme continua,
Distribución normal,
Distribución Erlang,
Distribución gamma,
Distribución t de Student,
Distribución F,
Pruebas de bondad de ajuste

83% encontró este documento útil (6 votos)

2K vistas51 páginas

Distribuciones de Probabilidad

Cargado por

Martin Cortes Cosme

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Temas abordados

Distribución Poisson,
Distribución binomial,
Distribución geométrica,
Distribución uniforme continua,
Distribución normal,
Distribución Erlang,
Distribución gamma,
Distribución t de Student,
Distribución F,
Pruebas de bondad de ajuste

INDICE

DISTRIBUCIÓN___________________________________________________________2

DISTRUBUCION DE PROBABILIDAD 3

DISTRIBUCION DE PROBABILIDAD DE UNA VARIABLE DISCRETA 4

DISTRIBUCION DE PROBABILIDAD DE UNA VARIABLE CONTINUA 4

DISTRIBUCIONES DISCRETAS

DISTRIBUCION POISSON 5

DISTRIBUCION BINOMIAL 6

DISTRIBUCION GEOMETRICA 8

DISTRIBUCIONES CONTINUAS

DISTRIBUCION UNIFORME CONTINUA ___ 10

DISTRIBUCION EXPONENCIAL _____ 13

DISTRIBUCION NORMAL 15

DISTRIBUCION ERLANG ______ 16

DISTRIBUCION GAMMA ____________________________________ 17

DISTRIBUCION t STUDENT 18

DISTRIBUCION BETA ___________ 19

DISTRIBUCION JI CUADRADA 20

DISTRIBUCION F _______ 21

PRUEBAS DE BONDAD Y AJUSTE 22

PRUEBA CHI CUADRADA _______ 23

PRUEBA KOLGOMOROV SMIRNOV ______ 30

Página 2
DISTRIBUCIÓN

Es la acción y efecto de distribuir. Aplicado a diferentes campos puede referirse a:

En el comercio, el reparto de productos y servicios:

o Canal de distribución
o Red de distribución de energía eléctrica,
o Distribución cinematográfica
o gran distribución y gran distribución especializada

En informática, distribución un conjunto de aplicaciones reunidas, como:

o Distribución Linux.
o Distribución BSD.

En matemáticas

o En estadística se define la distribución de probabilidad.

o En análisis matemático, se refiere a la teoría de distribuciones o
funciones generalizadas.

Y otros muchos más ejemplos.

Conclusión: la distribución la podemos aplicar a diferentes campos (empresas, comercios,

escuelas, en la vida real, etc.) ya que en todo esto siempre hay una acción y un efecto, que
es lo que significa la definición de distribución.

Página 3
Distribución de probabilidad
Una distribución de probabilidad indica toda la gama de valores que pueden representarse
como resultado de un experimento. Una distribución de probabilidad es similar al
distribución de frecuencias relativas .Si embargo, en vez de describir el pasado, describe la
probabilidad que un evento se realice en el futuro, constituye una herramienta fundamental
para la prospectiva, puesto que se puede diseñar un escenario de acontecimientos futuros
considerando las tendencias actuales de diversos fenómenos naturales.
Las decisiones estadísticas basadas en la estadística inferencial son fundamentales en la
investigación que son evaluadas en términos de distribución de probabilidades.

En estadística, dada una variable aleatoria X, la distribución de probabilidad de X es la

función FX(x), que asigna a cada evento definido sobre X una probabilidad, que está definida
por:

y de manera que se cumplan las siguientes tres condiciones:

Es continua por la derecha.

Es monótona no decreciente.
Para simplificar la notación, cuando no hay lugar a confusión se omite el subíndice X, y se
escribe simplemente F(x).

La función de distribución es la acumulada de la función de densidad de probabilidad f(x).

Es decir, se calcula directamente según:
Si x es una variable aleatoria discreta

Si x es una variable aleatoria continua

Propiedades
Para dos números reales cualesquiera a y b tal que (a < b), los sucesos y
serán mutuamente excluyentes y su suma es el suceso , por lo
que tenemos entonces que:

y finalmente

Por lo tanto una vez conocida la función de distribución F(x) para todos los valores de la
variable aleatoria x conoceremos completamente la distribución de probabilidad de la
variable.

Página 4
Para realizar cálculos es más cómodo conocer las distribución de probabilidad, para ver una
representación gráfica de la probabilidad es más práctico el uso de la función de densidad.

Existen diferentes tipos de modelos que permiten describir el comportamiento de

fenómenos estadísticos que permiten hacer inferencias y tomar decisiones en condiciones
de incertidumbre.

Conclusión: las distribuciones nos explica detalladamente resultados de experimentos o

sucesos en los que tengamos incertidumbre, las distribuciones nos ayudan ah resolver
problemas estadísticos que nos permite llegar a tomar decisiones en momentos de duda

Página 5
Distribuciones de probabilidad para una variable discreta
Se denomina distribución de variable discreta a aquella cuya función de probabilidad sólo
toma valores positivos en un conjunto de valores de X finito o infinito numerable. A dicha
función se la llama función de masa de probabilidad. En este caso la distribución de
probabilidad es el sumatorio de la función de masa, por lo que tenemos entonces que:

Y, tal como corresponde a la definición de distribución de probabilidad, esta expresión

representa la suma de todas las probabilidades desde hasta el valor x.

Una distribución de probabilidad para una variable aleatoria discreta es un

listado mutuamente excluyente, de todos los resultados numéricos posibles,
tal que existe una probabilidad particular de ocurrencia asociada con cada
uno de ellos.

Ejemplo

El experimento aleatorio consiste en el lanzamiento de cuatro monedas.

o ¿Cuales son los resultados posibles del experimento aleatorio para

el suceso que salga cara?

o ¿Cuál es la probabilidad del número de caras en el experimento

aleatorio?

Puntos de muestra Número de Caras Probabilidad

XXXX 0 1/16
XXXC 1 1/16
XXCX 1 1/16
XCXX 1 1/16
CXXX 1 1/16
CCXX 2 1/16
XCCX 2 1/16
XXCC 2 1/16
CXXC 2 1/16
CXCX 2 1/16
XCXC 2 1/16
CCCX 3 1/16
CCXC 3 1/16

Página 6
CXCC 3 1/16
XCCC 3 1/16
CCCC 4 1/16

Distribución de frecuencias relativas y frecuencias relativas acumuladas del

número de caras al arrojar cuatro monedas.

Número de caras f(xi) F(xi)

0 1/16 1/16
1 4/16 5/16
2 6/16 11/16
3 4/16 15/16
4 1/16 16/16

Función de Probabilidad: f(xi)

Si X es una variable aleatoria que puede asumir valores x1, x2, ...., xn, con
probabilidades asociadas f(x1), f(x2), ...., f(xn), entonces el conjunto de pares
ordenados (xi, fxi), i = 1, 2, ...., n, se llama Función de probabilidad o
Distribución de probabilidad de X.

¿Cual es la probabilidad de que al arrojar cuatro monedas salgan dos caras?

Página 7
F (2) = P (X = 2) = 6/16

• Requisitos
o La función f(xi), asume un valor numérico para todas las xi, 1 " i " N

o f(xi) " 0 para cualquier valor posible de x.

o Función de distribución acumulada: F(xi)

Si X es una variable aleatoria y, x es un número real, la Función de Distribución

Acumulada de x, representada por F(xi), muestra la probabilidad de que X asuma
valores menores o iguales a x y se expresa:

¿Cuál es la probabilidad de que al arrojar cuatro monedas salgan dos o menos

caras?

F(2) = P(X " 2) = 11/16

• Requisitos:
o 0 " F(x) " 1
o Si a < b, entonces F(a) < F(b).
o F(") = P(x " ") = 1 y F(- ") = P(x " - ") = 0

ESPERANZA MATEMÁTICA

El valor esperado o esperanza matemática de una variable aleatoria discreta

es un promedio y se calcula como la suma de cada valor que toma la
variable aleatoria multiplicada por su respectiva probabilidad.

x = E(X) = x1 * f(x1) + x2 * f(x2) + ... + xn * f(xn)

E(x) =

El valor esperado de caras al arrojar cuatro monedas es

x = E(X) = 0 (1/16) + 1 (4/16) + 2 (6/16) + 3 (4/16) + 4 (1/16)

= 2 caras.

VARIANCIA

La variancia de una variable aleatoria discreta se puede considerar como la

desviación promedio al cuadrado en torno a la media (Ex) tomada sobre
todos los valores.

La variabilidad de caras al arrojar cuatro monedas es

Página 8
V(x) = 2(x) = (0 - 2)2 (1/16) + (1 - 2)2 (4/16) + ... + (4 - 2)2 (1/16)

= 1(cara)2

(x) = 1 cara

Las distribuciones de variable discreta más importantes son las siguientes:

• Distribución binomial
• Distribución binomial negativa
• Distribución Poisson
• Distribución geométrica
• Distribución hipergeométrica

Página 9
Distribuciones de probabilidad de una variable continúa
Se denomina variable continua a aquella que puede tomar cualquiera de los infinitos valores
existentes dentro de un intervalo especifico. En el caso de variable continua la distribución
de probabilidad es la integral de la función de densidad, por lo que tenemos entonces que:

Hasta el momento se han considerado las distribuciones de probabilidad para variables

discretas, donde se podía asignar el valor que toma la función de probabilidad cuando la
variable aleatoria tomaba un valor en concreto. Sin embargo, al considerar las variables
continuas se encuentra uno el problema de que, lo más probable, los datos que se puedan
recabar no sean completamente exactos, o dos o más de ellos no coincidan, por lo que se
tienen que trabajar en intervalos y, en ese momento, modelar una función se convierte en
un problema serio.

Las distribuciones de probabilidad de variable continua son idealizaciones de las

distribuciones estadísticas de variable continua. Estas se obtienen empíricamente
(experimentando u observando). Aquellas son distribuciones teóricas.
Las distribuciones de probabilidad de variable continua se definen por medio de una
función y = f(x) que se llama función de probabilidad o función de densidad. Ha de ser f(x)
≥ 0 para todo x.
Las probabilidades vienen dadas por el área bajo la curva. Por tanto, el área encerrada bajo
la totalidad de la curva es 1. Es decir, tomamos como unidad el área bajo la curva completa.
Para que f(x) sea la función de densidad o de probabilidad de una variable aleatoria es
necesario que:
- f(x) se no negativa para todo x
- El área bajo la curva y = f(x) sea igual a 1
Para hallar la probabilidad P[a ≤ x ≤ b], obtendremos el área que hay bajo la curva en el
intervalo [a,b]
Las probabilidades de sucesos puntuales son cero: P[x = a] = 0. Por tanto:
P[a ≤ x ≤ b] = P[a < x < b]

Página 10
Conclusión: la distribución de variable continua a diferencia de la distribución de variable
discreta nos dará a conocer aquellos valores que tienen como resultado décimas ejemplo: la
estatura de un estudiante.

Las distribuciones de variable continua más importantes son las siguientes:

• Distribución ji cuadrado
• Distribución exponencial
• Distribución t de Student
• Distribución normal
• Distribución Gamma
• Distribución Beta
• Distribución F

Página 11
PRINCIPALES DISTRIBUCIONES DE VARIABLES DISCRETAS

DISTRIBUCION DE POISSON

En teoría de probabilidad y estadística, la distribución de Poisson es una

distribución de probabilidad discreta. Expresa la probabilidad de un número k de
eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa media
conocida, y son independientes del tiempo desde el último evento.

La distribución fue descubierta por Siméon-Denis Poisson (1781–1840) que publicó,

junto con su teoría de probabilidad, en 1838 en su trabajo Recherches sur la
probabilité des jugements en matières criminelles et matière civile ("Investigación
sobre la probabilidad de los juicios en materias criminales y civiles"). El trabajo
estaba enfocado en ciertas variables aleatorias N que cuentan, entre otras cosas, un
número de ocurrencias discretas (muchas veces llamadas "arribos") que tienen lugar
durante un intervalo de tiempo de duración determinada. Si el número esperado de
ocurrencias en este intervalo es λ, entonces la probabilidad de que haya exactamente
k ocurrencias (siendo k un entero no negativo, k = 0, 1, 2, ...) es igual a:

dónde

• e es el base del logaritmo natural (e = 2.71828...),

• k! es el factorial de k,
• k es el número de ocurrencias de un evento,
• λ es un número real positivo, equivalente al número esperado de ocurrencias
durante un intervalo dado. Por ejemplo, si los eventos ocurren de media cada
4 minutos, y se está interesado en el número de eventos ocurriendo en un
intervalo de 10 minutos, se usaría como modelo una distribución de Poisson
con λ = 2.5.

Por ejemplo, si 2% de los libros encuadernados en cierto taller tiene encuadernación

defectuosa, obtener la probabilidad de que 5 de 400 libros encuadernados en este
taller tengan encuadernaciones defectuosas.

Su media y su varianza son:

Página 12
Como una función de k, ésta es la función probabilidad de masa. La distribución de
Poisson puede ser vista como un caso limitante de la distribución binomial, es decir,
que una distribución binomial en la que y se puede aproximar por
una distribución de Poisson de valor

La distribución Poisson es también llamada Poissoniana, análogamente al término

Gaussiana para una distribución de Gauss o distribución normal.

Función de densidad de
probabilidad

El eje horizontal es el índice k. La

función solamente está definida en
valores enteros de k. Las líneas que
conectan los puntos son solo guías
para el ojo y no indican continuidad.

Función de distribución de
probabilidad

El eje horizontal es el índice k.

PROPIEDADES

Página 13
• El valor esperado de una variable aleatoria con distribución Poisson es igual a
λ y también lo es su varianza. Los momentos más altos de la distribución
Poisson son polinomios de Touchard en λ cuyos coeficientes tienen un
sentido combinatorio. De hecho, cuando el valor esperado de la distribución
Poisson es 1, entonces la fórmula de Dobinski dice que el enésimo momento
iguala al número de particiones de tamaño n.

• Las medidas de tendencia central de una variable aleatoria de distribución

Poisson con un λ no entero es igual a (o suelo de λ), el cual es el número
entero más grande menor o igual a λ. Esto también es expresado como la
función parte entera de λ. Cuando λ es un entero positivo, las medidas de
tendencia central son λ y λ − 1.

• Sumas de las variables aleatorias de distribución Poisson:

Si sigue una distribución Poisson con parámetro y Xi son

independientes entonces también sigue una

distribución Poisson cuyo parámetro es la suma de los parámetros del
componente.

• La función generadora de momentos de la distribución Poisson con valor

esperado λ es:

• Todas las acumulaciones de la distribución Poisson son iguales al valor

esperado λ. El enésimo momento factorial de la distribución Poisson es λn.

• La distribuciones Poisson son funciones probabilísticas infinitamente

divisibles.

• La divergencia Kullback-Leibler dirigida entre Poi(λ0) y Poi(λ) está dada por:

Página 14
CONCLUSION:

La distribución de poisson expresa el número de veces que ocurre un evento

en un tiempo fijo y el tiempo de cada uno es independiente del evento
anterior.

EJEMPLOS COMPLEMENTARIOS

1.-Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un día dado, b)
10 cheques sin fondos en cualquiera de dos días consecutivos?

Solución:

a) x = variable que nos define el número de cheques sin fondo que llegan al banco
en un día cualquiera = 0, 1, 2, 3, ....., etc, etc.
λ = 6 cheques sin fondo por día
ε = 2.718

( 6 )4 ( 2.718 )−6 ( 1296 )( 0.00248 )

p( x = 4 ,λ = 6 ) = = = 0.13392
4! 24

b) x= variable que nos define el número de cheques sin fondo que llegan al banco en
dos días consecutivos = 0, 1, 2, 3, ......, etc., etc.
λ = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos días
consecutivos

Nota: λ siempre debe de estar en función de x siempre o dicho de otra forma, debe
“hablar” de lo mismo que x.

(12)10( 2.718)−12 ( 6.1917364

Ε10)(0.000006151
)
p( x = 10,λ = 12) = = = 0.104953
10! 3628800

2.-En la inspección de hojalata producida por un proceso electrolítico

continuo, se identifican 0.2 imperfecciones en promedio por minuto.
Determine las probabilidades de identificar a) una imperfección en 3
minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando más una
imperfección en 15 minutos.

Solución:

Página 15
a) x = variable que nos define el número de imperfecciones en la hojalata por cada
3 minutos = 0, 1, 2, 3, ...., etc., etc.

λ = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

( 0.6 )1( 2.718 )−0.6 ( 0.6 )( 0.548845 )

p( x = 1,λ = 0.6 ) = = = 0.329307
1! 1

b) x = variable que nos define el número de imperfecciones en la hojalata por cada

5 minutos = 0, 1, 2, 3, ...., etc., etc.
λ = 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata

 (1)0( 2.718)−1 (1)(2.718)−1 

p( x = 2,3,4,etc....λ = 1) = 1− p( x = 0,1,λ = 1) = 1−  +  =
 0 ! 1! 

=1-(0.367918+0.367918) = 0.26416

c) x = variable que nos define el número de imperfecciones en la hojalata por cada

15 minutos = 0, 1, 2, 3, ....., etc., etc.
λ = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

( 3 )0 ( 2.718 )−3 ( 3 )1( 2.718 )−3

p( x = 0,1,λ = 3 ) = p( x = 0,λ = 3 ) + p( x = 1,λ = 3 ) = + =
0! 1!

= 0.0498026 + 0.149408 = 0.1992106

3.- Si ya se conoce que solo el 3% de los alumnos de Contabilidad son muy inteligentes
¿calcular la probabilidad de que si tomamos 100 alumnos al azar 5 de ellos sean muy
inteligentes.

n = 100 P = 0.03 100 * 0.03 = 3 x=5

e = 2.718281828

P(X=5) = e-3 35 / 5! = 0.10081

DISTRIBUCION BINOMIAL

Página 16
En estadística, la distribución binomial es una distribución de probabilidad
discreta, mide el número de éxitos en una secuencia de n experimentos
independientes, con una probabilidad θ de ocurrencia del éxito en cada uno de los
experimentos. (La distribución de Bernoulli es una distribución binomial con n = 1).

Su función de masa de probabilidad está dada por:

para , siendo las combinaciones de en (

elementos tomados de en )

Gráficamente se tiene

Figura: Función de probabilidad de una

variable binomial cunado n es pequeño.

Página 17
Figura: Función de probabilidad de una
variable binomial cuando n es grande.

Por ejemplo, la distribución binomial se puede usar para calcular la probabilidad de

sacar 5 caras y 7 cruces en 12 lanzamientos de una moneda. En realidad solo se
calcula la probabilidad de sacar 5 caras, pero como es lógico si en 12 lanzamientos de
una moneda sacamos 5 caras el resto deben ser cruces, 7 en este caso.

Por lo tanto debemos definir la variable "X: Número de caras obtenidas en 12

lanzamientos de moneda". En este caso se tiene que y
resulta:

Página 18
Obsérvese que para el caso concreto de la moneda al ser la probabilidad de éxito θ =
0,5 la función de masa de probabilidad solo depende del número combinatorio

ya que:

0,5x(1 − 0,5)n − x = 0,5x0,5n − x = 0,5n − x + x = 0,5n que es constante para un n fijo.

Su media y su varianza son:

Propiedades reproductivas

Dadas n variables aleatorias , tales que

• todas tienen una distribución binomial

• todas tienen el mismo parámetro
• cada una tiene su propio parámetro (es decir, los n no necesariamente
tienen que ser iguales)
• son todas independientes entre sí

• se toma la variable aleatoria

• se toma

Entonces:

La variable aleatoria Y tiene una distribución Binomial, con parámetros y .

Por lo tanto, dadas n variables binomiales independientes, donde cada una tiene su
propio n pero todas tienen igual , su suma es también una variable binomial, cuyo
parámetro n es la suma de los n de las variables originales, y cuyo parámetro
coincide con el de las originales.

CONCLUSION:

La distribución binomial es una distribución de probabilidad discreta, que

expresa el número de éxitos mediante “x” experimentos independientes.

Página 19
EJEMPLOS COMPLEMENTARIOS:

1. - S e l an za u na m on e da c ua t ro vec es . Ca l cu l a r l a p r ob ab i l i dad d e
qu e s al g a n m ás c ar as q u e c ruc es .

B(4, 0. 5) p = 0. 5q = 0. 5

2. - Un ag ent e d e s e gu ros v e n de pól i za s a c i nc o p ers on a s d e l a

mi s m a e d ad y qu e di s f rut an de b ue na s al u d . Se g ú n l as ta bl a s
ac t ual e s , l a p r ob abi l i dad de q u e u n a p ers on a e n e sta s c on d i ci one s
vi v a 3 0 añ os o m ás es 2/ 3. H á l l es e l a p r ob abi l i d a d d e q ue,
t ra ns c u rri d os 30 añ os, vi v an:

a) L as ci nc o p er s on as .

B(5, 2/ 3) p = 2 /3 q = 1/ 3

b) Al men os tr es p er s on as .

c) Ex act a men t e d os pers on as .

3. - L a p r ob abi l i da d d e qu e u n h om b re ac i ert e e n el bl a nc o es 1/ 4.
Si d i sp ara 10 v e ce s ¿ cu ál e s l a pr ob a bi l i d a d d e qu e ac i ert e

Página 20
ex ac t am e nt e e n t r es oc as i on e s? ¿ Cu á l es l a pr oba bi l i d a d d e q u e
ac i ert e p or l o m en os en un a oc as i ón ?

B(1 0, 1 /4) p = 1/ 4q = 3 /4

DISTRIBUCION GEOMETRICA

En teoría de probabilidad y estadística, la distribución geométrica es cualquiera de

las dos distribuciones de probabilidad discretas siguientes:

• la distribución de probabilidad del número X del ensayo de Bernoulli

necesaria para obtener un éxito, contenido en el conjunto { 1, 2, 3,...} o

• la distribución de probabilidad del número Y = X − 1 de fallos antes del primer

éxito, contenido en el conjunto { 0, 1, 2, 3,... }.

Cual de éstas es la que uno llama "la" distribución geométrica, es una cuestión de
convención y conveniencia.

Si la probabilidad de éxito en cada ensayo es p, entonces la probabilidad de que n

ensayos sean necesarios para obtener un éxito es

para n = 1, 2, 3,.... Equivalentemente, la probabilidad de que haya n fallos antes del

primer éxito es

Página 21
para n = 0,1, 2, 3,....

En ambos casos, la secuencia de probabilidades es una secuencia geométrica.

Por ejemplo, supongamos que un dado ordinario es lanzado repetidamente hasta

que aparece "1" por primera vez. La distribución de probabilidad del número de
veces que el dado es lanzado se encuentra en el conjunto infinito {1, 2, 3,...} y es una
distribución geométrica con p=1/6.

El valor esperado de una variable aleatoria X distribuida geométricamente es 1/'p y su

varianza es (1 − p)/p2;

Equivalentemente, el valor esperado de una variable aleatoria distribuida

geométricamente Y es (1 − p)/p, y su varianza es (1 − p)/p2.

La función generatriz de probabilidad de X y la de Y son, respectivamente,

Como su continua análoga (la distribución exponencial), la distribución geométrica

es sin memoria. Esto significa que si intentamos repetir el experimento hasta el
primer éxito, entonces, dado que el primer éxito todavía no ha ocurrido, la
distribución de probabilidad condicional del número de ensayos adicionales no
depende de cuantos fallos se hayan observado. El dado o la moneda que uno lanza
no tiene "memoria" de estos fallos. La distribución geométrica es de hecho la única
distribución discreta sin memoria.

De todas estas distribuciones de probabilidad contenidas en {1, 2, 3,... } con un valor

esperado dado μ, la distribución geométrica X con parámetro p = 1/μ es la de mayor
entropía

Página 22
La distribución geométrica del número y de fallos antes del primer éxito es
infinitamente divisible, esto es, para cualquier entero positivo n, existen variables
aleatorias independientes Y 1,..., Yn distribuidas idénticamente la suma de las cuales
tiene la misma distribución que tiene Y. Estas no serán geométricamente
distribuidas a menos que n = 1.

EJEMPLOS COMPLEMENTARIOS

1.- Se lanza al aire una moneda cargada 8 veces, de tal manera que la
probabilidad de que aparezca águila es de 2/3, mientras que la probabilidad
de que aparezca sello es de 1/3, Determine la probabilidad de que en el último
lanzamiento aparezca una águila.

Solución:

Si nosotros trazamos un diagrama de árbol que nos represente los 8 lanzamientos de

la moneda, observaremos que la única rama de ese árbol que nos interesa es aquella
en donde aparecen 7 sellos seguidos y por último una águila; como se muestra a
continuación:

SSSSSSSA

Sí denotamos;
x = el número de repeticiones del experimento necesarias para que ocurra un éxito
por primera y única vez = 8 lanzamientos
p = probabilidad de que aparezca una águila = p( éxito) = 2/3
q = probabilidad de que aparezca un sello = p(fracaso) = 1/3

Entonces la probabilidad buscada sería;

P(aparezca una águila en el último

lanzamiento)=p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(S)*p(A) =

x −1
=q*q*q*q*q*q*q*p = q p

Luego, la fórmula a utilizar cuando se desee calcular probabilidades con esta

distribución sería;
p( x ) = q x −1 p

Página 23
Donde:
p(x) = probabilidad de que ocurra un éxito en el ensayo x por primera y única vez
p = probabilidad de éxito
q = probabilidad de fracaso

Resolviendo el problema de ejemplo;

x = 8 lanzamientos necesarios para que aparezca por primera vez una águila
p = 2/3 probabilidad de que aparezca una águila
q = 1/3 probabilidad de que aparezca un sello

8−1
p(x=8) = ( 1 / 3 ) ( 2 / 3 ) = 0.0003048

2.-Sí la probabilidad de que un cierto dispositivo de medición muestre una

desviación excesiva es de 0.05, ¿cuál es la probabilidad de que; a) el sexto de
estos dispositivos de medición sometidos a prueba sea el primero en mostrar
una desviación excesiva?, b) el séptimo de estos dispositivos de medición
sometidos a prueba, sea el primero que no muestre una desviación excesiva?.

Solución:

a) x = 6 que el sexto dispositivo de medición probado sea el primero que muestre

una variación excesiva
p = 0.05 =probabilidad de que un dispositivo de medición muestre una variación
excesiva
q = 0.95 =probabilidad de que un dispositivo de medición no muestre una variación
excesiva
6−1
p(x = 6) = ( 0.95 ) ( 0.05 ) = 0.03869

b) x = 5 que el quinto dispositivo de medición probado, sea el primero que no

muestre una desviación excesiva
p = 0.95 = probabilidad de que un dispositivo de medición no muestre una variación
excesiva
q = 0.05 = probabilidad de que un dispositivo de medición muestre una variación
excesiva

5−1
p(x = 5) = ( 0.05 ) ( 0.95 ) = 0.0000059

Página 24
3.- Los registros de una compañía constructora de pozos, indican que la
probabilidad de que uno de sus pozos nuevos, requiera de reparaciones en el
término de un año es de 0.20. ¿Cuál es la probabilidad de que el quinto pozo
construido por esta compañía en un año dado sea el primero en requerir
reparaciones en un año?.

Solución:

x = 5 que el quinto pozo sea el primero que requiera reparaciones en un año

p = 0.20 = probabilidad de que un pozo requiera reparaciones en el término de un
año
q = 0.80 = probabilidad de que un pozo no requiera reparaciones en el término de un
año

5−1
p(x = 5) = ( 0.80 ) ( 0.20 ) = 0.08192

Página 25
DISTRIBUCIONES CONTINUAS

Distribución uniforme continua

En teoría de probabilidad y estadística, la distribución uniforme continua es una familia de

distribuciones de probabilidad para variables aleatorias continuas, tales que cada miembro
de la familia, todos los intervalos de igual longitud en la distribución en su rango son
igualmente probables. El dominio está definido por dos parámetros, a y b, que son sus
valores mínimo y máximo. La distribución es a menudo escrita en forma abreviada como
U(a,b).

Caracterización
Función densidad de probabilidad
La función densidad de probabilidad de la distribución uniforme continua es:

Los valores en los dos extremos a y b no son por lo general importantes porque no afectan el
valor de las integrales de f(x) dx sobre el intervalo, ni de x f(x) dx o expresiones similares. A
veces se elige que sean cero, y a veces se los elige con el valor 1/(b − a). Este último resulta
apropiado en el contexto de estimación por el metodo de maximum likelihood. En el
contexto del análisis de Fourier, se puede elegir que el valor de f(a) ó f(b) sean 1/(2(b − a)),
para que entonces la transformada inversa de muchas transformadas integrales de esta
función uniforme resulten en la función inicial, de otra forma la función que se obtiene sería
igual "en casi todo punto", o sea excepto en un conjunto de puntos con medida nula.
También, de esta forma resulta consistente con la función signo que no posee dicha
ambigüedad.

Función de distribución de probabilidad

La función de distribución de probabilidad es:

Funciones generadoras asociadas

Función generadora de momentos
La función generadora de momentos es

Página 26
a partir de la cual se pueden calcular los momentos m k

Para una variable aleatoria que satisface esta distribución, la esperanza matemática es
entonces m1 = (a + b)/2 y la varianza es m2 − m12 = (b − a)2/12.

Función generadora de cumulantes

Para n ≥ 2, el n-ésimo cumulant de la distribución uniforme en el intervalo [0, 1] es bb/n,
donde bn es el n-ésimo número de Bernoulli.

Propiedades
Generalización a conjuntos de Borel [editar]
Esta distribución puede ser generalizada a conjuntos de intervalos más complicados. Si S es
un conjunto de Borel de medida finita positiva, la distribución probabilidad uniforme en S se
puede especificar definiendo que la pdf sea nula fuera de S e igual a 1/K dentro de S, donde K
es la medida de Lebesgue de S.

Estadísticas de orden
Sea X1,..., Xn una muestra i.i.d. de U(0,1). Sea X(k) el orden estadístico k-ésimo de esta
muestra. Entonces la distribución de probabilidad de X(k) es una distribución Beta con
parámetros k y n − k + 1. La esperanza matemática es

Esto es útil cuando se realizan Q-Q plots.

Las varianzas son

'Uniformidad'
La probabilidad de que una variable aleatoria uniformemente distribuida se encuentre
dentro de algun intervalo de longitud finita es independiente de la ubicación del intervalo
(aunque si depende del tamaño del intervalo), siempre que el intervalo este contenido en el
dominio de la distribución.
Es posible verificar esto, por ejemplo si X ≈ U(0,b) y [x, x+d] es un subintervalo de [0,b] con
d fijo y d > 0, entonces

Página 27
lo cual es independiente de x. Este hecho es el que le da su nombre a la distribución.

Uniforme standard
Si se restringe <> y b = 1, a la distribución resultante U(0,1) se la llama distribución uniforme
standard.
Una propiedad interesante de la distribución uniforme standard es que si u1 es una
distribución uniforme standard, entonces 1-u1 también lo es.

Distribuciones relajadas
Si X tiene una distribución uniforme standard,
Y = -ln(X)/λ tiene una distribución exponencial con parámetro λ.
Y = 1 - X1/n tiene una distribución beta con parámetros 1 y n. (Notar que esto implica que la
distribución uniforme standard es un caso especial de la distribución beta, con parámetros 1
y 1.)

Relaciones con otras funciones

Siempre y cuando se sigan las mismas convenciones en los puntos de transición, la función
densidad de probabilidad puede también ser expresada mediante la función escalón de
Heaviside:

ó en términos de la función rectángulo

No existe ambigüedad en el punto de transición de la función signo. Utilizando la

convención de la mitad del máximo en los puntos de transición, la distribución uniforme se
puede expresar a partir de la función signo como:

Muestreo de una distribución uniforme

Existen muchos usos en que es útil realizar experimentos de simulación. Muchos lenguajes
de programación poseen la capacidad de generar números pseudoaleatorios que están
distribuidos de acuerdo a una distribución uniforme standard.
Si u es un valor muestreado de una distribución uniforme estandard, entonces el valor a + (b
− a)u posee una distribución uniforme parametrizada por a y b, como se describió
previamente.

Ejemplo en el intervalo [0,1]

Para este caso el intervalo queda definido por a = 0 y b = 1.
Entonces resulta:
f(x) = 1 para
F(x) = x para

Página 28
Conclusión

la distribución continua uniforme se utiliza un p-value a modo de prueba estadística para

una hipótesis nula simple, y la distribución de la prueba estadística es continua, entonces la
prueba estadística esta uniformemente distribuida entre 0 y 1 si la hipótesis nula es
verdadera.

Distribución exponencial

En estadística la distribución exponencial es una distribución de probabilidad continua con

un parámetro λ > 0 cuya función de densidad es

--
Su función de distribución es

Aquí e significa el número e.

El valor esperado y la varianza de una variable aleatoria X con distribución exponencial son

Se pueden calcular una variable aleatoria de distribución exponencial x por medio de una
variable aleatoria de distribución uniforme u = U(0,1):

Página 29
Ejemplo

El tiempo que transcurre antes de que una persona sea atendida en una cafetería es una
variable aleatoria que tiene una distribución exponencial con una media de 4 minutos. ¿Cuál
es la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos en al
menos 4 de los 6 días siguientes?

Solución:

la nos indica que la integral va a ser evaluada de 0 a 3

x = número de días en que un cliente es atendido antes de que transcurran 3 minutos

x = 0, 1, 2,...,6 días

p = probabilidad de que un cliente sea atendido antes de que transcurran 3 minutos en un

día cualquiera = 0.5276
q = probabilidad de que un cliente no sea atendido antes de que transcurran 3 minutos en
un día cualquiera = 1- p = 0.4724

= 0.11587 + 0.02157 = 0.13744

Relaciones
La suma de k variables aleatorias independientes de distribución exponencial con parámetro
λ es una variable aleatoria de distribución gamma.

Conclusión
La distribución exponencial es el equivalente continuo de la distribución geométrica
discreta. Esta ley de distribución describe procesos en los que nos interesa saber el tiempo
hasta que ocurre determinado evento, sabiendo que, el tiempo que pueda ocurrir desde
cualquier instante dado t, hasta que ello ocurra en un instante tf, no depende del tiempo
transcurrido anteriormente en el que no ha pasado nada

Página 30
Distribución normal
La distribución normal, también llamada distribución de Gauss o distribución gaussiana, es
la distribución de probabilidad que con más frecuencia aparece en estadística y teoría de
probabilidades. Esto se debe a dos razones fundamentalmente:
Su función de densidad es simétrica y con forma de campana, lo que favorece su aplicación
como modelo a gran número de variables estadísticas. Es, además, límite de otras
distribuciones y aparece relacionada con multitud de resultados ligados a la teoría de las
probabilidades gracias a sus propiedades matemáticas.
La función de densidad está dada por:

donde (mu) es la media y (sigma) es la desviación estándar ( es la varianza).

Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene
forma de campana.

La importancia de la distribución normal se debe principalmente a que hay muchas

variables asociadas a fenómenos naturales que siguen el modelo de la normal:
• Caracteres morfológicos de individuos
• Caracteres fisiológicos como el efecto de un fármaco
• Caracteres sociológicos como el consumo de cierto producto por un mismo grupo de
individuos
• Caracteres psicológicos como el cociente intelectual
• Nivel de ruido en Telecomunicaciones
• Número de granos de maíz contenidos en un choclo (mazorca)
• Errores cometidos al medir ciertas magnitudes
• Valores estadísticos muestrales como la media

Distribución normal estándar.

Estandarización
Cuando y , la distribución se conoce con el nombre de normal estándar.
Dada una variable aleatoria normal X, con media (también llamada Esperanza matemática)

y desviación típica , si definimos otra variable aleatoria entonces la

variable aleatoria Z tendrá una distribución de porcentaje altamente normal aunque algunas
veces muy estándar y a la vez pequeña y . Se dice que se ha tipificado o
estandarizado la variable X.

Página 31
Uso de tablas
La probabilidad de que una variable aleatoria (que sigue una distribución normal) se
encuentre entre dos valores determinados será en general difícil de calcular (hay que usar la
integral de la función de probabilidad). Para ello, existen tablas de distribución normal
tipificada, si bien éstas se calculan para la distribución Normal Tipificada.
Básicamente, se busca un valor de x (por ejemplo, ), y la tabla nos da la
probabilidad de que :
En el caso de que la distribución no sea estándar, por ejemplo, con y
, tendremos que tipificar la variable:

Se obtiene una variable Z normal, que además está tipificada. Si ahora se consulta en la
tabla,

Conclusión
La distribución normal proporciona la estimación de la probabilidad de que una variable
aleatoria asuma un valor de k desviaciones estándar de su media para cualquier valor de k.
Su función de densidad es simétrica y con forma de campana, lo que favorece su aplicación
como modelo a gran número de variables estadísticas. De entre todas ellas, la más utilizada
es la distribución normal estándar, que corresponde a una distribución de media 0 y
varianza 1.

Distribución Erlang
En estadística y simulación la distribución Erlang, también llamada distribución de Erlang,
es una distribución de probabilidad continua con dos parámetros k y θ cuya función de
densidad para valores x > 0 es

La distribución Erlang es el equivalente de la distribución gamma con el parámetro

y λ = 1 / θ. Para k = 1 eso es la distribución exponencial. Se utiliza la

Página 32
distribución Erlang para describir el tiempo de espera hasta el suceso número k en un
proceso de Poisson.

Esperanza
E(X) = k / λ

Varianza
V(X) = k / λ2

Función Generadora de Momento

(1 − t / λ) − k

Conclusión
La distribución Erlang es una distribución Poisson truncada de la misma manera que las dos
distribuciones binomiales negativas. La distribución Erlang es el equivalente de la
distribución gamma con el parámetro y . Para eso es la distribución exponencial. Se utiliza la
distribución Erlang para describir el tiempo de espera hasta el suceso número en un proceso
de Poisson

Distribución Gamma
En estadística la distribución gamma es una distribución de probabilidad continua con dos
parámetros k y λ cuya función de densidad para valores x > 0 es

Aquí e es el número e y Γ es la función gamma. Para valores enteros la

función gamma queda como Γ(k) = (k − 1)! (siendo ! la función factorial). En este caso - por
ejemplo para describir un proceso de Poisson - se llaman la distribución distribución Erlang
con un parámetro θ = 1 / λ.

El valor esperado y la varianza de una variable aleatoria X de distribución gamma son

E[X] = k / λ = kθ
V(X) = k / λ2 = kθ2

Relaciones
El tiempo hasta que el suceso número k ocurre en un Proceso de Poisson de intensidad λ es
una variable aleatoria con distribución gamma. Eso es la suma de k variables aleatorias
independientes de distribución exponencial con parámetro λ.

Conclusión
Es una función de probabilidad que genera variables aleatorias que sirve para dar un
panorama de la tendencia que estamos analizando.

Página 33
Distribución t de Student
En probabilidad y estadística, la distribución-t o distribución t de Student es una
distribución de probabilidad que surge del problema de estimar la media de una población
normalmente distribuida cuando el tamaño de la muestra es pequeño. Ésta es la base del
popular test de la t de Student para la determinación de las diferencias entre dos medias
muestrales y para la construcción del intervalo de confianza para la diferencia entre las
medias de dos poblaciones.

La distribución t surge, en la mayoría de los estudios estadísticos prácticos, cuando la

desviación típica de una población se desconoce y debe ser estimada a partir de los datos de
una muestra.

Aparición y especificaciones de la distribución t de Student

Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas

normalmente, con media μ y varianza σ2. Sea

la media muestral y

la varianza muestral. Entonces, está demostrado que

tiende a la distribución normal de media 0 y varianza 1 cuando n tiende a infinito.

Gosset estudió una expresión relacionada,

y mostró que T tiene la siguiente función de densidad:

Página 34
Con ν igual a n − 1.

La distribución de T se llama ahora la distribución-t.

El parámetro ν se llama convencionalmente el número de grados de libertad. La distribución

depende de ν , pero no de μ o σ; la independencia de μ y σ es lo que hace a la distribución t
tan importante en la teoría y en la práctica. Γ es la función gamma.

Grados De Libertad (gl): Número de observaciones que se utilizaron para calcular la

desviación estándar muestral menos 1, es decir (n-1).

Intervalos de confianza derivados de la distribución t de Student

El procedimiento para el cálculo del intervalo de confianza basado en la t de Student

consiste en estimar la desviación típica de los datos S y calcular el error estándar de la
media= S/(raíz cuadrada de n), siendo entonces el intervalo de confianza para la media = x
media +- t (alfa/2) multiplicado por (S/(raíz cuadrada de n)).

Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las
medias de muestras de dos distribuciones normales se distribuye también normalmente, la
distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse
igual a cero.

Conclusión

La distribución t de student es parecida a la distribución normal que surge del problema de

estimar la media de una población normalmente distribuida cuando el tamaño de la muestra
es pequeño, cuando la desviación típica de una población se desconoce y debe ser estimada
a partir de los datos de una muestra.

Distribución Beta
En estadística la distribución beta es una distribución de probabilidad continua con dos
parámetros a y b
cuya función de densidad para valores 0 < x < 1 es

Aquí Γ es la función gamma.

El valor esperado y la varianza de una variable aleatoria X con distribución beta son

Página 35
.

Un caso especial de la distribución Beta con a = 1 y b = 1 es la probabilidad uniforme.

Para relacionar con la muestra se iguala E[X] a la media y V[X] a la varianza y de despejan a
y b.

Aplicaciones
Algunas áreas, en las que se emplea la distribución beta como modelo de probabilidad
incluyen la distribución de artículos defectuosos sobre un intervalo de tiempo específico; la
distribución del intervalo de tiempo necesario para completar una fase de proyecto PERT,
evaluación de programas y técnicas de revisión; la distribución de la proporción de los
valores que deben caer entre dos observaciones extremas. La esencia de esta última área
tiene relación con los límites estadísticos de tolerancia. Estos límites son muy importantes,
especialmente en el control estadístico de calidad donde el control de variabilidad de un
producto es esencial. Este control, en general, se lleva a cabo mediante la medición de
algunas propiedades del producto o determinando los ajustes que deben hacerse al proceso
de producción para mejorar la calidad del producto. Los límites estadísticos de tolerancia no
son iguales a las tolerancias físicas o especificaciones límite. Éstos son conjuntos de criterios
diseñados para un proceso de producción en particular y que se espera que todas las
unidades cumplan.

Conclusión
La distribución beta es una distribución que permite generar una gran variedad de perfiles.
Se ha utilizado para representar variables físicas cuyos valores de encuentran restringidos a
un intervalo de longitud finita y para encontrar ciertas cantidades que se conocen como
límites de tolerancia sin necesidad de la hipótesis de una distribución normal. Además, la
distribución beta juega un gran papel en la estadística bayesiana.

Distribución ji-cuadrada
En estadística, la distribución ji-cuadrado, también denominada ji-cuadrado de Pearson, es
una distribución de probabilidad continua con un parámetro k que representa los grados de
libertad de la variable aleatoria:

donde Zi son variables de distribución normal, de media cero y varianza uno.

Esta distribución se expresa habitualmente
Donde el subíndice k de , es le número de sumandos, se denomina grados de libertad de
la distribución.
Se suele usar la denominada prueba ji-cuadrado como test de independencia y como test de
bondad de ajuste.

Página 36
Función de densidad
La función de densidad ji-cuadrado es:

donde y para .
Γ es la función gamma.

Función de distribución
La función de distribución es

donde es la función gamma incompleta.

El valor esperado y la varianza de una variable aleatoria X con distribución chi-cuadrada son

Aplicaciones
La distribución ji-cuadrado tiene muchas aplicaciones en inferencia estadística, por ejemplo
en el test ji-cuadrado y en la estimación de varianzas. También está involucrada en el
problema de estimar la media de una población normalmente distribuida y en el problema
de estimar la pendiente de una recta de regresión lineal, a través de su papel en la
distribución t de Student, y participa en todos los problemas de análisis de varianza, por su
papel en la distribución F de Snedecor, que es la distribución del cociente de dos variables
aleatorias de distribución ji-cuadrado e independientes.

Relación con otras distribuciones

La ji cuadrado es una distribución binomial inversa cuyo coeficiente de variabilidad es 10.1,
esta tiene un intervalo de confianza de 2.3 grados en la escala de desviaciones estandar.
Posee una distribución de Poisson elevada la cual asciende a 56.5 m Eq en los tres primeros
cuartiles de la recta.
Para k = 2 la distribución es una distribución exponencial de media k = 2.
Cuando k es suficientemente grande se aproxima por la distribución normal:

Conclusión

La distribución ji-cuadrada es la distribución muestral de s2. O sea que si se extraen todas las
muestras posibles de una población normal y a cada muestra se le calcula su varianza, se
obtendrá la distribución muestral de varianzas.

Página 37
Distribución F
Usada en teoría de probabilidad y estadística, la distribución F es una distribución de
probabilidad continua. También se la conoce como distribución F de Snedecor o como
distribución F de Fisher-Snedecor.
Una variable aleatoria de distribución F se construye como el siguiente cociente:

donde
U1 y U2 siguen una distribución ji-cuadrada con d1 y d2 grados de libertad respectivamente, y
U1 y U2 son estadísticamente independientes.
La distribución F aparece frecuentemente como la distribución nula de una prueba
estadística, especialmente en el análisis de varianza. Véase el test F.
La función de densidad de una F(d1, d2) viene dada por

para todo número real x ≥ 0, donde d1 y d2 son enteros positivos, y B es la distribución beta.

La función de distribución es

donde I es la función beta incompleta regularizada.

Distribuciones relacionadas
es una distribución ji-cuadrada cuando para .

Conclusión
La distribución F tiene una apariencia muy similar a la distribución ji-cuadrada; sin
embargo, se encuentra centrada respecto a 1, y los dos parámetros proporcionan una
flexibilidad adicional con respecto a la forma de la distribución

Página 38
PRUEBAS DE BONDAD DE AJUSTE

Una hipótesis estadística se definió como una afirmación o conjetura acerca de la

distribución f(x,θ) de una o más variables aleatorias. Igualmente se planteó que la
distribución podía tener uno o más parámetros desconocidos, que denotamos por θ y que la
hipótesis se relaciona con este parámetro o conjunto de parámetros En otros casos, se
desconoce por completo la forma de la distribución y la hipótesis entonces se relaciona con
una distribución específica f(x,θ) que podamos asignarle al conjunto de datos de la muestra.
El primer problema, relacionado con los parámetros de una distribución conocida o
supuesta es el problema que hemos analizado en los párrafos anteriores. Ahora
examinaremos el problema de verificar si el conjunto de datos se puede ajustar o afirmar que
proviene de una determinada distribución. Las pruebas estadísticas que tratan este
problema reciben el nombre general de "Pruebas de Bondad de Ajuste".
Se analizarán dos pruebas básicas que pueden aplicarse: La prueba Chi - Cuadrado y la
prueba de Smirnov-Kolmogorov. Ambas pruebas caen en la categoría de lo que en
estadística se denominan pruebas de "Bondad de Ajuste" y miden, como el nombre lo indica,
el grado de ajuste que existe entre la distribución obtenida a partir de la muestra y la
distribución teórica que se supone debe seguir esa muestra. Ambas pruebas están basadas en
la hipótesis nula de que no hay diferencias significativas entre la distribución muestral y la
teórica. Ambas pruebas están basadas en las siguientes hipótesis:
H0: f(x,θ) = f0(x,θ)
H1: f(x,θ) ≠ f0(x,θ)

donde f0(x,θ) es la distribución que se supone sigue la muestra aleatoria.

La hipótesis alternativa siempre se enuncia como que los datos no siguen la distribución
supuesta. Si se desea examinar otra distribución específica, deberá realizarse de nuevo la
otra prueba suponiendo que la hipótesis nula es esta nueva distribución. Al especificar la
hipótesis nula, el conjunto de parámetros definidos por θ puede ser conocido o desconocido.
En caso de que los parámetros sean desconocidos, es necesario estimarlos mediante alguno
de los métodos de estimación analizados con anterioridad.

Para formular la hipótesis nula deberán tenerse en cuenta los siguientes aspectos o criterios:
a) La naturaleza de los datos a analizar. Por ejemplo, si tratamos de investigar la
distribución que siguen los tiempos de falla de unos componentes, podríamos pensar
en una distribución exponencial, o una distribución gama o una distribución
Weibull, pero en principio no consideraríamos una distribución normal. Si estamos
analizando los caudales de un río en un determinado sitio, podríamos pensar en una
distribución logarítmica normal, pero no en una distribución normal.
b)
b) Histograma. La forma que tome el histograma de frecuencia es quizás la mejor
indicación del tipo de distribución a considerar.

Página 39
Prueba Chi Cuadrado (ji dos)
Esta prueba se usa cuando se quiere probar la hipótesis de que unos datos muestrales
provienen de una determinada distribución.
La prueba chi cuadrado se basa en la comparación entre la frecuencia observada en un
intervalo de clase y la frecuencia esperada en dicho intervalo, calculada de acuerdo con la
hipótesis nula formulada. Es decir, se quiere determinar si las frecuencias observadas en la
muestra están lo suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula.
Para esta prueba es necesario agrupar o distribuir las observaciones de la muestra en
intervalos de clase, preferiblemente del mismo tamaño. El estadístico de prueba está
definido como:

donde: Oi = Total de valores que caen en el intervalo i.

Ei = Número esperado de valores en el intervalo i.
k = Número de intervalos de clase en que se distribuyen las observaciones.

Si los límites del intervalo de clase i están dados por Xi-1 y Xi, como lo ilustra la presente
gráfica, el número esperado de observaciones para ese intervalo está dado por:

Ei =nPi
donde Pi representa la probabilidad de que una observación quede en el intervalo i, de
acuerdo con función de densidad que se esté analizando, y n es el número total de
observaciones.
La probabilidad de que una observación caiga en el intervalo i está dada por:

siendo f0(x,θ) la función de densidad de la variable aleatoria X, bajo la hipótesis nula.

Para ver que distribución sigue el estadístico X², considere la siguiente situación:
Suponga que las observaciones de la muestra pueden clasificarse en dos intervalos o
categorías. Sea Y1 el número de observaciones que caen en la categoría 1, y sea P1 su
respectiva probabilidad.

Si el tamaño de muestra es lo suficientemente grande, Y1 (que sigue una distribución

binomial) puede aproximarse por una distribución normal con valor esperado nP1 y varianza
nP1(1-P1). Por lo tanto, la variable Z definida a continuación sigue una distribución normal
estándar, y Z² una distribución chi cuadrado con un grado de libertad.

Página 40
Si definimos Y2 como Y2 = n - Y1, y P2 = 1 - P1, se tiene que Z² se puede desagregar de la
siguiente manera:

Ahora suponga que las observaciones pueden clasificarse no en dos sino en k clasificaciones
mutuamente excluyentes, y sean Yi y Pi el número de variables que caen en la categoría i y la
probabilidad respectiva. La distribución conjunta de Y1, Y2,...,Yk tiene una distribución
multinomial con parámetros n, P1, P2,... y Pn, donde Pk = 1 - P1 - P2 -... -Pk-1. Se puede
demostrar que la variable Z2 definida a continuación sigue una distribución chi cuadrado
con k-1 grados de libertad:

Comparando la expresión anterior con el estadístico X² definido previamente, vemos que

este estadístico sigue también la distribución chi cuadrado con k - 1 - p grados de libertad,
siendo p el número de parámetros estimados para definir completamente la función f0(x,θ).
Sin embargo para que esta suposición sea válida se requiere que el número esperado de
observaciones en cada intervalo de clase sea por lo menos 5 (Ei ≥ 5). Si esta condición no se
cumple, es necesario agrupar en uno los resultados de varios intervalos de clase.

Según lo anterior se acepta la hipótesis nula si X² ≤ , donde el valor

representa el valor de la distribución chi cuadrado con k-1-p grados de libertad y un

nivel de significancia de α (es el valor de distribución chi cuadrado que tiene un área de a a
su derecha).
Algunas consideraciones que hay que tener en cuenta con respecto a la aplicación de esta
prueba son las siguientes:
1) El número de intervalos de clase debe ser por lo menos cinco. Para facilidad de los
cálculos y la identificación de la posible distribución tampoco debería ser muy grande ( k ≤
20).
2) El número esperado de observaciones en cada intervalo debe ser mayor o igual a cinco; en
caso contrario, deberían agruparse varios intervalos para lograr esto.
3) Al realizar los cálculos para Pi hay que tener en cuenta los intervalos extremos como casos
especiales, a saber:
· Cálculo de P1. Aunque el primer intervalo incluye aquellos valores observados que están
ente X0 y X1, sólo corresponde a los resultados de una muestra. El hecho de que no se hayan
observado en la muestra valores menores o iguales que x0 no implica que en la pobla ción de
donde se toma la muestra no se puedan presentar valores menores o iguales que x0. Por lo
tanto, el cálculo de P1 corresponde a la probabilidad de que la variable aleatoria sea menor o
igual que X1, y no únicamente entre X0 y X1. Es decir,

· Cálculo de Pn. De manera similar, el último intervalo corresponde no sólo a los valores que
están entre Xk-1 y Xk, sino que comprende también los valores de la población que sean
mayores que Xk, así éstos no se hayan presentado en la muestra. Por lo tanto, Pk se calcula
como:

Página 41
Ejemplo. A un grupo de 80 empleados se les ha aplicado una prueba de habilidad espacial.
En una graduación de 0 a 100 han obtenido las puntuaciones dadas en la tabla siguiente. Se
pide verificar la hipótesis de que los puntajes se pueden ajustar a una distribución normal.

Solución. A continuación se hace el desarrollo completo de la prueba de bondad de ajuste,

partiendo de distribución de los datos en intervalos de frecuencia y la construcción del
histograma.
· La muestra tiene un puntaje promedio de 55.8 y una desviación estándar de 18.6 puntos.
· El puntaje mínimo fue de 14 y el máximo de 93.
· La amplitud o rango está dado por Rango = R = Rango = Xmax - Xmin = 93 - 14 = 79
· El número de intervalos de clase, calculado usando la fórmula de Sturgess, está dado por:
k = 1 +3.32 Log10 (80) = 7.32 ≈ 8

· La amplitud o ancho del intervalo está dado por = ≈ 10

La distribución de frecuencia muestra que los puntajes se pueden aproximar
razonablemente bien por una distribución normal. Por lo tanto la hipótesis formuladas son:

Página 42
H0: f(x,θ) = N(µ, σ²),
H1: f(x,θ) ≠ N(µ, σ²),

La tabla siguiente presenta los valores distribuidos en los intervalos de clase y la frecuencia
absoluta de cada intervalo, correspondiente al número de observaciones que caen en él.
Igualmente se presentan en la tabla los cálculos necesarios para realizar la prueba chi
cuadrado.
Los principales cálculos se resumen a continuación:
En general Pi, la probabilidad de que una observación quede en el intervalo i está dada por:

Como la variable aleatoria X se distribuye normalmente (µ, σ²), entonces Pi puede

expresarse como:

donde j(zi-1) y j (zi) son las probabilidades de que la variable aleatoria normal estándar Z sea
menor o igual a zi-1 y zi, respectivamente.
Al realizar los cálculos para Pi se tuvieron en cuenta los intervalos extremos como casos
especiales, a saber:
· Cálculo de P1. El cálculo de P1 corresponde a la probabilidad de que la variable aleatoria sea
menor o igual que X1, (igual a 24). Es decir,

· Cálculo de P8. El último intervalo corresponde a los valores de la población que sean
mayores que xn (84 en nuestro caso). Por lo tanto, P8 se calcula como:

· Para los demás valores Pi se calculó como: Pi = F(Xi) - F(Xi-1) = ϕ(zi)- ϕ(zi-1)

Página 43
El valor chi cuadrado calculado es X² = 1.46. El valor crítico con un nivel de significancia del
5% y 7 grados de libertad es 14.07. Por lo tanto, se concluye que no hay evidencia para
rechazar la hipótesis de que el puntaje obtenido en la prueba de habilidad se puede
representar mediante una distribución normal con un puntaje medio de 55.8 puntos, y una
desviación estándar de 18.6 puntos.
Ejemplo. Para verificar un generador congruencial de número aleatorios se generó una
secuencia de 100 números, los cuales se distribuyeron en 10 intervalos de clase igualmente
espaciados, y que se presentan en la tabla siguiente. Se desea probar, mediante la prueba chi
cuadrado, la hipótesis de que los números generados se distribuyen uniformemente entre 0
y 1. Use un nivel de confianza del 1%.

Las hipótesis a plantear son las siguientes:

H0: f(x,θ) = U(0,1) = 1
H1: f(x,θ) ≠ U(0,1)

La figura de la página siguiente nos muestra el histograma de frecuencia respectivo.

La probabilidad de que una observación caiga en el intervalo i está dada por:

donde f0(x,θ) = 1 ya que se trata de la distribución uniforme (0,1).

En nuestro caso, tratándose de la distribución uniforme y para k intervalos de clase
igualmente espaciados, la probabilidad de que una observación quede en el intervalo i está
dada por:
Pi = 1/k = 1/10 = 0.10, i = 1, 2 ,,, k
Entonces el número esperado de valores en cada intervalo está dado por:
Ei = pi N = N/k = 100/10 = 10, i = 1, 2 ,,, k

Página 44
Prueba de uniformidad Chi Cuadrado

El estadístico de prueba X² = 9.6 y el valor crítico = 21.7 para un nivel de

significancia del 1%, lo cual nos lleva a aceptar la hipótesis de que los valores generados
provienen de una distribución uniforme. El valor P sería de 0.38.
Ejemplo. La tabla siguiente presenta la distribución de frecuencia del número de defectos
encontrados en el análisis de los últimos 200 artículos producidos en un proceso de
producción. Usando un nivel de confianza del 5% se desea verificar mediante una prueba chi
cuadrado si dichos valores proceden de una distribución de Poisson con una media de3.5
defectos por artículo.

Solución. Las hipótesis planteadas son las siguientes:

Página 45
H0: f(x,λ) = Poisson (λ = 3.5)
H1: f(x, λ) ≠ Poisson (λ = 3.5)

La tabla siguiente presenta los cálculos requeridos para realizar la prueba de bondad de
ajuste. Para el cálculo de f(x,λ) que es una distribución de Poisson se usó la siguiente
relación:

Solución. El estadístico de prueba X² = 20.0 y el valor crítico = 14.07 para un

nivel de significancia del 5%, lo cual nos lleva a rechazar la hipótesis de que el número de
defectos del proceso sigue una distribución de Poisson con una media de 3.5 defectos por
artículo.

El número medio de defectos observados en la muestra está dado por:

Podría pensarse que el número de defectos en el proceso sí sigue una distribución de

Poisson, pero con un parámetro diferente de 3.5, posiblemente 3.0. (Verifique que si se
plantea como hipótesis nula H0: f(x,λ) = Poisson (λ = 3.0) el estadístico de prueba es 2.6 y en
este caso no se rechaza la hipótesis nula.

Página 46
Prueba de Smirnov - Kolmogorov (S-K)
En esta prueba también se está interesado en el grado de concordancia entre la distribución
de frecuencia muestral y la distribución de frecuencia teórica, bajo la hipótesis nula de que
la distribución de la muestra es f0(x,θ) e interesa probar que no existe diferencia
significativa. La prueba trabaja con la función de distribución ( distribución de frecuencia
acumulativa). Esta prueba pertenece al campo de la Estadística No Paramétrica.
Sea F0(x) la función de distribución teórica para la variable aleatoria X, y representa la
probabilidad de que la variable aleatoria X tome un valor menor o igual a x (también se
interpreta como la proporción esperada de observaciones que tengan un valor menor o igual
a x). Es decir:

Sea Sn (x) la función de distribución empírica, calculada con base en los valores observados
de la muestra n observaciones. Sn (x) representa la proporción de valores observados que son
menores o iguales a x, y está definida como:
Sn (x) = P ( X ≤ x/ dados los resultados muestrales) = m/n
donde m es el número de valores observados que son menores o iguales a x.
En la prueba de Smirnov-Kolmogorov se está interesado en la mayor desviación entre la
función de distribución teórica y la empírica, es decir entre F0 (x) y Sn(x), para todo el rango
de valores de x. Bajo la hipótesis nula se espera que estas desviaciones sean pequeñas y estén
dentro de los límites de errores aleatorios. Por lo tanto, en la prueba S-K se calcula la mayor
desviación existente entre F0 (x) y Sn(x), denotada por Dmax(x) y está dada por:
Dmax(x) = Max | FX (x) - Sn (x) |
La distribución de Dmax(x) es conocida y depende del número de observaciones n. Se acepta
la hipótesis nula de que no existe diferencia significativa entre las distribuciones teóricas y
empíricas si el valor de Dmax(x) es menor o igual que el valor crítico Dmaxp(α,n). (Ver tabla
adjunta para valores críticos).
Esta prueba se puede realizar para valores agrupados en intervalos de clase y también para
valores sin agrupar.

Página 47
Tabla tomada parcialmente del libro "Simulation and Analysis of Industrial Systems", de
Schmidt y Taylor.

El procedimiento general para realizar esta prueba para valores agrupados en intervalos de
clase es el siguiente:
1) Especificar la distribución nula es f0(x,θ), y estimar sus parámetros si es necesario.
2) Organizar la muestra en una distribución de frecuencia, en intervalos de clase.
3) Con base en la distribución observada de frecuencia, se calcula la distribución
acumulativa Sn(Xi) = mi/n, siendo Xi el límite superior del intervalo de clase, y mi el número
de valores de la muestra menores o iguales que Xi. Sn(Xi) corresponde simplemente a la
frecuencia relativa acumulada hasta el intervalo i.
4) Se calcula la función de distribución teórica F0Xi).
5) Para cada intervalo de clase se calcula la diferencia entre F0 (Xi ) y Sn (Xi), y se busca la
máxima Dmax = Max | FX (Xi) - Sn (Xi), i = 1, 2, ..., k.
6) Se busca en la tabla el valor crítico Dmaxp(α,n) con el nivel de significancia α. Si el valor
observado Dmax es menor o igual que el valor crítico, entonces se acepta la hipótesis nula de
que no existen diferencias significativas entre la distribución teórica y la distribución dada
por los resultados muestrales, es decir, que los valores generados siguen la distribución que
se había supuesto.

Página 48
Cuando la muestra es pequeña y/o los valores no se van a organizar en intervalos de clase el
procedimiento es similar, sólo que el paso 2 se cambia por "ordenar los valores de la
muestra" en forma ascendente, de menor a mayor", y en los pasos 3 y 4 se calculan las
funciones de distribución teórica y empírica para cada valor de la muestra.
Ejemplo. Considere de nuevo el ejemplo de la prueba de habilidad aplicada a un grupo de
80empleados. Mediante la prueba de Smirnov Kolomogorov. Con un nivel de significancia
del 5%, pruebe la hipótesis de que los puntajes obtenidos siguen una distribución normal.
Solución. De la tabla construida para realizar la prueba chi cuadrado tomaremos la
información pertinente y la complementaremos con la información faltante, relativa al
cálculo de Sn(Xi). Los cálculos se muestran a continuación.

El valor crítico para n = 80 valores y un nivel de significancia del 5% es Dmaxp(0.05,80) = 1.36/

= 0.152. Como la diferencia máxima observada fue de 0.0236 no hay razón para dudar
que los puntajes se puedan aproximar mediante una distribución normal.

Ejemplo: Prueba de Smirnov - Kolmogorov - Valores agrupados. En la tabla siguiente se

presentan los cálculos para realizar la prueba S-K para la muestra de 100 números aleatorios
generados mediante un generador congruencial multiplicativo con a = 899, C = 0 y M =
32768, usados para la prueba chi cuadrado.

Página 49
La diferencia máxima observada es Dmax(x) = 0.09 y el valor crítico para un nivel de
significancia del 1% es de 1.63/ = .163. Como Dmax(x) < D(0.01,100) no podemos rechazar
la hipótesis nula y debemos concluir que la muestra tomada del generador de números
aleatorios proviene de una distribución uniforme (0,1).
Ejemplo. Prueba de Smirnov - Kolmogorov - Valores individuales. Para realizar la prueba de
S-K no se requiere que las observaciones estén distribuidas en intervalos de clase, sino que
puede realizarse sin agrupar los valores en intervalos de clase, principalmente cuando el
tamaño de la muestra es pequeño. En este caso es necesario ordenar los valores en forma
ascendente, de menor a mayor, y calcular, para cada valor observado las distribuciones
teóricas F0(Xi) y empíricas Sn(Xi) en la forma como se explicó anteriormente. En la tabla
siguiente se presenta la prueba para los primeros 20 números aleatorios generados mediante
el generador congruencial multiplicativo mencionado anteriormente. La diferencia máxima
observada es 0.123 y la máxima permitida es 0.294 para 20 valores y un nivel de significancia
del 5%, lo cual lleva a la conclusión de que no existe evidencia de que las observaciones no
se distribuyan uniformemente en el intervalo (0,1).. Recordemos que F0(Xi) = Xi para la
distribución uniforme (0,1)

Prueba de Smirnov - Kolmogorov - Valores individuales

Propiedades de la prueba de Smirnov Kolmogorov

· La prueba de Smirnov - Kolmogorov puede aplicarse para tamaños de muestra pequeños, lo
que no sucede con la chi cuadrado.
· Además, la prueba S-K es más poderosa que la Ji dos, es decir, cuando se rechaza la
hipótesis nula, se tiene una mayor confiabilidad en dicho resultado.
· La prueba S-K debe usarse cuando la variable de análisis es continua. Sin embargo, si la
prueba se usa cuando la distribución de la población no es continua, el error que ocurre en
la probabilidad resultante está en la dirección segura. Es decir, cuando se rechaza la
hipótesis nula, tenemos verdadera confianza en la decisión.

Gráficos de Probabilidad Normal

Es una prueba gráfica que nos permite verificar si una muestra proviene de una distribución
normal. La prueba está basada en las calificaciones normales de los valores de la muestra, y
se basa en el principio usado para graficar en el papel probabilístico normal. Si una muestra
proviene de una distribución normal, al ordenar la muestra y graficar en un papel
probabilístico normal las probabilidades acumuladas empíricas, obtenidas de la muestra, la
gráfica resultante debe ser una línea recta. Por lo tanto, para realizar la prueba, se debe
obtener inicialmente la función de distribución empírica.

Página 50
Sea (X1, X2,…Xn) la muestra aleatoria. Los pasos a seguir serán los siguientes.
1) Se ordenan los valores de la muestra de menor a mayor. Sea X(1), X(2),…, X(n) la muestra
ordenada.

2) Se denomina "rango de Xi " a la posición en que queda el valor Xi al ordenar la muestra de

menor a mayor. Si consideramos los valores ya ordenados, el rango de X(i) será simplemente
i, ya que (i) denota la i-ésima posición al ordenar la muestra.

3) Sea

Pi corresponde, aproximadamente, a la probabilidad empírica del valor X(i).

4) Se define como "Calificación normal" al valor de Z en la distribución normal que tiene una
probabilidad acumulada de Pi, es decir, Zi = ϕ (-1) (Pi). Pi recibe el nombre de Pi ésimo fractil
de la distribución normal. La relación entre las calificaciones normales Zi y los X(i) debe ser
aproximadamente lineal, si la muestra proviene efectivamente de una distribución normal.
Por lo tanto, la correlación entre X(i) y los Zi debe ser aproximadamente 1 para muestras
grandes. X(i) podría expresarse como:
X(i) = a + bZi +ei

donde el parámetro "a" corresponde a la media de la población, "b" a la desviación estándar

y ei al error en el ajuste de los valores.
La gráfica X(i) vs Zi recibe el nombre de gráfica Cuantil Cuantil normal.
Considere la siguiente muestra. Verifique gráficamente si proviene de una distribución
normal

La tabla siguiente presenta los valores de la muestra ordenados de menor a mayor, el rango
de cada valor, y las respectivas calificaciones normales (Zi).

Página 51
Como puede observarse, la relación entre los datos es aproximadamente lineal, lo cual indica
que la muestra puede provenir de una distribución normal. El coeficiente de correlación
entre los Pi y los Zi es 0.9785

Como un segundo ejemplo considere la siguiente muestra.

A continuación se presenta la gráfica de probabilidad normal. Como puede observarse los

datos difieren bastante de una línea recta, lo cual indica que los valores no provienen de una
distribución normal

Conclusión
La prueba de K-S es aplicable solamente a variables aleatorias continuas comparar la gráfica
de la distribución empírica acumulada con la correspondiente gráfica de la función de
densidad acumulada de la distribución teórica propuesta. Si hay un acercamiento entre las
gráficas existe una probabilidad de que la distribución teórica se ajusta a los datos.

Página 52

Common questions

Con tecnología de IA