Está en la página 1de 18

INSTITUTO TECNOLÓGICO

SUPERIOR DE TAMAZUNCHALE
UNIDAD 4
Investigación de los temas de la
unidad
ALUMNOS:
JONATHAN ELI HERNÁNDEZ LÓPEZ.......22ISC063
YOAV ZURIEL PÉREZ HERNÁNDEZ.........22ISC042
JESÚS ALEJANDRO PLAISANT GARCÍA...22ISC010
KEVIN URIEL RIVERA LÓPEZ..................22ISC062
AULA: E3
TURNO: MATUTINO
SEMESTRE: 2º
GRUPO: M3
MATERIA: PROBABILIDAD Y ESTADISTICA
DOCENTE: ING. SUSANA GONZALEZ ZAMUDIO
CARRERA: ING.EN SISTEMAS COMPUTACIONALES
FECHA: 03/04/2023
INTRODUCCIÓN
La presente investigación de la unidad 4 se realizó por el interés de conocer más sobre
las distribuciones de probabilidad las cuales son herramientas fundamentales para
poder modelar eventos aleatorios en estadística y análisis de datos. En el estudio de la
probabilidad, es importante comprender la función de probabilidad, que describe la
probabilidad de que ocurra un evento aleatorio. Además, hay varias distribuciones de
probabilidad que se utilizan habitualmente en estadística algunas de estas son, la
distribución binomial, la distribución hipergeométrica, la distribución de Poisson, la
distribución normal, la distribución T-student, la distribución Chi cuadrada y la
distribución. Todos estos temas son importantes de conocer ya que la aplicación de
estas distribuciones de probabilidad es fundamental para la toma de decisiones y la
inferencia estadística precisa en una amplia variedad de campos, como la ingeniería, la
medicina, la física, la biología, la economía, etc
4.1 FUNCION DE LA PROBABILIDAD
En teoría de la probabilidad, una función de probabilidad (también
denominada función de masa de probabilidad) es una función que asocia a cada punto
de su espacio muestral X la probabilidad de que ésta lo asuma.

La gráfica de una función de probabilidad de masa, note que todos los valores
no son negativos, y la suma de ellos es igual a 1.

La función de masa de probabilidad de un Dado. Todos los números tienen la


misma probabilidad de aparecer cuando este es tirado.

En concreto, si el espacio muestral, E de la variable aleatoria X consta de los

puntos x1, x2,..., xk, la función de probabilidad P asociada a X es donde


pi es la probabilidad del suceso X = xi.
Por definición de probabilidad,

Hay que advertir que el concepto de función de probabilidad sólo tiene sentido
para variables aleatorias que toman un conjunto discreto de valores. Para variables
aleatorias continuas el concepto análogo es el de función de densidad.

4.2 DISTRIBUCION BINOMIAL

Una función de densidad de probabilidad más valiosa con muchas aplicaciones es la


distribución binomial. Esta distribución calculará las probabilidades de cualquier proceso
binomial. Un proceso binomial, a menudo llamado proceso de Bernoulli en honor a la
primera persona que desarrolló plenamente sus propiedades, es cualquier caso en el
que solo hay dos resultados posibles en cualquier ensayo, llamados éxitos y fracasos.
Recibe su nombre del sistema numérico binario, en el que todos los números se reducen
a 1 o 0, que es la base de la tecnología informática y de las grabaciones musicales en
CD.

Fórmula binomial

b(x)=(nx)pxqn–x�(�)=������–�
donde b(x) es la probabilidad de X aciertos en n ensayos cuando la probabilidad de un
éxito en CUALQUIER ENSAYO es p. Y, por supuesto, q=(1-p) y es la probabilidad de un
fracaso en cualquier ensayo.

Ahora podemos ver por qué la fórmula combinatoria se llama también coeficiente
binomial, ya que vuelve a aparecer aquí en la función de probabilidad binomial. Para que
la fórmula binomial funcione, la probabilidad de éxito en cualquier ensayo debe ser la
misma de un ensayo a otro, o en otras palabras, los resultados de cada ensayo deben
ser independientes. Lanzar una moneda es un proceso binomial porque la probabilidad
de obtener una cara en un lanzamiento no depende de lo que haya ocurrido en los
lanzamientos anteriores. (En este momento hay que señalar que utilizar p para el
parámetro de la distribución binomial es una violación de la regla de que los parámetros
de la población se designan con letras griegas. En muchos libros de texto se utiliza θ
(pronunciado theta) en lugar de p y así es como debe ser.

Al igual que un conjunto de datos, una función de densidad de probabilidad tiene una
media y una desviación típica que describe el conjunto de datos. Para la distribución
binomial vienen dadas por las fórmulas:

μ=npμ=np

σ=npq−−−√�=���

Observe que p es el único parámetro en estas ecuaciones. La distribución binomial se


considera, pues, de la familia de las distribuciones de probabilidad de un parámetro. En
resumen, sabemos todo lo que hay que saber sobre la binomial una vez que conocemos
p, la probabilidad de éxito en cualquier ensayo.
4.3 DISTRIBUCION HIPERGEOMETRICA

En teoría de la probabilidad la distribución hipergeométrica es una


distribución discreta relacionada con muestreos aleatorios y sin reemplazo.

Supóngase que se tiene una población de N elementos de los cuales, d


pertenecen a la categoría A y N-d a la B. La distribución hipergeométrica mide la
probabilidad de obtener x (0 ≤ x ≤ d) elementos de la categoría A en una muestra den
elementos de la población original.

Propiedades:

La función de probabilidad de una variable aleatoria con distribución


hipergeométrica puede deducirse a través de razonamientos combinatorios y es igual
a:

donde es el tamaño de población, es el tamaño de la muestra extraída, es el número


de elementos en la población original que pertenecen a la categoría deseada y e s el
número de elementos en la muestra que pertenecen a dicha categoría. La notación
hace referencia al coeficiente binomial, es decir, el número de combinaciones
posibles al seleccionar elementos de un total.

El valor esperado de una variable aleatoria X que sigue la distribución


hipergeométrica es:

Y su varianza:
4.4 DISTRIBUCION DE POISSON

Otra distribución de probabilidad útil es la distribución de Poisson o distribución del


tiempo de espera. Esta distribución se utiliza para determinar cuántos empleados de caja
son necesarios para mantener el tiempo de espera en la fila a niveles especificados,
cuántas líneas telefónicas son necesarias para evitar que el sistema se sobrecargue, y
muchas otras aplicaciones prácticas. Una modificación de la distribución de Poisson, la
Pascal, inventada hace casi cuatro siglos, es utilizada hoy en día por las compañías de
telecomunicaciones de todo el mundo para los factores de carga, los niveles de conexión
de los satélites y los problemas de capacidad de internet. La distribución recibe su
nombre de Simeón Poisson, que la presentó en 1837 como una extensión de la
distribución binomial, que veremos que se puede estimar con la Poisson.

Notación para el Poisson: P = Función de distribución de probabilidad


de Poisson

X ~ P(μ)
Se lee como “X es una variable aleatoria con una distribución de Poisson”. El parámetro
es μ (o λ); μ (o λ) = la media del intervalo de interés. La media es el número de
ocurrencias que se producen por término promedio durante el periodo del intervalo.
La fórmula para calcular las probabilidades que provienen de un proceso de Poisson es:

P(x)=μxe–μx!�(�)=���–��!

donde P(X) es la probabilidad de X aciertos, μ es el número esperado de aciertos basado


en datos históricos, e es el logaritmo natural aproximadamente igual a 2,718, y X es el
número de aciertos por unidad, normalmente por unidad de tiempo.
Para utilizar la distribución de Poisson, deben cumplirse ciertos supuestos. Estos son: la
probabilidad de un éxito, μ, no cambia dentro del intervalo, no puede haber éxitos
simultáneos dentro del intervalo y, por último, que la probabilidad de un éxito entre
intervalos es independiente, el mismo supuesto de la distribución binomial.
En cierto modo, la distribución de Poisson puede considerarse una forma inteligente de
convertir una variable aleatoria continua, normalmente el tiempo, en una variable
aleatoria discreta al dividir el tiempo en intervalos independientes discretos. Esta forma
de pensar en la Poisson nos ayuda a entender por qué se puede utilizar para estimar la
probabilidad de la variable aleatoria discreta de la distribución binomial. La Poisson pide
la probabilidad de un número de aciertos durante un periodo mientras que la binomial
pide la probabilidad de un número determinado de aciertos para un número dado de
ensayos.
4.5 DISTRIBUCION NORMAL

En estadística y probabilidad se llama distribución normal, distribución de


Gauss o distribución gaussiana, a una de las distribuciones de
probabilidad de variable continua que con más frecuencia aparece aproximada en
fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica
respecto de un determinado parámetro estadístico. Esta curva se conoce como campana
de Gauss y es el gráfico de una función gaussiana.
La importancia de esta distribución radica en que permite modelar numerosos
fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que
subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme
cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal
puede justificarse asumiendo que cada observación se obtiene como la suma de unas
pocas causas independientes.
De hecho, la estadística es un modelo matemático que sólo permite describir un
fenómeno, sin explicación alguna. Para la explicación causal es preciso el diseño
experimental, de ahí que al uso de la estadística en psicología y sociología sea conocido
como método correlacional.
La distribución normal también es importante por su relación con la estimación
por mínimos cuadrados, uno de los métodos de estimación más simples y antiguos.
Algunos ejemplos de variables asociadas a fenómenos naturales que siguen el modelo
de la normal son:
• caracteres morfológicos de individuos como la estatura;
• caracteres fisiológicos como el efecto de un fármaco;
• caracteres sociológicos como el consumo de cierto producto por un mismo
grupo de individuos;
• caracteres psicológicos como el cociente intelectual;
• nivel de ruido en telecomunicaciones;
• errores cometidos al medir ciertas magnitudes;
• etc.
La distribución normal también aparece en muchas áreas de la propia estadística. Por
ejemplo, la distribución muestral de las medias muestrales es aproximadamente normal,
cuando la distribución de la población de la cual se extrae la muestra no es
normal. Además, la distribución normal maximiza la entropía entre todas las
distribuciones con media y varianza conocidas, lo cual la convierte en la elección natural
de la distribución subyacente a una lista de datos resumidos en términos de media
muestral y varianza. La distribución normal es la más extendida en estadística y muchos
tests estadísticos están basados en una supuesta "normalidad".
En probabilidad, la distribución normal aparece como el límite de varias distribuciones de
probabilidad continuas y discretas.
4.6 DISTRIBUCIÓN T DE STUDENT

Descrita por William S. Gosset en 1908. Publicaba bajo el pseudónimo de “Student”


mientras trabajaba para la cervecería Guinnes en Irlanda. Está diseñada para probar
hipótesis en estudios con muestras pequeñas (menores de 30)

La fórmula general para la T de Student es la siguiente:

En donde el numerador representa la diferencia a probar y el denominador la desviación


estándar de la diferencia llamado también Error Estándar. En esta fórmula t representa
al valor estadístico que estamos buscando X barra es el promedio de la variable
analizada de la muestra, y miu es el promedio poblacional de la variable a estudiar. En
el denominador tenemos a s como representativo de la desviación estándar de la
muestra y n el tamaño de ésta.

Grados de libertad: El número de grados de libertad es igual al tamaño de la muestra


(número de observaciones independientes) menos 1.

gl = df = (n – 1)

Si pudiera expresar en un cierto número de pasos para resolver un problema de t de


student tendría que declarar los siguientes:

Paso 1. Plantear las hipótesis nula (H0) y la hipótesis alternativa (H1). La hipótesis
alternativa plantea matemáticamente lo que queremos demostrar, en tanto que la
hipótesis nula plantea exactamente lo contrario.

Paso 2. Determinar el nivel de significancia (rango de aceptación de la hipótesis


alternativa), a .
Se considera un nivel alfa de: 0.05 para proyectos de investigación; 0.01 para
aseguramiento de la calidad; y 0.10 para estudios o encuestas de mercadotecnia.

Paso 3. Evidencia muestral, se calcula la media y la desviación estándar a partir de la


muestra.

Paso 4. Se aplica la distribución T de Student para calcular la probabilidad de error por


medio de la fórmula general presentada al principio y se contrasta con el valor T obtenido
de la tabla correspondiente.

Paso 5. En base a la evidencia disponible se acepta o se rechaza la hipótesis alternativa.


Si la probabilidad de error (p) es mayor que el nivel de significancia se rechaza la
hipótesis alternativa. Si la probabilidad de error (p) es menor que el nivel de significancia
se acepta la hipótesis alternativa.

Por supuesto que al final lo que tenemos que contrastar es el valor de T que hayamos
obtenido en el problema contra el valor T crítico que obtenemos de la tabla de T de
Student.
4.7 DISTRIBUCIÓN DE CHI-CUADRADA

La distribución de chi-cuadrada es una distribución continua que se especifica por los


grados de libertad y el parámetro de no centralidad. La distribución es positivamente
asimétrica, pero la asimetría disminuye al aumentar los grados de libertad.

Minitab utiliza la distribución de chi-cuadrada (χ2) en pruebas de significancia estadística


para:

• Comprobar qué tan bien se ajusta una muestra a una distribución teórica. Por
ejemplo, puede utilizar una prueba de bondad de ajuste de chi-cuadrada para
determinar si los datos de la muestra se ajustan a una distribución de Poisson.

• Comprobar la independencia de las variables categóricas. Por ejemplo, un


fabricante desea saber si la ocurrencia de cuatro tipos de defectos (espárrago
faltante, abrazadera rota, sujetador flojo y sello con fugas) está relacionada con
los turnos (diurno, vespertino, nocturno).

Cuando los grados de libertad son 30 o más, la distribución de chi-cuadrada puede


aproximarse razonablemente con una distribución normal, como se ilustra en las
siguientes gráficas:

Distribución de chi-cuadrada con 20 grados de libertad

Distribución de chi-cuadrada con 40 grados de libertad


4.8 DISTRIBUCION F
La distribución F o distribución de Fisher-Snedecor es la que se usa para comparar las
varianzas de dos poblaciones diferentes o independientes, cada una de las cuales sigue
una distribución normal.

La distribución que sigue la varianza de un conjunto de muestras de una sola población


normal es la distribución ji-cuadrada (Χ2) de grado n-1, si cada una de las muestras del
conjunto tiene n elemento

Para comparar las varianzas de dos poblaciones diferentes, es necesario definir


un estadístico, es decir una variable aleatoria auxiliar que permita discernir si ambas
poblaciones tienen o no igual varianza.

Dicha variable auxiliar puede ser directamente el cociente de las varianzas muestrales
de cada población, en cuyo caso, si dicho cociente es cercano a la unidad, se tiene
evidencia que ambas poblaciones tienen varianzas semejantes.

El estadístico F y su distri bución teórica

La variable aleatoria F o estadístico F propuesto por Ronald Fisher (1890 – 1962) es el


que se usa más frecuentemente para comparar las varianzas de dos poblaciones y se
define de la siguiente manera:
Siendo s2 la varianza muestral y σ2 la varianza poblacional. Para distinguir cada uno de
los dos grupos poblacionales, se utilizan los subíndices 1 y 2 respectivamente.

Se sabe que la distribución ji-cuadrada con (n-1) grados de libertad es la que sigue la
variable auxiliar (o estadístico) que se define a continuación:

X2 = (n-1) s2 / σ2.

Por lo tanto, el estadístico F sigue una distribución teórica dada por la siguiente fórmula:

Siendo U la distribución ji-cuadrada con d1 = n1 – 1 grados de libertad para la población


1 y V la distribución ji-cuadrada con d2 = n2 – 1 grados de libertad para la población 2.
CONCLUSIÓN

En conclusión, aprendimos en esta unidad sobre las diferentes distribuciones y a saber


sus diferentes fórmulas para realizar una distribución de frecuencia y a cómo utilizar las
fórmulas en los ejercicios todos llegando a un mismo resultado.
REFERENCIAS BIBLIOGRÁFICAS

4.2 Distribución binomial. (s/f). Openstax.org. Recuperado el 3 de abril de 2023, de


https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-
empresarial/pages/4-2-distribucion-binomial

(S/f). Tecnm.mx. Recuperado el 3 de abril de 2023, de


https://hopelchen.tecnm.mx/principal/sylabus/fpdb/recursos/r129612.PDF

4.4 Distribución de Poisson. (s/f). Openstax.org. Recuperado el 3 de abril de 2023, de


https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-
empresarial/pages/4-4-distribucion-de-poisson

Ramón, I. J. M., & Perfil, V. T. mi. (s/f). Probabilidad y Estadística. Blogspot.com.


Recuperado el 3 de abril de 2023, de
http://probabilidadyestadisticaitsav.blogspot.com/2012/06/46-distribucion-
normal.html

Distribución de chi-cuadrada. (n.d.). Retrieved April 3, 2023, from


https://support.minitab.com/es-mx/minitab/21/help-and-how-to/probability-
distributions-random-data-and-resampling-analyses/supporting-
topics/distributions/chi-square-distribution/

Zapata, F. (2020, October 14). Distribución F: características y ejercicios resueltos.


Lifeder. https://www.lifeder.com/distribucion-f/

También podría gustarte