Está en la página 1de 11

UNIVERSIDAD CENTRAL

DEL ECUADOR

TEOREMA DE BAYES Y PARAMETROS PARA


REALIZAR ESTADISTICA DESCRIPTIVA

SANTIAGO GUERRA

TERCER SEMESTRE
INTRODUCCION

Thomas Bayes (1701 – 1761), ministro presbiteriano, teólogo, filósofo y matemático, dio a
conocer el conocido y famoso teorema que lleva su nombre en un estudio que realizo sobre las
aplicaciones de la Teoría de la Probabilidad. (Puppo, 2006)

Este teorema es válido en todas las aplicaciones de la teoría de la probabilidad, aunque, sin
embargo, ha existido mucha controversia sobre el tipo de probabilidades que emplea. A pesar
de que este teorema ha vuelto a ser popular, este puede servir para indicar como debemos
modificar las probabilidades que se tiene de un experimento cuando se recibe información
adicional. La utilidad de este teorema se demuestra ciertas estimaciones basadas en el
conocimiento subjetivo a priori y permitir revisar esas estimaciones en función de la evidencia,
lo que está abriendo nuevas formas de hacer conocimiento. (Regalado, 2009)

La estadística descriptiva es un conjunto de herramientas que se utiliza para resumir la


información contenida dentro de un grupo de datos. Esta estadística es parte fundamental de
un análisis estadístico complejo, en el cual se comienzan a tomar decisiones que afectarían al
desarrollo de la investigación. A manera de resumen la estadística descriptiva forma parte
inseparable de un análisis estadístico completo que puede tener su continuidad con análisis
inferencial cuando los datos que se manejan se corresponden con una muestra probabilística
extraída de una población. (I. Espejo Miranda, 2006)

MARCO TEÓRICO

Teorema de Bayes

Thomas Bayes, un clérigo del siglo XVIII, desarrolló el siguiente teorema, que fue conocido
después de su muerte, para el cálculo de probabilidades condicionales:

Sea { A1, A2, ….Ai….An} un conjunto de sucesos mutuamente excluyentes y cuya unión es el total
o sea 1, y tales que la probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso
cualquiera del que se conocen las probabilidades condicionales P (B/Ai). Entonces la
probabilidad P (Ai/B) viene dada por la expresión:

donde:

P(Ai) son las probabilidades a priori.

P(B / Ai) es la probabilidad de B en la hipótesis Ai.

P(Ai / B) son las probabilidades a posteriori.

Esto se cumple siempre que

(Regalado, 2009)

Ejemplos:

En un congreso se reúnen médicos de Europa, de los cuales son alemanes; franceses, e ingleses.
De estos médicos, el de los alemanes, el de los franceses y el de los ingleses están a favor de
utilizar una nueva vacuna para la gripe. Si escogemos un médico al azar, y está a favor de aplicar
la vacuna, ¿cuál es la probabilidad de que sea francés?

En una determinada ciudad se ha cometido un asesinato. De la investigación se encarga un


detective, que tiene 5 sospechosos entre los que se encuentra el asesino. Se sabe que el
detective trabaja con un pequeño margen de error, de forma que la probabilidad de creer
inocente al verdadero asesino es de 0’05 y la probabilidad de creer culpable a una persona
inocente es de 0’08. Si el detective cree que una persona es culpable, ¿cúal es la probabilidad
de que esa persona sea el asesino?

Solución: Para la resolución del problema se definen los siguientes sucesos:

A = {ser asesino}

I = {ser enjuiciado inocente}

C = {ser enjuiciado culpable}

a) Hay un asesino de 5 sospechosos, por tanto, la probabilidad de que una persona elegida al
azar sea el asesino es:

b) La probabilidad de creer inocente al verdadero asesino, es la probabilidad de ser enjuiciado


inocente condicionada a que es el asesino, es decir

Además, se sabe que P(C/A) =

c) La probabilidad de creer culpable a una persona inocente, es la probabilidad de ser enjuiciado


culpable condicionada a que no es el asesino, es decir

(I. Espejo Miranda, 2006)

Estadística Descriptiva

Es aquella rama de la Estadística que se encarga mediante la aplicación de métodos y técnicas


de obtener, organizar, presentar y describir los datos. Lo dicho anteriormente se aplica
directamente a los datos que forman parte de la muestra, la cual permitiría inferir o
generalizar acerca de la totalidad de los elementos que constituyen la población de estudio, si
la muestra es representativa. Los datos obtenidos y organizados pueden resumirse en forma
de tabulación, gráficos o números (Franco, 2014)
MEDIDAS DE POSICIÓN

Además de las medidas de tendencia central ya estudiadas (media, mediana, moda, me - dia
geométrica y media ponderada) hay otras que son más útiles en ciertas situaciones en que el
investigador o el estudiante no busca una ubicación central, sino una posición específica en la
distribución de una serie de datos. Estas medidas de posición (o de dispersión de distancia)
específica se conocen como: cuartiles, deciles y percentiles.

Cuartiles

En una serie de datos ordenados, los números que dividen a la serie en cuatro partes
porcentualmente iguales se llaman cuartiles. Éstos son tres y se denotan como Q 1, Q 2 y Q 3. El
segundo cuartil (Q2) es el valor que coincide con el de la mediana. El primero es el valor por
debajo del cual queda un cuarto (25%) de los valores de la serie ordenada, mientras que para
el tercero es el valor del cual quedan tres cuartas partes por debajo (75%) de la serie de datos.
Los cuartiles se utilizan en la construcción de gráficas de caja y de bigote (Figura 2.12)

Ejemplos:

- El dueño de la tortería Don Toño quiere saber cuál es el tiempo de entrega de pedidos, en
su nueva sucursal de Av. División del Norte 3553-D, con un área de cobertura de 5 km. El
día de hoy, en el turno matutino, se entregaron 11 pedidos.

¿Cuál es el rango de entrega (intercuartílico) para estos datos? Se empieza por encontrar el
valor del primer cuartil y después el del tercero.

El rango intercuartílico es:

El 50% de tiempo medio de entrega de pedidos tiene un rango de 18 minutos.

¿Cuál es el tiempo medio de la entrega de un pedido de tortas? El segundo cuartil coincide con
el valor de la mediana:
- Con los datos del cuadro 2.14, acerca de ingresos extras a la semana de los trabajadores de
una empresa manufacturera de Hermosillo, Sonora, se quiere conocer en dónde se ubica
del primer cuartil.

1. Se ubica la clase que contiene el cuartil uno:

Se busca el dato 52 con ayuda de la frecuencia acumulada.

2. El dato buscado, para este ejemplo, se ubica en la clase 3.


3. Se determinan las variables de la fórmula de cálculo del cuartil.

4. Se sustituyen los valores en la fórmula y se obtiene el valor del cuartil uno.

Esto indica que 25% de los datos en esta muestra tiene un valor menor que 215.35. Para el
tercer cuartil:

El intervalo intercuartílico más usado es la diferencia entre el tercer y primer cuartil de una
serie de datos. Este intervalo contiene exactamente 50% de los datos.
Deciles

Los deciles son números que dividen a una serie ordenada de datos en diez partes por -
centualmente iguales, y no en cuatro como en el caso de los cuartiles. Los deciles pue - den
calcularse del decil uno (D1) al decil nueve (D9).

Ejemplos:

- Calcular el decil 6 (D6) de las siguientes muestras de notas en matemáticas de un aula


(notas de 0 a 20): 16, 10, 12, 8, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14

Ordenamos de menor a mayor: 1, 8, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20

N = número de muestras = 15 muestras

x = (N · i) / 10 = (15 · 6) / 10 = 9

Como x = 9 es un número sin decimales, entonces el decil 6 es el valor de la muestra que ocupa
la posición 9

D6 (decil 6) = 13

- En un examen muy difícil de universidad, se obliga al profesor a aprobar al menos al 10%.


Calcular la nota a partir de la cual está obligado a aprobar siendo las notas (notas de 0 a
20): 0, 4, 1, 0, 0, 7, 2, 1, 4, 0, 3, 9, 2, 0, 0, 4, 8, 1, 0, 9, 4

Necesitamos calcular el decil 9 (D9) ya que nos interesa calcular el valor a partir del cual solo
hay un 10% con mejores notas

Ordenamos de menor a mayor: 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4, 4, 7, 8, 9, 9

N = número de muestras = 21 muestras

x = (N · i) / 10 = (21· 9) / 10 = 18,9

Como x = 18,9 es un número con decimales, entonces el decil 9 es la media de los valores que
ocupan la posición 18 y 19

D9 (decil 9) = (7 + 8) / 2 = 7,5

Percentiles

Es una medida estadística que se usa mucho cuando se quiere clasificar o ubicar características
en las personas (peso, estatura, etc.). Estas medidas son números que dividen una sucesión de
datos ordenados en cien partes porcentualmente iguales. Si los datos se encuentran
agrupados en una tabla de frecuencias, entonces los percentiles se calculan mediante la
fórmula:

- Calcular el percentil 40 (P40) de las siguientes muestras de notas en matemáticas de un


aula (notas de 0 a 20): 16, 10, 12, 8, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14

Ordenamos de menor a mayor: 1, 8, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20

N = número de muestras = 15 muestras

x = (N · i) / 100 = (15 · 40) / 100 = 6

Como x = 6 es un número sin decimales, entonces el percentil 40 es el valor de la muestra que


ocupa la posición 6

P40 (percentil 40) = 10

- En un examen muy difícil de universidad, se obliga al profesor a aprobar al menos al 10%.


Calcular la nota a partir de la cual está obligado a aprobar siendo las notas (notas de 0 a
20): 0, 4, 1, 0, 0, 7, 2, 1, 4, 0, 3, 9, 2, 0, 0, 4, 8, 1, 0, 9, 4

Necesitamos calcular el percentil 90 (P90) ya que nos interesa calcular el valor a partir del cual
solo hay un 10% con mejores notas

Ordenamos de menor a mayor: 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 2, 2, 3, 4, 4, 4, 4, 7, 8, 9, 9

N = número de muestras = 21 muestras

x = (N · i) / 100 = (21· 90) / 100 = 18,9

Como x = 18,9 es un número con decimales, entonces el percentil 90 es la media de los valores
que ocupan la posición 18 y 19

P90 (percentil 90) = (7 + 8) / 2 = 7,5

MEDIDAS DE DISPERSIÓN

La dispersión (diseminación, variabilidad o variación), la cual permite conocer qué tan


dispersas se encuentran las observaciones a cada lado del centro en una serie de datos, o bien
que tan alejadas se encuentran de la medida de tendencia central.

La variabilidad estudia o determina las distintas formas de la distribución, de acuerdo con el fin
perseguido por el investigador o estudiante de Estadística. En esta sección se describen las
diferentes medidas de variabilidad más comunes:

• El rango (amplitud o recorrido).

• La varianza.
• La desviación estándar.

(Franco, 2014)

Rango

El recorrido o rango es la diferencia entre el valor mayor y el valor menor de un conjunto de


datos.

(Espallargas, 2011)

Ejemplos:

- Serie de datos de la estatura de los alumnos de una clase y vamos a calcular el rango.

Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). Luego el
rango de esta muestra es 10 cm.

- Cuatro amigos han sacado las siguientes notas:

Empezamos calculando el recorrido para el Amigo A. Su nota más alta es 7 y su nota más baja
es 3, por lo tanto, su recorrido es:
El recorrido para el Amigo B es 8, para el Amigo C es 9 y para el Amigo D es 3.

Varianza

La Varianza es una medida estadística de la dispersión (variabilidad) que se define como la


media aritmética del cuadrado de las desviaciones de las muestras respecto a la media.

Se representa mediante el símbolo griego sigma al cuadrado (σ2) y se formula de la siguiente


manera:

donde ( ) es la media aritmética de los valores analizados.

(Espallargas, 2011)

Ejemplos:

- Calcular la varianza de las siguientes puntuaciones de un jugador de baloncesto en los


últimos partidos:

Puntuaciones: 18, 20, 20, 22, 20, 20

Calculamos la media aritmética ():

Número de valores: 6

Media Aritmética = (18 + 20 + 20 + 22 + 20 + 20) / 6 = 120 / 6 = 20

Calculamos la Varianza:

Varianza σ2 = [(18-20)2 + (20-20)2 + (20-20)2 + (22-20)2 + (20-20)2 + (20-20)2] / 6 =

16 / 6 = 8 /3 = 2,67

- Calcular la varianza de las siguientes notas de un alumno en los últimos exámenes:

Valores de las notas: 9, 10, 10, 11, 10, 10

Calculamos la media aritmética ():

Número de valores: 6

Media Aritmética = (9 + 10 + 10 + 11 + 10 + 10) / 6 = 60 / 6 = 10

Calculamos la Varianza:

Varianza σ2 = [(9-10)2 + (10-10)2 + (10-10)2 + (11-10)2 + (10-10)2 + (10-10)2] / 6 = 2 / 6 = 1 /3


= 0,33

Desviación Estándar
La Desviación Estándar (también conocida como Desviación Típica) es una medida de la
dispersión de los resultados de un muestreo, es decir: su precisión.

(Espallargas, 2011)

- Calcular la desviación estándar de las siguientes puntuaciones de un jugador de baloncesto


en los últimos partidos:

Puntuaciones: 18, 20, 20, 22, 20, 20

Calculamos la media aritmética ():

Número de valores: 6

Media Aritmética = (18 + 20 + 20 + 22 + 20 + 20) / 6 = 120 / 6 = 20

Calculamos la Desviación Estándar:

σ2 = [(18-20)2 + (20-20)2 + (20-20)2 + (22-20)2 + (20-20)2 + (20-20)2] / 6 = 16 / 6 = 8 /3 = 2,67

Desviación estándar: σ = √ 2,67 = 1,63

- Calcular la desviación estándar de las siguientes puntuaciones de otro jugador de


baloncesto en los últimos partidos:

Puntuaciones: 10, 32, 24, 26, 40, 30

Calculamos la media aritmética ():

Número de valores: 6

Media Aritmética = (10 + 32 + 24 + 26 + 40 + 24) / 6 = 156 / 6 = 26

Calculamos la Desviación Estándar:

σ2 = [(10-26)2 + (32-26)2 + (24-26)2 + (26-26)2 + (40-26)2 + (24-26)2] / 6 = (256 + 36 + 4 + 0 +


196 + 4) / 6 = 82,67

Desviación típica: σ = √ 82,67 = 9,09

CONCLUSIONES

- El teorema de Bayes es una proposición planteada que indica que las probabilidades A y B
de un experimento o muestra dependen una de otra ya que si, por ejemplo, que sabiendo
la probabilidad de tener un dolor de cabeza dado que se tiene gripe, se podría saber (si se
tiene algún dato más), la probabilidad de tener gripe si se tiene un dolor de cabeza. Los
resultados inferidos de la probabilidad B dependen de los resultados de los sucesos A.
- La Estadística Descriptiva no es más que una rama de la estadística que tiene por objeto
organizar y ordenar un grupo o conjunto de datos de un experimento, mediante la
utilización de métodos que son de dispersión y de posición. Estos métodos hace mucho
más fácil la organización de un conjunto grande de datos de un experimento o muestra
que se ha estudiado o analizado.

BIBLIOGRAFIA

Espallargas, D. (2011). Estadística Matemática. En: Selección de Guías de Estudio: Contabilidad


y Finanzas. Cuba: Editorial Universitaria.

Franco, J. (2014). Estadística para administración. México : Grupo editorial Patria.

I. Espejo Miranda, ,. F. (2006). Estadística descriptiva y probabilidad: teoría y problemas (3a.


ed.). España: Servicio de Publicaciones de la Universidad de Cádiz.

Puppo, A. (2006). Aplicaciones del Teorema de Bayes en la Ingeniería. Buenos Aires: Academia
Nacional de Ingeniería.

Regalado, R. F. (2009). El teorema de Bayes y su utilización en la interpretación de las pruebas


diagnósticas en el laboratorio clínico. La Habana: Revista Cubana de Investigaciones
Biomédicas.

También podría gustarte