Semana 2

Unidad I: Estadística descriptiva
Tema: introducción a la estadística y conceptos generales
Objetivo
Reseña histórica
La estadística que muchos consideran algo nuevo, debido al alcance que tiene en el manejo
de grandes cantidades de datos (información), pero su aplicación se remonta a las antiguas
civilizaciones como china donde el emperador Yao (2239 AC), dispuso la realización de un
censo; algo similar ocurrió con el rey Herodes, relacionado con un empadronamiento cuando
se habló del nacimiento de Jesús.
La estadística como disciplina, tuvo su origen en Alemania a mediados del siglo XVII, en el
reinado de Godofredo de Achewall (1719-1772), se usó la palabra estadística y se separó de
la sociología, hoy en día a alcanzó un alto desarrollo, con el apoyo de investigadores
dedicados a desarrollar y perfeccionar los métodos estadístico y a través del avance
tecnológico, permitiendo la selección de aquellos procedimientos que buscan mejorar los
resultados, al mismo tiempo disminuyendo los márgenes de error.
La palabra estadística, proviene de la palabra status que significa estado, algunos creen que
podría venir de la palabra alemana Stara que significa estado.
Aplicación de la estadística en nutrición.
La estadística es una herramienta valiosa en la investigación de la nutrición humana. La

nutrición es un campo complejo que involucra aspectos biológicos, fisiológicos, psicológicos
y sociales, y la estadística puede ser utilizada para analizar y entender estos diferentes
componentes. Las aplicaciones de la estadística en la nutrición incluyen el análisis de datos
sobre la ingesta de alimentos, la evaluación de la eficacia de las intervenciones dietéticas, la
identificación de factores de riesgo para enfermedades relacionadas con la nutrición y la
estimación de la prevalencia de trastornos alimentarios. Además, la estadística también se
utiliza en la interpretación de estudios epidemiológicos sobre la relación entre la nutrición y
la salud, lo que ayuda a los profesionales de la nutrición y la salud a tomar decisiones
informadas sobre la prevención y el tratamiento de enfermedades relacionadas con la
nutrición. En resumen, la estadística es una herramienta valiosa en la investigación de la
nutrición humana, ya que ayuda a los investigadores y profesionales de la salud a analizar y
entender la complejidad de este campo y a tomar decisiones informadas para mejorar la
salud y el bienestar de las personas.
Conceptos básicos.
Antes de adentrarnos en las herramientas estadística, necesitamos saber ciertos conceptos,

como:
Estadística:
Es la rama de la matemática encargada de procesar, analizar datos, la estadística ofrece los

procedimientos para recolectar y transformar los datos de manera que sean útiles a quienes
toman las decisiones.
Clasificación de la estadística
Estadistica
Descriptiva Inferencial
Descriptiva:
Esta se enfoca en la recolección, resumen y presentación de un conjunto de datos
Inferencial:
Esta utiliza datos de las muestras para obtener conclusiones acerca de cierta población.
Las definiciones anteriores hacen énfasis en población y muestra, pero que es población y
que es muestra.
Palabra clave Definición

Población Consiste en todos los miembros de un grupo acerca de los cuales se
desea obtener una conclusión
Muestra Es una parte de la población que se selecciona para obtener los datos
Parámetro Es una medida numérica que describe una característica de la población
Estadístico Es una medida numérica que describe una característica de la muestra
Graficamente esto es:
Variables estadisticas
Como en toda ciencia para realizar las conclusiones del estudio, se requiere datos, pero,
Que son los datos?
Datos:
Son valores o caracteristics que pueden ser observados, contados o medidos.
Variable: es una caracteristica o atributo que puede adquirir distinto valores

cualitativa ordinal:
son aquellas que poseen un
orden definido, por ejemplo:
cualitativa:
Grado academico
son aquellas que no se Tipo de quemadura
pueden medir
numericamente, por
ejemplo: color de ojos, Cualitativa nomial
estados de desnutricion, son aquellas que no admiten
grado academico etc un criterio de orden
por ejemplo
estados civil
Tipos de variable Cuantitativa discreta

son las que asumen cierto tipo
de valores despues de haber
realizado un conteo, por
ejemplo
Cuantitativas: Numero de hijos en una
son aquellas que se familia
pueden contar o medir de
forma numerica, por
ejemplo: peso en kg, la
altura en cm o promedio Cuantitativa continua
de calorias ingeridas dia. Estas surgen de un proceso de
medicion y pueden asumir
cualquier valor dentro de un
rango especificado
La temperatura del agua
Fuentes de informacion
Para poder llavar a cabo un estudio estadistico de una poblacion, primero se debe tener muy
claro que se quiere analizar para recolectar los datos adecuados , ahora, la recoleccion se
puede hacer recurriendo a las diversas fuentes, en terminos generales, las fuentes de donde
se obtienen los datos pueden clasificarse en primarias y secundarias
Primarias: mediante la observacion o realiazacion de experiementos, encuesta o

cuestionarios
Secundarios: como las bases de datos ya existentes, por ejemplo, la de FAO, OMS u otro tipo
de institucion.
Censo y muestreo
El termino censo, se refiere a la obtencion de datos de cada uno de los miembros de la

poblacion, es decir, el censo se aplica a la poblacion, pero en la mayoria de los casos censar
toda la poblacion resulta una tarea muy complicada, quizas por que no se cuenta con los
recursos humanos y econimicos para ello o en otro casos porque el proceso como tal no lo
permite, un ejemplo de ello son los procesos de produccion, donde estamos interesados en
medir la calidad del producto, resultaria imposible realizar un censo a toda la poblacion, es
por ellos que requerimos de una muestra, a este proceso de obtener una parte de la
poblacion, se llama muestreo.
Metodos de muestreo.
El proceso de muestreo comienza con la identificación de fuentes adecuadas de datos, como

las listas de población, directorios y mapas, entre otras, que son llamadas marcos muestrales.
De éstos se extrae la muestra. Cabe señalar que si el marco es inadecuado, entonces las
muestras serán también inadecuadas y nuestras estimaciones serán “malas”.
Hay dos tipos básicos de muestras:
Muestra no probabilística: los elementos se eligen sin tener en cuenta su probabilidad de

ocurrencia, es decir, sin tener en cuenta que suceda cierto resultado. Por ejemplo, una
muestra obtenida mediante una red social, en la cual sólo intervienen las personas que usan
ese medio. Este tipo de muestras son convenientes porque resultan rápidas y de bajo costo,
pero existe una falta de precisión en las estimaciones.
Muestra probabilística: los elementos que la componen se eligen de acuerdo con las
probabilidades de ocurrencia, esto es, existe un trabajo estadístico previo a la selección de la
muestra. El proceso de muestreo puede realizarse por etapas y en cada una de ellas es posible
aplicar un método distinto.
Todo depende de la situación en estudio, del presupuesto con que se cuente y de la

variabilidad que se quiera aceptar en los resultados. A continuación revisaremos de forma
general los métodos de muestreo más utilizados para obtener muestras probabilísticas.
Muestreo aleatorio simple.
El muestreo aleatorio simple es la técnica de muestreo más elemental, al punto que

constituye la base de otras técnicas. La muestra obtenida con este método resulta de una
selección hecha de manera tal que cada elemento de la población tiene la misma oportunidad
(probabilidad) de resultar seleccionado
Muestreo aleatorio sistemático
De acuerdo con este método, para obtener la muestra requerida primero se divide el tamaño
de la población (N) entre el tamaño de muestra (n) deseado y el resultado obtenido (k) se
redondea al entero más cercano. Luego, para seleccionar la muestra se elige al azar el primer
elemento y los subsiguientes se escogen cada k elementos. Cabe precisar que el muestreo
sistemático tiene un pequeño inconveniente: si existe algún patrón (comportamiento u
ordenamiento bajo algún criterio, como orden alfabético o por fecha de nacimiento) en la
lista de la población, existirán errores de selección que afectarán los resultados.
Muestreo aleatorio estratificado
Esta técnica se utiliza cuando una población está dividida en grupos, llamados estratos,
formados con base en cierta característica, pues así se garantiza que cada miembro de la
población esté en un y solamente un estrato. Después se toma una muestra de cada estrato y
se hacen comparaciones entre ellas. Merece la pena indicar que para que este tipo de
muestreo ofrezca una buena precisión es necesaria la homogeneidad de los elementos en
cada estrato, así como la heterogeneidad entre los estratos.
Muestreo aleatorio por conglomerado.
El muestreo por conglomerados consiste en dividir una población en grupos o

conglomerados usando cierto tipo de límite, por ejemplo, geográfico. Posteriormente, se
seleccionan conglomerados al azar y se recolecta una muestra eligiendo en forma aleatoria
elementos de cada uno de ellos. El muestreo por conglomerados resulta de gran utilidad para
reducir el costo del muestreo cuando la población está dispersa en una zona geográfica
extensa.
Tema: medidas de tendencia central, no centrales y dispersiones para datos agrupados
Objetivos
Calcula de manera las medidas de tendencia central, no centrales y dispersión asociadas a la

variable
Interpretas las medidas de tendencia central, no centrales y dispersión .
A continuación, se muestran el peso de 60 personas medidos en kg
53.6 69.1 75.8 86
54.8 69.9 76.1 86.5
59.3 69.9 78.6 87.5
59.9 70.3 78.6 91.1
59.9 70.3 81.5 91.9
61.3 70.8 82.1 92.7
61.3 72 82.1 92.8
62.6 72.5 83.2 94.2

66.2 72.5 83.3 94.7
66.2 73.8 83.5 94.9
66.5 73.9 83.8 95.2
67.1 74.6 83.8 97.3
67.8 74.9 84.3 105.9
68.1 75.2 85.5 109.9
68.1 75.4 85.6 110.3
La tabla de distribución de frecuencias es.
Rango
𝑅 = 110.3 − 53.6 = 56.7
Numero de intervalos
𝑘 = 1 + 3.322 log 60 = 6.91 = 7
Ancho de clase
𝑅 56.7
𝐴= = = 8.2
𝑘 7
Tabla
Límite Límite Frecuencia Frecuencia Frecuencia Frecuencia Marca de

inferior superior absoluta absoluta relativa relativa clase
acumulada acumulada
53.6 61.8 7 7 0.117 0.117 57.7
61.8 70.0 11 18 0.183 0.300 65.9
70.0 78.2 14 32 0.233 0.533 74.1
78.2 86.4 14 46 0.233 0.766 82.3
86.4 94.6 7 53 0.117 0.883 90.5
94.6 102.8 4 57 0.07 0.953 98.7
102.8 111.0 3 60 0.05 1.00 106.9
Medidas de tendencia central

Las medias de tendencia central son medidas estadísticas que se usan para describir como
se puede resumir la localización de los datos. Ubican e identifican el punto alrededor del cual
se centran los datos. Las medidas de tendencia central nos indican hacia donde se inclinan o
se agrupan más los datos. Las más utilizadas son: la media, la mediana y la moda. El propósito
de las medidas de tendencia central es:
1. Mostrar en qué lugar se ubica el elemento promedio o típica del grupo.
2. Sirve como un método para comparar o interpretar cualquier valor en relación con el
puntaje central o típico.
3. Sirve como un método para comparar el valor adquirido por una misma variable en dos
diferentes ocasiones.
4. Sirve como un método para comparar los resultados medios obtenidos por dos o más
grupos.
Promedio o media aritmética
Este valor se obtiene al multiplicar la marca de clase con la frecuencia absoluta, e ir sumando,
al final la suma total se divide entre el número total de datos, su fórmula es:
∑ 𝑓𝑖 ∗ 𝑚𝑖
𝑥̅ =
𝑛
Donde
𝑓𝑖 es la frecuencia del intervalo
𝑚𝑖 es la marca de clase asociada al intervalo
𝑛 es el numero de datos
Para nuestra tabla, este valor serio

57.7 ∗ 7 + 65.9 ∗ 11 + 74.1 ∗ 14 + 82.3 ∗ 14 + 90.5 ∗ 7 + 98.7 ∗ 4 + 106.9 ∗ 3
𝑥̅ =
60
= 77.79 𝑘𝑔
El peso promedio de la muestra de 60 personas es de 77.79 kg
Propiedades de la media aritmética
Los datos medidos en escala de intervalo o de razón, tienen una media aritmética.
El valor de la media aritmética es único, es decir, un conjunto de datos tiene un solo valor de
media aritmética.
Para el cálculo de la media aritmética se consideran todos los datos observados. Esta
propiedad determina que la media aritmética sea sensible a la presencia de valores extremos.
Es una medida muy útil cuando se necesita comparar estudios estadísticos de la misma
naturaleza.
Lamediaaritméticaeslaúnicamedidadetendenciacentral,dondelasumadelas desviaciones de
los elementos con respecto a ella, siempre es cero.
Mediana
La mediana Es el punto medio del total de observaciones ,luego de que han sido ordenados y
que deja al mismo número de observaciones por debajo de su valor ,así como por arriba de
él.
La mediana es una importante medida de ubicación, en casos en que la media aritmética no

es representativa de un conjunto de datos, esta situación se da cuando existe la presencia de
valores extremos altos o bajos, en cuyo caso la mediana proporciona un valor más
representativo de la tendencia central.
La fórmula matemática para el cálculo de la mediana en datos agrupados es la siguiente:

𝑛
− 𝑓𝐴𝑎
𝑥̃ = 𝑙𝑖 + (2 )∗𝐴
𝑓𝑖
Donde:
𝑙𝑖 es el limite inferior del intervalo donde se encuentra la mediana
𝑓𝑖 es la frecuencia absoluta del intervalo donde esta la mediana
𝑓𝐴𝑎 es la frecuencia acumulada anterior al intervalo donde esta la mediana
A es el ancho de clase
𝑛 es el numero de datos
Cálculo de la mediana
𝑛
Paso 1. Es encontrar el intervalo donde está la mediana, para ello calculamos el valor de 2 =
60
= 30, este valor se busca en la frecuencia absoluta acumulada de la tabla de distribución
2
de frecuencia, el intervalo es el siguiente
70.0 78.2 14 32 0.233 0.533 74.1

El límite inferior es 70.0, la frecuencia absoluta es 14, la frecuencia absoluta acumulado
anterior es 18, por lo tanto, la mediana es:
30 − 18
𝑥̃ = 70.0 + ( ) ∗ 8.2 = 70.0 + 7.03 = 77.03 𝑘𝑔
14
El peso medio de la muestra es aproximadamente 77.03 kg, este dato divide a la muestra es
dos, es decir el 50% de los pesos están por debajo de este valor y el 50% está por encima.
Propiedades de la mediana
Al igual que la media aritmética, su valor es único, entonces, un conjunto de datos posee una
sola mediana.
No se ve afectada por la presencia de valores extremos bajos o altos, en el caso del Ejemplo
anterior en el literal (a.) puede ser el último dato un valor tan alto como se quisiese, que la
mediana seguirá siendo la misma.
Puede ser determinada para distribuciones de frecuencia que tengan intervalos abiertos,
siempre y cuando la mediana no se encuentre en esa categoría.
Puede determinarse para datos que han sido medidos en escala de intervalo, de razón u
ordinal.
Moda
Es el valor de la observación o elemento que tiene la mayor frecuencia.
La moda es otra medida de tendencia central, que es muy útil para describir conjuntos de
datos nominales y ordinales y su determinación es sencilla, toda vez que queda fijada por la
ubicación del elemento que mayor frecuencia tiene, es decir, el que más veces aparece en el
estudio. En definitiva, la moda puede determinarse para cualquier conjunto de datos y al
igual que la mediana no se ve afectada por la presencia de valores extremos y puede ser
determinada para categorías con intervalos abiertos. Sin embargo la moda tiene una
desventaja, la cual hace que no sea muy utilizada, principalmente para datos numéricos y es
que muchos estudios no poseen moda no hay elementos con mayor frecuencia o puedan
tener varias modas (cuando dos o más elementos tienen la misma mayor frecuencia),dando
lugar en este último caso a que los estudios sean bimodales o plurimodales.
La fórmula matemática para su cálculo es:

𝑑1
𝑚𝑜𝑑𝑎 = 𝑙𝑖 + ( )∗𝐴
𝑑1 + 𝑑2
Donde
Li: Límite inferior de la clase modal (categoría con la mayor frecuencia)

d1:Diferencia entre la frecuencia de la clase modal y la frecuencia de la categoría anterior a
la clase modal. d2:Diferencia entre la frecuencia de la clase modal y la frecuencia de la
categoría anterior a la clase modal.
A : Ancho del intervalo de la clase modal.
Esta distribución de datos, es bimodal debido a que hay dos intervalos con mayor frecuencia
que es 14, se hare el cálculo de una de ellas, el cálculo del segundo valor queda como ejercicio
para el estudiante
61.8 70.0 11 18 0.183 0.300 65.9

70.0 78.2 14 32 0.233 0.533 74.1
78.2 86.4 14 46 0.233 0.766 82.3
De acá obtenemos que el límite inferior es 70, la frecuencia acumulada modal es 32, por lo
tanto
𝑑1 = 32 − 18 = 14 𝑑2 = 46 − 32 = 14
La moda es:
14
𝑚𝑜𝑑𝑎 = 70 + ( ) ∗ 8.2 = 74.1 𝑘𝑔
14 + 14
Medidas de dispersión para datos agrupados.
La dispersión de un conjunto de observaciones se refiere a la variedad que exhiben los

valores de las observaciones. Si todos los valores son iguales, no hay dispersión; si no todos
son iguales, hay dispersión en los datos. La magnitud de la dispersión puede ser pequeña,
cuando los valores, aunque distintos, estén próximos entre sí. Si los valores están
ampliamente desparramados, la dispersión es mayor. Otros términos que se utilizan como
sinónimos de dispersión son los de variación y discriminación.
Varianza
La variancia. Cuando los valores de un conjunto de observaciones están muy próximos a su

media, la dispersión es menor que cuando están distribuidos sobre un amplio recorrido.
Dado que esto es cierto, intuitivamente sería interesante el hecho de que se pudiera medir la
dispersión con respecto a la diseminación de los valores en torno a su media. Dicha medida
se realiza en lo que se conoce como variancia. Para calcular la variancia, se resta la media de
cada uno de los valores, se elevan al cuadrado las diferencias y, a continuación, se suman.
Esta suma de las desviaciones de los valores de su media (elevadas al cuadrado) se divide
entre el tamaño de la muestra, menos 1, para obtener la variancia. Suponiendo que ^2 es la
variancia de la muestra, el procedimiento puede escribirse simbólicamente como sigue:
2
∑(𝑚𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑠 =
𝑛−1
Debido a que la varianza está en unidades al cuadrado, esto presenta un inconveniente al
momento de realizar deducciones es por ello, que se le extrae raíz cuadrado, a este resultado
se le llama desviación estándar, su fórmula es:
∑(𝑚𝑖 − 𝑥̅ )2 ∗ 𝑓𝑖
𝑠=√
𝑛−1
Coeficiente de variación
La desviación estándar es útil como una medida de variación dentro de un determinado

conjunto de datos. Sin embargo, cuando se desea comparar la dispersión en dos conjuntos
de datos, el comparar las dos desviaciones estándar puede conducir a resultados ilógicos.
Puede ser que las dos variables que intervienen se midan en unidades distintas. Por ejemplo,
es posible que se desee saber, para una cierta población, si los niveles de colesterol en el
suero, medidos en mg por 100 ml, son más variables que el peso del cuerpo, medido en
kilogramos.
Además, aun cuando se utilice la misma unidad de medición, las dos medias pueden ser
bastante distintas. Si se compara la desviación estándar de los pesos de niños de primer año
de primaria con la desviación estándar de los pesos de jóvenes de primer año de secundaria,
puede encontrarse que fa desviación estándar de estos último, es numéricamente mayor que
la de los primeros debido a que los propios pesos son mayores y no porque la dispersión sea
mayor. Lo que se necesita en situaciones como esta es una medida de variación relativa, más
que una de variación absoluta. Dicha medida se encuentra en el coeficiente de variación, que
expresa la desviación estándar como un porcentaje de la media. La fórmula está dada por la
expresión:
𝑠
𝐶𝑉 = ∗ 100%
𝑥̅
Cálculo de las medidas de dispersión
Retomamos la tabla de distribución de frecuencia, aunque solo nos interesan la frecuencia

absoluta y la marca de clase.
Hay que recordar que el promedio fue de 𝑥̅ = 77.79 𝑘𝑔
Frecuencia Marca de ̅
𝒎𝒊 − 𝒙 ̅)𝟐
(𝒎𝒊 − 𝒙 ̅) 𝟐
(𝒎𝒊 − 𝒙
absoluta clase (mi) ∗ 𝒇𝒂
(fa)
7 57.7 -19.49 379.8601 2659.0207
11 65.9 -11.89 141.3721 1555.0931
14 74.1 -3.69 13.6161 190.6254
14 82.3 4.51 20.3401 284.7614
7 90.5 12.71 161.5441 1130.8087
4 98.7 20.91 437.2281 1748.9124
3 106.9 29.11 847.3921 2542.1763
Los valores de la última columna se suman y se dividen ente 59 (n-1)
𝑠2
2659.0207 + 1555.0931 + 190.6254 + 284.7614 + 1130.8087 + 1748.9124 + 2542.1763
=
60 − 1
= 171.3796
Como este valor esta expresado en kg^2, para obtener la desviación estándar únicamente
debemos calcular su raíz cuadrada.
𝑠 = √171.3796 = 13.0912 𝑘𝑔
El coeficiente de variación es:

13.0912
𝐶𝑉 = ∗ 100% = 16.83%
77.79
Dado que el CV nos da menor a 30%, esto nos indica que la media aritmética es
representativa del conjunto de datos y por ende estamos en presencia de datos homogéneos
( homogeneidad se refiere a que los datos están muy cercanos entre sí y no hay tanta
dispersión)
Ejercicio propuesto.
Los siguientes datos muestran las tallas medidas en cm a 60 personas.
161.74 162.601 171.394
158.584 163.936 171.394
157.555 168.654 172.954

167.002 170.684 171.41
165.172 172.114 169.34
168.734 171.127 166.944
161.22 170.558 168.934
164.305 166.615 159.236
165.64 168.934 172.385
165.64 167.273 170.152
170.235 162.641 169.34
167.27 171.41 164.145
162.472 167.356 183.387
169.38 177.46 170.192
167.35 171.41 171.41
166.498 169.137 172.791
173.372 171.167 159.235
169.312 168.82 161.1
166.738 167.596 168.694
171.29 169.861 173.36
Construya una tabla de distribución de frecuencias
Calcule las medidas de tendencia central e interpreta
Calcula el coeficiente de variación e interpretarlo
Gráficos estadísticos
. Ahora veremos las herramientas estadísticas más comunes para presentar datos y hacer
más comprensible la información. Esto se logra mediante la elaboración de tablas o gráficas.
En el esquema
siguiente se muestran los temas que abordaremos.
Presentación de
datos
Tablas de Polígonos Diagramas Diagramas
Histogramas Ojivas
frecuencia de de barra circulares
frecuencia
En la sección anterior se aborda el tema de la construcción de las tablas de distribución de

frecuencia, en esta ocasión veremos cómo realizar los gráficos estadísticos apropiados en
dependencia del tipo de variable que estamos trabajando.
Histograma
Un histograma es una gráfica de columnas que representa la distribución de frecuencias de

datos continuos. Se utiliza para ver cómo se distribuyen estos últimos, así como qué clases
tienen mayor concentración de datos.
Para trazar un histograma se sigue los pasos
1. Se dibujan los ejes coordenados.
2. En el eje x se localizan las marcas de cada clase. Como cada columna ejemplifica un
intervalo de clase, la base debe coincidir con el ancho de clase.
3. En el eje y se refiere la frecuencia (absoluta o relativa), así que la altura de cada columna
corresponde a ésta.
Retomemos la tabla de distribución de frecuencia realizada en la sección anterior, aunque

solo se trabajara con los intervalos y la frecuencia absoluta.
El histograma es un tipo de grafica que se usa para describir variables cuantitativas

continuas.
Límite Límite Frecuencia

inferior superior absoluta
53.6 61.8 7
61.8 70.0 11
70.0 78.2 14
78.2 86.4 14
86.4 94.6 7
94.6 102.8 4
102.8 111.0 3
Como se puede apreciar, este grafico nos muestra que la mayoría de los datos se concentran
en el centro, y aparte de ello la forma que tiene se asemeja a una colina, nos indica que los
datos cumplen con la normalidad.
Polígono de frecuencia
Un polígono de frecuencias es una gráfica de línea que sirve para representar la distribución
de frecuencias de datos continuos. Igual que el histograma, se utiliza para ver la forma de la
distribución de los datos, así como la ubicación de la mayor concentración de éstos. Como ya
se explicó, un histograma y un polígono de frecuencias sirven para ver la forma de la
distribución de los datos.
Cada persona decide cómo presentar la gráfica, si con columnas o con línea. Trazo de un
polígono de frecuencias
Para graficar un polígono de frecuencias se siguen estos pasos:
1. Se trazan los ejes coordenados.
2. Se dibuja un punto por cada coordenada. Las coordenadas son pares ordenados donde la
abscisa es la marca de clase (el eje x) y la ordenada es la frecuencia absoluta o relativa (el eje
y).
3. Se unen los puntos.
4. Se cierran los extremos con el eje horizontal
Grafico
Diagrama de pastel o grafico circular
Un diagrama circular o de pastel, igual que el diagrama de barras, se usa para representar
una distribución de frecuencias de datos discretos o categóricos y, como su nombre lo indica,
hay que trazar un círculo, en el que luego hay que dibujar divisiones (rebanadas) que
representan la frecuencia relativa.
Los grados de cada rebanada se calcula mediante la formula

360
𝑔𝑟𝑎𝑑𝑜𝑠 = 𝑓 ∗
𝑛
Donde f es la frecuencia absoluta y n es el total de datos
Ejemplo
Se entrevistó a 30 personas para conocer su sabor de refresco favorito. En la tabla de

frecuencias siguiente se registran los resultados. Con base en ella, traza un diagrama de
barras y uno circular. Interpreta.
Sabor Frecuencia Frecuencia relativa Grados

Cola 9 0.3 108
Cola light 6 0.2 72
Limón 4 0.1333 48
Manzana 3 0.1 36
Naranja 3 0.1 36
Toronja 5 0.1667 60
El diagrama viene dado por:
Refrescos
17%
30%
10%
10%
20%
13%
cola cola ligh limon manzana naranja toronja
Para el diagrama de barra tenemos
REFRESCOS
cola
9
cola ligh
6 toronja
limon 5
4 manzana naranja
3 3
cola cola ligh limon manzana naranja toronja
Ejercicios en clase
Ejercicio 1
En el histograma siguiente se muestran las calificaciones del primer examen de estadística:

Responda
¿Cuántos estudiantes presentaron el examen?
¿Cómo se distribuyen las calificaciones?
¿Cuántos estudiantes obtuvieron una calificación de menos de 70? ¿Cuántos más de 90?
Ejercicio 2
En el diagrama siguiente se muestra el consumo de energía eléctrica en México por sector:
Responda
¿Cuál es el sector que consume más energía?
¿Cuál es el sector que consume menos energía?
¿Qué consecuencias consideras que tiene el consumo excesivo de energía eléctrica?
Ejercicio 3
Se preguntó a 30 jóvenes cuántas horas dedicaban cada día a navegar en internet (el tiempo
que dedican a sesiones de chat y a las redes sociales quedan incluidos). Los resultados son
los siguientes:
Responda
¿Qué tipo de datos se maneja en este problema?
Construye la distribución de frecuencias correspondiente.
Traza un histograma .
¿A qué conclusiones llegaron tú y tus compañeros?
¿Crees que es recomendable pasar tanto tiempo frente a una computadora?
Ejercicio 4
El número de calorías correspondiente a los alimentos tipo sándwich que se sirven en un

negocio de comida rápida se presenta a continuación:
Responda
Realiza un histograma usando seis clases.
Describe la forma de la distribución de los datos.
Traza un polígono de frecuencia y expón tus conclusiones.
Medidas de tendencia central para datos no agrupados
Las medidas de tendencia central permiten obtener valores que representen el punto central
de los datos, es decir, determinar el valor más representativo de la variable que estamos
analizando. Las medidas de tendencia central más utilizadas son la media, la mediana y la
moda.
Medidas de tendencia central, no central es y de dispersión.

Con frecuencia una muestra constituye una larga lista de números. Para ayudar a que las
características de una muestra sean evidentes, se calcula el resumen estadístico. Las dos
cantidades más usadas en el resumen estadístico son la media de la muestra y la desviación
estándar de la muestra. La primera indica el centro de los datos y la segunda señala cómo
están distribuidos los datos.
Medidas de tendencia central
Una medida de tendencia central es un valor que se encuentra en el centro o a la mitad de un

conjunto de datos.
Media muestral. La media muestral también se llama “media aritmética”, o, simplemente,

“promedio”. Representa la suma de los números en la muestra, dividido entre la cantidad
total de números que hay
Sea 𝑿 = 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 , el promedio para este conjunto de datos se calcula de la siguiente

forma.
𝒏
𝒙𝒊
̅=∑
𝒙
𝒏
𝒊=𝟏
A continuación, un ejemplo.
Emisiones de automóviles: Científicos ambientales midieron las emisiones de gases de

invernadero de una muestra de automóviles. Las cantidades que se listan a continuación
están representadas en toneladas (por año), expresadas como equivalentes de CO2, calcule
el promedio para estos datos.
7.2 7.1 7.4 7.9 6.5 7.2 8.2 9.3

Al utilizar la formula obtenemos.
𝟕. 𝟐 + 𝟕. 𝟏 + 𝟕. 𝟒 + 𝟕. 𝟗 + 𝟔. 𝟓 + 𝟕. 𝟐 + 𝟖. 𝟐 + 𝟗. 𝟑 𝟔𝟎. 𝟖
̅=
𝒙 = = 𝟕. 𝟔
𝟖 𝟖
Anualmente el promedio cada automóvil tienen 7.6 toneladas de CO2 de emisiones.
Mediana.
A diferencia de la media, la mediana es una medida central resistente, ya que no cambia

mucho debido a la presencia de unos cuantos valores extremos (valores atípicos). La
mediana es un “valor intermedio”, ya que la mitad de los datos están por debajo de la mediana
y la otra mitad por arriba de ella. La siguiente definición es más precisa.
Definición.
La mediana de un conjunto de datos es la medida de tendencia central que implica el valor
intermedio, cuando los datos originales se presentan en orden de magnitud creciente (o
̃ (y se x lee “x con tilde).
decreciente). La mediana suele denotarse con 𝒙
Para calcular la mediana, primero se ordenan los datos (de menor a mayor) y luego se sigue
uno de los siguientes dos procedimientos:
1. Si el número de valores es impar, la mediana es el número que se localiza exactamente a la

mitad de la lista.
2. Si el número de valores es par, la mediana se obtiene calculando la media de los dos

números que están a la mitad
Ejemplo. Se retomarán los datos del ejemplo anterior, se ordenarán de menor a mayor.
6.5 7.1 7.2 7.2 7.4 7.9 8.2 9.3

El número de datos es par, por tanto (8+1)/2=4.5, el valor se encuentre entre la posición 4
que corresponde a 7.2 y la posición 5 que es 7.4, por tanto.
𝟕. 𝟐 + 𝟕. 𝟐
̃=
𝒙 = 𝟕. 𝟐
𝟐
Moda.
La moda de un conjunto de datos es el valor que se presenta con mayor frecuencia.
Un conjunto de datos puede tener una moda, más de una moda o ninguna moda.
•Cuando dos valores se presentan con la misma frecuencia y esta es la más alta, ambos
valores son modas, por lo que el conjunto de datos es bimodal.
•Cuando más de dos valores se presentan con la misma frecuencia y esta es la más alta, todos
los valores son modas, por lo que el conjunto de datos es multimodal.
•Cuando ningún valor se repite, se dice que no hay moda
Nuevamente se retomará el ejemplo anterior.
6.5 7.1 7.2 7.2 7.4 7.9 8.2 9.3

El valor que más frecuencia tienes es 7.2, por tanto
Moda=7.2
Medidas de tendencia no centrales.
Los cuartiles son medidas de ubicación, que se denotan por Q1, Q2 y Q3, y dividen un
conjunto de datos ordenado en cuatro partes iguales, con aproximadamente el 25% de los
valores en cada grupo.
He aquí descripciones de los tres cuartiles, que son más exactas que las implicadas en la
definición anterior:
Ejemplo.
En la tabla siguiente se presenta una lista de 35 presupuestos (en millones de dólares)

ordenados, los cuales se obtuvieron de la muestra aleatoria simple de películas.
Al calcular los cuartiles, se obtiene
Cuartil 1.
𝟑𝟓 𝟑𝟓
𝑸𝟏 = 𝒌 ∗ =𝟏∗ = 𝟖. 𝟕𝟓
𝟒 𝟒
Por tanto, la posición 8 corresponde a 30 y la nueva a 35, el primer cuartil es.
𝑸𝟏 = 𝟑𝟎 + 𝟎. 𝟕𝟓(𝟑𝟓 − 𝟑𝟎) = 𝟑𝟑. 𝟕𝟓
El 25% de las películas, tuvieron un presupuesto promedio de 33.75 millones de dólares.
(calcule el cuartil 2 y 3)
Resumen de los cinco números y grafico de caja
Los valores de los tres cuartiles se utilizan para el resumen de los 5 números y la construcción
de gráficas de caja
Definición.
Para un conjunto de datos, el resumen de los 5 números consiste en el valor mínimo; el

primer cuartil, Q1; la mediana (o segundo cuartil, Q2); el tercer cuartil, Q3; y el valor máximo.
Una gráfica de caja (o diagrama de caja y bigotes) es una gráfica de un conjunto de datos
consistente en una línea que se extiende desde el valor mínimo hasta el valor máximo, y una
caja con líneas trazadas en el primer cuartil, Q1, la mediana y el tercer cuartil, Q3.
Procedimiento para construir una gráfica de caja
1. Elabore el resumen de los 5 números consistente en el valor mínimo, Q1, la mediana, Q3,
y el valor máximo.
2. Construya una escala con valores que incluyan el valor mínimo y el valor máximo.
3. Construya una caja (un rectángulo) que se extienda desde Q1 hasta Q3, y dibuje una línea
en la caja, en el valor de la mediana. 4. Dibuje líneas que se extiendan hacia fuera de la caja
hasta los valores mínimo y máximo.
Para la construcción del diagrama se utilizará el ejemplo de las emisiones de CO2.
6.5 7.1 7.2 7.2 7.4 7.9 8.2 9.3

Los cinco números son los siguientes
Mínimo Primer cuartil Mediana Tercer cuartil Máximo

6.5 7.175 7.300 7.975 9.3
El diagrama de caja es el siguiente.
Medidas de dispersión
Las medidas de centralización vistas anteriormente reducen la información recogida de la

muestra a un solo valor. Sin embargo, dicho valor central, o medio, será más o menos
representativo de los valores de la muestra dependiendo de la dispersión que las medidas
individuales tengan respecto a dicho centro. Para analizar la representatividad de las
medidas de centralización se definen las llamadas medidas de dispersión. Estas nos
indicaran la variabilidad de los datos en torno a su valor promedio, es decir si se encuentran
muy o poco esparcidos en torno a su centro. Se pueden definir entonces, diversas medidas
de desviación o dispersión, siendo ´estas fundamentales para la descripción estadística de la
muestra.
Desviación estándar de una muestra La desviación estándar es la medida de variación que

más se utiliza en estadística.
La desviación estándar de un conjunto de valores muestrales, denotada con s, es la medida

de variación de los valores con respecto a la media. Es un tipo de desviación promedio de los
valores con respecto a la media
Se utilizan las siguientes formulas.
∑(𝑥 − 𝑥̅ )2
𝑠=√
𝑛−1
Las siguientes propiedades son consecuencia de la forma en que se define la desviación

estándar:
• La desviación estándar es una medida de variación de todos los valores con respecto a la
media.
•El valor de la desviación estándar s generalmente es positivo. Solo es igual a cero cuando
todos los valores de los datos son el mismo número. (Nunca es negativa). Además, valores
grandes de s implican mayores cantidades de variación.
•El valor de la desviación estándar s puede aumentar de manera drástica con la inclusión de
uno o más valores atípicos (valores de datos que se encuentran muy lejos de los demás).
• Las unidades de la desviación estándar s (como minutos, pies, libras, etcétera) son las
mismas de los datos originales.
Desviación estándar de una población
Para calcular a desviación estándar de una población se divide entre el total de datos y no
entre n-1, es decir.
𝑵
(𝒙𝒊 − 𝝁)𝟐
𝝈 = √∑
𝑵
𝒊=𝟏
Varianza de una muestra y de una población

Hasta ahora hemos utilizado el término variación como una descripción general de la
cantidad que los valores varían entre sí. (En ocasiones se aplica el término dispersión en vez
de variación). El término varianza tiene un significado específico.
Definición.
La varianza de un conjunto de valores es una medida de variación igual al cuadrado de la

desviación estándar.
Varianza muestral: el cuadrado de la desviación estándar s^2.
Varianza poblacional: 𝝈𝟐 el cuadrado de la desviación estándar poblacional 𝝈.
¿Por qué n-1?
En muchas ocasiones se definen varianza y desviación típica utilizando N en vez de n − 1 en

el denominador, representando entonces la varianza una verdadera media aritmética del
cuadrado de las desviaciones. Está claro que ambas definiciones llevan a valores muy
parecidos cuando N es grande. El motivo de haber optado aquí por la definición con n − 1 es
que esta da una mejor estimación de la dispersión de los datos. Téngase en cuenta que como
la suma de las desviaciones xi − x es siempre 0, la desviación del último dato puede calcularse
una vez que se conozcan las n − 1 anteriores. Es decir, solo se tienen n − 1 desviaciones
independientes (se dice que el sistema tiene n − 1 grados de libertad) y se promedia
entonces dividiendo por n −1, ya que no tiene mucho sentido promediar N números no
independientes. Nótese además que cuando solo se tiene un dato (N = 1), en el caso de la
definición con N en el denominador se obtendría una varianza 0, que no tiene mucho sentido,
mientras que en la definición con n − 1 la varianza estaría indeterminada.
Coeficientes de variación
Un problema que plantean las medidas de dispersión vistas es que vienen expresadas en las
unidades en que se ha medido la variable. Es decir, son medidas absolutas y con el único dato
de su valor no es posible decir si tenemos una dispersión importante o no. Para solucionar
esto, se definen unas medidas de dispersión relativas, independientes de las unidades
usadas. Estas dispersiones relativas van a permitir además comparar la dispersión entre
diferentes muestras (con unidades diferentes). Entre estas medidas hay que destacar el
coeficiente de variación de Pearson, definido como el cociente entre la desviación típica y la
media aritmética, es decir.
𝒔
𝑪𝑽 = ∗ 𝟏𝟎𝟎%
̅
𝒙
Cuanto mayor sea el CV, mayor dispersión tendrán los datos.
Asimetría y Curtosis
a descripción estadística de una muestra de datos no concluye con el cálculo de su tendencia
central y su dispersión. Para dar una descripción completa es necesario estudiar también el
grado de simetría de los datos respecto a su medida central y la concentración de los datos
alrededor de dicho valor.
Coeficiente de asimetría
se dice que una distribución de medidas es simétrica cuando valores de la variable

equidistantes, a uno y otro lado, del valor central tienen la misma frecuencia. Es decir, en este
caso tendremos simetría en el histograma (o en el diagrama de barras) alrededor de una
vertical trazada por el punto central. caso de una distribución perfectamente simétrica los
valores de media aritmética, mediana y moda coinciden
Coeficiente de Asimetría de Pearson.
Se define como.
̅ − 𝑴𝒐
𝒙
𝑨𝒑 =
𝒔
Ejercicios en clase.
1. Un fabricante de neumáticos quiere determinar el diámetro interior de cierto grado

de neumáticos. Idealmente el diámetro seria 570 mm, los datos son los siguientes
565 568 569 570 572 572 573 575

1.1. Encuentre la media y la mediana de la muestra
1.2. Encuentre la varianza, desviación estándar y el rango de la muestra
1.3. Mediante el uso de los estadísticos calculados anteriormente, ¿puede hacer
comentarios sobre la calidad de los neumáticos?
2. Se conduce un estudio de los efectos de fumar sobre los patrones de sueño. La
medición que se observa es el tiempo, en minutos, que toma quedar dormido, se
obtiene los siguientes datos.
fumadores No fumadores
69.3, 28.6,25.1,26.4,34.9,29.8,28.4,38.5,30.2,30.6,31.8
56.0,22.1,53.2,48.1,52.7,34.4,60 ,41.6,21.1,36.0,37.9,13.9
.2,43.8,23.2,13.8
2.1. Encuentre la media de la muestra para cada grupo
2.2. Encuentre la desviación estándar
2.3. Realiza un gráfico de caja para cada grupo
2.4. Calcula el CV
2.5. Comente que clase de impacto parece tener el fumar sobre el tiempo que se
requiere para quedar dormido.
3. En el artículo “Evaluación of Low-Temperatura Propretores of HMA Mixtures” (P.
Sibal, A. Lake y J. UPS, en Jornal of Transportación Engineering, 2002:578-583) se
midieron los siguientes valores de la tensión de fractura (en megapascales) para una
muestra de 24 mezclas de asfalto mezclado caliente (HMA)
30 75 79 80 80 105 126 138 149 179 179 191

223 232 232 236 240 242 245 247 254 274 384 470
3.1. Calcule la media, mediana, moda, varianza, desviación estándar e interprete

3.2. Construya un diagrama de caja para los datos de asfalto.
3.3. ¿Qué valores, si los hay, son atípicos?
3.4. Construya una gráfica de puntos para los datos de asfalto.
Con el fin de construir diagramas de caja, se define un dato atípico como un punto cuya
distancia al cuartil más cercano es mayor a 1.5 IQR. Una definición más general y menos
precisa es que un dato atípico es cualquier punto que está separado de la mayor parte de los
datos. ¿Hay puntos en el conjunto de datos del asfalto que son datos atípicos bajo esta
definición más general, pero no bajo la definición del diagrama de caja? ¿Si es así, cuáles son?
4. considérense la resistencia ( en psi) al rompimiento obtenidas de dos muestras de

dos botellas cada una:
Muestra 1: 230, 250, 245, 258, 265, 240

Muestra 2: 190, 228, 305, 240, 265, 260
4.1. calcule la media, y la desviación estándar, coeficiente de variación de cada
muestra.
4.2. ¿Cuál muestra presenta mayor resistencia al rompimiento? Justifica la respuesta
Unidad II: Introducción a la probabilidad
Temas:
Probabilidad clásica
Axiomas de probabilidad
Regla de la suma y probabilidad condicional.
Distribución normal de probabilidad
Probabilidad clásica
La teoría de probabilidad proporciona la base para la inferencia estadística, es por ello que
para una mejor compresión de los conceptos de inferencia es necesario una introducción a
esta rama de la matemática.
Un ejemplo de probabilidad es el siguiente, se suele escuchar a un médico decir que un

paciente tiene 50% de probabilidad de sobrevivir a una operación, otro médico puede decir
que esta un 95% seguro de que un paciente tiene una enfermedad determinada, una
enfermera decir que 7 de cada 10 pacientes cancelaran la cita, así, se tiene la costumbre de
medir la probabilidad de ocurrencia de algún evento por medio de un numero entre cero y
uno, cuanto más cerca este de 1 más probable es que suceda.
Experimentos aleatorios
La teoría de la probabilidad surge para poder estudiar los, llamados, experimentos

aleatorios. Se dice que un experimento es aleatorio si puede dar lugar a varios resultados sin
que se pueda predecir con certeza el resultado concreto. Es decir, al repetir el experimento
bajo condiciones similares se obtendrán resultados que, en general, serán diferentes. Un
ejemplo de un experimento aleatorio puede ser la tirada de un dado, ya que no se puede
predecir el número que aparecerá en su cara superior.
Evento
Conjunto de uno o más resultados de un experimento, se puede hablar de evento simple, que
es un resultado del espacio muestral con una sola característica, un vento conjunto es, por su
parte, un resultado del espacio muestral con dos o más característica.
Especio muestral
Conjunto de todos los posibles evento o resultado que pueden ocurrir en un experimento
aleatorio
Punto muestral
Son cada uno de los elementos del espacio muestral.
Ejemplo
Experimento Lanzar un dado y observar el número que cae hacia arriba

Espacio muestral 1, 2, 3, 4, 5, 6
Punto muestral Cada uno de los valores del espacio muestral
Evento simple Que sea un numero par (una sola característica)
Evento conjunto Que sea un numero par mayor que 4 ( dos características)
Enfoque de probabilidad
Hay dos tipos de enfoque de probabilidad, tenemos el enfoque subjetivo que como su nombre
sugiere viene basado en la experiencia del investigador, por ejemplo, decir que existe una
probabilidad alta que hoy llueve en función de ciertos patrones que se observan, está el
enfoque objetivo, este tiene un fundamento matemático (teórico).
Enfoque de
probabilidad
Objetivo Subjetivo
Clasico Empirico
Enfoque clásico
Se basa en la idea de que los resultados de un experimento son igualmente posibles. Se

calcula de la manera siguiente:
𝑐𝑎𝑠𝑜 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 =
𝑐𝑎𝑠𝑜 𝑡𝑜𝑡𝑎𝑙𝑒𝑠
Es decir
𝑛
𝑃(𝐴) =
𝑁
Ejemplo
En una universidad 600 alumnos estudian en la escuela de negocios (economía,

administración y relaciones internacionales, entre otras carreras), 550 estudian en la escuela
de ingeniería y 350 en la de humanidades.
Determina las siguientes probabilidades
Estudie en la escuela de ingeniería.
Estudie en la escuela de humanidades.
Estudie en la escuela de ingeniería o de negocios
Enfoque empírico
Este enfoque se basa principalmente en frecuencias relativas, esto es, en el número de veces
que ocurrió cierto evento en el pasado, y se calcula de esta manera:
# 𝑣𝑒𝑐𝑒𝑠 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑖𝑜 𝑒𝑛 𝑒𝑙 𝑝𝑎𝑠𝑎𝑑𝑜
𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 =
# 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠
Axiomas de probabilidad
Para un suceso A, se cumple los siguientes enunciados
1. La probabilidad de A es mayor o igual a cero

𝑃(𝐴) ≥ 0
2. La probabilidad de A esta entre cero y uno
0 ≤ 𝑃(𝐴) ≤ 1
3. La probabilidad del espacio muestral es 1
𝑃(𝑆) = 1
4. La probabilidad de la unión de suceso es la suma de las probabilidades
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
5. La probabilidad A y su complemento es 1
𝑃(𝐴) + 𝑃(𝐴𝑐 ) = 1
Ejemplo
Se lanza un dado, calcule la probabilidad de obtener un numero par o un número mayor que
3.
Ejemplo
Un experimento consiste en lanzar una moneda y después lanzarla una segunda vez si sale
cara, si sale cruz en el primer lanzamiento, entonces se lanza un dado una vez.
a. Construya el espacio muestral

b. Calcula la probabilidad de que salga cruz y el dado caiga en un número par
Probabilidad conjunta
Ya aprendimos como calcular las probabilidades simples ( de una sola característica), ahora
estudiaremos como calcular la probabilidad de eventos conjuntos (dos o más característica)
Probabilidad conjunta
Eventos mutuamente Probabilidad

Evntos independientes
excluyentes condicional
Regla de la
Regla de la suma A priori
multiplicacion
A posteriori
Independencia de eventos
Dos o más eventos son independientes si la ocurrencia de uno no afecta la ocurrencia o no

ocurrencia del otro. Matemáticamente eso se puede expresar como:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵)
En caso contrario serán dependientes.
Probabilidad condicional
A menudo sucede que un evento influye en que se presente u ocurra otro. Esto recibe el
nombre de probabilidad condicional, que se define como la probabilidad de que el evento A
ocurra, puesto que ya se presentó el evento B. La probabilidad condicional se calcula como
sigue:
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵 ) = ; 𝑃(𝐵) ≠ 0
𝑃(𝐵)
A este tipo de probabilidad condicional se le conoce como a priori, ya que sucede un evento
y se quiere conocer la probabilidad de su efecto.
De la formula anterior tenemos que:
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐵)𝑃(𝐴⁄𝐵 )
Esta es la regla de multiplicación para eventos dependientes.
Si los eventos son independientes, se tiene que:
𝑃(𝐴⁄𝐵 ) = 𝑃(𝐴) 𝑃(𝐵⁄𝐴) = 𝑃(𝐵)
Ejemplo
Comportamiento del consumidor. Se seleccionó una muestra de 1004 encuestados en el área

metropolitana para determinar cierta información acerca del comportamiento de los
consumidores. Entre las preguntas estaba: “¿Disfruta usted comiendo chocolates?” De 527
hombres que respondieron a la encuesta, 302 contestaron que sí; de 477 mujeres, 452
respondieron que sí.
a) Elabora una tabla de contingencia para evaluar las probabilidades.
b) Da un ejemplo de evento simple.
c) Da un ejemplo de evento conjunto.
d) ¿Cuál es el complemento de “disfrutar comiendo chocolates”? ¿Cuál es la probabilidad de

que un encuestado elegido al azar sea hombre?
e) Disfrute comiendo chocolates?
f) Sea mujer y disfrute comiendo chocolates?
g) Sea hombre y no disfrute comiendo chocolates?
h) Sea mujer o disfrute comiendo chocolates?
i) Sea hombre o no disfrute comiendo chocolates?
j) Sea hombre o mujer?
k) Sea mujer, puesto que disfruta comiendo chocolates?
l) ¿Son eventos independientes ser mujer y disfrutar comiendo chocolates?
Teorema de Bayes
Thomas Bayes (Inglaterra 1702-1761) fue un teólogo protestante que dedicó gran parte de
su vida a demostrar la existencia de Dios para quienes no creían. En su afán por probar
mediante métodos matemáticos que dios es la única causa de todo lo que existe dio con una
fórmula que hoy en día resulta muy útil y que se conoce como teorema de Bayes.
El teorema de Bayes sirve para calcular la probabilidad condicional a posteriori. En otras

palabras, sirve para determinar la probabilidad de una de las causas, puesto que ya se
observó el efecto, y se calcula de la manera siguiente:
𝑃(𝐵𝑗 )𝑃 (𝐴⁄𝐵 )
𝐵 𝑗
𝑃 ( 𝑗⁄𝐴) =
𝑛 𝐴
∑𝑖=1 𝑃(𝐵𝑖 )𝑃 ( ⁄𝐵 )
𝑖
Donde 𝐵𝑗 es la causa j y A es el efecto, y 𝐵𝑖 es la causa i, donde 𝑖 = 1,2,3, … 𝑛
Reescribiendo la formula
𝑃(𝐵𝑗 )𝑃 (𝐴⁄𝐵 ) 𝑃(𝐴 ∩ 𝐵𝑗 ) 𝑃(𝐴 ∩ 𝐵𝑗 )

𝐵 𝑗
𝑃 ( 𝑗⁄𝐴) = = =
∑𝑛𝑖=1 𝑃(𝐵𝑖 )𝑃 (𝐴⁄𝐵 ) ∑𝑛𝑖=1 𝑃(𝐴
∩ 𝐵𝑖 ) 𝑃(𝐴)
𝑖
Ejemplo
1. Una empresa dedicada a la fabricación de bolsas de plástico tiene tres máquinas (A, B
y C) para ello. La máquina A realiza 25% de la producción de bolsas; la máquina B,
35%, y la máquina C, 40%. Se ha determinado que cuando las bolsas son hechas por
la máquina A, 5% tiene defectos; de la máquina B, 10% los tiene, y de la máquina C,
3%. De acuerdo con estos datos:
a. Realiza el diagrama de árbol correspondiente.
b. ¿Cuál es la probabilidad de que una bolsa, elegida al azar, esté defectuosa?
c. Si una bolsa está defectuosa, ¿cuál es la probabilidad de que haya sido producida por
la máquina A? ¿Por la máquina B? ¿Y por la máquina C?
2. El cáncer de pulmón consiste en un crecimiento anormal de las células de ese órgano.

La enfermedad se produce habitualmente en las paredes internas de los bronquios,
que al crecer puede obstruir el paso del aire y alterar la respiración. Por ello, produce
generalmente falta de aire, ahogo y fatiga. El hábito de fumar tabaco es la causa
principal del cáncer de pulmón, tanto en hombres como en mujeres
(http://www.elmundo.es/elmundosalud/especiales/cancer/ pulmon5.html). Se
sabe que 40% de las personas fuma o ha fumado alguna vez en su vida. Además, se
sabe que 90% de quienes fuman o han fumado presentan cáncer de pulmón y que
25% de las personas no fumadoras pueden desarrollar cáncer de pulmón. De acuerdo
con esta información:
a) Elabora el árbol de probabilidad respectivo.
b) Calcula la probabilidad de que una persona presente cáncer de pulmón, sea o no
fumadora.
c) Si una persona desarrolla cáncer de pulmón, ¿cuál es la probabilidad de que haya
sido fumadora?
d) ¿Cuál es la probabilidad de que una persona sea fumadora “pasiva” y desarrolle
cáncer de pulmón?
e) ¿Crees que las campañas emprendidas en el país para alentar a la gente a que deje
de fumar han sido eficaces? Explica tu respuesta. ¿Qué propondrías para lograr
una influencia mayor en la población a este respecto y que un número más grande
de personas dejara de fumar
3. México registra altos porcentajes de embarazos en adolescentes. Entre las causas se
encuentran la insuficiente educación sexual, la falta de disponibilidad de métodos
anticonceptivos, la poca preparación en materia sexual de maestros y gobiernos
locales que obstaculizan políticas públicas en la materia. De acuerdo con estudios
realizados, 72.5% de las mujeres utilizan anticonceptivos. Se sabe que 23% de las
mujeres que no emplearon algún método anticonceptivo se embarazan; en tanto que
14% de las mujeres que sí lo usaron resultaron embarazadas. Con base en estos datos:
a) Elabora el árbol de probabilidad correspondiente.
b) ¿Qué porcentaje existe de embarazos?
c) Si una persona se embaraza, ¿cuál es la probabilidad de que haya sido por no utilizar
algún método anticonceptivo?
d) Si una persona se embaraza, ¿cuál es la probabilidad de que haya sido así pese a haber
utilizado algún método anticonceptivo?
Variables aleatorias y Distribución Normal de Probabilidades.
Uno variable aleatoria es un medio para describir los resultados del espacio muestral
mediante la asignación de valores. En el caso de una variable aleatoria continua, los valores
numéricos provienen de un intervalo continuo, es decir, no son valores específicos, sino que
puede ser cualquier valor entre dos números, a y b. En otras palabras, con variables
aleatorias continuas la probabilidad de que la variable aleatoria X sea igual a un valor es cero,
P(X = x) = 0, ya que es imposible que X tenga exactamente ese valor.
Experimento Variable aleatoria X Valores posibles de X

Tomar café durante el día Contar la cantidad de café 0 a 1.5 litros
que se toma en el día
Manejar un auto Determinar la distancia 0 a n kilómetros
recorrida en una semana
Determinar el consumo Medir la cantidad de calorías 0 a p calorías diarias
diario de calorías ingeridas en un día
Determinar la altura media Mediar la altura de los 0a 2.5 metros
de los estudiantes de una estudiantes de una escuela
escuela
La distribución normal es la más importante, debido principalmente a que hay muchas
variables asociadas a fenómenos naturales que siguen un comportamiento que, al graficarse,
tienen forma de campana. Estas variables pueden referirse a:
Caracteres morfológicos de personas, animales o plantas, como tallas, pesos, diámetros,
perímetros, etcétera.
Caracteres fisiológicos, por ejemplo, efecto de una misma dosis de un fármaco o de una
misma cantidad de abono.
Caracteres sociológicos, por citar algunos casos, consumo de cierto producto por un mismo
grupo de individuos o las puntuaciones obtenidas en un examen.
Caracteres psicológicos, como el cociente intelectual o el grado de adaptación a un medio,

entre otros.
Errores cometidos al medir ciertas magnitudes.
Característica de la distribución normal
• La distribución normal se conoce también como campana de Gauss en honor de Karl

Friedrick Gauss y debido a que tiene forma de campan
• Por una distribución de probabilidad, el área bajo la curva es 1
• Es una distribución asintótica, es decir que x tiende a mas o menos infinito, la función
tiende a cero.
• Es una distribución simétrica respecto a la media (𝜇). Además, la media, la moda y la
mediana tiene el mismo valor.
• El punto máximo se encuentra en 𝜇
• La ubicación de la distribución normal se ubica en 𝜇
• La dispersión de la distribución normal se determina por 𝜎
• Los puntos de inflexión, donde la curvatura de la función se encuentre en 𝜇 ± 𝜎
La función de densidad de esta distribución viene dada por:

1 1 𝑥−𝜇 2
𝑒 2 𝜎 )
− (
𝑓(𝑥) =
√2𝜋𝜎 2
Distribución normal estándar
Esta distribución tiene media igual a cero y desviación estándar igual a uno. Es importante
señalar que a la variable aleatoria distribuida como una normal estándar se le llama Z para
diferenciarla de la X.
Por lo tanto:
𝑥−𝜇
𝑧=
𝜎
De manera grafica se tiene
Ejemplo
Se midió el índice de masa corporal en 100 participantes, obteniendo un promedio de 27.86

y una desviación estándar de 4.4262.
Si se elige una personal al azar, cual es la probabilidad que el índice de masa corporal sea.
a. Mayor a 30
b. Menor a 23
c. Entre 24 y 28
d. Entre 25 y 30
e. Entre 20 y 24
f. Menor a 40
g. Mayor a 24.32
h. Menor a 28.16
i. Mayor a 29.99
j. Cuál es el valor máximo del índice de masa corporal del 20%, 65% y 95% de los
participantes.
Suponga que las edades en las que se adquiere cierta enfermedad están distribuidas de forma
aproximadamente normal, con una media de edad de 12.5 años y una desviación estándar de
3 años. Un niño acaba de contraer dicha enfermedad. Cual es la probabilidad de que el niño
tenga:
a. Entre 8.5 y 14.5 años?

b. Mas de 10 años?
c. Menor a 13 años?
Distribuciones muestrales
La distribucion de todos los valores posibles que puede tomar algun estadistico, calculado de
muestras del mismo tamano extraidas al azar de la misma poblacion, se conoce como
distribucion muestral de esa estadistico.
Ejercicio en clase.
Obtenga la edad de 5 estudiantes para formar nuestra poblacion (N=5), de esta poblacion
extraer todas las muestras posibles de tamano 2 y construir la distribucion muestral para la
media.
Distribucion de medias muestrales
Como ya se aprecio en el ejerciicoo anterior, se deduce lo siguiente:
Suponga que una muestra de n observaciones se toma de una poblacion con media 𝜇 y
varianza 𝜎 2 , cada observacion 𝑋𝑖 ; 𝑖 = 1,2,3, … , 𝑛 de la muestra aleatoria tendra entonces la
misma distribucion normal de la poblacion que se muestrea, de aquí se deduce que:
1
𝑋̅ = (𝑋 + 𝑋2 + ⋯ + 𝑋𝑛 )
𝑛 1
Tiene un distribucion normal con media
1
𝜇𝑋̅ = (𝜇 + + ⋯ + 𝜇) = 𝜇
𝑛
Y varianza
1 2 𝜎2
𝜎𝑋2̅ 2 2
= 2 (𝜎 + 𝜎 + ⋯ + 𝜎 ) =
𝑛 𝑛
Teorema central de limite
Si 𝑋̅ es la media de una muestra aleatoria de tamaño n tomada de una población con media
𝜇 y varianza finita 𝜎 2 , entonces la forma límite de la distribución de:
(𝑋̅ − 𝜇)
𝑍=
𝜎/√𝑛
Conforme la muestra se hace muy grande, es la distribución normal estándar 𝑛(𝑧, 0,1)
Inferencia estadística
La inferencia estadística se puede tomar en dos partes, las cuales son: estimación y prueba
de hipótesis, analicemos el siguiente enunciado.
Un candidato a un cargo público puede desear estimar la verdadera proporción de votantes

que lo favorecerán mediante la obtención de las opiniones de una muestra aleatoria de 100
de ellos. La fracción de votantes en la muestra que favorecerán al candidato se podría utilizar
como una estimación de la verdadera proporción en la población de votantes. El
conocimiento de la distribución muestral de una proporción nos permite establecer el grado
de precisión de nuestra estimación. Este problema cae en el área de la estimación.
Estimación por intervalo
Es improbable que incluso el estimador insesgado más eficaz estime con exactitud el
parámetro poblacional. Es cierto que nuestra precisión aumenta con muestras grandes; pero
no hay razón por la cual deberíamos esperar que una estimación puntual de una muestra
dada sea exactamente igual al parámetro poblacional que se supone estima. Hay muchas
situaciones en que es preferible determinar un intervalo dentro del cual esperaríamos
encontrar el valor del parámetro. Tal intervalo se llama estimación por intervalo.
Suponga que desea formar un intervalo de la forma.
𝐿<𝜇<𝑈
Donde nuestro parámetro de interés (en este caso la media poblaciones), este dentro del
valor L, el cual es el limite inferior del intervalo y U el cual es el límite superior del intervalo.
Como los valores de L y U cambian con cada muestra que sacamos, de la distribución
muestral de 𝜇, queremos encontrar 𝑃(𝐿 < 𝜇 < 𝑈) sea igual algún valor fraccional positivo
que queramos especificar, esto es:
𝑃(𝐿 < 𝜇 < 𝑈) = 1 − 𝛼

Para 0 < 𝛼 < 1, tenemos entonces una probabilidad de 1 − 𝛼 de seleccionar una variable
aleatoria que produzca un intervalo que contenga nuestro parámetro de interés, el intervalo
𝐿 < 𝜇 < 𝑈 se calcula a partir de una muestra seleccionada, se llama intervalo de confianza
de (1 − 𝛼)%, donde 1 − 𝛼 se llama grado de confianza y los extremos 𝐿, 𝑈 son los limites de
confianza inferior y superior respectivamente.
Dado que la distribución muestral del parámetro se comporta de manera normal, donde:
(𝑋̅ − 𝜇)
𝑧=
𝜎/√𝑛
Entonces:
𝑥̅ − 𝜇
𝑃 (−𝑧𝛼 < 𝜎 < 𝑧𝛼2 ) = 1 − 𝛼
2
√𝑛
𝑥̅ −𝜇
De la expresión −𝑧𝛼 < 𝜎 < 𝑧𝛼 despejamos la media, tenemos que:
2 √𝑛 2
𝜎 𝜎
𝑥̅ − 𝑧𝛼 ∗ < 𝜇 < 𝑥̅ + 𝑧𝛼 ∗
2 √𝑛 2 √𝑛
De esta forma podemos calcular un intervalo de confianza para la media poblacional.
Ejemplos
Una muestra de 100 hombres adultos aparentemente normales, de 25 años de edad, mostró
una presión sistólica sanguínea media de 125. Si se tiene la sensación de que la desviación
estándar de la población es de 15, encuentre:
a) El intervalo de confianza del 90 por ciento para madia .
b ) El intervalo de confianza del 95 por ciento para la media

intervalo de confianza cuando se desconoce 𝜎.
En muchas ocasiones se desea estimar o construir un intervalo de confianza para la media

poblacional, el problema que nos enfrentamos es que quizás desconocemos la varianza
poblacional o el tamaño de muestra es pequeño, para ello nos auxiliamos de la distribución
T student.
Recordemos que si tenemos una muestra aleatoria a partir de una distribución normal,
entonces la variable aleatoria.
𝑥̅ − 𝜇
𝑇=
𝑠/√𝑛
Tiene una distribución t de student con n-1 grados de libertad, donde s es la desviación
estándar muestral, entonces nuestro intervalo queda de la siguiente manera.
𝑠 𝑠
𝑥̅ − 𝑡𝛼,𝑛−1 ∗ < 𝜇 < 𝑥̅ + 𝑡𝛼,𝑛−1 ∗
2 √𝑛 2 √𝑛
Ejemplo
El contenido de 7 contenedores similares de ácido sulfúrico es de 9.8, 10.2, 10.4, 9.8, 10.0,
10.2, y 9.6 litros. Encuentre un intervalo de confianza de 95% para la media de todos los
contenedores, si se supone una distribución aproximadamente normal.
Estimación por intervalo de una proporción
Muchas cuestiones de interés para quien trabaja en el campo de la salud se relacionan con la
proporción de las poblaciones. ;Qué proporción de los pacientes que reciben un tipo
particular de tratamiento se recupera? ;Qué proporción de alguna población tiene cierta
enfermedad? ¿Qué proporción de una población es inmune a cierta enfermedad?
De manera general el intervalo de confianza viene estructurado de la siguiente forma:
𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 ± 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 ∗ 𝑒𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟

𝑥
Para el caso de la proporción el estimador, viene dado por: 𝑝̂ = 𝑛, donde x es el numero de
caso de interés y n es el tamaño de la muestra.
𝑝̂(1−𝑝̂)
Donde el error estándar viene dado por: √ , la fórmula es:
𝑛
𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ )
𝑝̂ − 𝑧𝛼 √ < 𝑃 < 𝑝̂ + 𝑧𝛼/2 √
2 𝑛 𝑛
Ejemplo
En un estudio diseñado para conocer la relación entre cierto medicamento y cierta anomalía
en los embriones de pollo, se inyectaron con el medicamento 50 huevos fecundados al cuarto
día de incubación, en el vigésimo día de incubación se examinaron los embriones y se
observo la presencia de la anomalía en 12 de ellos, encuentra un intervalo de confianza del
85%, 90% y 95% para P
Intervalo de confianza para diferencia de dos proporciones
Sean 𝑝̂1 y 𝑝̂2 estimadores puntuales de las proporciones 𝑃1 , 𝑃2 respectivamente, un intervalo

de confianza para la diferencia de las proporciones viene dado por:
𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂ 2 (1 − 𝑝̂ 2 )
(𝑝̂1 − 𝑝̂2 ) − 𝑧𝛼 √ + < 𝑃1 − 𝑃2
2 𝑛1 𝑛2
𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂2 (1 − 𝑝̂2 )

< (𝑝̂1 − 𝑝̂2 ) + 𝑧𝛼 √ +
2 𝑛1 𝑛2
Ejemplo
Doscientos pacientes que sufrían de cierta enfermedad fueron divididos al azar en dos
grupos iguales. Del primer grupo, quienes recibieron el tratamiento estándar, 78 se
recuperaron en un plazo de tres días. De los otros 100, quienes fueron tratados mediante un
nuevo tratamiento , 90 se recuperaron al cabo de tres días también. Los médicos desearon
estimar la diferencia verdadera en las proporciones de quienes se recuperaron en tres días.
Intervalo de confianza para la diferencia de medias
Si 𝑥̅1 , 𝑥̅2 son las medias de muestras aleatorias independientes de tamaños 𝑛1 𝑦 𝑛2 de

poblaciones con varianzas conocidas 𝜎12 𝑦 𝜎22 respectivamente, un intervalo de confianza de
(1 − 𝛼)% para 𝜇1 − 𝜇2 este dato por:
𝜎12 𝜎22 𝜎12 𝜎22

(𝑥̅1 − 𝑥̅2 ) − 𝑧𝛼 √ + < 𝜇1 − 𝜇2 < (𝑥̅1 − 𝑥̅2 ) + 𝑧𝛼 √ +
2 𝑛2 𝑛2 2 𝑛2 𝑛2
Donde 𝑧𝛼 es el valor de z que deja un área de 𝛼/2 a la derecha.

2
Ejemplo
Se lleva a cabo un experimento donde se comparan dos tipos de motores, A y B. Se mide el

rendimiento de combustible en millas por galón. Se realizan 50 experimentos con el motor
tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se
mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas
por galón, y el promedio para el motor B es de 42 millas por galón. Encuentre un intervalo
de confianza de 96% sobre μB – μA, donde μA y μB son el rendimiento de combustible medio
poblacional para los motores A y B, respectivamente. Suponga que las desviaciones estándar
poblacionales son 6 y 8 para los motores A y B, respectivamente.
Intervalo de confianza para diferencias de medias con varianzas desconocidas
Si 𝑥̅1 , 𝑥̅2 son las medias de muestras aleatorias independientes de tamaños 𝑛1 𝑦 𝑛2 de

poblaciones aproximadamente normal con varianzas iguales pero desconocidas, un intervalo
de confianza de (1 − 𝛼)% para 𝜇1 − 𝜇2 este dado por:
1 1 1 1
(𝑥̅1 − 𝑥̅2 ) − 𝑡𝛼 ∗ 𝑆𝑝 √ + < 𝜇1 − 𝜇2 < (𝑥̅1 − 𝑥̅2 ) + 𝑡𝛼 ∗ 𝑆𝑝 √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
Donde 𝑆𝑝 es la estimación de la unión de la desviación estándar poblacional, la cual viene

dada por
(𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22

𝑆𝑝2 =
𝑛1 + 𝑛2 − 2
Y 𝑡𝛼/2 es el valor t con 𝑛1 + 𝑛2 − 2 grados de libertad.
Ejemplo
En un estudio que se lleva a cabo en el Instituto Politécnico y Universidad Estatal de Virginia

sobre el desarrollo de ectomycorrhizal, una relación simbiótica entre las raíces de los árboles
y un hongo, en la cual se transfieren minerales del hongo a los árboles y azúcares de los
árboles a los hongos, se plantan en un invernadero 20 robles rojos con el hongo Pisolithus
tinctorus. Todos los árboles se plantan en el mismo tipo de suelo y reciben la misma cantidad
de luz solar y agua. La mitad no recibe nitrógeno en el momento de plantarlos para servir
como control y la otra mitad recibe 368 ppm de nitrógeno en forma de NaN03. Los pesos de
los tallos, que se registran en gramos, al final de 140 días se registran como sigue:
Sin 0.32 0.53 0.28 0.37 0.47 0.43 0.36 0.42 0.38 0.43
nitrógeno
Con 0.26 0.43 0.47 0.49 0.52 0.75 0.79 0.86 0.62 0.46
nitrógeno
Construya un intervalo de confianza de 95% para la diferencia en los pesos medios de los
tallos entre los que no recibieron nitrógeno y los que recibieron 368 ppm de nitrógeno.
Suponga que las poblaciones están distribuidas normalmente con varianzas iguales.
Muestras pareadas.
Anteriormente se estudio el caso cuando se tenían dos muestras independientes, se
consideraba el tamaño de las muestras y si las varianzas eran o no iguales.
Considere el caso en que desea estudiar la efectividad de una dieta, para ello toma en cuenta
a 15 individuos para formar su población de prueba, en esta caso se está interesado en medir
los pesos antes y después de seguir la dieta , estos dos momentos forman mis dos muestras,
una muestra de peso antes de empezar la dieta y otro muestra de peso después de iniciar la
dieta, para determinar si la dieta es efectiva consideremos las diferencias de pesos
𝑑1 , 𝑑2 , … , 𝑑𝑛 en las observaciones pareadas, estas diferencias son los valores de una muestra
aleatoria 𝐷1 , 𝐷2 , … , 𝐷𝑛 de una población de diferencias que asumiremos se distribuye normal
media 𝜇𝐷 = 𝜇1 − 𝜇2 y varianza 𝜎𝐷2 , donde los estimadores puntuales son 𝐷 ̅ 𝑦 𝑆𝑑2
respectivamente.
Intervalos de confianza
Si 𝑑̅ y 𝑠𝑑 son la media y desviación estándar, respectivamente, de las diferencias distribuidas

normal de n pares aleatorios de mediaciones, un intervalo de confianza de (1 − 𝛼)% para
𝜇𝐷 = 𝜇1 − 𝜇2 es:
𝑠𝑑 𝑠𝑑
𝑑̅ − 𝑡𝛼 < 𝜇𝐷 < 𝑑̅ + 𝑡𝛼
2 √𝑛 2 √𝑛
Donde 𝑡𝛼 es el valor de t con n-1 grados de libertad.
2
Ejemplo
Una enfermera del trabajo desea saber si la exposición a ruido provoca manifestaciones extra
auditivas como alteración de la presión arterial sistólica. Para ello, realiza un estudio sobre
un grupo de trabajadores expuestos a ruido que trabaja en una fábrica textil. El diseño
epidemiológico planteado recoge la tensión arterial antes de comenzar a trabajar y después
de 8 horas ininterrumpidas de actividad laboral. Los resultados se muestran en la siguiente
tabla.
N 1 2 3 4 5 6 7 8 9 1 1 1 1 1 1 1 1 1 1 2
0 1 2 3 4 5 6 7 8 9 0
TAS 1 1 1 1 1 1 1 1 1 1 1 1 1 1 9 1 1 1 1 1
Pre 2 1 3 0 2 1 4 3 2 3 2 3 0 1 6 2 4 3 2 3
m 0 8 6 8 6 6 2 0 2 0 6 8 8 6 8 6 8 0 0
mH
g
TAS 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Pos 2 2 4 0 2 3 4 3 3 3 4 3 2 1 1 3 5 4 2 3
t 4 0 4 6 4 0 6 6 4 6 0 6 6 2 0 8 6 0 0 8
m
mH
G
Construya un intervalo de confianza para las diferencias de las muestras e interprete los
resultados
Pruebas de hipótesis
Una hipótesis estadística es un enunciado sobre la naturaleza de una población,

generalmente se formula en términos de un cierto parámetro desconocido de la población.
El contraste de hipótesis es una técnica de la estadística inferencial que permite comprobar

si la información que proporciona una muestra observada concuerda o no con la hipótesis
formulada
• Por lo general, las hipótesis establecen que un cierto parámetro poblacional tiene un
valor o pertenece a una determinada región
• Se toma una muestra aleatoria representativa de la población para decidir su se
rechaza o no la hipótesis planteada
• Si la información muestral es consistente con la hipótesis estadística entonces no se
rechaza dicha hipótesis, en caso contrario, se rechaza.
Contraste de hipótesis
Se llama hipótesis nula, denotada H0, al enunciado acerca de un parámetro de la población

que se somete a contraste, la hipótesis contraria a la nula se llama alternativa, esta se denota
como H1.
La hipótesis nula suele representar como una igualdad del tipo 𝐻0 : 𝜃 = 𝜃0 , donde 𝜃0 denota
un hipotético valor para un parámetro de 𝜃 de la población.
Los tipos de constaste dependen de la forma de plantear la hipótesis alternativa
• Bilateral o de dos colas 𝐻1 : 𝜃 ≠ 𝜃0

• Unilateral a la derecha o de una cola a la derecha 𝐻1 : 𝜃 > 𝜃0
• Unilateral a la izquierda o de una cola a la izquierda 𝐻1 : 𝜃 < 𝜃0
Procedimiento y decisión
Para el contrate de una hipótesis nula se determina:
• Un estadístico, llamada estadístico de contraste, que sigue un modelo de distribución

de probabilidad conocido, este valor se calcula a partir de la muestra
• La región critica o región de rechazo que esta definida como el conjunto de valores
del estadístico de contraste para los que se rechaza la hipótesis nula
• Un nivel de significación 𝛼 que es la probabilidad de rechazar la hipótesis nula cuando
es cierta, se denomina nivel de confianza al valor 1 − 𝛼
El contrate estadístico de la hipótesis nula queda completamente especificado al determinar

el valor del estadístico de contraste y la región critica.
Criterio del p valor
El p valor o nivel critico asociado a un contraste se define como el mínimo nivel de

significancia con el que la hipótesis nula será rechazada a favor de la alternativa
Para un nivel de significancia de 𝛼 se tiene que.
• Rechazar H0 si: 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼

• No rechazar H0 si: 𝑝 − 𝑣𝑎𝑙𝑜𝑟 > 𝛼
Tipo de errores
Como el contaste de una hipótesis solo puede tener dos resultados, entonces, al tomar la
decisión solo puede haber dos tipos de error:
• Error tipo I: se rechaza la hipótesis nula cuando esta es verdadera

• Error tipo II: no se rechaza la hipótesis nula cuando esta es falsa
Las probabilidades de cometer cada uno de estos dos tipos de error miden el riesgo de tomar
una decisión incorrecta al realizar un contraste de hipótesis:
• Nivel de significancia, 𝛼 = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼)

• 𝛽 = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼)
Las probabilidades de tomar una decisión correcta en un contraste de hipótesis se llaman
• Nivel de confianza, 1 − 𝛼 = 𝑃(𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑐𝑢𝑎𝑛𝑑𝑜 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)

• Potencia, 1 − 𝛽 = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑐𝑢𝑎𝑛𝑑𝑜 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎)
Prueba de hipótesis para la media poblacional .
Varianza conocida
Si el tamaño de muestra es relativamente grande (𝑛 ≥ 30), y se conoce la varianza

poblacional, entonces podemos usar la siguiente estadística
𝑥̅ − 𝜇
𝑍=
𝜎/√𝑛
Ejemplos
1. Una encuesta de 64 laboratorios médicos revelo que el precio medio cargado para
cierta prueba fue de $12 con una desviación estándar de $6. ¿proporcionan estos
datos evidencia suficiente que indique que la media poblacional es mayor a $10?, usa
un nivel de significación de 0.05
2. Se llevo a cabo un estudio sobre nutrición en un país en desarrollo, una muestra de
500 adultos reporto un consumo medio diario de 1985 calorías con una desviación
estándar de 210 calorías. ¿puede concluirse a partir de estos datos que la media de la
población es menor a 2000 calorías?
3. Una encuesta de 100 hospitales de tamaño similar revelo un censo promedio diario
en el servicio de pediatría de 27 con una desviación estándar de 6.5, ¿proporcionan
estos datos evidencia suficiente como para indicar que la media de la población es
mayor a 25?
Varianza desconocida
Si se desconoce a varianza poblacional, al igual que se trabajo con los intervalos de confianza,
podemos auxiliarnos de la distribución t student, cuyo estadístico toma la forma de:
𝑥̅ − 𝜇
𝑡=
𝑠/√𝑛
Ejemplo
Pruebe la hipótesis de que el contenido promedio de los envases de cierto envase para
refresco es de 10 litros, si los contenidos de una muestra aleatoria de 10 envases son 10.2,
9.7, 10.1, 10.3, 9.8, 9.9, 10.4, 10.3, 9.8 litros, utilice un nivel de significancia de 0.01.
Prueba de hipótesis para datos pareados.
Suponga que tiene dos muestras pareadas, tal como se trabajo en los intervalos de confianza,
la pregunta a responder es:
¿existe evidencia suficiente que muestra una diferencia significativa en las medias de ambas
muestras?
Tenga en cuenta que al ser muestras pareadas, dichas muestras no son independiente, quizás
a la pregunta anterior se limite a saber si en el caso de nutrición es si la dieta funciono o no
funciono, o si el medicamente ha sido efecto o no, para responder estas interrogantes
debemos tomar en cuenta , como que las poblaciones deben se homogéneas y que el
paramiento se asigna de manera aleatoria.
En el intervalo de confianza para las diferencias de media , teníamos que:

̅ − 𝜇𝐷
𝐷
𝑇=
𝑠𝐷 /√𝑛
Donde 𝐷 ̅ y 𝑠𝐷 son variables aleatorias que representan la media muestral y las desviaciones
estándar de las diferencias de las observaciones en las unidades experimentales, este
problema de dos muestras se reduce a las diferencias de los valores calculadora 𝑑1 , 𝑑2 , … , 𝑑𝑛 ,
de esta forma la hipótesis nula es:
𝐻0 : 𝜇𝐷 = 𝑑0
El estadístico de prueba se calcula mediante a formula:
𝑑̅ − 𝑑0
𝑡=
𝑠𝑑 /√𝑛
Las regiones críticas se construyen usando a la distribución t con n-1 grados de libertad.
Ejemplo
Una enfermera del trabajo desea saber si la exposición a ruido provoca manifestaciones extra
auditivas como alteración de la presión arterial sistólica. Para ello, realiza un estudio sobre
un grupo de trabajadores expuestos a ruido que trabaja en una fábrica textil. El diseño
epidemiológico planteado recoge la tensión arterial antes de comenzar a trabajar y después
de 8 horas ininterrumpidas de actividad laboral. Los resultados se muestran en la siguiente
tabla.
N 1 2 3 4 5 6 7 8 9 1 1 1 1 1 1 1 1 1 1 2
0 1 2 3 4 5 6 7 8 9 0
TAS 1 1 1 1 1 1 1 1 1 1 1 1 1 1 9 1 1 1 1 1
Pre 2 1 3 0 2 1 4 3 2 3 2 3 0 1 6 2 4 3 2 3
m 0 8 6 8 6 6 2 0 2 0 6 8 8 6 8 6 8 0 0
mH
g
TAS 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Pos 2 2 4 0 2 3 4 3 3 3 4 3 2 1 1 3 5 4 2 3
t 4 0 4 6 4 0 6 6 4 6 0 6 6 2 0 8 6 0 0 8
m
mH
G

Semana 2

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Semana 2

Cargado por

Copyright:

Formatos disponibles

Unidad I: Estadística descriptiva

Tema: introducción a la estadística y conceptos generales

Aplicación de la estadística en nutrición.

La estadística es una herramienta valiosa en la investigación de la nutrición humana. La

Antes de adentrarnos en las herramientas estadística, necesitamos saber ciertos conceptos,

Es la rama de la matemática encargada de procesar, analizar datos, la estadística ofrece los

Esta se enfoca en la recolección, resumen y presentación de un conjunto de datos

Palabra clave Definición

Que son los datos?

Son valores o caracteristics que pueden ser observados, contados o medidos.

Variable: es una caracteristica o atributo que puede adquirir distinto valores

Tipos de variable Cuantitativa discreta

Primarias: mediante la observacion o realiazacion de experiementos, encuesta o

El termino censo, se refiere a la obtencion de datos de cada uno de los miembros de la

El proceso de muestreo comienza con la identificación de fuentes adecuadas de datos, como

Hay dos tipos básicos de muestras:

Muestra no probabilística: los elementos se eligen sin tener en cuenta su probabilidad de

Todo depende de la situación en estudio, del presupuesto con que se cuente y de la

Muestreo aleatorio simple.

El muestreo aleatorio simple es la técnica de muestreo más elemental, al punto que

Muestreo aleatorio sistemático

Muestreo aleatorio estratificado

Muestreo aleatorio por conglomerado.

El muestreo por conglomerados consiste en dividir una población en grupos o

Tema: medidas de tendencia central, no centrales y dispersiones para datos agrupados

Calcula de manera las medidas de tendencia central, no centrales y dispersión asociadas a la

Interpretas las medidas de tendencia central, no centrales y dispersión .

A continuación, se muestran el peso de 60 personas medidos en kg

53.6 69.1 75.8 86

54.8 69.9 76.1 86.5

59.3 69.9 78.6 87.5

59.9 70.3 78.6 91.1

59.9 70.3 81.5 91.9

61.3 70.8 82.1 92.7

61.3 72 82.1 92.8

62.6 72.5 83.2 94.2

66.2 73.8 83.5 94.9

66.5 73.9 83.8 95.2

67.1 74.6 83.8 97.3

67.8 74.9 84.3 105.9

68.1 75.2 85.5 109.9

68.1 75.4 85.6 110.3

La tabla de distribución de frecuencias es.

𝑅 = 110.3 − 53.6 = 56.7

𝑘 = 1 + 3.322 log 60 = 6.91 = 7

Límite Límite Frecuencia Frecuencia Frecuencia Frecuencia Marca de

Medidas de tendencia central

1. Mostrar en qué lugar se ubica el elemento promedio o típica del grupo.

Promedio o media aritmética

𝑓𝑖 es la frecuencia del intervalo

𝑚𝑖 es la marca de clase asociada al intervalo

Para nuestra tabla, este valor serio

El peso promedio de la muestra de 60 personas es de 77.79 kg

Propiedades de la media aritmética

La mediana es una importante medida de ubicación, en casos en que la media aritmética no

La fórmula matemática para el cálculo de la mediana en datos agrupados es la siguiente:

𝑙𝑖 es el limite inferior del intervalo donde se encuentra la mediana

𝑓𝑖 es la frecuencia absoluta del intervalo donde esta la mediana

𝑓𝐴𝑎 es la frecuencia acumulada anterior al intervalo donde esta la mediana

70.0 78.2 14 32 0.233 0.533 74.1

Es el valor de la observación o elemento que tiene la mayor frecuencia.

La fórmula matemática para su cálculo es:

Li: Límite inferior de la clase modal (categoría con la mayor frecuencia)