ESTADÍSTICA

ESTADÍSTICA
1. INTRODUCCIÓN.
1.1 NOCIÓN Y UTILIDAD DE LA ESTADÍSTICA Y PROBABILIDAD.
Probabilidad. Valor entre cero y uno, inclusive, que describe la posibilidad relativa de que ocurra un
evento. Se representa con la letra p. Por ejemplo la probabilidad de A se representa:
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴

𝑝(𝐴) =
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
Se utiliza en situaciones cuyo resultado está determinado por el azar y no puede decirse con
exactitud.
Estadística. Es la ciencia que se encarga de recolectar, organizar, resumir y analizar datos para
después obtener conclusiones a partir de ellos. Esto facilita la solución de problemas en los cuales
necesitamos conocer algunas características sobre el comportamiento de algún suceso o evento.
1.2 POBLACIÓN Y MUESTRA.
Población. Conjunto bien definido de todos los individuos, de donde se observa o será observada
cierta característica. Se representa con la letra N.
Espacio muestral. También es llamado espacio probabilístico. Son todos los posibles resultados de
un experimento; se representa con la letra . Ejemplo. Al lanzar dos dados de diferente color, en
cada dado puede caer alguna de sus seis caras, por lo que se tendría el siguiente espacio muestral.
Dado 1
1, 1 1, 2 1, 3 1, 4 1, 5 1, 6
2, 1 2, 2 2, 3 2, 4 2, 5 2, 6
Dado 2
3, 1 3, 2 3, 3 3, 4 3, 5 3, 6
4, 1 4, 2 4, 3 4, 4 4, 5 4, 6
5, 1 5, 2 5, 3 5, 4 5, 5 5, 6
6, 1 6, 2 6, 3 6, 4 6, 5 6, 6
Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no aleatorio o de juicio
y el muestreo aleatorio (que incorpora el azar como recurso en el proceso de selección).
Muestreo probabilístico.
Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcular la
probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de
muestreo es el más aconsejable.
Sin reposición de los elementos: Cada elemento extraído se descarta para la subsiguiente
extracción. Por ejemplo, si se extrae una muestra de una "población" de bombillas para estimar la
vida media de las bombillas que la integran, no será posible medir más que una vez la bombilla
seleccionada.
Con reposición de los elementos: Las observaciones se realizan con reemplazamiento de los
individuos, de forma que la población es idéntica en todas las extracciones. En poblaciones muy
grandes, la probabilidad de repetir una extracción es tan pequeña que el muestreo puede
considerarse con reposición aunque, realmente, no lo sea.
Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir una extracción es
tan pequeña que el muestreo puede considerarse con reposición. Para realizar este tipo de
muestreo, y en determinadas situaciones, es muy útil la extracción de números aleatorios mediante
ordenadores, calculadoras o tablas construidas al efecto. Pero no es exacto.
Algunos ejemplos del muestreo probabilístico serían: muestreo sistemático, muestreo estratificado el
cual de acuerdo al tamaño de la muestra se divide en asignación proporcional y asignación óptima,
muestreo por estadios múltiples, muestreo por conglomerados y homogeneidad de las poblaciones o
sus subgrupos.
Muestreo no probabilístico.
Es aquél para el que no puede calcularse la probabilidad de extracción de una determinada muestra.
Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo del
tema bajo estudio, por lo tanto, se considera que la información aportada por esas personas es vital
para la toma de decisiones.
Algunos ejemplos del muestreo no probabilístico son: muestreo por cuotas, muestreo de bola de
nieve y muestreo subjetivo por decisión razonada.
1.3 VARIABLES.
Se llama variable, a la característica o propiedad de los individuos u objetos que se desea estudiar y
se puede medir o calificar; es una característica que cambia o varía con el tiempo en un individuo
dado, o cambia o varía de elemento en una población de estudio, por ejemplo si se habla de la edad,
del peso, de la estatura, etc. La variable se representa con una letra, x, y, P, t o cualquier letra
relacionada con el nombre de la variable. Se utiliza para medir características y valores tanto
cualitativos como cuantitativos a través de la utilización de escalas que permitan medir de mejor
manera un resultado obtenido.
Las variables se clasifican en variables cualitativas y cuantitativas.
Variables cualitativas. Se refieren a características o cualidades que no pueden ser medidas con
números. Podemos distinguir dos tipos:
 Variable cualitativa nominal. Presenta modalidades no numéricas que no admiten un criterio

de orden. Ejemplo. El estado civil, con las siguientes modalidades, casado, soltero, separado,
divorciado y viudo.
 Variable cualitativa ordinal o variable cuasicuantitativa. Presenta modalidades no numéricas,
en las que existe un orden. Por ejemplo. La nota en un examen, insuficiente, regular, bueno,
excelente; puesto conseguido en una prueba deportiva 1°, 2°, 3°; las medallas de una prueba
deportiva oro, plata, bronce.
Variables cuantitativas o aleatorias. Es la que se expresa mediante un número, por tanto se

pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
 Variable discreta. Es aquella que toma valores aislados, es decir no admite valores
intermedios entre dos valores específicos. Por ejemplo. El número de hermanos de 5 amigos:
2, 1, 0, 1, 3.
 Variable continua. Es aquella que puede tomar valores comprendidos entre dos números. Por
ejemplo. La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
1.4 CONCEPTOS BÁSICOS Y OPERACIONES ELEMENTALES EN LA TEORÍA DE
CONJUNTOS.
Un conjunto es cualquier colección de objetos de cualquier tipo que puede ser tratado como una
entidad. Los objetos que forman al conjunto se denominan elementos del conjunto.
Por colección entenderemos a una agrupación que está determinada por una propiedad enunciada
por medio de un lenguaje preciso. Todo conjunto es una colección de objetos, pero no toda colección
de objetos es un conjunto.
Al representar los conjuntos y sus elementos, tendremos en cuenta las siguientes convenciones:
 Los conjuntos se designan con letras mayúsculas.

 Los elementos se designan con letras minúsculas.
 Los elementos del conjunto se encierran entre llaves y se separan por comas.
 El elemento  significa es elemento de o pertenece a.
 Análogamente,  significa no es elemento de o no pertenece a.
La colección de objetos que se han de usar como elementos en un estudio cualquiera se llama
Conjunto Universal o de Referencia el cual se denota con el símbolo U.
Existen dos formas para describir los elementos de un conjunto:
Por extensión. Cuando se listan uno a uno los elementos del conjunto.
Ejemplo. A = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}.
Por compresión. Si P(x) es un predicado (propiedad), A = {x  P(x)} denota al conjunto A tal que x  A
si y sólo si P(x) es verdadero.
Ejemplo. A ={x / x es entero y menor de 10}
Si un conjunto es finito pero muy largo o es infinito, pueden usarse las elipses (…) para especificar
implícitamente un conjunto.
Ejemplo. El conjunto de los enteros positivos del 1 al 50 puede especificarse por {1, 2, 3, …, 50}, y el
conjunto de enteros positivos pares es especificado por {0, 2, 4, 6, …}.
Sea A un conjunto cualquiera, se llama cardinal de A al número de elementos de A y se denota A.
Un conjunto sin elementos recibe el nombre de conjunto vacío y se representa por ( ) o por . El
cardinal del conjunto vacío es 0.
Se dice que un conjunto S es subconjunto de T, si todos los elementos de S lo son también de T. El

símbolo  se lee es subconjunto de o está incluido en. Así, S  T se lee S es subconjunto de T.
Decir que S no es subconjunto de T significa que algún elemento de S no lo es de T. En tal caso
escribimos S  T. Entenderemos que el conjunto vacío siempre es subconjunto de cualquier
conjunto T.
Se dice que S es un subconjunto propio de T, si S  T, y además existe algún elemento de T que no

está en S. Esto lo escribimos S  T.
Dado un conjunto A, el conjunto potencia de A es el conjunto de todos los subconjuntos de A, y se

denota como P(A) o 2A.
Ejemplo. Si A = {a, b, c}, entonces:
2A = {{ }, {a}, {b}, {c}, {a, b}, {a, c}, {b, c}, {a, b, c}}.
Si A es finito, entonces 2A = 2A; en este caso 23 = 8.
La unión de los conjuntos A y B es el conjunto formado por todos los elementos que pertenecen a A
o a B o a ambos. La unión de conjuntos se define como:
A  B = {x (x  A)  (x  B)}
La intersección de los conjuntos A y B es el conjunto formado por los elementos que pertenecen
tanto a A como a B. La intersección de conjuntos se define como:
A  B = {x  (x  A)  (x  B)}
Dos conjuntos A y B se dice que son disjuntos si no tienen elementos comunes, es decir, si A  B =
.
La diferencia de los conjuntos A y B es el conjunto de elementos que pertenecen a A y no

pertenecen a B. La diferencia de conjuntos se define como:
A – B = {x  (x  A)  (x  B)}
La diferencia de conjuntos no es conmutativa, así que: (A – B)  (B – A).
La diferencia simétrica de los conjuntos A y B es el conjunto de los elementos que pertenecen a A

o a B pero no a ambos. La diferencia simétrica de conjuntos se define como:
A  B = (A  B) – (A  B) = (A – B)  (B – A)
El complemento de un conjunto A es el conjunto de los elementos que pertenecen al conjunto

universal U y no pertenecen a A. El complemento de conjuntos se define como:
A´= Ac = {x  (x  U)  (x  A)}
2. PROBABILIDAD.
2.1 CONCEPTOS BÁSICOS DE PROBABILIDAD.
Un experimento es una observación de un fenómeno que ocurre en la naturaleza.
Hay dos tipos de experimentos:
Experimentos Determinísticos: Son aquellos en donde no hay incertidumbre acerca del

resultado que ocurrirá cuando éstos son repetidos varias veces. Por ejemplo, medir el área de un
salón de clase, medir la estatura de una persona adulta. En ambos casos una vez que se conoce el
resultado del experimento en una repetición, entonces se sabe con certeza lo que ocurrirá en la
siguiente repetición.
Experimentos Aleatorios: Son aquellos en donde no se puede anticipar el resultado que ocurrirá,
pero si se tiene una completa idea acerca de todos los resultados posibles del experimento cuando
éste es ejecutado. Además, asumiendo que el experimento se puede repetir muchas veces bajo las
mismas condiciones se pueden tratar de construir un modelo que represente el comportamiento del
experimento. A continuación algunos ejemplos:
Exp 1: Lanzar un dado y anotar el número que aparece en la cara superior.
Exp 2: Lanzar un par de monedas y anotar el resultado que aparece en cada una de ellas.
Exp 3: Un vendedor de la Enciclopedia Británica visita tres casas ofreciendo la colección y se anota
V si vende o N si no vende en cada casa.
Exp 4: Se anota el número de boletos de lotería que hay que comprar hasta ganarse el premio
mayor.
Exp 5: Se anota el tiempo que hay que esperar para ser atendidos en un Banco.
Espacio Muestral: Es el conjunto de posibles resultados de un experimento aleatorio.

Representaremos el espacio muestral por S y cada elemento de él es llamado un punto muestral.
A continuación daremos los espacios muestrales de algunos de los experimentos anteriores.
S1 = { 1, 2 ,3 ,4 ,5 ,6 }
S2 = { C C , C X , X C , X X }
S3 = {VVV,VVN,VNV,NVV,VNN, NNV, NVN,NNN}
Un Evento es un resultado particular de un experimento aleatorio. En términos de conjuntos, un

evento es un subconjunto del espacio muestral. Por lo general se le representa por las
primeras letras del alfabeto. A continuación daremos ejemplos de eventos correspondientes a los
experimentos aleatorios definidos anteriormente:
A: Que salga un número par al lanzar un dado.
A = { 2,4,6}
B: Que salga por lo menos una cruz.
B = {C X ,X C ,XX}
2.2 ENFOQUES DE LA PROBABILIDAD.
Por lo regular las personas, en eventos anteriores, y en algún momento de su vida, tienen que
enfrentarse a situaciones cuyo resultado está determinado por el azar; sin embargo se encuentran
diferencias en los casos, en algunos para estimar la probabilidad se debe considerar información y
opiniones personales, en algunos otros, es necesario recurrir a información disponible de lo sucedido
en eventos anteriores, y en otros, puede determinarse a partir del número de eventos posibles.
La probabilidad puede clasificarse de la siguiente forma: subjetiva, frecuencial y clásica.
La probabilidad subjetiva es el grado de creencia o juicio personal.
La probabilidad frecuencial es el cociente entre la frecuencia observada de un suceso y el total de

observaciones cuando un experimento se realiza un número grande de veces.
La probabilidad clásica se define como el cociente entre el número de resultados favorables y los
posibles, si todos tienen la misma posibilidad de presentarse.
3. MEDIDAS Y ANÁLISIS.
3.1 DATOS: REDONDEO, NOTACIÓN SISTEMATIZADA, CIFRAS SIGNIFICATIVAS, CÁLCULOS,
ORGANIZACIÓN, MÉTODOS DE RECOLECCIÓN.
Redondeo. Es un procedimiento que consiste en escribir un número que representa una cantidad
con menos cifras de las que tiene, para tener una idea rápida de la cantidad. Por ejemplo, si en una
obra determinada se invirtieron 2 458 606 pesos, en lugar de decir dicha cantidad se menciona “se
invirtieron 2.5 millones de pesos”, la cual es una cifra redondeada.
Para redondear alguna cifra lo que se hace es escribirla a la unidad más cercana. Así, por ejemplo,
el número 23.4 se redondea a 23, pues está más cerca de 23 que de 24. Si se va a redondear a
centésimas, la cifra 2.438, se escribirá como 2.44, ya que está más cerca de 2.44 que de 2.43.
En ocasiones se tienen cifras que se encuentran exactamente a la mitad de entre dos números, por
ejemplo 2.235, se encuentra a la misma distancia de 2.23 y de 2.24. En estos casos se debe decidir
por algún criterio que reduzca el error por redondeo acumulado cuando se tiene un gran número de
datos. Por lo regular se sugiere que se rendondee al par más cercano. En el caso de 2.235 se
redondearía a 2.24; el número 3.225 se redondearía como 3.22.
Notación sistematizada. Son las diferentes formas de escribir algunas de las cantidades que
implican notaciones amplias, en estadística se manejan la notación sigma, factorial y científica.
Notación Sigma. Su notación se debe al nombre de la letra griega , que indica un conjunto de
números o cantidades que deben ser sumadas. Se representa mediante:
𝑛
∑ 𝑥𝑖
𝑖=?
Donde n = El subíndice del último número de la serie que debe ser sumada.
xi = Variable con subíndice que representa el iésimo elemento del conjunto.
 = Letra griega sigma que indica que debe realizarse la sumatoria.
i = El subíndice del primer elemento de la serie que va a ser sumada.
Ejemplo. La suma de una variable es igual a la suma de cada una de ellas.

8
∑ 𝑥1 = 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥7 + 𝑥8
𝑖=1
Notación factorial. Es el resultado de multiplicar su número por todos los números enteros positivos
menores que dicho número, se representa como n! y se lee “el factorial de n”.
Ejemplo. El factorial de 5
5! = (5)(4)(3)(2)(1) = 120
Notación científica. Es una manera de escribir en forma breve cifras muy grandes o muy pequeñas.
La forma general es “a x 10”, en donde “a” es un número entre 1 y 9, “n” es un número entero.
Ejemplo. El número 25 000 se escribe como 2.5 x 104, o el número 0.00025 se escribe como 2.5 x
10-4. Nota que si el punto decimal se desplaza a la izquierda el exponente de la base 10 es positivo e
indica el número de lugares que se movió el punto decimal hacia la izquierda; en cambio, si se
desplaza el punto decimal a la derecha, el exponente es negativo, e indica el número de lugares que
se recorrió el punto decimal hacia la derecha.
Cifras significativas. A los dígitos exactos que se utilizan para escribir una cifra, aparte de los ceros
para localizar el punto decimal, se les llama cifras significativas del número.
Ejemplo. 3.22 tiene tres cifras significativas.
0.0032, que se escribe como 3.2 x 10-3, tiene dos cifras significativas.
0.00320, que se escribe como 3.20 x 10-3, tiene tres cifras significativas.
Organización de datos. Cuando se realiza el estudio de una variable “x”, se obtiene un conjunto de
datos. Éstos por lo regular se encuentran dentro de alguna lista, por ejemplo las calificaciones de los
alumnos de un grupo de matemáticas. En la lista aparece una columna con el nombre de los
alumnos ordenados alfabéticamente y una segunda columna con la calificación correspondiente a
cada alumno.
Si bien es cierto que los datos están acomodados en tablas, alineados en columnas, éstos no están
ordenados desde el punto de vista estadístico. Para poder analizarlos es necesario organizarlos.
Para ello se ordenan los datos, posteriormente se concentran en tablas de valores y por último se
visualizan mediante gráficas.
Métodos de recolección. Los datos estadísticos se obtienen a partir de diferentes fuentes, entre las
cuales se encuentran la encuesta, el experimento o la investigación documental.
La encuesta consiste en recopilar datos mediante el uso de cuestionarios o entrevistas.
El experimento es un procedimiento utilizado en la investigación científica para obtener información

que permita conocer el comportamiento de algún proceso.
La investigación documental es un procedimiento para obtener datos mediante la consulta de

información ya escrita y concentrada en documentos que se localicen en libros o revistas en
bibliotecas, hemerotecas, o en centros virtuales.
3.2 MEDIDAS DE TENDENCIA CENTRAL.
Las medidas de tendencia central nos indican en torno a qué valor (centro) se distribuyen los datos.
Media. Es el valor promedio de la distribución, se le define como la suma de todas las

observaciones, de datos cuantitativos, dividida entre el número total de observaciones. Se
representa con la letra  o con el símbolo 𝑥̅ ; la primera es para representar la media de una
población y la segunda para representar la media de una muestra de población.
Ejemplo. Encuentra la media de 23, 24, 24, 25, 26, 28.
∑𝑛𝑖=1 𝑥𝑖 23 + 24 + 24 + 25 + 26 + 28 150
𝑥̅ = = = = 25
𝑛 6 6
Mediana. Es la puntación de la escala que separa la mitad superior de la distribución y la
inferior, es decir divide la serie de datos en dos partes iguales. No necesariamente es un
valor observado. Si el conjunto de datos es un número impar, la mediana se encontrará
a la mitad de la lista ordenada, ubicándose en la posición (n + 1)/2.
Ejemplo. La mediana de 21, 23, 24, 24, 25, 26, 28, 29, 30, es 25.
Moda. Es el valor que más se repite en una distribución. Puede no existir, o bien en
caso de existir, puede haber uno o más valores que representen a la moda.
Ejemplo. En el conjunto de datos de la tabla, ¿cuál es la moda?
p f
48 3
49 2
50 5
52 10
54 6
55 4
Como la frecuencia más alta es 10 y pertenece al 52, la moda es el número 52.
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número
de individuos. Para calcular las medidas de posición es necesario que los datos estén
ordenados de menor a mayor.
La medidas de posición son:
 Los cuartiles dividen la serie de datos en cuatro partes iguales.
 Los deciles dividen la serie de datos en diez partes iguales.
 Los percentiles dividen la serie de datos en cien partes iguales.
Regresión lineal. Es una aproximación a la relación lineal entre las variables utilizando una
ecuación lineal a datos observados, en estadística sirve para calcular la relación entre dos
variables ajustando una ecuación lineal a los datos observados.
3.3 MEDIDAS DE DISPERSIÓN.
Las medidas de dispersión nos informan sobre cuánto se alejan del centro los
valores de la distribución.
Las medidas de dispersión son:
El rango es la diferencia entre el mayor y el menor de los datos de una distribución

estadística. Se representa con la letra R (no debe confundirse con el rango de una
función).
Ejemplo. Determina el rango de los datos 21, 21, 23, 24, 24, 25, 26, 28, 29, 30.
R = 30 – 21 = 9
Cada dato tiene una cierta distancia respecto a la media; a la diferencia entre un valor
x i , y la media 𝑥̅ , se le llama desviación o desvío: “xi - 𝑥̅ ”.
Ejemplo. Considerando el conjunto A, cuyos elementos son 5, 8, 10, 12, 15, y con media igual a
10. Determina los desvíos de cada uno de los datos respecto a la media.
xi (x i -𝑥̅ )
5 -5
8 -2
10 0
12 2
15 5
La desviación media es una medida que intenta representar a los desvíos,

empleando los valores absolutos de los mismos. Se calcula mediante la siguiente
expresión:
∑𝑛𝑖=1|xi − 𝑥̅ |
𝐷𝑀 =
𝑛
La varianza de un conjunto de datos es un estadístico que representa la variación que
tienen los datos respecto a la media. Se representa con s 2 , si se trata de la varianza
de una muestra. Para calcularla se utiliza la siguiente fórmula:
∑𝑛𝑖=1(xi − 𝑥̅ )2
𝑠2 =
𝑛−1
Ejemplo. Determina el valor de la varianza del conjunto 21, 21, 23, 24, 24, 25, 26, 28,
29, 30, cuya media es 25.1
∑𝑛𝑖=1(xi − 𝑥̅ )2 (21 − 25.1)2 + (21 − 25.1)2 + ⋯ + (30 − 25.1)2 88.9

𝑠2 = = = = 9.87
𝑛−1 10 − 1 9
La desviación típica o estándar es la raíz cuadrada de la varianza. Se representa

mediante la letra s.
Ejemplo. Calcula la desviación típica del ejercicio anterior.
𝑠 = √𝑠 2 = √9.87 = 3.14
3.4 DISTRIBUCIONES DE FRECUENCIAS: ACUMULADAS Y RELATIVAS ACUMULADAS.
Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los
datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencia:
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio

estadístico. Se representa por f i. La suma de las frecuencias absolutas es igual al número total de
datos, que se representa por N. f1 + f2 + f3 +…+ fn = N
Para indicar resumidamente estas sumas se utiliza la letra griega .

i=n
∑ fi = N
i=1
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el

número total de datos. Se puede expresar en tantos por ciento y se representa por n i.
𝑓𝑖
𝑛𝑖 =
𝑁
La suma de las frecuencias relativas es igual a 1.
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado. Se representa por Fi.
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado
valor y el número total de datos. Se puede expresar en tantos por ciento.
Ejemplo. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas
máximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31,
30, 31, 34, 33, 33, 29, 29.
xi fi Fi ni Ni
27 1 1 0.032 0.032
28 2 3 0.065 0.097
29 6 9 0.194 0.290
30 7 16 0.226 0.516
31 8 24 0.258 0.774
32 3 27 0.097 0.871
33 3 30 0.097 0.968
34 1 31 0.032 1
31 1
Este tipo de tablas de frecuencia se utiliza con variables discretas.
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados intervalos de
clases. A cada clase se le asigna su frecuencia correspondiente.
Límites de la clase. Cada clase está delimitada por el límite inferior de la clase y el límite superior
de la clase.
Amplitud de la clase. Es la diferencia entre el límite superior o inferior de la clase.
Marca de clase. Es el punto medio de cada intervalo y es el valor que representa a todo el intervalo
para el cálculo de algunos parámetros.
Ejemplo. Construye una tabla de datos agrupados con la siguiente distribución. 3, 15, 24, 28, 33, 35,
38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,
28, 38, 41, 48, 15, 32, 13.
Primero se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48. Se restan
y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de
intervalos que queramos poner. Es conveniente que el número de intervalos oscile entre 6 y 15. En
este caso, 48 – 3 = 45, incrementamos el número hasta 50, dividido entre 5, nos quedan 10
intervalos. Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al
intervalo, pero el límite superior no pertenece , entonces se cuenta en el siguiente intervalo.
Intervalo ci fi Fi ni Ni
0, 5 2.5 1 1 0.025 0.025
5, 10 7.5 1 2 0.025 0.050
10, 15 12.5 3 5 0.075 0.125
15, 20 17.5 3 8 0.075 0.200
20, 25 22.5 3 11 0.075 0.275
25, 30 27.5 6 17 0.150 0.425
30, 35 32.5 7 24 0.175 0.600
35, 40 37.5 10 34 0.250 0.850
40, 45 42.5 4 38 0.100 0.950
45, 50 47.5 2 40 0.050 1
40 1
3.5 REPRESENTACIONES GRÁFICAS.
El histograma es la representación gráfica de los datos mediante un gráfico formado por una
sucesión de rectángulos. En él se muestra la distribución de frecuencias de los datos, y está formado
por rectángulos cuya anchura representa a cada uno de los intervalos y la altura corresponde a la
frecuencia de cada una de las clases que se están graficando.
Para trazar un histograma se parte de una tabla de frecuencias, se traza un eje de coordenadas
adecuado a los datos, se marcan los límites verdaderos de los intervalos, se identifican los puntos
medios, y se dibujan los rectángulos cuya altura será de acuerdo a las frecuencias de cada clase.
Ejemplo. Elabora un histograma a partir de la información de la siguiente tabla de datos.
Intervalo de Punto medio xi f

clase
38-42 40 3
43-47 45 7
48-52 50 17
53-57 55 13
58-62 60 6
63-67 65 4
Total 50
20
15
10
0
40 45 50 55 60 65
El polígono de frecuencia es la representación gráfica de los datos mediante un gráfico de línea.
En él se muestra la distribución de frecuencias de los datos, y está formado por segmentos de línea
que unen los puntos correspondientes a la frecuencia de cada una de las clases que se están
graficando. Al cerrar la figura con segmentos de línea adicionales en los extremos unidos al eje
horizontal, se forma un polígono, de ahí el porque se llama polígono de frecuencias. Se traza de
manera similar a la gráfica de una ecuación o de una función, a partir de una tabla de frecuencias, en
donde el eje “x” representa el dato xi y el eje “y” representa a las frecuencias f.
Ejemplo. Traza una gráfica de polígonos de frecuencia con los datos del ejercicio anterior.
20
15
10
0
40 45 50 55 60 65
La ojiva es la representación gráfica de las frecuencias acumuladas mediante un gráfico de línea. En

él se muestra la distribución de frecuencias acumuladas de los datos, y se forma con segmentos de
línea de manera similar al polígono de frecuencias. Se traza de manera similar a la gráfica de una
ecuación o de una función, a partir de una tabla de frecuencias acumuladas, en donde el eje “x”
representa al dato xi y el eje “y” representa a las frecuencias fa.
Ejemplo. Elabora una ojiva a partir de la siguiente tabla de datos.
f fa
3 3
7 10
17 27
13 40
6 46
4 50
60
50
40
30
20
10
0
40 45 50 55 60 65
La gráfica de barras se traza de manera similar al histograma, sólo que las barras se dibujan
separadas unas de otras. En esta clase de gráfica, la escala en el eje x es para mostrar categorías o
intervalos de números no consecutivos.
Ejemplo.
El gráfico circular es otra manera de hacer la representación gráfica de los datos. También es
llamado gráfica de pastel. A diferencia de los gráficos anteriores, en el gráfico circular sólo se
representan datos de frecuencias relativas o frecuencias porcentuales. Para trazar esta clase de
gráfico, se debe dividir el área del círculo de manera proporcional a las frecuencias. Para construirlas
fácilmente, se le agrega a la tabla de frecuencias una nueva columna correspondiente a la
proporción del círculo, multiplicando la frecuencia relativa por 360°; posteriormente con la ayuda de
un transportador se hacen las divisiones del círculo.
Ejemplo. Elabora una gráfica circular a partir de los datos de la tabla.
f fr f% (fr)(360°)
3 0.06 6 21.6°
7 0.14 14 50.4°
17 0.34 34 122.4°
13 0.26 26 93.6°
6 0.12 12 43.2°
4 0.08 8 28.8°
50 1 100 360°
8 6
12 14
26
34
Los diagramas de caja son una representación visual que describe varias características
importantes, al mismo tiempo, tales como la dispersión y simetría.
Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos,
sobre un rectángulo, alineado horizontal o verticalmente.
Una gráfica de este tipo consiste en una caja rectangular, donde los lados más largos muestran el
recorrido intercuartílico. Este rectángulo está dividido por un segmento vertical que indica donde se
posiciona la mediana y por lo tanto su relación con los cuartiles primero y tercero (recordemos que el
segundo cuartil coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mínimo y
máximo de la variable. Las líneas que sobresalen de la caja se llaman bigotes. Estos bigotes tienen
un límite de prolongación, de modo que cualquier dato o caso que no se encuentre dentro de este
rango es marcado e identificado individualmente
Ejemplo. Utilizamos la ya usada distribución de frecuencias, que representan la edad de un colectivo

de 20 personas.
36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40
Para calcular los parámetros estadístico, lo primero es ordenar la distribución.
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45
Calcular lo cuartiles.
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20
resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable

que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la
media aritmética de dicho valor y el siguiente:
Mediana = Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro
caso, como 3N / 4 = 15, resulta:
Q2=(39 + 39) / 2 = 39
Dibujar la caja y los bigotes.

El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1)
La primera parte de la caja a (Q1, Q2),
La segunda parte de la caja a (Q2, Q3)
El bigote de la derecha viene dado por (Q3, Xmáx).
4. EXPERIMENTOS Y EVENTOS.
4.1 PROBAILIDAD DE EVENTOS SIMPLES Y COMPUESTOS, PROBABILIDAD AXIOMÁTICA Y
PROBABILIDAD CONDICIONAL.
Probabilidad de eventos simples. La probabilidad clásica de un evento E, se escribe p(E), se

define como el número de resultados que componen al evento E, entre el número de resultados que
componen el espacio muestral:
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐸

𝑝(𝐸) =
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑒𝑠𝑝𝑎𝑐𝑖𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
En ocasiones se llama resultados favorable a los resultados del evento E, cuya probabilidad se
desea determinar, por lo que a veces se escribe como:
𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠

𝑝=
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠
Ahora si se dice que un evento puede ocurrir en “n” distintas maneras, igualmente posibles, y si “a”
son las maneras consideradas como aciertos (resultados favorables), en tanto que “b”, son
considerados fallos (resultados desfavorables), entonces la probabilidad de acierto “p” está definida
por la razón entre casos favorables y el total de casos:
𝑎 𝑎
𝑝= 𝑜 𝑝=
𝑛 𝑎+𝑏
Y la probabilidad de que el evento no ocurra “q” está definida por la razón entre el número de
fracasos y el total de casos, se tiene:
𝑎 𝑏
𝑞= 𝑜 𝑞=
𝑛 𝑎+𝑏
Si se suman la probabilidad de los aciertos con los fracasos se tiene:
𝑎 𝑏 𝑎+𝑏
+ = =1
𝑎+𝑏 𝑎+𝑏 𝑎+𝑏
Por lo tanto: p+q=1 p=1–q q=1–p
Estas ecuaciones indican que si la probabilidad de que ocurra un evento es “p” entonces la
probabilidad de que no ocurra es 1 – p; o bien, si la probabilidad de que no ocurra un evento es “q”,
entonces la probabilidad de que sí ocurra es 1 – q.
Ejemplo. Al tirar una moneda al aire, puede caer “águila” o “sol”, ¿cuál es la probabilidad de que
caiga águila?
1 𝑒𝑣𝑒𝑛𝑡𝑜 á𝑔𝑢𝑖𝑙𝑎 1
𝑝(á𝑔𝑢𝑖𝑙𝑎) = =
2 𝑒𝑣𝑒𝑛𝑡𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠 2
Probabilidad de eventos compuestos. Cuando calculas probabilidades, a menudo tienes que

tomar en consideración dos o más eventos, conocidos como eventos compuestos. En un evento
compuesto, si el segundo evento no depende del resultado del primer evento, entonces los eventos
son independientes. Si el resultado de un evento compuesto influye en el otro evento, entonces los
eventos son dependientes.
Probabilidad de dos eventos independientes. La probabilidad de que ocurran dos eventos

independientes se calcula multiplicando la probabilidad del primer evento por la probabilidad del
segundo evento. P(A y B) = P(A) . P(B)
Probabilidad de dos eventos dependientes. Si dos eventos A y B son dependientes, entonces la

probabilidad de que ocurran los dos eventos es igual al producto de la probabilidad de A por la
probabilidad de B después de ocurrir A. P(A y B) = P(A) . P(B dado A).
Ejemplo. ¿Cuál es la probabilidad de obtener dos caras seguidas al tirar una moneda?
La primera vez que se tira la moneda no afecta la segunda vez, así que estos eventos son
independientes.
1 1 1 1
P(caras y caras) = 2 ∙ 2 = 4, la probabilidad de obtener dos caras seguidas al tirar una moneda es de 4
Probabilidad axiomática. La probabilidad desde el punto de vista axiomático, propone las reglas
que el cálculo de las probabilidades debe satisfacer, para ello se basa en los siguientes 3 postulados
y axiomas:
1. La probabilidad de un suceso A es un número real mayor o igual que cero; P(A)  0.

2. La probabilidad del total, , es igual a 1; P() = 1.
3. Si dos sucesos son mutuamente excluyentes, es decir, que no ocurren simultáneamente,
entonces la probabilidad del suceso compuesto por ambos es la suma de las probabilidades
de cada uno de los sucesos; P(A1  A2) = P(A1) + P(A2)
Tomando en cuenta que la probabilidad de un evento, por definición, es la frecuencia relativa,

entonces se tiene lo siguiente:
Si A es un evento de un espacio muestral S, y p(A) es la probabilidad de A, entonces se satisfacen

los axiomas de la probabilidad:
Axioma 1. La probabilidad de un suceso A es un número real entre 0 y 1. 0  p(A)  1.
Axioma 2. La probabilidad de S es igual a 1. P(S) = 1
Axioma 3. Si A1 y A2 son sucesos mutuamente excluyentes, entonces la probabilidad de la unión de

ellos es la suma de sus probabilidades. P(A  B) = P(A1) + P(A2).
Probabilidad condicional. Se denomina a la probabilidad de que ocurra un evento en particular,
dado que ocurrió otro evento.
La probabilidad de que ocurra el evento A dado que ya ocurrió B se denota como P(A/B).
P(A/B) se lee “p de A dado B” y significa “la probabilidad del evento A, dado que el evento B ocurre”.
Ejemplo. Considera un cuadrado formado a su vez por 16 cuadritos.
La probabilidad de que ocurra el cuadrito es 1/16. Sin embargo, la probabilidad de que ocurra el
mismo cuadrito una vez que ya ha ocurrido en B, se escribe P(A/B), es ¼.
4.2 DISTRIBUCIONES DE PROBABILIDAD.
Distribución normal. Es una distribución de variable continua que queda especificada por dos
parámetros de los que depende su función de densidad y que resultan ser la media () y su
desviación típica ().
(𝑥−𝜇)2
−
𝑒 2𝜎2
Su función de densidad es: 𝑓(𝑥 ) =
𝜎 √2𝜋
Distribución binomial. La distribución binomial está asociada a experimentos del siguiente tipo:
 Realizamos n veces cierto experimento en el que consideramos sólo la posibilidad de éxito o

fracaso.
 La obtención de éxito o fracaso en cada ocasión es independiente de la obtención de éxito o
fracaso en las demás ocasiones.
 La probabilidad de obtener éxito o fracaso siempre es la misma en cada ocasión.
Ejemplo.
Tiramos un dado 7 veces y contamos el número de cincos que obtenemos. ¿Cuál es la probabilidad
de obtener tres cincos?
Este es un típico ejemplo de distribución binomial, pues estamos repitiendo 7 veces el experimento
de lanzar un dado. ¿Cuál es nuestro éxito?
Evidentemente, sacar un 5, que es en lo que nos ﬁjamos, el fracaso, por tanto, sería no sacar 5, sino
sacar cualquier otro número. Por tanto,
Éxito = E = “sacar un 5” = ´ ⇒ p(E) =1/6.
Fracaso = F = “no sacar un 5” =⇒ p(F) =5/6.
Para calcular la probabilidad que nos piden, ﬁjémonos en que nos dicen que sacamos 3 cincos y por
lo tanto tenemos 3 éxitos y 4 fracasos, ¿de cuántas maneras pueden darse estas posibilidades?
Podríamos sacar 3 cincos en las 3 primeras tiradas y luego 4 tiradas sin sacar cinco, es decir:
EEEFFFF, pero también podríamos sacar EFEFFFE, es decir que en realidad estamos calculando
de cuántas maneras se pueden ordenar 4 fracasos y 3 éxitos. Recordando las técnicas
combinatorias, este problema se reduce a calcular las permutaciones con elementos repetidos:
Y por tanto, como p(E) = 1/6 y tengo 3 éxitos y p(F) = 5/6 y tengo 4 fracasos:
1 1 1 5 5 5 5
p(tener 3 éxitos y 4 fracasos) = 35 · ∙ ∙ ∙ ∙ ∙ ∙ = 0.0781
6 6 6 6 6 6 6
Como repetir este proceso sería bastante penoso en la mayoría de los casos, lo mejor es recurrir a la
siguiente fórmula que expresa la probabilidad de obtener cierto número de éxitos en una distribución
binomial:
𝑛
𝑝(𝑥 = 𝑘) = ( ) ∙ 𝑝𝑘 ∙ 𝑞 (𝑛−𝑘)
𝑘
4.3 DISTRIBUCIONES MUESTRALES.
Cuando n es lo bastante grande, su distribución muestral también es una normal. El último resultado
es cierto sea cual sea la distribución de los datos originales. Es decir, no es preciso que partamos ni
de distribuciones normales ni de distribuciones de Bernoulli, ya que para muestras de tamaños lo
bastante grandes, la distribución de la media muestral es normal sea cual sea la distribución original.
Este resultado fundamental de la estadística tiene un nombre propio: el teorema del límite central.
El teorema del límite central dice que si una muestra es lo bastante grande (n > 30), sea cual sea la
distribución de la variable de interés, la distribución de la media muestral será aproximadamente una
normal. Además, la media será la misma que la de la variable de interés, y la desviación típica de la
media muestral será aproximadamente el error estándar.
Una consecuencia de este teorema es la siguiente:
Dada cualquier variable aleatoria con esperanza m y para n lo bastante grande, la distribución de la
variable (𝑥̅ − 𝜇)/(𝑒𝑟𝑟𝑜𝑟 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟)es una normal estándar.
Ejemplo. Una empresa de mensajería que opera en la ciudad tarda una media de 35 minutos en
llevar un paquete, con una desviación típica de 8 minutos. Supongamos que durante el día de hoy
han repartido doscientos paquetes.
a) ¿Cuál es la probabilidad de que la media de los tiempos de entrega de hoy esté entre 30 y 35
minutos?
b) ¿Cuál es la probabilidad de que, en total, para los doscientos paquetes hayan estado más de 115
horas?
Consideremos la variable X = “Tiempo de entrega del paquete”. Sabemos que su media es 35

minutos y su desviación típica, 8. Pero fijaos en que no sabemos si esta variable sigue una
distribución normal. Durante el día de hoy se han entregado n = 200 paquetes. Es decir, tenemos
una muestra x1, x2, ..., xn de nuestra variable.
Por el teorema del límite central sabemos que la media muestral se comporta como una normal de
esperanza 35 y desviación típica:
8
= 0.566
√200
Si utilizamos esta aproximación, ya podemos contestar a la pregunta a. Debemos calcular:
30 − 35 𝑥̅ − 35 35 − 35
𝑃(30 ≤ 𝑥̅ ≤ 35) = 𝑃 ( ≤ ≤ )
0.566 0.566 0.566
que es aproximadamente igual a la probabilidad siguiente:
30 − 35 35 − 35
𝑃( ≤𝑍≤ ) = 𝑃(−8.83 ≤ 𝑍 ≤ 0) = 𝑃(𝑍 ≤ 0) − 𝑃(𝑍 ≤ −8.83) = 0.5 − 0 = 0.5
0.566 0.566
donde Z es una normal (0,1). Es decir, tenemos una probabilidad aproximada del 0,4616 de que la
media del tiempo de entrega de hoy haya estado entre 30 y 35 minutos.
Por lo que respecta a la segunda pregunta, de entrada debemos pasar las horas a minutos, ya que
ésta es la unidad con la que nos viene dada la variable. Observad que 115 horas por 60 minutos nos
dan 6.900 minutos. Se nos pide que calculemos la probabilidad siguiente:
6.900
𝑃 (𝑥̅ > ) = 𝑃(𝑥̅ > 34.5)
200
y como que sabemos que la media se distribuye aproximadamente como una normal de media 35 y
desviación típica 0,566 (supondremos siempre que la distribución de la media es normal, ya sea
porque la variable de interés es normal o porque la muestra es lo bastante grande), esta probabilidad
se puede aproximar por la probabilidad de una distribución normal estándar Z:
34.5 − 35
𝑃 (𝑍 > ) = 𝑃(𝑍 > −0.88) = 1 − 𝑃(𝑍 < −0.88) = 1 − 0.1894 = 0.8106
0.566
Parámetro. Es una cantidad numérica calculada sobre una población y resume los valores que ésta
toma en algún atributo.
 Intenta resumir toda la información que hay en la población en unos pocos números
(parámetro). La altura media de los sujetos.
Estadístico. Es una cantidad numérica calculada sobre una muestra que resume su información
sobre algún aspecto.
 Si un estadístico se usa para aproximar un parámetro también se le suele llamar estimador.

 Normalmente os interesa conocer un parámetro, pero por la dificultad que conlleva estudiar a
*TODA* la población, calculamos un estimador sobre una muestra y confiamos en que sean
próximos.
4.4 REGLAS DE PROBABILIDAD.
Sucesos mutuamente excluyentes. Dos o más eventos son mutuamente excluyentes o disjuntos,
si no pueden ocurrir simultáneamente. Es decir, la ocurrencia de un evento impide automáticamente
la ocurrencia del otro evento (o eventos).
Ejemplo. Al lanzar una moneda solo puede ocurrir que salga cara o sello pero no los dos a la vez,
esto quiere decir que estos eventos son excluyentes.
Regla de la adición. Si p1, p2, p3, … pn, son las probabilidades de n sucesos mutuamente
excluyentes. La probabilidad P de que uno de estos sucesos se presente en un solo ensayo, estará
da por la suma de las probabilidades de cada suceso, esto es:
P= p1 + p2 + p3 +…+pn
P(A o B) = P(A) + P(B)
Ejemplo. La probabilidad de obtener un As o un Rey, sacando una sola carta de la baraja española
de 40 cartas.
La baraja española de 40 naipes consta de 4 palos (bastos, copas, espadas, oros) y numeradas del
1 al 10 (A, 2, 3, 4, 5, 6, 7, Sota, Caballo, Rey). Si la baraja es de 48 naipes contiene el 8 y el 9 y la
numeración es del 1 al 12.
Para el ejemplo, si uno de los casos aparece, queda excluido el otro
4
𝑃(𝐴) = (𝐴𝑠)
40
4
𝑃(𝐵) = (𝑅𝑒𝑦)
40
𝑃(𝐴𝑜𝐵) = 𝑃(𝐴) + 𝑃(𝐵)
1 1 1
𝑃(𝐴𝑜𝐵) = + =
10 10 5
Sucesos compatibles. Dos o más eventos son compatibles, o que no son mutuamente excluyentes,
cuando la ocurrencia de un suceso no impide la ocurrencia de un seceso no impide la ocurrencia del
otro. En este caso la probabilidad de uno de los dos sucesos se halla así:
𝑃(𝐴𝑜𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵)
Ejemplo. Si consideramos en un juego de domino sacar al menos un blanco y un seis, estos eventos
son no excluyentes porque puede ocurrir que salga el seis blanco.
Sucesos independientes. Dos o más eventos son independientes cuando la ocurrencia o no-
ocurrencia de un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o
eventos). Un caso típico de eventos independientes es el muestreo con reposición, es decir, una vez
tomada la muestra se regresa de nuevo a la población donde se obtuvo.
Ejemplo. Lanzar al are dos veces una moneda son eventos independientes por que el resultado del
primer evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el segundo
lanzamiento.
Regla de la multiplicación. Si p1, p2, p3, …pn, son las probabilidades de n sucesos independientes.
La probabilidad P de que uno de estos sucesos se presente en un solo ensayo, estará dada por el
producto de cada suceso, esto es:
𝑃 = 𝑝1 × 𝑝2 × 𝑝3 × … × 𝑝𝑛
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵)
Ejemplo. Que probabilidad tendremos de obtener dos reyes sacando una carta de una baraja y la
otra de una segunda baraja.
El hecho de sacar una carta de un paquete de barajas no afecta la probabilidad de sacar un rey en el
segundo paquete.
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃(𝐵)
4 4 1
𝑃(𝐴 ∩ 𝐵) = × =
40 40 100
Sucesos dependientes. Dos o más eventos serán dependientes cuando la ocurrencia o no-
ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro (u otros). Cuando tenemos
este caso empleamos entonces, el concepto de probabilidad condicional para denominar la
probabilidad del evento relacionado. La expresión P(AB) indica la probabilidad de ocurrencia del
evento A si el evento B ya ocurrió.
𝐵
𝑃(𝐴 ∩ 𝐵) = 𝑃(𝐴)𝑃 ( )
𝐴
Ejemplo. Probabilidad de obtener 3 ases, sacando sucesivamente tres cartas de una baraja
española, sin volverlas a incluir (sin repetición) en el montón.
Probabilidad de sacar el primer As. Como son 4 ases y 40 cartas
4
𝑃(𝐴) =
40
Probabilidad de sacar el segundo As, dado que ya saque el primer As: ahora sólo quedan 3 Ases y
39 cartas
3
𝑃( )
39
Probabilidad de sacar el tercer As, dado que ya saque dos Ases: ahora sólo quedan 2 Ases y 38
cartas.
𝐶 2
𝑃( ) =
𝐴𝐵 38
𝐵 𝐶
𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) = 𝑃(𝐴)𝑃 ( ) 𝑃 ( )
𝐴 𝐵𝐴
4 3 2 1
𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) = ∙ ∙ =
40 39 38 2470

ESTADÍSTICA

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

ESTADÍSTICA

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑑𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜 𝐴

1.2 POBLACIÓN Y MUESTRA.

Las variables se clasifican en variables cualitativas y cuantitativas.

 Variable cualitativa nominal. Presenta modalidades no numéricas que no admiten un criterio

Variables cuantitativas o aleatorias. Es la que se expresa mediante un número, por tanto se

 Los conjuntos se designan con letras mayúsculas.

Existen dos formas para describir los elementos de un conjunto:

Ejemplo. A = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}.

Ejemplo. A ={x / x es entero y menor de 10}

Sea A un conjunto cualquiera, se llama cardinal de A al número de elementos de A y se denota A.

Se dice que un conjunto S es subconjunto de T, si todos los elementos de S lo son también de T. El

Se dice que S es un subconjunto propio de T, si S  T, y además existe algún elemento de T que no

Dado un conjunto A, el conjunto potencia de A es el conjunto de todos los subconjuntos de A, y se

Ejemplo. Si A = {a, b, c}, entonces:

Si A es finito, entonces 2A = 2A; en este caso 23 = 8.

La diferencia de los conjuntos A y B es el conjunto de elementos que pertenecen a A y no

La diferencia de conjuntos no es conmutativa, así que: (A – B)  (B – A).

La diferencia simétrica de los conjuntos A y B es el conjunto de los elementos que pertenecen a A

El complemento de un conjunto A es el conjunto de los elementos que pertenecen al conjunto

Un experimento es una observación de un fenómeno que ocurre en la naturaleza.

Hay dos tipos de experimentos:

Experimentos Determinísticos: Son aquellos en donde no hay incertidumbre acerca del

Exp 1: Lanzar un dado y anotar el número que aparece en la cara superior.

Espacio Muestral: Es el conjunto de posibles resultados de un experimento aleatorio.

S3 = {VVV,VVN,VNV,NVV,VNN, NNV, NVN,NNN}

Un Evento es un resultado particular de un experimento aleatorio. En términos de conjuntos, un

A: Que salga un número par al lanzar un dado.

B: Que salga por lo menos una cruz.

2.2 ENFOQUES DE LA PROBABILIDAD.

La probabilidad puede clasificarse de la siguiente forma: subjetiva, frecuencial y clásica.

La probabilidad subjetiva es el grado de creencia o juicio personal.

La probabilidad frecuencial es el cociente entre la frecuencia observada de un suceso y el total de

xi = Variable con subíndice que representa el iésimo elemento del conjunto.

 = Letra griega sigma que indica que debe realizarse la sumatoria.

i = El subíndice del primer elemento de la serie que va a ser sumada.

Ejemplo. La suma de una variable es igual a la suma de cada una de ellas.

Ejemplo. 3.22 tiene tres cifras significativas.

La encuesta consiste en recopilar datos mediante el uso de cuestionarios o entrevistas.

El experimento es un procedimiento utilizado en la investigación científica para obtener información

La investigación documental es un procedimiento para obtener datos mediante la consulta de

3.2 MEDIDAS DE TENDENCIA CENTRAL.

Media. Es el valor promedio de la distribución, se le define como la suma de todas las

Ejemplo. En el conjunto de datos de la tabla, ¿cuál es la moda?

La medidas de posición son:

 Los cuartiles dividen la serie de datos en cuatro partes iguales.

 Los deciles dividen la serie de datos en diez partes iguales.

 Los percentiles dividen la serie de datos en cien partes iguales.

Las medidas de dispersión son:

El rango es la diferencia entre el mayor y el menor de los datos de una distribución

La desviación media es una medida que intenta representar a los desvíos,

∑𝑛𝑖=1(xi − 𝑥̅ )2 (21 − 25.1)2 + (21 − 25.1)2 + ⋯ + (30 − 25.1)2 88.9

La desviación típica o estándar es la raíz cuadrada de la varianza. Se representa

Ejemplo. Calcula la desviación típica del ejercicio anterior.

3.4 DISTRIBUCIONES DE FRECUENCIAS: ACUMULADAS Y RELATIVAS ACUMULADAS.

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio

Para indicar resumidamente estas sumas se utiliza la letra griega .

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el

Amplitud de la clase. Es la diferencia entre el límite superior o inferior de la clase.

3.5 REPRESENTACIONES GRÁFICAS.

Ejemplo. Elabora un histograma a partir de la información de la siguiente tabla de datos.

Intervalo de Punto medio xi f

La ojiva es la representación gráfica de las frecuencias acumuladas mediante un gráfico de línea. En

Ejemplo. Elabora una ojiva a partir de la siguiente tabla de datos.