Texto Estadistica

ESTADÍSTICA PRÁCTICA
I
NOCIONES PRELIMINARES DE ESTADISTICA
1.1. Nomenclatura
El termino estadística proviene del latín statisticum collegium (“consejo de Estado”) y de su

derivado italiano statista (“hombre de Estado o político”). En 1749, el alemán Gottfried
Achenwall comenzó a utilizar la palabra alemana statistik para designar el análisis de datos
estatales. Por lo tanto, los orígenes de la estadística están relacionados con el gobierno y sus
cuerpos administrativos.
Hoy puede decirse que la recopilación y la interpretación de los datos obtenidos en un estudio es
tarea de la estadística, considerada como una rama de la matemática. Las estadísticas (el
resultado de la aplicación de un algoritmo estadístico a un grupo de datos) permiten la toma de
decisiones dentro del ámbito gubernamental, pero también en el mundo de los negocios y el
comercio.
1.2. Definición de Estadística
Definimos la estadística, como “La ciencia aplicada que nos proporciona un conjunto de métodos,
técnicas o procedimientos para: recopilar, organizar (clasificar, agrupar), presentar, y analizar
datos con el fin de describirlos o de realizar generalizaciones válidas”.
1.2.1. Estadística Descriptiva
La estadística descriptiva analiza, estudia y describe a la totalidad de individuos de una población. Su

finalidad es obtener información, analizarla, elaborarla y simplificarla lo necesario para que pueda
ser interpretada cómoda y rápidamente, por tanto, pueda utilizarse eficazmente para el fin que se
desee. El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta
de los siguientes pasos:
 Selección de caracteres dignos de ser estudiados.

 Mediante encuesta o medición, obtención del valor de cada individuo en los caracteres
seleccionados.
 Elaboración de tablas de frecuencias, mediante la adecuada clasificación de los individuos
dentro de cada carácter.
 Representación gráfica de los resultados (elaboración de gráficas estadísticas).
 Obtención de parámetros estadísticos, números que sintetizan los aspectos más relevantes de
una distribución estadística.
1.2.2. Estadística Inferencial
La estadística descriptiva trabaja con todos los individuos de la población. La estadística

inferencial o inferencia estadística, trabaja con muestras, subconjuntos formados por algunos
Ing. Ma. Ivonne Rocha Página 1
individuos de la población. A partir del estudio de la muestra se pretende inferir aspectos

relevantes de toda la población. Cómo se selecciona la muestra, cómo se realiza la inferencia, y
qué grado de confianza se puede tener en ella son aspectos fundamentales de la estadística
inferencial, para este estudio se requiere un alto nivel de conocimientos de estadística, probabilidad
y matemáticas.
Se denomina también inferencia estadística al conjunto de métodos con los que se hacen la
generalización o la inferencia sobre una población utilizando una muestra. La inferencia puede
contener conclusiones que pueden no ser ciertas en forma absoluta, por lo que es necesario que
éstas sean dadas con una medida de confiabilidad que es la probabilidad.
La estadística inferencial simplemente es el procedimiento por medio del cual se llega a las
inferencias acerca de una población base en los resultados obtenidos de una muestra extraída de la
población, es decir, la Estadística Inferencial investiga o analiza una población partiendo de una
toma de muestra.
Estas dos partes de la estadística no son mutuamente excluyentes, ya que para utilizar los métodos
de la inferencia estadística, se requiere conocer los métodos de la estadística descriptiva
1.2.3. Análisis Bayesiano de decisión
La inferencia bayesiana es un tipo de inferencia estadística en la que las evidencias u

observaciones se emplean para actualizar o inferir la probabilidad de que una hipótesis pueda ser
cierta. El nombre «bayesiana» proviene del uso frecuente que se hace del teorema de Bayes
durante el proceso de inferencia. El teorema de Bayes se ha derivado del trabajo realizado por el
reverendo Thomas Bayes. Hoy en día, uno de los campos de aplicación es en la teoría de la
decisión, visión artificial (simulación de la percepción en general) y reconocimiento de patrones
por ordenador.
La incertidumbre y la imprecisión son propias en el proceso de razonamiento. La lógica establece

unas reglas de inferencia a partir de las cuales se construye el sistema de razonamiento deductivo,
en el que una proposición determinada es considerada como cierta o falsa, sin que se admitan
grados entre estos dos extremos. Los métodos de razonamiento aproximado, entre los que se
encuentran los métodos bayesianos, aportan modelos teóricos que simulan la capacidad de
razonamiento en condiciones de incertidumbre, cuando no se conoce con absoluta certeza la
verdad o falsedad de un enunciado o hipótesis, e imprecisión, enunciados en los que se admite un
rango de variación.
Todos estos métodos tienen en común la asignación de una probabilidad como medida de
credibilidad de las hipótesis. En este contexto, la inferencia se entiende como un proceso de
actualización de las medidas de credibilidad al conocerse nuevas evidencias. Mediante la
aplicación del Teorema de Bayes se busca obtener las probabilidades de las hipótesis
condicionadas a las evidencias que se conocen. La diferencia entre los distintos métodos
bayesianos, modelos causales y redes bayesianas, se basa en las hipótesis de independencia
condicional entre hipótesis y evidencias. Dichas relaciones se expresan comúnmente mediante un
grafo acíclico dirigido.
Lo atractivo de la Estadística Bayesiana?
i) Construcción axiomática
ii) Una sola regla de decisión
iii) La única que ofrece solución para ciertos problemas
Axiomas de coherencia
i) Comparación
ii) Transitividad
iii) Dominancia-Sustitución
iv) Referencia
Ejemplos de inferencia
Un ejemplo de inferencia bayesiana es el siguiente:
 Durante miles de millones de años, el sol ha salido después de haberse puesto. El sol se ha
puesto esta noche. Hay una probabilidad muy alta de (o 'Yo creo firmemente' o 'es verdad')
que el sol va a volver a salir mañana. Existe una probabilidad muy baja de (o 'yo no creo de
ningún modo' o 'es falso') que el sol no salga mañana.
La inferencia bayesiana usa un estimador numérico del grado de creencia en una hipótesis aún
antes de observar la evidencia y calcula un estimador numérico del grado de creencia en la
hipótesis después de haber observado la evidencia. La inferencia bayesiana generalmente se basa
en grados de creencia, o probabilidades subjetivas, en el proceso de inducción y no necesariamente
declara proveer un método objetivo de inducción.
La gran ventaja de la estadística bayesiana es que no opera en el vacío, se basa en conocimiento

previo y proporciona un marco de análisis mucho más rico en tanto deja mucha más libertad al
investigador para que este pueda valorar hasta qué punto es probable que se produzcan
determinados resultados en sus experimentos. Sin embargo, estas mismas ventajas también se
pueden convertir en críticas: deja a la subjetividad del investigador algo que siempre se ha dicho
de la ciencia, debería ser objetivo. Además, el rechazo de la estadística bayesiana a las pruebas de
significación es un rechazo frontal al falsacionismo de Karl Popper, teoría filosófico-lógica sobre
cómo tiene que ser el método científico. Según el falsacionismo, cuando los datos contradicen una
teoría, ésta se tiene que dejar de lado.

Así, La magnitud y el impacto que los Bayesianos han tenido no sólo en el desarrollo de la teoría
estadística, sino también en el pensamiento de varios autores, surge el hecho de poder deducir
ventajas y desventajas. No es que la estadística bayesiana sea buena o mala por definición, sino
que depende de la manera en que ésta se use. Los métodos no pueden juzgarse por sí mismos, sino
por la manera según la que éstos se aplican.
1.3. Métodos estadísticos
Estudios Experimentales y Observacionales
Un objetivo común para un proyecto de investigación estadística es investigar la causalidad, y en

particular extraer una conclusión en el efecto que algunos cambios en los valores de predictores o
variables independientes tienen sobre una respuesta o variables dependientes. Hay dos grandes
tipos de estudios estadísticos para estudiar causalidad: estudios experimentales y observacionales.
En ambos tipos de estudios, el efecto de las diferencias de una variable independiente (o variables)
en el comportamiento de una variable dependiente es observado. La diferencia entre los dos tipos
es la forma en que el estudio es conducido. Cada uno de ellos puede ser muy efectivo.
Un estudio experimental implica tomar mediciones del sistema bajo estudio, manipular el sistema
y luego tomar mediciones adicionales usando el mismo procedimiento para determinar si la
manipulación ha modificado los valores de las mediciones.
En contraste, un estudio observacional no necesita manipulación experimental. Por el contrario,

los datos son recogidos y las correlaciones entre predictores y las respuestas son investigadas.
Un ejemplo de un estudio experimental es el famoso experimento de Hawthorne el cual pretendía

probar cambios en el ambiente de trabajo en la planta Hawthorne de la Western Electric Company.
Los investigadores estaban interesados en si al incrementar la iluminación en un ambiente de
trabajo, la producción de los trabajadores aumentaba. Los investigadores primero midieron la
productividad de la planta y luego modificaron la iluminación en un área de la planta para ver si
cambios en la iluminación afectarían la productividad. La productividad mejoró bajo todas las
condiciones experimentales. Sin embargo, el estudio fue muy criticado por errores en los
procedimientos experimentales, específicamente la falta de control de un grupo y seguimiento.
Un ejemplo de un estudio observacional es un estudio que explora la correlación entre fumar y el

cáncer de pulmón. Este tipo de estudio normalmente usa una encuesta para recoger observaciones

acerca del área de interés y luego produce un análisis estadístico. En este caso, los investigadores
recogerían observaciones de fumadores y no fumadores y luego mirarían los casos de cáncer de
pulmón en ambos grupos.
1.4. Etapas de la Investigación Estadística
ETAPAS DE LA INVESTIGACIÓN ESTADISTICA
PLANIFICACIÓN
* Planteamiento del problema
* Formulación Objetivos
* Fundamentos e importancia de la
investigación
* Determinación de la unidad de análisis y
variables
Identificación de la fuente de informacion
RESULTADOS Y CONCLUSIONES
RECOLECCION DE DATOS
ORGANIZACIÓN
Tabulación, Consistencia, Procesamiento y
Presentación de Datos
ANÁLISIS E INTERPRETACION DE RESULTADOS

Cálculo e interpretación de indicadores estadísticos
I. Planificación.
La planificación no se realizará adecuadamente si antes no se ha definido claramente la naturaleza
y objetivos de la investigación así como la evaluación de los conocimientos que se tienen sobre el
problema y de las hipótesis que se han formulado para explicarlo.
1º Paso: Planteamiento del problema.
Para realizar el estudio de un problema es necesario delimitarlo y formularlo
adecuadamente, definiéndolo de manera clara y precisa. ¿Qué necesidades o inconvenientes
hay?
2º Paso: Determinar los objetivos de la investigación.
¿Qué se va realizar en el estudio?
3º Paso: Formulación de Hipótesis.
Las hipótesis son afirmaciones que se verificaran o rechazaran en el transcurso del
desarrollo de la investigación.
Su formulación debe ser clara puesto que el diseño, planificación y desarrollo de la

investigación dependerán de las hipótesis que se van a probar.

4º Paso: Fundamento e importancia de la investigación.
¿Para que servirá la investigación?
5º Paso: Unidad de análisis y variables.
¿A quién o qué voy a analizar? (mínima unidad de investigación)
¿Qué datos se debe obtener de ellos?.
6º Paso: Identificación de las Fuentes de Información.
Si se necesitara realizar encuestas o entrevistas, recurrir a archivos (registros
continuos) o ambos.
II. Recolección de Datos.
En segundo lugar, se considera la ejecución de la investigación, la misma que implica la
recolección, clasificación y análisis de la información recogida según lo planificado.
Los principales puntos que deben considerarse al recoger la información son:
 Los errores que pueden cometerse en la recolección de los datos.
 Es el acopio de información y se incluye desde elaborar fichas bibliográficas hasta la
aplicación de cuestionarios con el empleo de técnicas de muestreo.
 Las condiciones que deben reunir los individuos que se estudian y los procedimientos más
pertinentes para su elección.
III. Organización de Datos.

Etapa que implica la revisión cuidadosa de la información recogida para resumirla y presentarla
convenientemente.
Se consideran los siguientes aspectos:
Revisión y corrección de la información recogida esta etapa es llamada: Consistencia.
Presentación de la información mediante cuadros, tablas y gráficos.
IV .Análisis e Interpretación de Resultados.
Después de la recopilación de los datos de una tarea o investigación estadística, estos son pasados
a una hoja de datos. Cada columna de la hoja de datos es una variable estadística.
Para el análisis estadístico de los valores de una variable, es necesario organizarlos y presentarlos
en forma tal, que facilite su comprensión y su posterior utilización. Los datos son organizados o
agrupados en un cuadro numérico y presentados en gráficas estadísticas.

Si la variable es cuantitativa y el interés es sólo obtener algunas medidas descriptivas de ellas

puede que no sea necesario agruparlos.
Existen muchos paquetes de cómputo estadísticos para organizar o agrupar datos.
V. Resultados y Conclusiones.
Generalización o inferencia Estadística. Consiste en obtener conclusiones acerca de la población

muestreada que dio lugar a los datos recopilados, es el principal objetivo de las investigaciones
estadísticas.
Interpretación y decisión. Consiste en la fase final del estudio la cual determinará si una solución
es adecuada o no, dependiendo de los resultados obtenidos.
 Introducción a la estadística descriptiva
 Proceso estadístico
 Recolección, clasificación, tabulación e interpretación de la información
1.5. Introducción a Elementos de Software estadístico
El uso de ordenadores y calculadoras facilita el que los alumnos comprendan mejor temas
complejos de matemáticas. Es evidente que en muchos casos la tecnología agiliza y supera, la
capacidad de cálculo de la mente humana, con ayuda de la tecnología, los alumnos tienen más
tiempo para concentrarse en enriquecer su aprendizaje matemático.
Las nuevas tecnologías han venido a cambiar por completo el panorama tradicional de como se
hacían, se veían y se enseñaban las matemáticas. Introducirse en este nuevo panorama implica
realizar profundos cambios en nuestros programas educativos.
Es muy amplia la variedad de aplicaciones informáticas disponibles para estadística y

probabilidad:
Excel/Calc
La hoja de cálculo Excel o Calc (OpenOffice) es un software considerado como estándar en todos
los entornos (educativo, profesional, familiar, etc), que posee la virtud de presentar una interfaz
agradable, una facilidad de uso digna de elogio y permite realizar análisis estadísticos simples o
más complejos y avanzados
La Hoja de Cálculo Excel/Calc puede convertirse en una poderosa herramienta para crear entornos
de aprendizaje que enriquezcan la representación (modelado), comprensión y solución de problemas,
en el área de la estadística y probabilidad. Excel ofrece funcionalidades que van más allá de la
tabulación, cálculo de fórmulas y graficación de datos:
 En estadística descriptiva representa todos los tipos de gráficos y calcula la media, moda,
mediana, recorrido, varianza y desviación típica.

 En estadística bidimensional representa la nube de puntos y la recta de regresión. Calcula el

centro de gravedad, las desviaciones típicas marginales, la covarianza, el coeficiente de
correlación, la recta de regresión y buscar objetivos.
 En la distribución binomial, calcula cualquier probabilidad, la media, varianza y desviación
típica.
 En la distribución normal, calcula cualquier probabilidad en la normal estándar N(0, 1) y en
cualquier normal N(m, s) y genera la tabla N(0, 1)
 En inferencia estadística calcula los intervalos de confianza, el tamaño de la muestra y se
puede aplicar al contraste de hipótesis, tanto en el bilateral como en el unilateral.
 En probabilidad simula todo tipo de lanzamientos.
La instalación del programa es muy sencilla, además Microsoft Excel incluye un comando para el
análisis de datos, dentro de las "herramientas para el análisis", su uso es poco común, ya que no
se tiene cuidado de instalar todas las funciones dentro de las "herramientas", perdiendo la
oportunidad de utilizar un medio poderoso para el estudio dentro de la estadística.
SPSS
Es la herramienta estadística más utilizada a nivel mundial en el entorno académico, con sus
últimas versiones. Puede trabajar con bases de datos de gran tamaño. Además, de permitir la re
codificación de las variables y registros según las necesidades del usuario. El programa consiste en
un módulo base y módulos anexos que se han ido actualizando constantemente en español con
nuevos procedimientos estadísticos.
Entre otros tenemos:
Minitab es otro de los programas más usados en el mundo para análisis estadístico. Permite
calcular la mayoría de metodologías estadísticas habituales, entre las que se cuentan: análisis
exploratorio de datos, gráficos estadísticos, control de calidad, estadística no paramétrica,
regresión y sus variantes, análisis multivariado de datos, etc.
Statgraphics es un programa de estadística de fácil manejo y una buena herramienta para la

enseñanza de la estadística en secundaria y para la investigación en educación.
Statistica es otro de los programas más usados a nivel mundial para el análisis estadístico. Entre
todas las bondades y pruebas estadísticas que incluye, destaca la variedad de gráficos y la facilidad
en el manejo de bases de datos.
El paquete estadístico MCEST es también una herramienta de trabajo muy útil, entre otros
paquetes, para construir distribuciones de frecuencias.

II
INTRODUCCIÓN A LA ESTADÍSTICA
2.1. Población y Muestra
Población en estadística se denomina a un conjunto de elementos: personas, objetos, etc. en los que
se pueden observar o medir una o más características de naturaleza cualitativa o cuantitativa.
A cada elemento de una población se le denomina unidad elemental o unidad estadística.
Por ejemplo, los empleados de una empresa en un día laborable, constituyen una población en la
que cada empleado (unidad estadística), tiene muchas características a ser observadas como:
género, estado civil, lugar de procedencia, grado de instrucción, etc. (características cualitativas) o
número de hijos, ingresos mensuales, etc.(características cuantitativas).
El resultado de observar o medir una característica en una unidad estadística, se denomina dato
estadístico, valor observado o simplemente observación.
a) Tipos de población
Por el número de elementos que la componen, la población se clasifica en finita o infinita. La

población es finita si tiene un número finito N de elementos. En caso contrario la población es
infinita. En la práctica una población finita con un número grande de elementos se considera como
una población infinita.
b) Muestra
Al definir investigación estadística a realizar, se debe decidir entre investigar toda la población o
sólo una parte de ella. El primer procedimiento es denominado censo y el segundo es llamado
muestreo.
Se denomina muestra a una parte de la población seleccionada de acuerdo con un plan o una
regla con el fin de obtener información acerca de la población de la cual proviene.
La muestra debe ser seleccionada de manera que sea representativa de la población. Un método de
selección de muestras representativas es al azar, esto es, cada elemento de la población tiene la
misma posibilidad de ser incluida en la muestra.
2.2. Variables estadísticas
La característica que se observa o mide en las unidades estadísticas de una población tiene
diversos valores de naturaleza cualitativa o cuantitativa. Por ejemplo, la característica “género"
tiene dos "valores" (modalidades): hombre y mujer. La característica "peso en kilogramos" tiene

infinitos valores.
Por tanto se denomina variable estadística a una característica definida en una población y
que asume por lo menos dos valores. Estos valores pueden ser de calidad o de cantidad.
Figura 1.0. Variable estadística
Por ejemplo en la población constituida por los empleados de la universidad, algunas variables
estadísticas definidas en esta población son:
X = "Género", cuyos valores son: Masculino, femenino
Y= "Estado civil", cuyos valores pueden ser: Soltero, casado, viudo, divorciado
Z= "Número de hijos", cuyos valores posibles son: 0, 1, 2, etc.
W= "Salarios mensuales", cuyos valores son números reales no negativos.
Si una variable estadística es denotada por X, entonces, sus valores observados en una muestra de
n unidades estadísticas escogidas de una población se denotarán por x1,x2,…,xn, conforme al
orden en que se han obtenido. Si sus valores son observados en toda una población finita de n
unidades estadísticas, se denotarán por x1, x2,...,xn
2.3. Escala de Medición.
Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en

observación. Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razón.
Las variables de las escalas nominal y ordinal se denominan también categóricas, por otra parte las
variables de escala de intervalo o de razón se denominan variables numéricas. Con los valores de las
variables categóricas no tiene sentido o no se puede efectuar operaciones aritméticas. Con las
variables numéricas sí.

La escala nominal sólo permite asignar un nombre al elemento medido. Esto la convierte en la
menos informativa de las escalas de medición.
Los siguientes son ejemplos de variables con este tipo de escala:
 Nacionalidad.
 Uso de anteojos.
 Número de camiseta en un equipo de fútbol.
 Número de Cédula Nacional de Identidad.
A pesar de que algunos valores son formalmente numéricos, sólo están siendo usados para identificar
a los individuos medidos.
La escala ordinal, además de las propiedades de la escala nominal, permite establecer un orden entre
los elementos medidos.
Ejemplos de variables con escala ordinal:
 Preferencia a productos de consumo

 Etapa de desarrollo de un ser vivo.
 Clasificación de películas por una comisión especializada.
 Madurez de una fruta al momento de comprarla.
La escala de intervalo, además de todas las propiedades de la escala ordinal, hace que tenga sentido
calcular diferencias entre las mediciones.
Esta es una escala en la cual los números no solo se encuentran ordenados por rangos, sino que
también están divididos en determinados intervalos. La particularidad que diferencia esta escala de la
de relaciones que se describirá posteriormente, consiste en que el cero de la escala se selecciona de
manera arbitraria.
Los siguientes son ejemplos de variables con esta escala:
 Temperatura de una persona.

 Ubicación en una carretera respecto de un punto de referencia (Kilómetro 85 Ruta
 Sobrepeso respecto de un patrón de comparación.
 Nivel de aceite en el motor de un automóvil medido con una vara graduada.
Finalmente, la escala de razón permite, además de lo de las otras escalas, comparar mediciones
mediante un cociente.
Las variables de razón poseen las mismas características de las variables de intervalo, con la
diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de
medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta, Multiplicación y
División) y Lógica (Comparación y ordenamiento). Este tipo de variables permiten el nivel más alto
de medición, además que determinan la distancia exacta entre los intervalos de una categoría Las

variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo de escala de medida.
Debido a la similitud existente entre las escalas de intervalo y de razón, el Stadistic Program Social
System (SPSS) las ha reunido en un nuevo tipo de medida exclusivo del programa, al cual denomina
Escala. Las variables de escala son para SPSS todas aquellas variables cuyos valores representan
magnitudes, ya sea que cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta discutiremos
a continuación los diferentes procedimientos estadísticos que se pueden utilizar de acuerdo al tipo de
medida de cada variable.
Algunos ejemplos de variables con la escala de razón son los siguientes:
 Altura de personas.
 Cantidad de litros de agua consumido por una persona en un día.
 Velocidad de un auto en la carretera.
 Número de goles marcados por un jugador de básquetbol en un partido.
La escala de intervalo tiene un cero que se establece por convención y puede tener variaciones. Es
arbitrario. Por otra parte, la escala de razón tiene un cero real, fijo, no sujeto a variaciones; es propio
de la medición hecha.
2.4. Clasificación de las variables
Las variables pueden ser de dos tipos: cualitativas y cuantitativas.

a) Variables Cualitativas: Son aquellas que no se pueden medir numéricamente
Ejemplo 1. Nacionalidad, color de la piel, sexo.
Ejemplo 2. El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y
viudo.
b) Variables Cuantitativas: Son aquellas que tienen valor numérico (edad, precio de un
producto, ingresos anuales).
A su vez, las variables cuantitativas pueden ser: discretas y continuas.
Una variable cuantitativa discreta es aquella que toma valores aislados, es decir no admite
valores intermedios entre dos valores específicos.
Ejemplo 1. El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Ejemplo 2. Número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá
ser 3.45)
Una variable cuantitativa continua es aquella que puede tomar valores comprendidos entre
dos números. Pueden tomar cualquier valor real dentro de un intervalo.

Ejemplo 1. La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con tres
decimales.
Ejemplo 2. La velocidad de un vehículo puede ser 80.3 km/h, 94.57 km/h...etc.
2.5. Parámetro Estadístico
Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución
estadística.
Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una
gráfica.
Hay tres tipos parámetros estadísticos:
 Medidas de Centralización.
 Medidas de Posición
 Medidas de Dispersión.
Medidas de Centralización
Nos indican en torno a qué valor (centro) se distribuyen los datos.
Las medidas de centralización son:
 Media aritmética, la media es el valor promedio de la distribución.
 Mediana, la mediana es la puntación de la escala que separa la mitad superior de la
distribución y la inferior, es decir divide la serie de datos en dos partes iguales.
 Moda, la moda es el valor que más se repite en una distribución.
Medidas de Posición
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de
individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a
mayor.
Las medidas de posición son:
 Cuartíles, dividen la serie de datos en cuatro partes iguales.
 Decíles, dividen la serie de datos en diez partes iguales.
 Percentiles, dividen la serie de datos en cien partes iguales.
Medidas de Dispersión
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la
distribución.
Las medidas de dispersión son:
 Rango o recorrido, es la diferencia entre el mayor y el menor de los datos de una
distribución estadística.
 Desviación media, es la media aritmética de los valores absolutos de las desviaciones
respecto a la media.
 Varianza, es la media aritmética del cuadrado de las desviaciones respecto a la media.
 Desviación típica, es la raíz cuadrada de la varianza.

En los siguientes capítulos estudiaremos cada una de estas medidas o parámetros estadísticos.
Ejercicios
Ejercicio 1. Indica que variables son cualitativas y cuales cuantitativas:
1. Comida Favorita.
2. Profesión que te gusta.
3. Número de goles marcados por tu equipo favorito en la última temporada.
4. Número de alumnos de tu Instituto.
5. El color de los ojos de tus compañeros de clase.
6. Coeficiente intelectual de tus compañeros de clase.
Solución. 1) Cualitativa, 2) Cualitativa, 3) Cuantitativa, 4) Cuantitativa, 5) Cualitativa

6) Cuantitativa
Ejercicio 2. De las siguientes variables indica cuáles son discretas y cuales continuas.
1. Número de acciones vendidas cada día en la Bolsa.

2. Temperaturas registradas cada hora en un observatorio.
3. Período de duración de un automóvil.
4. El diámetro de las ruedas de varios coches.
5. Número de hijos de 50 familias.
6. Censo anual de los españoles.
Solución.1) Discreta, 2) Continua, 3) Continua, 4) Continua, 5) Discreta, 6) Discreta
Ejercicio 3. Clasificar las siguientes variables en cualitativas y cuantitativas discretas o

continuas.
1. La nacionalidad de una persona.

2. Número de litros de agua contenidos en un depósito.
3. Número de libros en un estante de librería.
4. Suma de puntos obtenidos en el lanzamiento de un par de dados.
5. La profesión de una persona.
6. El área de las distintas baldosas de un edificio.
Solución. 1) Cualitativa, 2) Cuantitativa continua, 3) Cuantitativa discreta, 4) Cuantitativa

discreta, 5) Cualitativa, 6) Cuantitativa continua.

III
ESTADISTICA DESCRIPTIVA.
3.1. Recolección de Datos
Una vez que se han recogido los valores que toman las variables de nuestro estudio (datos),
procederemos al análisis descriptivo de los mismos. Para variables categóricas, como el sexo o el
estado, se quiere conocer el número de casos en cada una de las categorías, reflejando habitualmente
el porcentaje que representan del total, y expresándolo en una tabla de frecuencias.
Para variables numéricas, en las que puede haber un gran número de valores observados distintos, se
ha de optar por un método de análisis distinto, respondiendo a las siguientes preguntas:
 ¿Alrededor de qué valor se agrupan los datos?

 Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen?
 ¿muy concentrados? ¿muy dispersos?
Consiste en la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier

actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores
pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como tales,
es decir, únicamente los adquiere, los recopila y los organiza.
Incluye la tabulación, representación y descripción de conjuntos de datos, a partir de ellos se puede

organizar, simplificar y resumir información básica. Los datos pueden ser de variables
cuantitativas o categóricas.
El término estadística se emplea en una gran variedad de formas. En plural se emplea como
sinónimo de dato.
3.2. Proceso Estadístico
El trabajo estadístico o la investigación estadística es un proceso que pasa por las

siguientes etapas:
- Formulación del problema

- Diseño del experimento.
- Recopilación de los datos. .
- Clasificación, tabulación y descripción de resultados.
- Generalización o inferencia.
- Interpretación y decisión
El uso de los métodos estadísticos es muy variado y se aplican generalmente a distintos campos
como son los negocios, economía, educación, medicina, ingeniería, etc. Para lo cual el proceso

para realizar un estudio estadístico está constituido de las siguientes etapas:
Formulación del problema. Para realizar el estudio de un problema es necesario delimitarlo y

formularlo adecuadamente, definiéndolo de manera clara y precisa.
Diseño del experimento. Esta etapa se basa primordialmente en obtener un máximo de

información empleando un mínimo de costo y tiempo.
Recopilación de datos. Es el acopio de información y se incluye desde elaborar fichas

bibliográficas hasta la aplicación de cuestionarios con el empleo de técnicas de muestreo.
Existe una gran variedad de técnicas para realizar la investigación, que se deberán seleccionar de
acuerdo a las necesidades del problema, así como a diferentes factores como son el tiempo, costo,
tipo de actividades a realizar, recursos humanos, etc.
Las técnicas de recopilación de datos las podemos realizar con:

Investigación documental
Consiste en el estudio de documentos escritos sobre un objeto determinado, es decir son todos
aquellos documentos registrados en diferentes dispositivos físicos a los que podemos tener acceso
en forma directa o indirecta para su consulta y se puede clasificar en:
Documental Bibliográfica (libros)
Documental Hemerográfica (periódicos)
Documental Escrita (manuscritos, imprenta)
Documental Audiográfica (grabaciones, todo lo relacionado formato audio)
Documental Video gráfica (documentales, todo lo relacionado a formatos de video)
Documental iconográfica (cuadros, pinturas, monumentos, estatuas y retratos)
Recursos Digitales (Sistemas informáticos digitales)
Investigación de campo
Consiste en obtener información directa mediante diferentes actividades por contacto directo con
el hecho que se quiere investigar así como las personas relacionadas y se puede realizar:
a) Por observación directa
b) Por interrogación
a) Observación Directa.
Es el procedimiento empírico básico, el cual consiste en realizar la percepción intencionada de una
actividad determinada mediante la experimentación la cual consiste en la obtención de datos
cuantitativos por medio de la medición del fenómeno que se esté observando. Para realizar la
observación se utilizan diversos instrumentos auxiliares los cuales son:
La ficha de campo, Sirven para recolectar información sobre la población a investigar
anotando los hechos significativos. Debe ir lo siguiente:
* Tema de investigación
* Nombre del investigador
* Institución
* Lugar, Fecha, Hora
* Datos de la fuente (edad, sexo, ocupación)
Estudio de Actividades, realizadas con anterioridad, biografías, etc
b) Por Interrogación
La Entrevista, Es una de las técnicas más comunes y es considerada como la relación
directa entre el investigador y el objeto de estudio a través de individuos o grupos con el fin
de obtener testimonios reales.
a) Entrevistas formales
b) Entrevistas informales
La Encuesta Consiste en recopilar información sobre una parte de la población, en donde
la información recopilada puede emplearse para un análisis cuantitativo con el fin de
identificar las magnitudes del problema.
a) Un cuestionario, Es un eficaz auxiliar en la observación científica que contiene
aspectos del fenómeno esenciales, las cuales son preguntas formuladas por escrito y
no es necesaria la presencia del investigador.
- Cuestionarios por correo
- Cuestionario administrado por el entrevistado
- Cuestionario administrado por el entrevistador
b) Una cedula de entrevista, Tiene carácter de anónimo, donde el encuestador es
quien llena la cedula de entrevista, además es posible aclarar la información sobre
las preguntas y es utilizada cuando una persona tiene un bajo nivel cultural.
Clasificación, tabulación y descripción de resultados.
El proceso de tabulación consiste en el recuento de los datos que están contenidos en los
cuestionarios. En este proceso incluimos todas aquellas operaciones encaminadas a la obtención de
resultados numéricos relativos a los temas de estudio que se tratan en los cuestionarios. Se requiere
una previa codificación de las respuestas obtenidas en los cuestionarios. Realizamos tabulación,
codificación y diseño de gráficos con datos biográficos, de consumo o de opinión. Los resultados
serán presentados en tablas y/o mapas gráficos que expliquen las relaciones existentes entre las
diversas variables analizadas. Esta presentación se adecuará a la petición de nuestros clientes
mediante análisis estadísticos de datos, grabados por nosotros o por terceros, análisis bivariantes,
análisis multivariantes, tests de contraste de hipótesis
Tras la recogida de información en una investigación, nos encontraremos con una serie de datos
sobre diferentes variables de los individuos de una muestra. El primer paso para comenzar a analizar
los datos es el de organizarlos de manera que podamos ver las características de los diferentes
valores que han tomado las observaciones. El tipo de organización de los datos depende del tipo de
variable, puede ser: Cualitativa, cuantitativa, cronológica y geográfica. La información clasificada
toma la forma de un cuadro o tabla de manera que los procesos de clasificación y tabulación están
bastante ligados y tiene como fin ordenar los datos de forma que facilite su análisis e interpretación.
La clasificación – tabulación puede hacerse de dos maneras: manualmente o mecánicamente, la

decisión sobre el uso de una u otra forma depende de la cantidad de datos, el tiempo y el costo
aunque habrá que tomar en cuenta la disponibilidad del equipo.

IV
DISTRIBUCIÓN DE FRECUENCIAS
Después de la recopilación de los datos de una tarea o investigación estadística, estos son pasados
a una hoja de datos. Cada columna de la hoja de datos es una variable estadística.
Para el análisis estadístico de los valores de una variable, es necesario organizarlos y presentarlos
en forma tal, que facilite su comprensión y su posterior utilización. Los datos son organizados o
agrupados en un cuadro numérico y presentados en gráficas estadísticas.
Si la variable es cuantitativa y el interés es sólo obtener algunas medidas descriptivas de ellas, puede
ser que no sea necesario agruparlos.
Existen muchos paquetes de cómputo estadísticos para organizar o agrupar datos.
Todo cuadro numérico básicamente debe contener:
* Un título adecuado para evitar confusiones y para expresar brevemente su contenido.
* El cuerpo o agrupación de datos
* La fuente de los datos, si no son datos propios.
El cuadro numérico de una sola variable estadística se denominan distribución de frecuencias. Las
distribuciones de frecuencias desarrolladas en este capítulo son de variable cualitativa, de
variable cuantitativa discreta y por intervalos.
En el procedimiento de la construcción de distribuciones de frecuencias, nos referiremos a datos de
muestras.
4.1. Distribución de frecuencias de variable cualitativa
Si la variable X es cualitativa, observada en una muestra de n unidades estadísticas de una

población que origina k cualidades diferentes C1 C2, ...,Ck, la tabulación o agrupación de estos n
datos, es la distribución de frecuencias del cuadro 1.1.
La frecuencia absoluta fi, es el número de datos que resulta del conteo en la categoría respectiva
Ci, donde i = l, 2, ...,k. La suma de todas las frecuencias absolutas es igual a n, el total de datos
observados.
La frecuencia relativa hi se define en cada categoría Ci por hi = fi /n.
La suma de todas las frecuencias relativas es igual a uno.
La frecuencia porcentaje p i, se define en cada categoría C¡ por pi = hi x 100 %
El total de las frecuencias porcentajes es igual a cien.

Cuadro 1.1. Distribución de frecuencias de variable cualitativa
4.2. Gráfica de la distribución de variable cualitativa
Existe una gran variedad de gráficas para la distribución de frecuencias de variable cualitativa, las
más comunes son la de barras separadas y la de sectores circulares.
En una gráfica de barras, los datos de cada una de las cualidades Ci se representan por una barra
rectangular vertical (u horizontal), cuya altura (o largo) es proporcional a su frecuencia (de
cualquiera de los tres tipos). Las barras se dibujan dejando un espacio entre ellas.
Si la escala es nominal las cualidades pueden ser colocadas en cualquier orden. Pero, si el nivel de
la escala es ordinal las cualidades deben ir ordenadas.
En una gráfica circular, los datos de cada categoría Ci se representan por un sector circular cuyo
ángulo en el centro es igual a h i x 360°. Si la gráfica por sectores circulares es tridimensional ésta
se denomina gráfica de pastel.
Ejemplo 1.
En una encuesta de opinión acerca de las preferencias de bebidas gaseosas por su color: Negro(N),
Blanco (B), Rojo(R), una muestra de 20 consumidores marcó las siguientes respuestas:
B, N, N, B, R, N, N, B, B, N
B, N, N, R, B, N, B, R, B, N
Describa la variable estadística y obtenga la distribución de frecuencias. Luego presente los datos
agrupados en las gráficas de barras y circular.
Finalmente desarrolle un breve cometario de los resultados del sondeo.
Solución.
La variable estadística es X= "Color de la bebida gaseosa". Es una variable cualitativa cuyos
valores están en el nivel de escala nominal. La agrupación de sus valores es la distribución de

frecuencias del cuadro 1.2. Sus gráficas son las figuras 1.1 y 1.2.
Cuadro 1.2. Distribución de consumidores por el color de bebida gaseosa .
La figura 1.1 es la representación gráfica por medio de barras de la distribución de personas por el
color de su bebida gaseosa preferida.
La figura 1.2 es la representación mediante gráfica de sectores circulares del cuadro 1.2. La
frecuencia 45% es equivalente a 0.45x360° = 162°, la frecuencia 40% es equivalente a 0.40x360° =
144° y la frecuencia 15% es equivalente a 0.15x360° = 54°.
40%
15%
Negro
Blanco
Rojo
45%
Figura. 1.2 Gráfica sectores circulares
La bebida que más prefiere la muestra es la de color negro, 9 de 20 o 45%. Sólo un 15% de la
muestra (3 de 20) prefieren el color rojo.
El color negro que tiene mayor frecuencia es la moda de la distribución.
4.2. Distribución de frecuencias de variable cuantitativa discreta
Una distribución de frecuencias de variable discreta tiene la estructura básica del cuadro 1.1,
donde, en la primera columna se introducen los valores distintos de la variable discreta.
Si n valores de una variable discreta X observados en una muestra de una población, tienen k
(k≤,n) valores distintos, xl,x2,...,xk, que se repiten respectivamente f1, ,f2,….,fk veces,
entonces, la organización o agrupación de estos n datos origina la distribución de frecuencias del
cuadro 1.3.
Cuadro 1.3. Distribución de frecuencias de variable discreta
4.3. Gráfica de la distribución de variable discreta
La representación gráfica más común de una distribución de frecuencias de variable discreta es

denominada de bastón que consiste en trazar en cada valor distinto de la variable, segmentos de
recta proporcionales a su frecuencia (de cualquiera de los tres tipos).
Los segmentos de recta pueden tener cualquier grosor, pero, cuidando de no confundir la
presentación gráfica de bastón con la de barras separadas de la distribución de frecuencias de
variable cualitativa.
Ejemplo 1.
Ante la pregunta del número de hijos por familia, una muestra de 20 hogares marcó las siguientes
respuestas:
2, 1, 2. 4, 1, 3, 2, 3, 2, 0
3, 2, 1, 3, 2, 3, 3, 1, 2, 4
Describa la variable de la encuesta y obtenga la distribución de frecuencias de los datos. Luego,

grafique la distribución. Finalmente desarrolle un breve comentario.
Solución
La variable estadística es X = "Número de hijos por familia". Esta variable es cuantitativa discreta
cuyos valores están en el nivel de escala de razón.
Los valores observados de la variable originan cinco valores distintos 0, 1, 2, 3, 4, los que se
repiten respectivamente: 1, 4, 7, 6, 2 veces. La distribución de frecuencias de los datos observados
es desarrollada en el cuadro 1.4.
Número de Frecuencias (Familias)

Hijos Absolutas Relativas Porcentajes
xi fi hi pi
0 1 0.05 5
1 4 0.20 20
2 7 0.35 35
3 6 0.30 30
4 2 0.10 10
Total 20 1.00 100
Cuadro 1.4. Distribución de frecuencias de X=Número de hijos por familia
En esta grafica se indican comparativamente las frecuencias absolutas y relativas
La distribución de los datos es asimétrica y presenta una concentración en el valor 2 de la variable.

La mayoría de familias de la muestra (35%) tiene 2 hijos. Sólo un 5% no tienen hijos.
Ejemplo 2.
Las puntuaciones obtenidas por un grupo de estudiantes en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias

Solución
Se realizará primero el conteo respectivo de cada variable, anotando el valor en la frecuencia

absoluta, en base a la cual calcularemos: la Frecuencia Absoluta Acumulada, Frecuencia Relativa,
Frecuencia Relativa Acumulada y el Porcentaje.
xi Conteo fi Fi hi Hi pi
13 III 3 3 0.15 0.15 15%
14 I 1 4 0.05 0.20 5%
15 IIIII 5 9 0.25 0.45 25%
16 IIII 4 13 0.20 0.65 20%
18 III 3 16 0.15 0.80 15%
19 I 1 17 0.05 0.85 5%
20 II 2 19 0.10 0.95 10%
22 I 1 20 0.05 1 5%
N= 20 1.00 100%
De acuerdo a la tabla elaborada el 25% del grupo obtuvo la calificación de 15.
4.4. Distribución de frecuencias por intervalos
La distribución de frecuencias por intervalos o clases se aplica cuando la variable estadística

cuantitativa es continua o cuando el número de valores distintos de una variable discreta es muy
grande (más de 20 líneas en el monitor de una computadora).
Intervalos Ii Conteo FRECUENCIAS

Absolutas fi Relativas hi Porcentajes pi
I1 ////….. f1 h1 p1
I2 /////….. f2 h2 p2
….. ….. …….. …….
Ik /////… fk hk pk
Total n 1.00 100 %
Cuadro 1.5. Distribución de frecuencias por intervalos
Esta distribución, que tiene la estructura básica del cuadro 1.1, donde, en la primera columna se
insertan los valores de la variable en intervalos de números.
La amplitud de los intervalos, se obtiene dividiendo el rango de valores de los datos en k

intervalos y determinando el número de datos qué contiene cada intervalo (Cuadro 1.5).
Para construir la distribución de frecuencias por intervalos hay varios procedimientos. En este texto
se conviene y recomienda:

 R1. Elegir no menos de 4 ni más de 20 intervalos. Con menos de 4 se podrían omitir

características importantes de los datos. Con más de 20 se pueden complicar
innecesariamente los cálculos de las medidas descriptivas.
Los intervalos pueden ser de longitudes iguales o diferentes, en ambos casos se consiguen
los mismos objetivos. En este texto elegimos todos los intervalos de igual amplitud A.
Convenimos, además, que si todos los datos son números enteros, entonces, A debe ser
entero. Si al menos un dato tiene un decimal, entonces, A debe tener un decimal. Si al menos
un dato tiene dos decimales, entonces, A debe tener dos decimales, etc.
 R2. El número de intervalos elegido, debe originar una distribución de frecuencias mono-
modal. Es decir, una distribución cuyas frecuencias van aumentando progresivamente hasta
una frecuencia máxima y luego van disminuyendo también progresivamente.
4.5. Construcción de la Distribución de Frecuencias
Dados n valores de alguna variable cuantitativa X continua (o discreta con más de 20 valores
distintos) el método que convenimos a seguir en la construcción de la distribución de frecuencias
es:
1. Determinar el rango (R) de valores de los datos que se define por:
R= Xmax – Xmin
Donde, Xmax es el dato máximo y Xmin es el dato mínimo.
2. Determinar el número de intervalos, k, teniendo en cuenta la recomendación Rl.
Un valor aproximado del número de intervalos, k, nos proporciona la regla de Sturges, donde
K= 1 + 3.3*log(n), n ≥ 10
Redondeando el número obtenido al entero inmediato mayor.
Por ejemplo, si n = 45 datos sin decimales, entonces, k=1+ 3.3 1og (45) = 6.4556.
Luego, k podrá elegirse como 6, 7, 8, o cualquier otro número entero cercano al valor de k,
teniendo en cuenta las recomendaciones Rl y R2.
Alternativamente se puede aplicar k = √ , donde 25 ≤ n ≤ 400.
3. Determinar la amplitud A del intervalo, dividiendo el rango entre el número de

intervalos- Esto es,

A ~ R / k , sometida a la condición k A>R.
Si la división R / k es exacta, entonces, A = R / k. En este caso, el dato Xmax coincide con el

extremo derecho del último intervalo (por eso se cierra por la derecha este intervalo).
Si la división R / k no es exacta (teniendo en cuenta el número de decimales de los datos),

entonces, el número A se aproxima por exceso de manera que el número de intervalos logre cubrir
todo el rango, esto es, de manera que kA>R. En este caso, el dato Xmaj¡ es menor que el extremo
derecho del último intervalo.
Por ejemplo, si los datos no tiene decimales y si R/k = 5, entonces, A=5. Si los datos tienen dos
decimales y si R / k = 5.3416, se elige A = 5.35.
4. Determinar los extremos de los intervalos de la siguiente manera:
L1=[Xmin+ Xmin+ A [
l2=[Xmin + A, Xmin +2A [
I3 =[Xmin +2A, Xmin +3A [
……………………………
Ik=[Xmin+(k-1)A, Xmin + kA ]
Observe que se cierra por la derecha el último intervalo, Esto se debe a que si la división R / k es
exacta (considerando el número de decimales de los datos), entonces,
Xmax = Xmin + KA
Ejemplo 1.
Los salarios quincenales, en dólares, recopilados en una muestra de 45 empleados son:
63 82 36 49 56 64 59 35 78
43 51 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
50 64 76 44 73 56 62 63 60
Describa la variable y desarrolle la distribución de frecuencias de los datos.

Solución
La variable estadística es X = "Salarios quincenales de empleados". Es una variable cuantitativa

continua cuyos valores están en el nivel de escala de razón.
1) De los datos, se obtiene Xmax = 82 y Xmin = 26.
El rango de valores de los datos es: R = 82 - 26 = 56
2) El número aproximado de intervalos es por la regla de Sturges:
k = 1 + 3.3 log(45) = 6.4556
Elegimos 7 intervalos. (Se puede elegir cualquier otro número cercano a 7)
3) La amplitud A del intervalo se obtiene del cociente:
R 56
 8
k 7
Dado que los datos no tienen decimales y dado que la división es exacta en los números enteros,
elegimos A = 8
4) Los intervalos, el conteo y las frecuencias absolutas de los 45 salarios quincenales se

desarrollan en el cuadro 1.6:
Cuadro 1.6. Distribución de frecuencias de X=Salarios de empleados
Intervalos Conteo Frecuencias
de salarios ($) Ii de empleados Absolutas Relativas Porcentajes

fi hi Pi %
[26, 34[ / 1 0.022 2.2
[34, 42[ // 2 0.044 4.4
[42, 50[ //// 4 0.089 8.9
[50, 58[ ////////// 10 0.222 22.2
[58; 66[ ///// ///// ///// / 16 0.356 35.6
[66,74[ ///// /// 8 0.178 17.8
[ 74, 82[ //// 4 0.089 8.9
Total 45 1.000 100.0

4.6. Marca de clase
La marca de clase o marca del intervalo Ii =[Li ,Ui[ es el número mi que se define como el punto
medio del intervalo. Esto es,
Por ejemplo, las marcas de clase de los intervalos del cuadro 1.6 son respectivamente: 30, 38,46,
54,62, 70 y 78.
Los datos organizados en distribución de frecuencias por intervalos, pierden su valor original. Se
asume que los datos en un intervalo dado se "distribuyen uniformemente", por lo tanto, la marca de
clase es el valor representativo de todos los datos contenidos en el intervalo. Por ejemplo, el
intervalo [58, 66[, contiene 16 datos. Se asume que cada uno de estos datos es representado por 62,
la marca del intervalo. Se asume también que los 16 datos están distribuidos uniformemente en el
intervalo. En este sentido hay 8 casos entre 58 y 62, y 8 casos entre 62 y 66.
Es evidente, que al representar los datos tabulados en un intervalo por su correspondiente marca
de clase, se dejan sin efecto los valores originales, por lo que se pierde alguna información. Por lo
tanto, el cálculo de las medidas descriptivas a partir de la distribución de frecuencias, producirán
valores aproximados de los valores exactos de las medidas.
Observe, además, que cuando los intervalos son reemplazados por su marca de clase, la
distribución de frecuencias resultante es similar a una distribución de frecuencias de variable
discreta. Por lo tanto, los cálculos de las medidas descriptivas se desarrollarán con métodos
similares.
4.7. Gráfica de la distribución por intervalos
La representación gráfica de la distribución de frecuencias por intervalos puede ser un histograma, o

un polígono de frecuencias. Del polígono de frecuencias se obtiene la curva de frecuencias.
Histograma
Es una gráfica básica o primaria que consiste de barras rectangulares no separadas, dibujadas con
orientación vertical u horizontal. El ancho de cada barra es proporcional a la amplitud del intervalo
y el largo es proporcional a su frecuencia (absoluta, relativa, o en porcentaje).
Los números representativos de la escala de los intervalos de la variable son generalmente las
marcas de clase de cada intervalo. Aunque también, pueden colocarse los límites de los intervalos.
En la escala de las frecuencias, se colocan los valores de cualquiera de los tres tipos de
frecuencias, sin que esto cambie la forma de la gráfica,
Al trazar las escalas del eje de la variable, se debe tener en cuenta si la variable tiene un cero real o
un cero arbitrario.
Por ejemplo, la figura 1.4 es el histograma con frecuencias absolutas de la distribución de

frecuencias del cuadro 1.6
Figura 1.4 Histograma
Polígono de Frecuencias
Es una gráfica secundaria más avanzada que el histograma. Se obtiene uniendo con segmentos
de recta, los puntos que tienen proporcionalmente como abscisa a la marca de clase y como
ordenada a la frecuencia respectiva (de cualquiera de los tres tipos). Se encierran ambos extremos
de la gráfica, en los puntos donde las marcas de clase extendidas no tienen frecuencia o tienen
frecuencias cero.
Por ejemplo, la figura 1.5 es el polígono de frecuencias absolutas de la distribución de frecuencias

del cuadro 1.6.
Figura 1.5 Polígono de Frecuencias

Curva de frecuencias
La curva de frecuencias es una gráfica "avanzada" de una distribución de frecuencias por

intervalos que se obtiene del polígono de frecuencias "suavizando" sus puntos angulosos. En el
proceso de suavización se recomienda tener en cuenta que la "porción" de área que se descarta
deberá ser proporcional a la "porción" de área que se incluye en el interior de la gráfica.
Figura 1.6. Curva de frecuencias
Por ejemplo, la figura 1.6 es la curva de frecuencias absolutas de la distribución de frecuencias del
cuadro 1.6.
La importancia de una curva de frecuencias es que se describe como una aproximación del
modelo de distribución de la variable o del tipo de población de la que se han obtenido los datos
de la muestra. La curva de frecuencias se aplica como un método gráfico para describir
aproximadamente las características de la distribución de la población como: Su forma:
Simétrica o asimétrica (positiva o negativa), Su tipo: Uniforme, exponencial, normal, etc.
Las curvas de frecuencias pueden pues, tener una gran variedad de formas. Algunas de ellas son las
siguientes:
4.8. Distribuciones Simétricas
Las curvas simétricas son de 3 tipos:
Normal o mesocúrtica (figura 1.7(a)),
Platicúrtica (figura 1.7(b)), y
Leptocúrtica (figura 1.7(c)).

Figura 1.7. Curvas Simétricas
4.9. Distribuciones Asimétricas
Las curvas asimétricas pueden ser de dos tipos:
Asimétricas positivas (o de cola al lado derecho), figura 1.8 (a).
Asimetría negativa (o de cola a la izquierda), fig. 1.8(b).
a) Asimétrica positiva b) Asimétrica negativa

Figura 1.8. Curvas Asimetricas
4.10. Distribución multimodal
Una curva de frecuencias es bimodal si tiene dos frecuencias máximas, como la figura 1.9(a). Es
trimodal si tiene tres frecuencias máximas, como la figura 1.9 (b), etc.
a) Curva bimodal b) Curva trimodal
Figura 1.9. Curvas multimodales

4.11. Distribución de frecuencias acumuladas no Agrupadas
A) Distribución de variable cualitativa
A nivel nominal no tienen ningún significado las frecuencias acumuladas.
B) Distribución de frecuencias acumuladas de variable discreta
Si la variable es discreta y su distribución de frecuencias es de la forma: dato <=> frecuencia,

entonces, la frecuencia acumulada (absoluta, relativa o en porcentaje) menor o igual que un
valor determinado de la variable, es la suma de las frecuencias no acumuladas respectivas hasta el
valor de la variable.
Si la distribución de la variable discreta Atiene k valores distintos x1,x2,...,xk, entonces, la

frecuencia acumulada absoluta, Fi hasta el valor xi es la suma de las frecuencias absolutas fi de
todos los valores menores o iguales a xi, , esto es,
Del mismo modo la frecuencia acumulada relativa H) hasta el valor xi es la suma de las
frecuencias relativas hx de todos los valores menores o iguales a xi.
∑ ó , i=1, 2, ……..,k
Y la frecuencia acumulada en porcentajes Pi hasta el valor x, es la suma de las frecuencias en

porcentajes pi de todos los valores menores o iguales a xi,
∑ ó Pi =Hi x 100 %, i=1,2,…….k
En el cuadro 1.7, se desarrollan las frecuencias acumuladas absolutas, relativas y de porcentajes

del número de hijos de 20 familias del cuadro 1.4.
El valor F3 = 12 significa que: hay 12 familias de las 20, que tienen 2 hijos o menos, o que el 60%
de las familias del grupo tienen 2 hijos o menos.

# de hijos Frecuencias (familias) Frecuencias Acumuladas

Xi
Xi Absolutas Relativas Porcentajes Absoluta Relativas Porcentajes
Pi %
fi Hi Fi Hi Pi %
0 1 0.05 5 1 0.05 5
1 4 0.20 20 5 0.25 25
2 7 0.35 35 12 0.60 60
3 6 0.30 30 18 0.90 90
4 2 0.10 10 20 1.00 100
Total 20 1.0000 100

Cuadro 1.7. Distribución de frecuencias acumuladas del # de hijos
C) Distribución de frecuencias acumuladas por intervalos
Si la distribución de frecuencias es construida por intervalos, la frecuencia acumulada

(absoluta, relativa o en porcentaje) de cada intervalo es la suma de las frecuencias respectivas
hasta ese intervalo.
En el cuadro 1.8 se desarrollan las frecuencias acumuladas absolutas, relativas y de porcentajes de

los salarios quincenales de los 45 empleados que corresponden al cuadro 1.6.
La frecuencia acumulada Fi es la suma de las frecuencias absolutas hasta el intervalo i, conde, i =

1, 2, 3,4, 5,6, 7. Por ejemplo:
F3 = f1 + f2 + f 3 = 1 + 2 + 4 = 7 indica que 7 de 45 salarios son menores que $50
Cuadro 1.8. Distribución de frecuencias acumuladas de X: Salarios de empleados

Intervalos Frecuencias (Empleados) Frecuencias Acumuladas
de salarios Absoluta Relativa Porcentaje Absoluta Relativa Porcentaje
h fi hi pi % Fi Hi Pi %
[26,34[ 1 0.022 2.2 1 0.022 2.2
[34,42[ 2 0:044 4.4 3 0.066 6.6
[42,50[ 4 0.089 8.9 7 0.155 15.5
[50,58[ 10 0.222 22.2 17 0.377 37.7
[58,66[ 16 0.356 35.6 33 0.733 73,3
[66,74[ 8 0.178 17.8 41 0.911 91.1
[74.82] 4 0.089 8.9 45 1.000 100.0
Total 45 Í.000 100.0

Del mismo modo se definen las frecuencias acumuladas relativas y de porcentajes.
4.12. Grafica de la distribución acumulativa por intervalos
La gráfica más usada de la distribución de frecuencias acumuladas por intervalos, es el polígono de

frecuencias acumuladas, conocida también como ojiva de la distribución de frecuencias por
intervalos denominada también ojiva continua.
Salarios
Figura 1.11 Ojiva de la distribución por intervalos
Esta ojiva, se obtiene uniendo con segmentos de recta, los puntos cuya abscisa es proporcional
al límite superior Ui de cada intervalo y cuya ordenada es proporcional a la frecuencia acumulada
respectiva (absoluta, relativa o porcentaje), comenzando con el intervalo (extendido al lado
izquierdo) cuya frecuencia acumulada es cero.
La figura 1.11 representa la distribución de frecuencias acumuladas de los ingresos quincenales de

la muestra de 45 empleados del cuadro 1.8.
Otras Representaciones Graficas
Diagrama de Tallo y Hoja
El diagrama de tallo y hoja permite representar datos cuantitativos en un formato gráfico, similar a un
histograma, es una herramienta que permite obtener una representación visual informativa de un conjunto
de datos, para su elaboración es necesario separar para cada uno de los datos el último dígito de la derecha
(hoja) del bloque de cifras restantes (tallo).

Los pasos para construir el diagrama son:
Paso # 0: Paso opcional, ordenar de forma ascendente (de menor a mayor) los datos. Este paso permite
obtener una representación ordenada del diagrama de tallo y hoja.
Paso # 1: Seleccionar el último dígito de la derecha para el valor de la hoja, siendo los dígitos iniciales los
valores del tallo. Para números mayores de cuatro dígitos es posible utilizar valores de hojas de más de un
dígito.
Paso # 2: Hacer una lista de los valores de los tallos en una columna, ordenados de forma ascendente (de
menor a mayor).
Paso # 3: Registrar las hojas por cada observación junto al valor correspondiente del tallo.
También es posible agregar una columna de datos adicionales con información complementaria como lo
son la frecuencia relativa, la frecuencia acumulada, un indicador del tallo que incluya la mediana...
El número de tallos puede variar de un diagrama a otro, sin embargo es recomendable que este número
oscile entre 5 y 20 tallos ya que esto nos facilitará y permitirá:
1. Identificar el valor característico de la distribución de los datos.

2. Identificar la forma general de la distribución de los datos.
3. La dispersión de los datos.
Sin embargo lo anterior no será posible si la dispersión de los datos es muy grande.
Ejemplo:
La tabla siguiente muestra la resistencia a la compresión de 80 ejemplares de prueba de una aleación
aluminio-litio:
105 221 183 186 121 181 180 143

97 154 153 174 120 168 167 141
245 228 174 199 181 158 176 110
163 131 154 115 160 208 158 133
207 180 190 193 194 133 156 123
134 178 76 167 184 135 229 146
218 157 101 171 165 172 158 169
199 151 142 163 145 171 148 158
160 175 149 87 160 237 150 135
196 201 200 176 150 170 118 149
Paso # 0: Se ordenan los datos de forma ascendente, lo cual facilitará el manejo de la información,
recordando que este paso permitirá tener una representación ordenada del diagrama de tallo y hoja (paso
opcional).
76 123 145 154 163 172 181 200

87 131 146 156 163 174 183 201
97 133 148 157 165 174 184 207
101 133 149 158 167 175 186 208
105 134 149 158 167 176 190 218
110 135 150 158 168 176 193 221
115 135 150 158 169 178 194 228
118 141 151 160 170 180 196 229
120 142 153 160 171 180 199 237
121 143 154 160 171 181 199 245

Paso # 1: Se separa el último dígito de cada celda para identificar los tallos y las hojas.
7 6 12 3 14 5 15 4 16 3 17 2 18 1 20 0
8 7 13 1 14 6 15 6 16 3 17 4 18 3 20 1
9 7 13 3 14 8 15 7 16 5 17 4 18 4 20 7
10 1 13 3 14 9 15 8 16 7 17 5 18 6 20 8
10 5 13 4 14 9 15 8 16 7 17 6 19 0 21 8
11 0 13 5 15 0 15 8 16 8 17 6 19 3 22 1
11 5 13 5 15 0 15 8 16 9 17 8 19 4 22 8
11 8 14 1 15 1 16 0 17 0 18 0 19 6 22 9
12 0 14 2 15 3 16 0 17 1 18 0 19 9 23 7
12 1 14 3 15 4 16 0 17 1 18 1 19 9 24 5
Paso # 2 y Paso # 3: Hacer una lista de los valores de tallos en una columna y registrar las hojas por cada
observación junto al valor correspondiente del tallo. Si se desea puede agregar una columna adicional que
indique la frecuencia.
Tallo Hoja Frecuencia

7 6 1
8 7 1
9 7 1
10 1 5 2
11 0 5 8 3
12 0 1 3 3
13 1 3 3 4 5 5 6
14 1 2 3 5 6 8 9 9 8
15 0 0 1 3 4 4 6 7 8 8 8 8 12
16 0 0 0 3 3 5 7 7 8 9 10
17 0 1 1 2 4 4 5 6 6 8 10
18 0 0 1 1 3 4 6 7
19 0 3 4 6 9 9 6
20 0 1 7 8 4
21 8 1
22 1 8 9 3
23 7 1
24 5 1
Con lo cual queda terminado el diagrama de tallo y hoja.

Ejercicios de Aplicación
Ejercicio 1.

V
MEDIDAS DE TENDENCIA CENTRAL
El comportamiento de las variables estadísticas se puede estudiar, como se ha visto, a través de las
tablas de frecuencia.
Las medidas de tendencia central son varias: en este acápite se estudiara la media aritmética, la
mediana y la moda.
Las medidas de tendencia central son valores promedio que reflejan la tendencia de los datos a
concentrarse en torno a un valor central o de posición, representativas del conjunto de datos
ordenados.
5.1. La Media Aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el
número total de datos.
Para Datos no Agrupados
Es el símbolo de la media aritmética.
Ejemplo 1
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Ejemplo 2
El profesor de la materia de estadística desea conocer el promedio de puntos ganados en una clase
de 10 alumnos. Las notas de los alumnos son:
3,2 3,1 2,4 4,0 3,5
3,0 3,5 3,8 4,2 4,0
¿Cuál es el promedio de puntos de los alumnos de la clase?

SOLUCIÓN
Aplicando la fórmula para datos no agrupados tenemos:
Cabe anotar que en el ejemplo estamos hablando de una población correspondiente a todos los
alumnos de la clase (10 alumnos en total). El promedio de las notas es de 3,47.
Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmética.
En este caso la media pasa de 3,47 a 3,15. Esta variación notoria se debió a que la media aritmética
es sensible a los valores extremos cuando tratamos con pocos datos. El 0,0 es una nota atípica
comparada con las demás, que están ubicadas entre 3,0 y 4,2.
Media aritmética para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:
Ejemplo
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la
tabla. Calcular la puntuación media.
Ii xi fi xi · f i
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820

5.2. Media Ponderada
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para
determinado estudio. En esos casos se puede utilizar una media ponderada. Si es
un conjunto de datos o media muestral y son números reales positivos, llamados
"pesos" o factores de ponderación, se define la media ponderada relativa a esos pesos como:
Se obtiene multiplicando cada uno de los datos por su ponderación o peso y luego sumarlos, para
obtener una suma ponderada. A continuación se divide la suma ponderada entre la suma de los
pesos, dando como resultado la media ponderada.
Ejemplo
Calcular la media aritmética ponderada de las edades de los alumnos de cuarto de secundaria
Si sabemos que existen 42 alumnos y 1 alumno tienen 16 años, 4 alumnos tienen 17 años, 35
alumnos tienen 18 años y dos alumnos tienen 19 años.
Por cierto, la media no es la suma de 16+17+18+19 dividida entre 4; seria así si hubiera 1 alumno
de cada edad. En este caso, primero debemos calcular la suma total de años, para lo que es
necesario ponderar cada edad por el número de alumnos que la tienen.
En seguida la suma total de años se divide por el total de alumnos que la tienen.
También se puede simplificar las operaciones elaborando una tabla de frecuencias con una nueva
columna con los productos (xj -fi), de cada valor de la variable por su frecuencia, como se observa
en la tabla.
Edad alumnos:
Variable xi fi Xi.fi
16 1 16
17 4 68
18 35 630
19 2 38
Suma 42 752

X= = 17.9
5.3. Media geométrica
La media geométrica de una cantidad arbitraria de números (por decir n números) es la raíz n-
ésima del producto de todos los números, es recomendada para datos de progresión geométrica,
para promediar razones, interés compuesto y números índices.
Por ejemplo, la media geométrica de 2 y 18 es
Otro ejemplo, la media geométrica de 1, 3 y 9 sería
√ =√ =3
5.4. Mediana (Me)
Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por
debajo y por arriba de la mediana son iguales.
La definición geométrica se refiere al punto que divide en dos partes a un segmento. Por ejemplo,
la mediana del segmento es el punto C.
A C B
Existen entonces dos segmentos iguales:

→ →
Mediana para datos no agrupados (cantidad de datos impar)

Ejemplo1: Encontrar la mediana para los siguientes datos:
41234221553
Solución
PASO 1: Ordenar los datos.
11222334455
PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.
11222334455
La mediana es 3, dejando 5 datos a cada lado.
Mediana para datos no agrupados (cantidad de datos par)
Ejemplo2: Modifiquemos el ejemplo anterior, eliminando el último dato. Encontrar la mediana:
4123422155
Solución
PASO 1: Ordenar los datos.

1122234455
PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.
1122234455
El punto medio se encuentra entre dos valores: 2 y 3, por tanto, el valor de la mediana
Me = (2+3)/2 = 2,5
Mediana para Datos Agrupados
Aplicamos la siguiente fórmula

Ejemplo 1: Hallar la mediana de los siguientes
Intervalos de Frecuencia Frecuencia Abs.

Clase Absoluta f(i) Acumulada F (i)
28-38 2 2
38-48 7 9
48-58 7 16
58-68 14 30
68-78 15 45
48-88 8 53
88-98 3 56
n = 56
Se determina la clase donde se encuentra la clase mediana, para esto se efectúa una división:
Luego la mediana ocupa el 28 lugar, por lo tanto debe encontrarse en la cuarta clase, puesto que en
esta clase se encuentran los elementos que ocupan los lugares 16 al 30, por tanto:
Para aplicar la fórmula: 58 es el límite inferior de la clase donde está la mediana

14 es la frecuencia de la clase mediana
16 es la frecuencia de la clase anterior a la clase mediana
Sustituyendo en la formula tenemos:
Me = 66.5

Ejemplo: Mediana para datos agrupados en tablas tipo B
Determinar la mediana de la siguiente tabla de frecuencia:
Ni Li Ls f F p P Mc
1 21,20 29,21 5 5 12,50% 12,50% 25,21
2 29,21 37,21 2 7 5,00% 17,50% 33,21
3 37,21 45,21 10 17 25,00% 42,50% 41,21
4 45,21 53,21 7 24 17,50% 60,00% 49,21
5 53,21 61,21 12 36 30,00% 90,00% 57,21
6 61,21 69,21 3 39 7,50% 97,50% 65,21
7 69,21 77,20 1 40 2,50% 100,00% 73,21
Total 40 100,00%
SOLUCIÓN
Se determina la clase donde se encuentra la clase mediana, para esto se efectúa una
división:
Luego la mediana ocupa el 20 lugar, por lo tanto debe encontrarse en la cuarta clase,
puesto que en esta clase se encuentran los elementos que ocupan los lugares 17 al 24, por
tanto:
Para aplicar la fórmula: 45,21 es el límite inferior de la clase donde está la mediana
7 es la frecuencia de la clase mediana
16 es la frecuencia de la clase anterior a la clase
mediana
Sustituyendo en la fórmula tenemos:

5.5. Moda
La moda es el valor que tiene mayor frecuencia absoluta.
Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 M o= 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia
es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.
2, 2, 3, 3, 6, 6, 9, 9 Mo = No hay moda
Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio

de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Cálculo de la moda para datos agrupados
Para calcular la moda de n datos organizados por intervalos, se sigue los siguientes pasos:
1. Se determina el intervalo que contienen a la moda Mo, este intervalo, denominado

intervalo modal y que debe ser el único con la mayor frecuencia, tiene amplitud A,
frecuencia absoluta fi y sus frecuencias vecinas antes y después son fi-1 y fi+1
respectivamente.
Luego se aplica la fórmula:
Li es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.

Esta fórmula de la moda se la puede poner de la siguiente forma:
Dónde:
Li es el límite inferior del intervalo modal
d1 = fi - fi-1
d2= fi + fi+1
A es la amplitud del intervalo modal
Nota.- la fórmula de la moda se aplica en distribuciones con una sola frecuencia

máxima
Ejemplo
Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:
Ii fi
[60 - 63) 5
[63 - 66) 18
[66 - 69) 42
[69 - 72) 27
[72 - 75) 8
100
El intervalo [66 – 69) se denomina clase modal
d1 = 42 - 18 = 24
d2= 42 + 27= 69

Ejemplo de una aplicación que permita hallar la. Media, la Mediana y la Moda
Una distribución estadística viene dada por la siguiente tabla:
Ii [10, 15) [15, 20) [20, 25) [25, 30) [30, 35)
fi 3 5 7 4 2
Hallar: La moda, mediana y media.
Marca de
Ii fi Fi x i · fi
Clase (xi)
[10, 15) 12.5 3 3 37.5
[15, 20) 17.5 5 8 87.5
[20, 25) 22.5 7 15 157.5
[25, 30) 27.5 4 19 110
[30, 35) 32.5 2 21 65
21 457.5
La colocamos en forma vertical para completar la tabla con la frecuencia acumulada F i y

el producto xi*fi cuya sumatoria nos servirá para hallar la media aritmética
Moda
Mediana
Media aritmética

Ejercicios Resueltos
Ejercicio 1. Calcular la media, la mediana y la moda de la siguiente serie de números: 5,

3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.
x i fi Fi x i · f i
2 2 2 4
3 2 4 6
4 5 9 20
5 6 15 30
6 2 17 12
8 3 20 24
20 96
Moda Mo = 5
Mediana 20/2 = 10 Me = 5
Media
Ejercicio 2. Calcular la mediana de una distribución estadística que viene dada por la
siguiente tabla:
Ii fi Fi
[60, 63) 5 5
[63, 66) 18 23
[66, 69) 42 65
[69, 72) 27 92
[72, 75) 8 100
100

Ejercicio 3. En un test realizado a un grupo de 42 personas se han obtenido las

puntuaciones que muestra la tabla. Calcula la puntuación media.
Ii xi fi xi · f i
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820
Ejercicio 4. Sea una distribución estadística que viene dada por la siguiente tabla:
xi 61 64 67 70 73
fi 5 18 42 27 8
Calcular: La moda, mediana y media.
Moda
Mo = 67
Mediana
102/2 = 50 Me = 67
Media

Ejercicio 5.
Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta
en el momento de andar por primera vez:
Meses Niños
9 1
10 4
11 9
12 16
13 11
14 8
15 1
Calcular la moda, la mediana y la media aritmética.
Moda Mo = 12
Mediana 50/2 = 25 Me = 12
Media aritmética
Ejercicio 6.
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que

muestra la tabla. Calcular la puntuación media.
Ii xi fi xi · fi
[10, 20) 15 1 15
[20, 30) 25 8 200
[30,40) 35 10 350
[40, 50) 45 9 405
[50, 60 55 8 440
[60,70) 65 4 260
[70, 80) 75 2 150
42 1 820

VI
MEDIDAS DE DISPERSIÓN
6.1. Introducción.
Las medias de tendencia central o posición nos indican donde se sitúa un dato dentro de
una distribución de datos. Las medidas de dispersión, variabilidad o variación nos indican
si esos datos están próximos entre sí o sí están dispersos, es decir, nos indican cuán
esparcidos se encuentran los datos. Estas medidas de dispersión nos permiten apreciar la
distancia que existe entre los datos a un cierto valor central e identificar la concentración
de los mismos en un cierto sector de la distribución, es decir, permiten estimar cuán
dispersas están dos o más distribuciones de datos.
Estas medidas permiten evaluar la confiabilidad del valor del dato central de un conjunto
de datos, siendo la media aritmética el dato central más utilizado. Cuando existe una
dispersión pequeña se dice que los datos están dispersos o acumulados cercanamente
respecto a un valor central, en este caso el dato central es un valor muy representativo. En
el caso que la dispersión sea grande el valor central no es muy confiable. Cuando una
distribución de datos tiene poca dispersión toma el nombre de distribución homogénea y
si su dispersión es alta se llama heterogénea.
6.2. Rango o Recorrido Estadístico

En estadística descriptiva se denomina rango estadístico (R) o recorrido estadístico al
intervalo de menor tamaño que contiene a los datos.
Requisitos del Rango
* Ordenamos los números según su tamaño.

* Restamos el valor mínimo del valor máximo.
* Es calculable mediante la resta del valor mínimo al valor máximo.
* Comparte unidades con los datos.
* Permite obtener una idea de la dispersión de los datos.
Ejemplo 1
Para una serie de datos de carácter cuantitativo como es la estatura de una persona en
centímetros:
185, 165, 170, 182, 155
Es posible ordenar los datos como sigue:
x(1) = 155, x(2) = 165, x(3) = 170, x(4) = 182, x(5) = 185
Donde la notación x(i) indica que se trata del elemento i-ésimo de la serie de datos.

De este modo, el rango sería la diferencia entre el valor máximo x(5) y el mínimo x(1); ó
lo que es lo mismo:
R = x(5) − x(1) , con cinco valores, nos da que el Rango = 185-155 = 30.
Ejemplo 2
Para una muestra (0, 45, 50, 55, 100), el dato menor es 0 y el dato mayor es 100 (Valor
unitario inmediatamente posterior al dato mayor menos el dato menor). Sus valores se
encuentran en un rango de:
Rango = (100-0) =100
6.3. Medio Rango
El medio rango o rango medio de un conjunto de valores numéricos es la media del

menor y mayor valor, o la mitad del camino entre el dato de menor valor y el dato de
mayor valor. En consecuencia el medio rango es:
Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de
mayor valor Max= 8. El medio rango resolviéndolo mediante la correspondiente fórmula
sería:
Representación del medio rango
Se representaría de esta forma:

6.4. Desviación media o desviación promedio
La desviación media o desviación promedio es la media aritmética de los valores

absolutos de las desviaciones respecto a la media aritmética.
Propiedades
Guarda las mismas dimensiones que las observaciones. La suma de valores absolutos es
relativamente sencilla de calcular, pero esta simplicidad tiene un inconveniente: Desde el
punto de vista geométrico, la distancia que induce la desviación media en el espacio de
observaciones no es la natural (no permite definir ángulos entre dos conjuntos de
observaciones). Esto hace que sea muy engorroso trabajar con ella a la hora de hacer
inferencia a la población.
Cuando mayor sea el valor de la desviación media, mayor es la dispersión de los datos.
Sin embargo, no proporciona una relación matemática precisa entre su magnitud y la
posición de un dato dentro de una distribución.
La desviación media al tomar los valores absolutos mide una observación sin mostrar si la
misma está por encima o por debajo de la media aritmética.
Para Datos No Agrupados
Se emplea la ecuación:
Ejemplo:
Calcular la desviación media de la distribución: 3, 8, 8, 8, 9, 9, 9, 18
Solución:
Se calcula la media aritmética.
Se calcula la desviación media.

Empleando Excel se calcula de la siguiente manera:
Para Datos Agrupados en Tablas de Frecuencia
Ejemplo: Calcular la desviación media en base a la siguiente tabla sobre las

calificaciones de un estudiante en 12 asignaturas evaluadas sobre 10.
Cantidad de
Calificación
asignaturas
6 4
7 2
8 3
9 2
10 1
Total 12

Solución:
Se calcula la media aritmética.
Para Datos Agrupados en Intervalos
Donde Xm es la marca de clase.
Ejemplo ilustrativo: Calcular la desviación media de un curso de 40 estudiantes en la

asignatura de Estadística en base a la siguiente tabla:
Cantidad de
Calificación
estudiantes
2-4 6
4-6 8
6-8 16
8-10 10
Total 40
Solución:

Para calcular la media aritmética se llena la siguiente tabla:
Intervalo f xm f·xm
2-4 6 3 18
4-6 8 5 40
6-8 16 7 112
8-10 10 9 90
Total 40 260
Calculando la media aritmética se obtiene:
6.5. Varianza
Varianza y la Desviación Estándar
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la

media de una distribución estadística.
La varianza se representa por .

Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que
son equivalentes a las anteriores.
Propiedades de la varianza
1. La varianza será siempre un valor positivo o cero, en el caso de que las

puntuaciones sean iguales.
2. Si a todos los valores de la variable se les suma un número la varianza no varía.
3. Si todos los valores de la variable se multiplican por un número la varianza

queda multiplicada por el cuadrado de dicho número.
4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas
varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
Observaciones sobre la varianza
1. La varianza, al igual que la media, es un índice muy sensible a las puntuaciones

extremas.
2. En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
3. La varianza no viene expresada en las mismas unidades que los datos, ya que las
desviaciones están elevadas al cuadrado.

Las propiedades de la varianza (respectivamente, desviación típica) son importantes a la

hora de hacer un cambio de origen y escala a una variable. En primer lugar, la varianza
(resp. Desviación típica) no se ve afectada si al conjunto de valores de la variable se le
añade una constante. Si además cada observación es multiplicada por otra constante, en este
caso la varianza cambia en relación al cuadrado de la constante (resp. la desviación típica
cambia en relación al valor absoluto de la constante).
Uso de la Desviación Estándar
La desviación estándar indica la variabilidad de un proceso, una medida, etc.
Se suele usar en control estadístico de calidad, en mediciones, en determinar la esperanza

de vida de cosas o personas, gracias a la Desviación Estándar se pueden analizar
investigaciones, encuestas realizadas etc, con el fin de estimar determinados parámetros y
probabilidades.
Por ejemplo:
 Estimar índices de consumo.

 Controlar la variabilidad en presupuestos, comercializaciones, productos, en las
ventas, etc.
 Estimar si un estudiante alcance o no, la nota de promoción.
 Controlar que los productos no estén fuera de la fecha de vencimiento.
 Dar proyecciones sobre quién asumirá el próximo gobierno.
6.6. Desviación Estándar
La desviación estándar (o desviación típica) es una medida de dispersión para variables

de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es
una medida (cuadrática) de lo que se apartan los datos de su media, y por tanto, se mide
en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que representan
los datos en su distribución, con objeto de tener una visión de los mismos más acorde con
la realidad a la hora de describirlos e interpretarlos para la toma de decisiones.
Desviación estándar o Típica
Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos
respecto a su punto central o media. La desviación estándar nos da como resultado un
valor numérico que representa el promedio de diferencia que hay entre los datos y la
media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la
varianza, por lo tanto su ecuación sería:

Ejemplo
Calcular la varianza y desviación típica de las siguientes cantidades medidas en metros:

3, 3, 4, 4, 5
Solución: Para calcular dichas medidas de dispersión es necesario calcular previamente el

valor con respecto al cual vamos a medir las diferencias. Éste es la media:
La varianza es:
Siendo la desviación típica su raíz cuadrada:
Ejercicio 1: Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18

Ejercicio 2:
Calcular la varianza de la distribución de la tabla con datos agrupados:
x i fi x i · f i x i2 · f i
[10, 20) 15 1 15 225
[20, 30) 25 8 200 5 000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050
Ejercicio 3: Hallar la desviación media, la varianza y la desviación típica de la series

de números siguientes:
a) 2, 3, 6, 8, 11.
b) 12, 6, 7, 3, 15, 10, 18, 5.
c) 2, 3, 6, 8, 11.
Resolución: a) 2, 3, 6, 8, 11.

b) Resolución: 12, 6, 7, 3, 15, 10, 18, 5.
c) Resolución: 2, 3, 6, 8, 11. Queda para trabajo del estudiante
Ejercicio 4: Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de
su consulta en el momento de andar por primera vez:
MESES NIÑOS
9 1
10 4
11 9
12 16
13 11
14 8
15 1
Calcular la desviación típica.
Resolución:

Ejercicio 5: El gerente de una empresa de alimentos desea saber que tanto varían los
pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por
seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los
siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:
Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con
una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta
información le permite al gerente determinar cuánto es el promedio de perdidas causado
por el exceso de peso en los empaques y le da las bases para tomar los correctivos
necesarios en el proceso de empacado.
6.7. Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una muestra y su

media.
El coeficiente de variación se suele expresar en porcentajes:
El coeficiente de variación permite comparar las dispersiones de dos distribuciones

distintas, siempre que sus medias sean positivas.
Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan
entre sí.

La mayor dispersión corresponderá al valor del coeficiente de variación mayor.
Ejemplo:
Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 24. ¿Cuál de las dos
presenta mayor dispersión?
La primera distribución presenta mayor dispersión.
6.8. Teorema de Chebyshev
A pesar de lo anterior, es difícil describir exactamente qué es lo que mide la desviación

estándar. Sin embargo, hay un resultado útil, que lleva el nombre del matemático ruso
Pafnuty Lvovich Chebyshev, y se aplica a todos los conjuntos de datos. Este teorema de
Chebyshev establece que para todo conjunto de datos, por lo menos 1- 1/k2 de las
observaciones están dentro de k desviaciones estándar de la media, en donde k es
cualquier número mayor que 1. Este teorema se expresa de la siguiente manera:
Así por ejemplo, si se forma una distribución de datos con k =3 desviaciones estándar por
debajo de la media hasta 3 desviaciones estándar por encima de la media, entonces por lo
menos
Interpretación: El 88,89% de todas las observaciones estarán dentro ± 3 desviaciones de

la media.
Para Datos No Agrupados
La varianza para una población se calcula con:

Notas:
1) Para el cálculo de la varianza de una muestra se divide por n-1 en lugar de N, debido a
que se tiene n-1 grados de libertad en la muestra. Otra razón por la que se divide por n-1
es debido a que una muestra generalmente está un poco menos dispersa que la población
de la cual se tomó. Al dividir para n-1 en lugar de N se cumple con la tendencia y sentido
lógico de que la varianza y desviación estándar de la muestra deben tener un valor más
pequeño que la varianza y desviación estándar de la población.
2) En la realidad, salvo indicación expresa, no se calcula la varianza y la desviación

estándar de la población, ya que para ahorrar tiempo, esfuerzo, dinero, etc. es mejor
trabajar con datos que representan a la muestra.
Ejemplo 1
Considere que los siguientes datos corresponden al sueldo de una población: $350, $400,
$500, $700 y $1000
1) Calcular la desviación estándar.

2) ¿Cuál es el intervalo que está dentro de k = 2 desviaciones estándar de la media?. ¿Qué

porcentaje de las observaciones se encuentran dentro de ese intervalo?
Solución:
1) Para la calcular la desviación estándar se sigue los siguientes pasos:
a) Se calcula la media aritmética.
b) Se aplica la respectiva fórmula para calcular la varianza
c) Se calcula la desviación estándar.

2) Cálculo del intervalo de k = 2 desviaciones estándar de la media.
Se transportan 2 desviaciones estándar (2 x $ 237,4868) = $ 474,97 por encima y por

debajo de la media = $ 590
Por lo tanto se tiene un intervalo desde $ 590 - $474,97 = $ 115,03 hasta $ 590 + $474,97
= $ 1064,97
Aplicando el Teorema de Chebyshev
Interpretación: Se puede afirmar que por lo menos el 75% los sueldos están entre
$115,03 y $ 1064,97
Ejemplo 2: Dos empresas, A y B, venden sobres de café instantáneo de 350 gramos. Se

seleccionaron al azar en los mercados cinco sobres de cada una de las compañías y se
pesaron cuidadosamente sus contenidos. Los resultados fueron los siguientes:

A B
350,14 350,09
350,18 350,12
349,98 350,20
349,99 349,88
350,12 349,95
1) ¿Qué empresa proporciona más café en sus sobres?
2) ¿Qué empresa llena sus sobres de manera más consistente?
Solución:
a) Se calcula las medias aritméticas.
Interpretación:
Como la media aritmética de la empresa A es mayor que la de la empresa B, por lo tanto

la empresa A proporciona más café en sus sobres.
Para conocer la consistencia de las empresas se calcula las desviaciones estándar
b) Se calcula las desviaciones estándar.

Interpretación: Como la desviación estándar de la empresa A es menor a la desviación

estándar de la empresa B, por lo tanto la empresa A es más consistente al llenar los sobres
de café.

Ejercicios para Resolver
Para evaluar la viabilidad de un proyecto de reforestación de una zona sometidas a estrés

turístico, para el que se ha solicitado una subvención publica, se analizó la composición
en mg/cm3 de desechos orgánicos del territorio. Los datos obtenidos fueron:
1. Construir la tabla de frecuencias y representar la información gráficamente.

2. A partir de la tabla de frecuencias interprete: la frecuencia absoluta y la frecuencia
relativa acumulada.
3. Entre qué niveles de composición se encuentra aproximadamente el 51,4% de las
observaciones con menores niveles registrados?.
Resolución

VII
PROBABILIDAD
7.1. Introducción
La probabilidad mide la frecuencia con la que aparece un resultado determinado cuando

se realiza un experimento.
Ejemplo: tiramos un dado al aire y queremos saber cuál es la

probabilidad de que salga un 2, o que salga un número par, o que salga
un número menor que 4.
El experimento tiene que ser aleatorio, es decir, que pueden

presentarse diversos resultados, dentro de un conjunto posible de
soluciones, y esto aún realizando el experimento en las mismas condiciones. Por lo tanto,
a priori no se conoce cuál de los resultados se va a presentar:
Ejemplos: Lanzamos una moneda al aire: el resultado puede ser cara o cruz, pero no
sabemos de antemano cuál de ellos va a salir.
En la Lotería de Navidad, el "Gordo" (llamamos "Gordo" al primer premio) puede ser

cualquier número entre el 1 y el 100.000, pero no sabemos a priori cual va a ser.
Hay experimentos que no son aleatorios y por lo tanto no se les puede aplicar las reglas
de la probabilidad.
Ejemplo:
En lugar de tirar la moneda al aire, directamente seleccionamos la cara. Aquí no podemos
hablar de probabilidades, sino que ha sido un resultado determinado por uno mismo.
Antes de calcular las probabilidades de un experimento aleatorio hay que definir una serie
de conceptos:
Suceso elemental: Hace referencia a cada una de las posibles soluciones que se pueden
presentar.
Ejemplo:
Al lanzar una moneda al aire, los sucesos elementales son la cara y la cruz. Al lanzar un
dado, los sucesos elementales son el 1, el 2, .., hasta el 6.
Suceso compuesto: Es un subconjunto de sucesos elementales.

Ejemplo:
Lanzamos un dado y queremos que salga un número par. El suceso "numero par" es un
suceso compuesto, integrado por 3 sucesos elementales: el 2, el 4 y el 6
O, por ejemplo, jugamos a la ruleta y queremos que salga "menor o igual que 18". Este es
un suceso compuesto formado por 18 sucesos elementales (todos los números que van del
1 al 18).
Al conjunto de todos los posibles sucesos elementales lo denominamos espacio muestral.

Cada experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con
todas las soluciones posibles).
Ejemplo:
Si tiramos una moneda al aíre una sola vez, el espacio muestral será cara o cruz.
Si el experimento consiste en lanzar una moneda al aire dos veces, entonces el espacio
muestral estaría formado por (cara-cara),
7.2. Relación entre sucesos
Entre los sucesos compuestos se pueden establecer distintas relaciones:
a) Un suceso puede estar contenido en otro: Las posibles soluciones del primer suceso
también lo son del segundo, pero este segundo suceso tiene además otras soluciones
suyas propias.
Ejemplo:
Lanzamos un dado y analizamos dos sucesos: a) que salga el número 6, y b) que salga un
número par. Vemos que el suceso a) está contenido en el suceso b).
Siempre que se da el suceso a) se da el suceso b), pero no al contrario. Por ejemplo, si el

resultado fuera el 2, se cumpliría el suceso b), pero no el a).
b) Dos sucesos pueden ser iguales: esto ocurre cuando siempre que se cumple uno de
ellos se cumple obligatoriamente el otro y viceversa.
Ejemplo:
Lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que
salga múltiplo de 2. Vemos que las soluciones coinciden en ambos casos.
c) Unión de dos o más sucesos: la unión será otro suceso formado por todos los
elementos de los sucesos que se unen.

Ejemplo: Lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par y
b) que el resultado sea mayor que 3. El suceso unión estaría formado por los siguientes
resultados: el 2, el 4, el 5 y el 6
d) Intersección de sucesos: Es aquel suceso compuesto por los elementos comunes de

dos o más sucesos que se intersectan.
Ejemplo:
Lanzamos un dado al aire, y analizamos dos sucesos: a) que salga número par, y b) que
sea mayor que 4. La intersección de estos dos sucesos tiene un sólo elemento, el número
6 (es el único resultado común a ambos sucesos: es mayor que 4 y es número par).
e) Sucesos incompatibles: Son aquellos que no se pueden dar al mismo tiempo ya que no
tienen elementos comunes (su intersección es el conjunto vacio).
Ejemplo:
Lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número menor que 3,
y b) que salga el número 6. Es evidente que ambos no se pueden dar al mismo tiempo.
f) Sucesos complementarios: Son aquellos que si no se da uno, obligatoriamente se tiene

que dar el otro.
Ejemplo:
Lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número par, y b) que
salga un número impar. Vemos que si no se da el primero se tiene que dar el segundo (y
viceversa).
7.3. Cálculo de probabilidades
La probabilidad mide la mayor o menor posibilidad de que se dé un determinado

resultado (suceso) cuando se realiza un experimento aleatorio.
La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y

100%):
El valor cero corresponde al suceso imposible: Lanzamos un dado al aire y la

probabilidad de que salga el número 7 es cero (al menos, si es un dado certificado por la
OMD, "Organización Mundial de Dados").
El valor uno corresponde al suceso seguro: Lanzamos un dado al aire y la probabilidad

de que salga cualquier número del 1 al 6 es igual a uno (100%).

El resto de sucesos tendrá probabilidades entre cero y uno: Que será tanto mayor
cuanto más probable sea que dicho suceso tenga lugar.
¿Cómo se mide la probabilidad?
Uno de los métodos más utilizados es aplicando la Regla de Laplace: define la

probabilidad de un suceso como el cociente entre casos favorables y casos posibles.
P(A) = Casos favorables / casos posibles
Veamos algunos ejemplos:
a) Probabilidad de que al lanzar un dado salga el número 2: el caso favorable es tan

sólo uno (que salga el dos), mientras que los casos posibles son seis (puede salir cualquier
número del uno al seis). Por lo tanto:
P(A) = 1 / 6 = 0,166 (o lo que es lo mismo, 16,6%)
b) Probabilidad de que al lanzar un dado salga un número par: en este caso los casos
favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles
siguen siendo seis. Por lo tanto:
P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%)
c) Probabilidad de que al lanzar un dado salga un número menor que 5: en este caso
tenemos cuatro casos favorables (que salga el uno, el dos, el tres o el cuatro), frente a los
seis casos posibles. Por lo tanto:
P(A) = 4 / 6 = 0,666 (o lo que es lo mismo, 66,6%)
d) Probabilidad de que nos toque el "Gordo" de Navidad: tan sólo un caso favorable,
el número que jugamos (¡qué triste...¡), frente a 100.000 casos posibles. Por lo tanto:
P(A) = 1 / 100.000 = 0,00001 (o lo que es lo mismo, 0,001%)
Para poder aplicar la Regla de Laplace el experimento aleatorio tiene que cumplir dos
requisitos:
a) El número de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos
resultados, al aplicar la regla "casos favorables / casos posibles" el cociente siempre sería
cero.
b) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado,
algunas caras tuvieran mayor probabilidad de salir que otras, no podríamos aplicar esta
regla.

A la regla de Laplace también se le denomina "probabilidad apriori", porque para

aplicarla es necesario conocer antes de realizar el experimento cuales son los posibles
resultados y saber que todos tienen las mismas probabilidades.
Cuando se realiza un experimento aleatorio un número muy elevado de veces, las

probabilidades de los diversos posibles sucesos empiezan a converger hacia valores
determinados, que son sus respectivas probabilidades.
Ejemplo:
Si lanzo una vez una moneda al aire y sale "cara", quiere decir que el suceso "cara" ha
aparecido el 100% de las veces y el suceso "cruz" el 0%.
Si lanzo diez veces la moneda al aire, es posible que el suceso "cara" salga 7 veces y el
suceso "cruz" las 3 restantes. En este caso, la probabilidad del suceso "cara" ya no sería
del 100%, sino que se habría reducido al 70%.
Si repito este experimento un número elevado de veces, lo normal es que las

probabilidades de los sucesos "cara" y "cruz" se vayan aproximando al 50% cada una.
Este 50% será la probabilidad de estos sucesos según el modelo frecuentista.
En este modelo ya no será necesario que el número de soluciones sea finito, ni que todos
los sucesos tengan la misma probabilidad.
Ejemplo:
Si la moneda que utilizamos en el ejemplo anterior fuera defectuosa (o estuviera trucada),
es posible que al repetir dicho experimento un número elevado de veces, la "cara" saliera
con una frecuencia, por ejemplo, del 65% y la "cruz" del 35%. Estos valores serían las
probabilidades de estos dos sucesos según el modelo frecuentista.
A esta definición de la probabilidad se le denomina probabilidad a posteriori, ya que

tan sólo repitiendo un experimento un número elevado de veces podremos saber cuál es la
probabilidad de cada suceso.
7.4. Probabilidad de sucesos
Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar dos
sucesos entre sí, así como de las posibles relaciones que se pueden establecer entre los
mismos. Vamos a ver ahora cómo se refleja esto en el cálculo de probabilidades.
a) Un suceso puede estar contenido en otro: entonces, la probabilidad del primer suceso
será menor que la del suceso que lo contiene.

Ejemplo:
Lanzamos un dado y analizamos dos sucesos: a) que salga el número 6, y b) que salga un
número par. Dijimos que el suceso a) está contenido en el suceso b).
P(A) = 1/6 = 0,166
P(B) = 3 / 6 = 0,50
Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es menor
que la probabilidad del suceso que lo contiene, suceso b).
b) Dos sucesos pueden ser iguales: En este caso, las probabilidades de ambos sucesos
son las mismas.
Ejemplo:
salga múltiplo de 2. Las soluciones coinciden en ambos casos.
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
c) Intersección de sucesos: es aquel suceso compuesto por los elementos comunes de los
dos o más sucesos que se interceptan. La probabilidad será igual a la probabilidad de los
elementos comunes.
Ejemplo:
sea mayor que 3. La intersección de estos dos sucesos tiene dos elementos: el 4 y el 6.
Su probabilidad será por tanto:
P(A  B) = 2 / 6 = 0,33
d) Unión de dos o más sucesos: la probabilidad de la unión de dos sucesos es igual a la

suma de las probabilidades individuales de los dos sucesos que se unen, menos la
probabilidad del suceso intersección
Ejemplo:
Lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que el
resultado sea mayor que 3. El suceso unión estaría formado por los siguientes resultados:
el 2, el 4, el 5 y el 6.

P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
P (A  B) = 2 / 6 = 0,33
Por lo tanto,
P (A u B) = (0,50 + 0,50) - 0,33 = 0,666
e) Sucesos incompatibles: la probabilidad de la unión de dos sucesos incompatibles será

igual a la suma de las probabilidades de cada uno de los sucesos (ya que su intersección
es el conjunto vacio y por lo tanto no hay que restarle nada).
Ejemplo:
Lanzamos un dado al aire y analizamos dos sucesos:
a) que salga un número menor que 3, y b) que salga el número 6.
La probabilidad del suceso unión de estos dos sucesos será igual a:
P(A) = 2 / 6 = 0,333
P(B) = 1 / 6 = 0,166
Por lo tanto,
P(A u B) = 0,33 + 0,166 = 0,50
f) Sucesos complementarios: la probabilidad de un suceso complementario a un suceso

(A) es igual a 1 - P(A)
Ejemplo:
Lanzamos un dado al aire. el suceso (A) es que salga un número par, luego su
complementario, suceso (B), es que salga un número impar.
La probabilidad del suceso (A) es igual a :
P(A) = 3 / 6 = 0,50
Luego, la probabilidad del suceso (B) es igual a:
P(B) = 1 - P(A) = 1 - 0,50 = 0,50

Se puede comprobar aplicando la regla de "casos favorables / casos posibles":
P(B) = 3 / 6 = 0,50
g) Unión de sucesos complementarios: la probabilidad de la unión de dos sucesos

complementarios es igual a 1.
Ejemplo:
Seguimos con el ejemplo anterior: a) que salga un número par, y b) que salga un número
impar. La probabilidad del suceso unión de estos dos sucesos será igual a:
P(A) = 3 / 6 = 0,50
P(B) = 3 / 6 = 0,50
Por lo tanto,
P(A U B) = 0,50 + 0,50 = 1
7.5. Combinaciones, Variaciones y Permutaciones Simples
El cálculo de los sucesos favorables o sin repetición que no plantea ningún problema por
ser de un número reducido, se pueden calcular con facilidad aplicando la Regla de
Laplace
Ejemplo 1:
Probabilidad de que al lanzar un dado salga el número 2. Tan sólo hay un caso favorable,
mientras que los casos posibles son seis.
Probabilidad de acertar al primer intento el horóscopo de una persona. Hay un caso

favorable y 12 casos posibles.
Sin embargo, a veces calcular el número de casos favorables y casos posibles es complejo
y hay que aplicar reglas matemáticas:
Ejemplo 2:
5 matrimonios se sientan aleatoriamente a cenar y queremos calcular la probabilidad de

que al menos los miembros de un matrimonio se sienten junto. En este caso, determinar el
número de casos favorables y de casos posibles es complejo.

Las reglas matemáticas que nos pueden ayudar son el cálculo de combinaciones, el
cálculo de variaciones y el cálculo de permutaciones.
a) Combinaciones:
Determina el número de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con

los "n" elementos de una nuestra. Cada subgrupo se diferencia del resto en los elementos
que lo componen, sin que influya el orden.
Ejemplo, calcular las posibles combinaciones de 2 elementos que se pueden formar con
los números 1, 2 y 3.
Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el cálculo de

combinaciones las parejas (1,2) y (2,1) se consideran idénticas, por lo que sólo se cuentan
una vez.
b) Variaciones:
Calcula el número de subgrupos de 1, 2, 3, etc. elementos que se pueden establecer con

los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos
que lo componen o en el orden de dichos elementos (es lo que le diferencia de las
combinaciones).
Ejemplo, calcular las posibles variaciones de 2 elementos que se pueden establecer con
los números 1, 2 y 3.
Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso
los subgrupos (1,2) y (2,1) se consideran distintos.
c) Permutaciones:
Calcular las posibles agrupaciones que se pueden establecer con todos los elementos de
un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los
elementos.
Ejemplo, Calcular las posibles formas en que se pueden ordenar los números 1, 2 y 3.
Hay 6 posibles agrupaciones: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2) y (3, 2, 1)
7.6. Combinaciones, Variaciones y Permutaciones (II)
a) Combinaciones:
Para calcular el número de combinaciones se aplica la siguiente fórmula:

El término " n ! " se denomina "factorial de n" y es la multiplicación de todos los

números que van desde "n" hasta 1.
Ejemplo: 4 ! = 4 * 3 * 2 * 1 = 24
La expresión "Cm,n" representa las combinaciones de "m" elementos, formando

subgrupos de "n" elementos.
Ejemplo: C10,4 son las combinaciones de 10 elementos agrupándolos en subgrupos de 4

elementos:
Es decir, podríamos formar 210 subgrupos diferentes de 4 elementos, a partir de los 10

elementos.
b) Variaciones:
Para calcular el número de variaciones se aplica la siguiente fórmula:
La expresión "Vm,n" representa las variaciones de "m" elementos, formando subgrupos de

"n" elementos. En este caso, como vimos en la lección anterior, un subgrupo se
diferenciará del resto, bien por los elementos que lo forman, o bien por el orden de dichos
elementos.
Ejemplo: V10,4 son las variaciones de 10 elementos agrupándolos en subgrupos de 4

elementos:
Es decir, podríamos formar 5.040 subgrupos diferentes de 4 elementos, a partir de los 10

elementos.

c) Permutaciones:
Para calcular el número de permutaciones se aplica la siguiente fórmula:
La expresión "Pm" representa las permutaciones de "m" elementos, tomando todos los
elementos. Los subgrupos se diferenciaran únicamente por el orden de los elementos.
Ejemplo: P10 son las permutaciones de 10 elementos:
Es decir, tendríamos 3.628.800 formas diferentes de agrupar 10 elementos.
7.7. Combinaciones, Variaciones y Permutaciones (III)
Vamos a analizar ahora que ocurriría con el cálculo de las combinaciones, de las
variaciones o de las permutaciones en el supuesto de que al formar los subgrupos los
elementos pudieran repetirse.
Por ejemplo: tenemos bolas de 6 colores diferentes y queremos formar subgrupos en los
que pudiera darse el caso de que 2, 3, 4 o todas las bolas del subgrupo tuvieran el mismo
color. En este caso no podríamos utilizar las fórmulas que vimos en la lección anterior.
a) Combinaciones con repetición:
Para calcular el número de combinaciones con repetición se aplica la siguiente fórmula:
Ejemplo: C'10,4 son las combinaciones de 10 elementos con repetición, agrupándolos en

subgrupos de 4, en los que 2, 3 o los 4 elementos podrían estar repetidos:
Es decir, podríamos formar 715 subgrupos diferentes de 4 elementos.

b) Variaciones con repetición:
Para calcular el número de variaciones con repetición se aplica la siguiente fórmula:
Ejemplo: V'10,4 son las variaciones de 10 elementos con repetición, agrupándolos en

subgrupos de 4 elementos:
Es decir, podríamos formar 10.000 subgrupos diferentes de 4 elementos.
c) Permutaciones con repetición:
Para calcular el número de permutaciones con repetición se aplica la siguiente fórmula:
Son permutaciones de "m" elementos, en los que uno de ellos se repite " x 1 " veces, otro "
x2 " veces y así ... hasta uno que se repite " x k " veces.
Ejemplo: Calcular las permutaciones de 10 elementos, en los que uno de ellos se repite en 2 ocasiones y
otro se repite en 3 ocasiones:
Es decir, tendríamos 302,400 formas diferentes de agrupar estos 10 elementos.
Ejercicios
Ejercicio 1
Calcular la probabilidad de acertar los 14 signos de la quiniela:
Solución:
Se aplica la Regla de Laplace (casos favorables / casos posibles). El caso favorable es

tan sólo uno (acertar los 14 signos). Los casos posibles se calculan como variaciones con
repetición de 3 elementos (1, X y 2), tomados de 14 en 14 (los signos que hay que
rellenar).
Son variaciones y no combinaciones ya que el orden influye: no es lo mismo (1,1,X) que

(1, X, 1). Y son con repetición, ya que cualquiera de los signos (1, X y 2) se puede repetir
hasta 14 veces.
Por lo tanto, los casos posibles son:
Y la probabilidad de acertar los 14 resultados es:
No demasiado elevada....pero el que la sigue la consigue.
Ejercicio 2
Y la probabilidad de acertar 12 signos de la quiniela:
Solución:
Aplicamos nuevamente la Regla de Laplace. En este caso los casos favorables se

calculan como combinaciones de 14 elementos tomados de 2 en 2, de esta manera
obtenemos todas las posibles alternativas de fallar 2 resultados de 14 (lo que equivale a
acertar 12 resultados). Utilizamos combinaciones y no variaciones ya que el orden no
importa (da lo mismo fallar el 3º y el 6º, que el 6º y el 3º)
Los casos posibles siguen siendo los mismos:
Por lo que la probabilidad de acertar 12 resultados es:
Por lo tanto, tenemos más probabilidades de acertar 12 resultados que 14 (¿será por eso
por lo que pagan menos?).

Ejercicio 3
Calcular la probabilidad de, en una carrera de 12 caballos, acertar los 3 que quedan
primeros (sin importar cuál de ellos queda primero, cual segundo y cual tercero).
Solución:
Se aplica la Regla de Laplace. El caso favorable es tan sólo uno: los 3 caballos que
entran en primer lugar. Los casos posibles se calculan como combinaciones de 12
elementos tomados de 3 en 3 (es decir, determinamos todas las posibles alternativas de 3
caballos que pueden entrar en las 3 primeras posiciones). Como el orden de estos 3
primeros caballos no importa, utilizamos combinaciones en lugar de variaciones.
Por lo tanto, los casos posibles son:
Por lo que la probabilidad de acertar los 3 caballos ganadores es:
Algo mayor que en las quinielas.... Eso sí, se paga menos.
Ejercicio 4
Y si hubiera que acertar, no sólo los 3 caballos que ganan, sino el orden de su entrada en
meta.
Solución:
El caso favorable sigue siendo uno: los 3 caballos que entran en primer lugar, colocados
en su orden correspondiente.
Los casos posibles se calculan ahora como variaciones (ya que el orden influye) de 12
elementos tomados de 3 en 3 (calculamos todas las posibles maneras en que los 12
caballos podrían ocupar las 3 primeras posiciones.
Por lo que la probabilidad de acertar los 3 caballos ganadores es:

Menor que en el ejemplo 3º. Ya no vale acertar que 3 caballos entran en primer lugar,
sino que tenemos que acertar el orden de su entrada.
7.8. Probabilidad condicionada
Las probabilidades condicionadas se calculan una vez que se ha incorporado

información adicional a la situación de partida:
Ejemplo 1: se tira un dado y sabemos que la probabilidad de que salga un 2 es 1/6

(probabilidad a priori). Si incorporamos nueva información (por ejemplo, alguien nos
dice que el resultado ha sido un número par) entonces la probabilidad de que el resultado
sea el 2 ya no es 1/6.
Las probabilidades condicionadas se calculan aplicando la siguiente fórmula:
Dónde:
P (B/A) es la probabilidad de que se de el suceso B condicionada a que se haya dado el

suceso A.
P (B  A) es la probabilidad del suceso simultáneo de A y de B
P (A) es la probabilidad a priori del suceso A
En el ejemplo que hemos visto:
P (B/A) es la probabilidad de que salga el número 2 (suceso B) condicionada a que haya

salido un número par (suceso A).
P (B  A) es la probabilidad de que salga el dos y número par.
P (A) es la probabilidad a priori de que salga un número par.
Por lo tanto:
P (B  A) = 1/6
P (A) = 1/2
P (B/A) = (1/6) / (1/2) = 1/3

Luego, la probabilidad de que salga el número 2, si ya sabemos que ha salido un número

par, es de 1/3 (mayor que su probabilidad a priori de 1/6).
Ejemplo 2:
En un estudio sanitario se ha llegado a la conclusión de que la probabilidad de que una

persona sufra problemas coronarios (suceso B) es el 0,10 (probabilidad a priori).
Además, la probabilidad de que una persona sufra problemas de obesidad (suceso A) es el

0,25 y la probabilidad de que una persona sufra a la vez problemas de obesidad y
coronarios (suceso intersección de A y B) es del 0,05.
Calcular la probabilidad de que una persona sufra problemas coronarios si está obesa
(probabilidad condicionada P(B/A)).
P (B  A) = 0,05
P (A) = 0,25
P (B/A) = 0,05 / 0,25 = 0,20
Por lo tanto, la probabilidad condicionada es superior a la probabilidad a priori. No

siempre esto es así, a veces la probabilidad condicionada es igual a la probabilidad a
priori o menor.
Por ejemplo: probabilidad de que al tirar un dado salga el número 2, condicionada a que
haya salido un número impar.
La probabilidad condicionada es en este caso cero, frente a una probabilidad a priori de

1/6.
7.9. Probabilidad compuesta
La probabilidad compuesta (o regla de multiplicación de probabilidades) se deriva de

la probabilidad condicionada:
La probabilidad de que se den simultáneamente dos sucesos (suceso intersección de A y

B) es igual a la probabilidad a priori del suceso A multiplicada por la probabilidad del
suceso B condicionada al cumplimiento del suceso A.
La fórmula para calcular esta probabilidad compuesta es:

Ejemplo 1: Estudiamos el suceso A (porcentaje de varones mayores de 40 años casados)

y el suceso B (varones mayores de 40 años con más de 2 hijos) y obtenemos la siguiente
información:
Un 35% de los varones mayores de 40 años están casados.
De los varones mayores de 40 años y casados, un 30% tienen más de 2 hijos (suceso B
condicionado al suceso A).
Calcular la probabilidad de que un varón mayor de 40 años esté casado y tenga más
de 2 hijos (suceso intersección de A y B).
Por lo tanto:
P (A) = 0,35
P (B/A) = 0,30
P (A  B) = 0,35 * 0,30 = 0,105
Es decir, un 10,5% de los varones mayores de 40 años están casados y tienen más de 2
hijos.
Ejemplo 2: Estudiamos el suceso A (alumnos que hablan inglés) y el suceso B (alumnos

que hablan alemán) y obtenemos la siguiente información:
Un 50% de los alumnos hablan inglés.
De los alumnos que hablan inglés, un 20% hablan también alemán (suceso B
condicionado al suceso A).
Calcular la probabilidad de que un alumno hable inglés y alemán (suceso

intersección de A y B).
Por lo tanto:
P (A) = 0,50
P (B/A) = 0,20
P (A  B) = 0,50 * 0,20 = 0,10
Es decir, un 10% de los alumnos hablan inglés y alemán.

7.10. Teorema de la probabilidad total
El Teorema de la probabilidad total nos permite calcular la probabilidad de un suceso

a partir de probabilidades condicionadas:
Ejemplo: supongamos que si llueve la probabilidad de que ocurra un accidentes es x% y

si hace buen tiempo dicha probabilidad es y%. Este teorema nos permite deducir cuál es
la probabilidad de que ocurra un accidente si conocemos la probabilidad de que llueva y
la probabilidad de que haga buen tiempo.
La fórmula para calcular esta probabilidad es:
Es decir, la probabilidad de que ocurra el suceso B (en nuestro ejemplo, que ocurra un
accidente) es igual a la suma de multiplicar cada una de las probabilidades
condicionadas de este suceso con los diferentes sucesos A (probabilidad de un accidente
cuando llueve y cuando hace buen tiempo) por la probabilidad de cada suceso A.
Para que este teorema se pueda aplicar hace falta cumplir un requisito:
Los sucesos A tienen que formar un sistema completo, es decir, que contemplen todas
las posibilidades (la suma de sus probabilidades debe ser el 100%).
Ejemplo 1: al tirar una moneda, el suceso "salir cara" y el suceso "salir cruz" forman un
sistema completo, no hay más alternativas: la suma de sus probabilidades es el 100%
Ejemplo 2: al tirar un dado, que salga el 1, el 2, el 3, o el 4 no forman un sistema

completo, ya que no contempla todas las opciones (podría salir el 5 o el 6). En este caso
no se podría aplicar el teorema de la probabilidad total.
Ejercicio 1: En un saquito hay papeletas de tres colores, con las siguientes probabilidades
de ser elegidas:
a) Amarilla: probabilidad del 50%.
b) Verde: probabilidad del 30%
c) Roja: probabilidad del 20%.
Según el color de la papeleta elegida, podrás participar en diferentes sorteos. Así, si la

papeleta elegida es:

a) Amarilla: participas en un sorteo con una probabilidad de ganar del 40%.
b) Verde: participas en otro sorteo con una probabilidad de ganar del 60%
c) Roja: participas en un tercer sorteo con una probabilidad de ganar del 80%.
Con esta información, ¿qué probabilidad tienes de ganar el sorteo en el que

participes?:
1.- Las tres papeletas forman un sistema completo: sus probabilidades suman 100%
2.- Aplicamos la fórmula:
Luego,
P (B) = (0,50 * 0,40) + (0,30 * 0,60) + (0,20 * 0,80) = 0,54
Por tanto, la probabilidad de que ganes el sorteo es del 54%.
Ejercicio 2: Van a cambiar a tu jefe y se barajan diversos candidatos:
a) Carlos, con una probabilidad del 60%
b) Juan, con una probabilidad del 30%
c) Luis, con una probabilidad del 10%
En función de quien sea tu próximo jefe, la probabilidad de que te suban el sueldo es la

siguiente:
a) Si sale Carlos: la probabilidad de que te suban el sueldo es del 5%.
b) Si sale Juan: la probabilidad de que te suban el sueldo es del 20%.
c) Si sale Luis: la probabilidad de que te suban el sueldo es del 60%.
En definitiva, ¿Cuál es la probabilidad de que te suban el sueldo?:
1.- Los tres candidatos forman un sistema completo
2.- Aplicamos la fórmula:
P (B) = (0,60 * 0,05) + (0,30 * 0,20) + (0,10 * 0,60) = 0,15

Por tanto, la probabilidad de que te suban el sueldo es del 15%. Lo llevas claro amigo...
7.11. Teorema de Bayes
El Teorema de Bayes viene a seguir el proceso inverso al del Teorema de la

probabilidad total:
Teorema de la probabilidad total: a partir de las probabilidades del suceso A

(probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del
suceso B (que ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente)

deducimos las probabilidades del suceso A (¿estaba lloviendo o hacía buen tiempo?).
La fórmula del Teorema de Bayes es:
Tratar de explicar estar fórmula con palabras es un galimatías, así que vamos a intentar
explicarla con un ejemplo. De todos modos, antes de entrar en el ejercicio, recordar que
este teorema también exige que el suceso A forme un sistema completo.
Ejercicios
Ejercicio 1: El parte meteorológico ha anunciado tres posibilidades para el fin de

semana:
a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%
c) Que haya niebla: probabilidad del 20%.
Según estos posibles estados meteorológicos, la posibilidad de que ocurra un accidente es

la siguiente:
a) Si llueve: probabilidad de accidente del 10%.
b) Si nieva: probabilidad de accidente del 20%
c) Si hay niebla: probabilidad de accidente del 5%.

Resulta que efectivamente ocurre un accidente y como no estábamos en la ciudad no

sabemos qué tiempo hizo (nevó, llovió o hubo niebla). El teorema de Bayes nos permite
calcular estas probabilidades:
Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se

denominan "probabilidades a priori" (lluvia con el 60%, nieve con el 30% y niebla con
el 10%).
Una vez que incorporamos la información de que ha ocurrido un accidente, las

probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se
denominan "probabilidades a posteriori".
Vamos a aplicar la fórmula:
a) Probabilidad de que estuviera lloviendo:
La probabilidad de que efectivamente estuviera lloviendo el día del accidente

(probabilidad a posteriori) es del 71,4%.
b) Probabilidad de que estuviera nevando:
La probabilidad de que estuviera nevando es del 21,4%.
c) Probabilidad de que hubiera niebla:
La probabilidad de que hubiera niebla es del 7,1%.

Independencia de Sucesos
 Dos sucesos son independientes entre sí, si la ocurrencia de uno de ellos no

afecta para nada a la ocurrencia del otro:
Ejemplo 1: el suceso estatura de los alumnos de una clase y el color del pelo son
independientes: el que un alumno sea más o menos alto no va a influir en el color de su
cabello, ni viceversa.
Para que dos sucesos sean independientes tienen que verificar al menos una de las
siguientes condiciones:
P (B/A) = P (B) es decir, que la probabilidad de que se de el suceso B, condicionada a

que previamente se haya dado el suceso A, es exactamente igual a la probabilidad de B.
Ejemplo 2: la probabilidad de que al tirar una moneda salga cara (suceso B),
condicionada a que haga buen tiempo (suceso A), es igual a la propia probabilidad del
suceso B.
P (A/B) = P (A) es decir, que la probabilidad de que se de el suceso A, condicionada a

que previamente se haya dado el suceso B, es exactamente igual a la probabilidad de A.
Ejemplo 3: la probabilidad de que haga buen tiempo (suceso A), condicionada a que al
tirar una moneda salga cara (suceso B), es igual a la propia probabilidad del suceso A.
P (A  B) = P (A) * P (B) es decir, que la probabilidad de que se de el suceso conjunto A

y B es exactamente igual a la probabilidad del suceso A multiplicada por la probabilidsad
del suceso B.
Ejemplo 4: La probabilidad de que haga buen tiempo (suceso A) y salga cara al tirar una
moneda (suceso B), es igual a la probabilidad del suceso A multiplicada por la
probabilidad del suceso B.
 Si el suceso A es independiente del suceso B, entonces el suceso B también es

independiente del suceso A.
Ejemplo 1: Analicemos dos sucesos:
Suceso A: la probabilidad de que haga buen tiempo es del 0,4
Suceso B: la probabilidad de tener un accidente es del 0,1
Suceso intersección: la probabilidad de que haga buen tiempo y tener un accidente es del
0,08

Veamos si se cumple alguna de las condiciones señaladas:
P (B/A) = P (A  B) / P (A) = 0,08 / 0,4 = 0,2 (que no es igual a P (B))
P (A/B) = P (A  B) / P (B) = 0,08 / 0,6 = 0,133 (que no es igual a P (A))
P (A  B) = 0,08 (que no es igual a P (A) multiplicado por P (B))
Por lo tanto, no se cumple ninguna de las tres condiciones señaladas por lo que estos dos
sucesos no son independientes, sino que existe algún grado de dependencia entre ellos.
Ejemplo 2: analicemos dos sucesos:
Suceso A: la probabilidad de que haga buen tiempo es del 0,4
Suceso B: la probabilidad de salir cara al lanzar una moneda es del 0,5
Suceso intersección: la probabilidad de que haga buen tiempo y que salga cara es 0,2
Veamos si se cumple alguna de las condiciones señaladas:
P (B/A) = P (A  B) / P (A) = 0,2 / 0,4 = 0,5 (igual que P (B))
P (A/B) = P (A  B) / P (B) = 0,2 / 0,6 = 0,4 (igual que P (A))
P (A  B) = 0,2 (igual a P (A) multiplicado por P (B))
Por lo tanto, estos dos sucesos sí son independientes.
7.12. Distribuciones discretas: Bernouilli
Distribuciones discretas y continuas
Las distribuciones discretas son aquellas en las que la variable puede pude tomar un
número determinado de valores:
Ejemplo: si se lanza una moneda al aire puede salir cara o cruz; si se tira un dado puede
salir un número de 1 al 6; en una ruleta el número puede tomar un valor del 1 al 32.
Las distribuciones continuas son aquellas que presentan un número infinito de posibles
soluciones:
Ejemplo: El peso medio de los alumnos de una clase puede tomar infinitos valores dentro
de cierto intervalo (42,37 kg, 42,3764 kg, 42, 376541kg, etc); la esperanza media de vida
de una población (72,5 años, 7,513 años, 72, 51234 años).

Vamos a comenzar por estudiar las principales distribuciones discretas.
Distribuciones discretas: Bernouilli
Es aquel modelo que sigue un experimento que se realiza una sola vez y que puede tener
dos soluciones: acierto o fracaso:
- Cuando es acierto la variable toma el valor 1

- Cuando es fracaso la variable toma el valor 0
Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale);
probabilidad de ser admitido en una universidad (o te admiten o no te admiten);
probabilidad de acertar una quiniela (o aciertas o no aciertas)
Al haber únicamente dos soluciones se trata de sucesos complementarios:
A la probabilidad de éxito se le denomina "p"
A la probabilidad de fracaso se le denomina "q"
Verificándose que:
p+q=1
Veamos los ejemplos anteriores :
Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire:
Probabilidad de que salga cara: p = 0,5
Probabilidad de que no salga cara: q = 0,5
p + q = 0,5 + 0,5 = 1
Ejemplo 2: Probabilidad de ser admitido en la universidad:
Probabilidad de ser admitido: p = 0,25
Probabilidad de no ser admitido: q = 0,75
p + q = 0,25 + 0,75 = 1
Ejemplo 3: Probabilidad de acertar una quiniela:
Probabilidad de acertar: p = 0,00001

Probabilidad de no acertar: q = 0,99999
p + q = 0,00001 + 0,99999 = 1
7.13. Distribuciones discretas: Binomial
La distribución binomial parte de la distribución de Bernouilli:
La distribución de Bernouiili se aplica cuando se realiza una sola vez un experimento

que tiene únicamente dos posibles resultados (éxito o fracaso), por lo que la variable sólo
puede tomar dos valores: el 1 y el 0
La distribución binomial se aplica cuando se realizan un número"n" de veces el

experimento de Bernouiili, siendo cada ensayo independiente del anterior. La variable
puede tomar valores entre:
0: si todos los experimentos han sido fracaso
n: si todos los experimentos han sido éxitos
Ejemplo: se tira una moneda 10 veces: ¿cuantas caras salen? Si no ha salido ninguna la
variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han
sido cara la variable toma el valor 10
La distribución de probabilidad de este tipo de distribución sigue el siguiente modelo:
¿Alguien entiende esta fórmula? Vamos a tratar de explicarla con un ejemplo:
Ejemplo 1: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?
" k " es el número de aciertos. En este ejemplo " k " igual a 6 (en cada acierto decíamos
que la variable toma el valor 1: como son 6 aciertos, entonces k = 6)
" n" es el número de ensayos. En nuestro ejemplo son 10
" p " es la probabilidad de éxito, es decir, que salga "cara" al lanzar la moneda. Por lo
tanto p = 0,5

La fórmula quedaría:
Luego,
P (x = 6) = 0,205
Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una
moneda.
Ejemplo 2: ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un

dado ocho veces?
" k " (número de aciertos) toma el valor 4
" n" toma el valor 8
" p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666)
La fórmula queda:
Luego,
P (x = 4) = 0,026
Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el números 3 al tirar
un dado 8 veces.
7.14. Distribuciones discretas: Poisson
La distribución de Poisson parte de la distribución binomial:
Cuando en una distribución binomial se realiza el experimento un número "n" muy

elevado de veces y la probabilidad de éxito "p" en cada ensayo es reducida, entonces se
aplica el modelo de distribución de Poisson:
Se tiene que cumplir que:
" p " < 0,10

" p * n " < 10
La distribución de Poisson sigue el siguiente modelo:
Vamos a explicarla:
El número "e" es 2,71828
"  " = n * p (es decir, el número de veces " n " que se realiza el experimento
multiplicado por la probabilidad " p " de éxito en cada ensayo)
" k " es el número de éxito cuya probabilidad se está calculando
Veamos un ejemplo:
La probabilidad de tener un accidente de tráfico es de 0,02 cada vez que se viaja, si se

realizan 300 viajes, ¿cual es la probabilidad de tener 3 accidentes?
Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10,
entonces aplicamos el modelo de distribución de Poisson.
Luego,
P (x = 3) = 0,0892
Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8,9%
Otro ejemplo:
La probabilidad de que un niño nazca pelirrojo es de 0,012. ¿Cuál es la probabilidad de

que entre 800 recien nacidos haya 5 pelirrojos?
Luego,
P (x = 5) = 4,602

Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recien nacidos es del
4,6%.
7.15. Distribuciones discretas: Hipergeométrica
Las distribución hipergeométrica es el modelo que se aplica en experimentos del

siguiente tipo:
En una urna hay bolas de dos colores (blancas y negras), ¿cuál es la probabilidad de que
al sacar 2 bolas las dos sean blancas?
Son experimentos donde, al igual que en la distribución binomial, en cada ensayo hay tan
sólo dos posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribución
binomial en que los distintos ensayos son dependientes entre sí:
Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca,
en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son
diferentes (hay dependencia entre los distintos ensayos).
La distribución hipergeométrica sigue el siguiente modelo:
Dónde:
Vamos a explicarlo:
N: es el número total de bolas en la urna
N1: es el número total de bolas blancas
N2: es el número total de bolas negras

k: es el número de bolas blancas cuya probabilidad se está calculando
n: es el número de ensayos que se realiza
Veamos un ejemplo: en una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál
es la probabilidad de que 3 sean blancas?
Entonces:
N = 12; N1 = 7; N2 = 5; k = 3; n = 4
Si aplicamos el modelo:
Por lo tanto, P (x = 3) = 0,3535. Es decir, la probabilidad de sacar 3 bolas blancas es del

35,3%.
Pero este modelo no sólo se utiliza con experimentos con bolas, sino que también se
aplica con experimentos similares:
Ejemplo: en una fiesta hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al

azar ¿Cuál es la probabilidad de que las 3 sean solteras?
Por lo tanto, P (x = 3) = 0,0175. Es decir, la probabilidad de que las 3 personas sean

solteras es tan sólo del 1,75%.
7.16. Distribuciones discretas: Multinomial
La distribución multinomial es similar a la distribución binomial, con la diferencia de

que en lugar de dos posibles resultados en cada ensayo, puede haber múltiples resultados:

Ejemplo de distribución binomial: a unas elecciones se presentaron 2 partidos políticos:

el POPO obtuvo un 70% de los votos y el JEJE el 30% restante. ¿Cuál es la probabilidad
de que al elegir 5 ciudadanos al azar, 4 de ellos hayan votado al JEJE?
Ejemplo de distribución multinomial: a esas elecciones se presentaron 4 partidos

políticos: el POPO obtuvo un 40% de los votos, el JEJE el 30%, el MUMU el 20% y el
LALA el 10% restante. ¿Cuál es la probabilidad de que al elegir 5 ciudadanos al azar, 3
hayan votado al POPO, 1 al MUMU y 1 al LALA?
La distribución multinomial sigue el siguiente modelo:
Donde:
X1 = x1: indica que el suceso X 1 aparezca x1 veces (en el ejemplo, que el partido POPO lo
hayan votado 3 personas)
n: indica el número de veces que se ha repetido el suceso (en el ejemplo, 5 veces)
n!: es factorial de n (en el ejemplo: 5 * 4 * 3 * 2 * 1)
p1: es la probabilidad del suceso X1 (en el ejemplo, el 40%)
Veamos el ejemplo:
Luego:
P = 0,0256
Es decir, que la probabilidad de que las 5 personas elegidas hayan votado de esta manera
es tan sólo del 2,56%
Nota: 0! es igual a 1, y cualquier número elevado a 0 es también igual a 1
Veamos otro ejemplo:
En una fiesta, el 20% de los asistentes son españoles, el 30% franceses, el 40% italiano y
el 10% portugueses. En un pequeño grupo se han reunido 4 invitados: ¿cual es la
probabilidad de que 2 sean españoles y 2 italianos?

Aplicamos el modelo:
Luego
P = 0,0384
Por lo tanto, la probabilidad de que el grupo esté formado por personas de estos países es
tan sólo del 3,84%.
7.17. Distribuciones discretas: Multihipergeométrica
La distribución multihipergeométrica es similar a la distribución hipergeométrica, con

la diferencia de que en la urna, en lugar de haber únicamente bolas de dos colores, hay
bolas de diferentes colores.
Ejemplo: en una urna hay 7 bolas blancas, 3 verdes y 4 amarillas: ¿cuál es la

probabilidad de que al extraer 3 bolas sea cada una de un color distinto?
La distribución multihipergeométrica sigue el siguiente modelo:
Donde:
X1 = x1: indica que el suceso X 1 aparezca x1 veces (en el ejemplo, que una de las bolas
sea blanca)
N1: indica el número de bolas blancas que hay en la urna (en el ejemplo, 7 bolas)
N: es el número total de bolas en la urna (en el ejemplo, 14 bolas)
n: es el número total de bolas que se extrae n (en el ejemplo, 3 bolas)

Veamos el ejemplo:
Luego:
P = 0,2307
Es decir, que la probabilidad de sacar una bola de cada color es del 23,07%.
En una caja de lápices hay 10 de color amarillo, 3 de color azul y 4 de color rojo. Se
extraen 7 lápices, ¿cual es la probabilidad de que 5 sean amarillos y 2 rojos?
Aplicamos el modelo:
Luego
P = 0,0777
Por lo tanto, la probabilidad de que los 5 lápices sean de los colores indicados es del
7,77%.
7.18. Distribuciones continuas: Uniforme
La distribución uniforme es aquella que puede tomar cualquier valor dentro de un

intervalo, todos ellos con la misma probabilidad.
Es una distribución continua porque puede tomar cualquier valor y no únicamente un

número determinado (como ocurre en las distribuciones discretas).
Ejemplo: el precio medio del litro de gasolina durante el próximo año se estima que
puede oscilar entre 140 y 160 ptas. Podría ser, por tanto, de 143 ptas., o de 143,4 ptas., o
de 143,45 ptas., o de 143,455 ptas, etc. Hay infinitas posibilidades, todas ellas con la
misma probabilidad.
Su función de densidad, aquella que nos permite conocer la probabilidad que tiene cada
punto del intervalo, viene definida por:
Dónde:
b: es el extremo superior (en el ejemplo, 160 ptas.)
a: es el extremo inferior (en el ejemplo, 140 ptas.)
Por lo tanto, la función de distribución del ejemplo sería:
Es decir, que el valor final esté entre 140 ptas. y 141 ptas. tiene un 5% de probabilidad,
que esté entre 141 y 142, otro 5%, etc.
El valor medio de esta distribución se calcula:
En el ejemplo:
Por lo tanto, el precio medio esperado de la gasolina para el próximo año es de 150 ptas.
El volumen de precipitaciones estimado para el próximo año en la ciudad de Sevilla va a

oscilar entre 400 y 500 litros por metro cuadrado. Calcular la función de distribución y la
precipitación media esperada:
Es decir, que el volumen de precipitaciones esté entre 400 y 401 litros tiene un 1% de
probabilidades; que esté entre 401 y 402 litros, otro 1%, etc.

El valor medio esperado es:
Es decir, la precipitación media estimada en Sevilla para el próximo año es de 450 litros.
7.19. Distribuciones continuas: Normal (I)
Es el modelo de distribución más utilizado en la práctica, ya que multitud de

fenómenos se comportan según una distribución normal.
Esta distribución de caracteriza porque los valores se distribuyen formando una campana
de Gauss, en torno a un valor central que coincide con el valor medio de la distribución:
Un 50% de los valores están a la dercha de este valor central y otro 50% a la izquierda
Esta distribución viene definida por dos parámetros:
X: N ( 2)
esel valor medio de la distribución y es precisamente donde se sitúa el centro de la

curva (de la campana de Gauss).
2: es la varianza. Indica si los valores están más o menos alejados del valor central: si la
varianza es baja los valores están próximos a la media; si es alta, entonces los valores
están muy dispersos.
Cuando la media de la distribución es 0 y la varianza es 1se denomina "normal

tipificada", y su ventaja reside en que hay tablas donde se recoge la probabilidad
acumulada para cada punto de la curva de esta distribución.
Además, toda distribución normal se puede transformar en una normal tipificada:

Ejemplo: una variable aleatoria sigue el modelo de una distribución normal con media 10
y varianza 4. Transformarla en una normal tipificada.
X: N (10, 4)
Para transformarla en una normal tipificada se crea una nueva variable (Y) que será
igual a la anterior (X) menos su media y dividida por su desviación típica (que es la
raíz cuadrada de la varianza)
En el ejemplo, la nueva variable sería:
Esta nueva variable se distribuye como una normal tipificada, permitiéndonos, por tanto,
conocer la probabilidad acumulada en cada valor.
Y: N (0, 1)
7.20. Distribuciones continuas: Normal (II)
La distribución normal tipificada tiene la ventaja, como ya hemos indicado, de que las
probabilidades para cada valor de la curva se encuentran recogidas en una tabla.
X 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5723
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7090 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7813 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8416 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633

1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,98169
2,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,98574
2,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,98899
2,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,99158
2,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,99361
2,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,99520
2,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,99643
2,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,99736
2,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,99807
2,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861
¿Cómo se lee esta tabla?
La columna de la izquierda indica el valor cuya probabilidad acumulada queremos

conocer. La primera fila nos indica el segundo decimal del valor que estamos
consultando.
Ejemplo: Queremos conocer la probabilidad acumulada en el valor 2,75.Entonces

buscamos en la columna de la izquierda el valor 2,7 y en la primera fila el valor 0,05. La
casilla en la que se interseccionan es su probabilidad acumulada (0,99702, es decir
99.7%).
Atención: La tabla nos da la probabilidad acumulada, es decir, la que va desde el inicio

de la curva por la izquierda hasta dicho valor. No nos da la probabilidad concreta en ese
punto. En una distribución continua en el que la variable puede tomar infinitos valores, la
probabilidad en un punto concreto es prácticamente despreciable.
Ejemplo: Imaginemos que una variable continua puede tomar valores entre 0 y 5. La
probabilidad de que tome exactamente el valor 2 es despreciable, ya que podría tomar
infinitos valores: por ejemplo: 1,99, 1,994, 1,9967, 1,9998, 1999791, etc.
Veamos otros ejemplos:
Probabilidad acumulada en el valor 0,67: la respuesta es 0,7486
Veamos ahora, como podemos utilizar esta tabla con una distribución normal:
Ejemplo: el salario medio de los empleados de una empresa se distribuye según una
distribución normal, con media 5 millones de ptas. y desviación típica 1 millón de ptas.
Calcular el porcentaje de empleados con un sueldo inferior a 7 millones de ptas.

Lo primero que haremos es transformar esa distribución en una normal tipificada, para
ello se crea una nueva variable (Y) que será igual a la anterior (X) menos su media y
dividida por la desviación típica
En el ejemplo, la nueva variable sería:
Esta nueva variable se distribuye como una normal tipificada. La variable Y que
corresponde a una variable X de valor 7 es:
Ya podemos consultar en la tabla la probabilidad acumulada para el valor 2 (equivalente a

la probabilidad de sueldos inferiores a 7 millones de ptas.). Esta probabilidad es 0,97725
Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 millones de ptas. es

del 97,725%.
7.21. Distribuciones continuas: Normal (III): Ejercicios
Ejercicio 1º: La renta media de los habitantes de un país es de 4 millones de ptas/año,

con una varianza de 1,5. Se supone que se distribuye según una distribución normal.
Calcular:
a) Porcentaje de la población con una renta inferior a 3 millones de ptas.
b) Renta a partir de la cual se sitúa el 10% de la población con mayores ingresos.
c) Ingresos mínimo y máximo que engloba al 60% de la población con renta media.
a) Porcentaje de la población con una renta inferior a 3 millones de ptas.
Lo primero que tenemos que hacer es calcular la normal tipificada:
(*) Recordemos que el denominador es la desviación típica ( raíz cuadrada de la varianza)
El valor de Y equivalente a 3 millones de ptas es -0,816.

P (X < 3) = P (Y < -0,816)
Ahora tenemos que ver cuál es la probabilidad acumulada hasta ese valor. Tenemos un
problema: la tabla de probabilidades (ver lección 35) sólo abarca valores positivos, no
obstante, este problema tiene fácil solución, ya que la distribución normal es simétrica
respecto al valor medio.
Por lo tanto:
P (Y < -0,816) = P (Y > 0,816)
Por otra parte, la probabilidad que hay a partir de un valor es igual a 1 (100%) menos la
probabilidad acumulada hasta dicho valor:
P (Y > 0,816) = 1 - P (Y < 0,816) = 1 - 0,7925 (aprox.) = 0,2075
Luego, el 20,75% de la población tiene una renta inferior a 3 millones ptas.
b) Nivel de ingresos a partir del cual se sitúa el 10% de la población con renta más
elevada.
Vemos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el 0,9

(90%), lo que quiere decir que por encima se sitúa el 10% superior.
Ese valor corresponde a Y = 1,282 (aprox.). Ahora calculamos la variable normal X

equivalente a ese valor de la normal tipificada:
Despejando X, su valor es 5,57. Por lo tanto, aquellas personas con ingresos superiores a
5,57 millones de ptas. constituyen el 10% de la población con renta más elevada.
c) Nivel de ingresos mínimo y máximo que engloba al 60% de la población con renta
media
Vemos en la tabla el valor de la variable normalizada Y cuya probabilidad acumulada es

el 0,8 (80%). Como sabemos que hasta la media la probabilidad acumulada es del 50%,
quiere decir que entre la media y este valor de Y hay un 30% de probabilidad.
Por otra parte, al ser la distribución normal simétrica, entre -Y y la media hay otro 30%
de probabilidad. En definitiva, el segmento (-Y, Y) engloba al 60% de población con
renta media.

El valor de Y que acumula el 80% de la probabilidad es 0,842 (aprox.), por lo que el

segmento viene definido por (-0,842, +0,842). Ahora calculamos los valores de la
variable X correspondientes a estos valores de Y.
Los valores de X son 2,97 y 5,03. Por lo tanto, las personas con ingresos superiores a 2,97
millones de ptas. e inferiores a 5,03 millones de ptas. constituyen el 60% de la población
con un nivel medio de renta.
Ejercicio 2º: La vida media de los habitantes de un país es de 68 años, con una varianza
de 25. Se hace un estudio en una pequeña ciudad de 10.000 habitantes:
a) ¿Cuántas personas superarán previsiblemente los 75 años?
b) ¿Cuántos vivirán menos de 60 años?
a) Personas que vivirán (previsiblemente) más de 75 años
Calculamos el valor de la normal tipificada equivalente a 75 años
Por lo tanto
P (X > 75) = (Y > 1,4) = 1 - P (Y < 1,4) = 1 - 0,9192 = 0,0808
Luego, el 8,08% de la población (808 habitantes) vivirán más de 75 años.
b) Personas que vivirán (previsiblemente) menos de 60 años
Calculamos el valor de la normal tipificada equivalente a 60 años
Por lo tanto
P (X < 60) = (Y < -1,6) = P (Y > 1,6) = 1 - P (Y < 1,6) = 0,0548
Luego, el 5,48% de la población (548 habitantes) no llegarán probablemente a esta edad.
7.22. Distribuciones continuas: Normal (IV): Ejercicios
Ejercicio 1º: El consumo medio anual de cerveza de los habitantes de un país es de 59

litros, con una varianza de 36. Se supone que se distribuye según una distribución normal.

a) Si usted presume de buen bebedor, ¿cuántos litros de cerveza tendría que beber al año
para pertenecer al 5% de la población que más bebe?.
b) Si usted bebe 45 litros de cerveza al año y su mujer le califica de borracho ¿qué podría
argumentar en su defensa?
a) 5% de la población que más bebe.
Vemos en la tabla el valor de la variable tipificada cuya probabilidad acumulada es el

0,95 (95%), por lo que por arriba estaría el 5% restante.
Ese valor corresponde a Y = 1,645 (aprox.). Ahora calculamos la variable normal X

equivalente a ese valor de la normal tipificada:
Despejando X, su valor es 67,87. Por lo tanto, tendría usted que beber más de 67,87 litros
al año para pertenecer a ese "selecto" club de grandes bebedores de cerveza.
b) Usted bebe 45 litros de cerveza al año. ¿Es usted un borracho?
Vamos a ver en qué nivel de la población se situaría usted en función de los litros de
cerveza consumidos.
Calculamos el valor de la normal tipificada correspondiente a 45 litros:
Por lo tanto
P (X < 45) = (Y < -2,2) = P (Y > 2,2) = 1 - P (Y < 2,2) = 0,0139
Luego, tan sólo un 1,39% de la población bebe menos que usted. Parece un argumento de
suficiente peso para que dejen de catalogarle de "enamorado de la bebida"
Ejercicio 2º: A un examen de oposición se han presentado 2.000 aspirantes. La nota

media ha sido un 5,5, con una varianza de 1,5.
a) Tan sólo hay 100 plazas. Usted ha obtenido un 7,7. ¿Sería oportuno ir organizando una
fiesta para celebrar su éxito?
b) Va a haber una 2ª oportunidad para el 20% de notas más altas que no se hayan
clasificados. ¿A partir de que nota se podrá participar en esta "repesca"?

a) Ha obtenido usted un 7,7
Vamos a ver con ese 7,7 en qué nivel porcentual se ha situado usted, para ello vamos a
comenzar por calcular el valor de la normal tipificada equivalente.
A este valor de Y le corresponde una probabilidad acumulada (ver tablas) de 0,98214

(98,214%), lo que quiere decir que por encima de usted tan sólo se encuentra un 1,786%.
Si se han presentado 2.000 aspirante, ese 1,786% equivale a unos 36 aspirantes. Por lo
que si hay 100 plazas disponibles, tiene usted suficientes probabilidades como para ir
organizando la "mejor de las fiestas".
b) "Repesca" para el 20% de los candidatos
Vemos en la tabla el valor de la normal tipificada que acumula el 80% de la probabilidad,

ya que por arriba sólo quedaría el 20% restante.
Este valor de Y corresponde a 0,842 (aprox.). Ahora calculamos el valor de la normal X

equivalente:
Despejamos la X y su valor es 6,38. Por lo tanto, esta es la nota a partir de la cual se

podrá acudir a la "repesca".
7.23. Teorema del Límite Central
El Teorema del Límite Central dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que éste
sea), la suma de ellas se distribuye según una distribución normal.
Ejemplo: la variable "tirar una moneda al aire" sigue la distribución de Bernouilli. Si

lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una
independiente entre si) se distribuye según una distribución normal.
Este teorema se aplica tanto a suma de variables discretas como de variables continuas.
Los parámetros de la distribución normal son:
Media: n *  (media de la variable individual multiplicada por el número de variables

independientes)

Varianza: n * (varianza de la variable individual multiplicada por el número de

variables individuales)
Veamos un ejemplo:
Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el
valor 0. Cada lanzamiento es una variable independiente que se distribuye según el
modelo de Bernouilli, con media 0,5 y varianza 0,25.
Calcular la probabilidad de que en estos 100 lanzamientos salgan más de 60 caras.
La variable suma de estas 100 variables independientes se distribuye, por tanto, según una
distribución normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan más de 60 caras calculamos la variable normal
tipificada equivalente:
(*) 5 es la raiz cuadrada de 25, o sea la desviación típica de esta distribución
Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salga más de 60 caras es tan
sólo del 2,28%.
Referencias bibliográficas
 Suárez, Mario y TAPIA, Fausto Ibarra, (2011), “Interaprendizaje de Estadística

Básica”. Ecuador.
 Suárez Ibujes, Mario Orlando, “Medidas de Dispersión”
 Matas, A. (2000). “Análisis de datos” I. Sevilla: Kronos.
 Instituto Tecnológico de Apizaco Departamento de Ciencias Básicas, “Aplicación
de la Estadística”
 Hernández González, José Luis “Estadística Administrativa” I pag. 8 M. en C.

Texto Estadistica

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Texto Estadistica

Cargado por

Copyright:

Formatos disponibles

ESTADÍSTICA PRÁCTICA

El termino estadística proviene del latín statisticum collegium (“consejo de Estado”) y de su

1.2. Definición de Estadística

1.2.1. Estadística Descriptiva

La estadística descriptiva analiza, estudia y describe a la totalidad de individuos de una población. Su

 Selección de caracteres dignos de ser estudiados.

1.2.2. Estadística Inferencial

La estadística descriptiva trabaja con todos los individuos de la población. La estadística

individuos de la población. A partir del estudio de la muestra se pretende inferir aspectos

1.2.3. Análisis Bayesiano de decisión

La inferencia bayesiana es un tipo de inferencia estadística en la que las evidencias u

La incertidumbre y la imprecisión son propias en el proceso de razonamiento. La lógica establece

Lo atractivo de la Estadística Bayesiana?

Un ejemplo de inferencia bayesiana es el siguiente:

La gran ventaja de la estadística bayesiana es que no opera en el vacío, se basa en conocimiento

Ing. Ma. Ivonne Rocha Página 3

1.3. Métodos estadísticos

Estudios Experimentales y Observacionales

Un objetivo común para un proyecto de investigación estadística es investigar la causalidad, y en

En contraste, un estudio observacional no necesita manipulación experimental. Por el contrario,

Un ejemplo de un estudio experimental es el famoso experimento de Hawthorne el cual pretendía

Un ejemplo de un estudio observacional es un estudio que explora la correlación entre fumar y el

Ing. Ma. Ivonne Rocha Página 4

1.4. Etapas de la Investigación Estadística

ETAPAS DE LA INVESTIGACIÓN ESTADISTICA

ANÁLISIS E INTERPRETACION DE RESULTADOS

Ing. Ma. Ivonne Rocha Página 5

investigación dependerán de las hipótesis que se van a probar.

III. Organización de Datos.

Ing. Ma. Ivonne Rocha Página 6

Si la variable es cuantitativa y el interés es sólo obtener algunas medidas descriptivas de ellas

Existen muchos paquetes de cómputo estadísticos para organizar o agrupar datos.

Generalización o inferencia Estadística. Consiste en obtener conclusiones acerca de la población

Es muy amplia la variedad de aplicaciones informáticas disponibles para estadística y

Ing. Ma. Ivonne Rocha Página 7

 En estadística bidimensional representa la nube de puntos y la recta de regresión. Calcula el

Entre otros tenemos:

Statgraphics es un programa de estadística de fácil manejo y una buena herramienta para la

Ing. Ma. Ivonne Rocha Página 8

2.1. Población y Muestra

A cada elemento de una población se le denomina unidad elemental o unidad estadística.

Por el número de elementos que la componen, la población se clasifica en finita o infinita. La

2.2. Variables estadísticas

Ing. Ma. Ivonne Rocha Página 9

Figura 1.0. Variable estadística

X = "Género", cuyos valores son: Masculino, femenino

Z= "Número de hijos", cuyos valores posibles son: 0, 1, 2, etc.

W= "Salarios mensuales", cuyos valores son números reales no negativos.

2.3. Escala de Medición.

Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en

Ing. Ma. Ivonne Rocha Página 10

Los siguientes son ejemplos de variables con este tipo de escala:

Ejemplos de variables con escala ordinal:

 Preferencia a productos de consumo

Los siguientes son ejemplos de variables con esta escala:

 Temperatura de una persona.

Ing. Ma. Ivonne Rocha Página 11

Algunos ejemplos de variables con la escala de razón son los siguientes:

2.4. Clasificación de las variables

Las variables pueden ser de dos tipos: cualitativas y cuantitativas.

Ejemplo 1. El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Ing. Ma. Ivonne Rocha Página 12

Ejemplo 1. La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

2.5. Parámetro Estadístico