Está en la página 1de 156

UNIVERSIDAD TECNOLÓGICA DE

QUERÉTARO

MANUAL DE MÉTODOS ESTADÍSTICOS


PARA
TECNICO SUPERIOR UNIVERSITARIO
TECNOLOGÍA AMBIENTAL

Compilador: Joaquín Antonio Quiroz Carranza

1
CONTENIDO

INTRODUCCIÓN .................................................................................................... 3

CONCEPTOS GENERALES ................................................................................... 4

DATO, INFORMACIÓN Y CONOCIMIENTO ....................................................... 4

RECOLECCIÓN, CLASIFICACIÓN Y ANÁLISIS DE DE DATOS ....................... 8

ESTADÍSTICA: CONCEPTOS GENERALES ......................................................... 9

TABLA DE FRECUENCIAS .................................................................................. 21

DIAGRAMA DE PARETO: HERRAMIENTA BÁSICA PARA LA MEJORA DE LA

CALIDAD ........................................................................................................... 30

MEDIDAS DE TENDENCIA CENTRAL ................................................................. 39

TEORÍA DE CONJUNTOS .................................................................................... 58

TEORIA DE PROBABILIDAD................................................................................ 78

DISTRIBUCIÓN DE PROBABILIDAD ................................................................... 91

DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL ................................................. 92

DISTRIBUCIÓN DE PROBABILIDAD CONTINUA .............................................. 104

ESTIMACIÓN DE INTERVALO DE CONFIANZA ............................................... 116

PRUEBA DE HIPOTESIS.................................................................................... 124

REGRESIÓN LINEAL SIMPLE .......................................................................... 133

GRÁFICOS DE CONTROL ................................................................................. 141

2
INTRODUCCIÓN

Todas las actividades cotidianas que realizan los seres humanos, implican la toma
de decisiones. Estas, para asumirse, requieren de información y conocimiento, los
cuales son resultado de la obtención, organización, procesamiento y análisis de
datos. Por ello se puede afirmar que de forma empírica o sistemática todos los
seres humanos aplican métodos estadísticos en su vida cotidiana, muchas de las
veces sin reconocer esta habilidad.

Este Manual de Métodos Estadísticos tiene el objetivo de que el Técnico Superior


Universitario reflexione diversos conceptos y ejercite habilidades en el manejo y
análisis de datos mediante diversos métodos estadísticos.

Lo más relevante de estos apuntes es su orientación hacia el autoaprendizaje o el


aprendizaje autónomo, por lo que cada apartado presenta una parte conceptual y
otra con ejercicios y repasos

Es necesario que como actividad transversal de la asignatura, los estudiantes


conformen equipos de trabajo, elijan un tema de interés relacionado con el plan de
estudios, busquen información básica, elaboraren un cuestionario sobre el tema, lo
apliquen en el lugar correspondiente a un mínimo de 30 personas y procesen los
datos con las distintas técnicas que se presentan a lo largo del curso como son
tablas de frecuencia, elaboración de histogramas, calculo de medidas de
tendencia central y dispersión, entre otras.

Lo anterior, es con el fin de tener una aplicación de los métodos estadísticos,


sobre una porción de la realidad de interés por parte de estudiantes, que
conformen cada uno de los equipos.

Este Manual de Métodos estadísticos se complementa con procedimientos


detallados para realizar las aplicaciones o cálculos en Excell, Word o Power point.

3
CONCEPTOS GENERALES

DATO, INFORMACIÓN Y CONOCIMIENTO

El dato es una representación simbólica (numérica, alfabética, algorítmica etc.), un


atributo o una característica de una entidad (fenómeno, organismo, organización,
u objeto). El dato no tiene sentido en sí mismo, pero sí recibe un tratamiento o
procesamiento apropiado, se puede utilizar en la realización de cálculos o toma de
decisiones o en la descripción de sucesos y entidades.

Los datos son comunicados por varios tipos de símbolos tales como las letras del
alfabeto, números, movimientos de labios, puntos y rayas, señales con la
mano, dibujos, etc. Estos símbolos se pueden ordenar y reordenar de forma
utilizable para generar información.

Los datos son símbolos que describen condiciones, hechos, situaciones o valores
y se caracterizan por no contener ninguna información. Un dato puede significar
un número, una letra, un signo ortográfico o cualquier símbolo que represente una
cantidad, una medida, una palabra o una descripción.

La importancia de los datos está en su capacidad de asociarse dentro de un


contexto para convertirse en información. Por si mismos los datos no tienen
capacidad de comunicar un significado y por tanto no pueden afectar
el comportamiento de quien los recibe. Para ser útiles, los datos deben convertirse
en información para ofrecer un significado, conocimiento, ideas o conclusiones.

EL CONCEPTO DE INFORMACIÓN

La información no es un conjunto cualquiera de datos. Es una colección de hechos


significativos y pertinentes para el organismo u organización que los percibe ya
que describen sucesos o entidades.

4
Para ser significativos, los datos deben constar de símbolos reconocibles, estar
completos y expresar una idea no ambigua. Los símbolos de los datos son
reconocibles cuando pueden ser correctamente interpretados.

La integridad de los datos significa que todos los datos requeridos para responder
a una pregunta específica están disponibles. Los datos son inequívocos cuando el
contexto es claro. Tenemos que conocer el contexto de estos símbolos antes de
poder conocer su significado.

Los datos son pertinentes o relevantes cuando son utilizados para responder a
preguntas propuestas. Como se dispone de un considerable número de hechos en
nuestro entorno. Solo los hechos relacionados con las necesidades de información
son pertinentes.

DIFERENCIA ENTRE DATOS E INFORMACIÓN

Los datos a diferencia de la información son utilizados con diversos métodos para
organizarlos y presentarlos a fin de permitir una transmisión o
almacenamiento más eficaces.

La cantidad de información de un mensaje puede ser entendida como el número


de símbolos posibles que representan el mensaje, los símbolos que representan el
mensaje no son más que datos significativos.

En su concepto más elemental, la información es un mensaje con un contenido


determinado emitido por una entidad hacia otra y, como tal, representa un papel
primordial en el proceso de la comunicación, a la vez que posee una evidente
función social.

A diferencia de los datos, la información tiene significado para quien la recibe, por
eso, los seres humanos siempre han tenido la necesidad de cambiar entre sí
información que luego transforman en acciones. La información es un conjunto de
datos procesados con significado, propósito y utilidad.

5
PRINCIPALES CARACTERÍSTICAS DE LA INFORMACIÓN

En general la información tiene una estructura interna y puede ser calificada según
varios aspectos:

 Significado: ¿Qué quiere decir?, del significado de una información, cada


individuo evalúa las consecuencias posibles y adecúa sus actitudes y acciones
de manera acorde a las consecuencias previsibles que se deducen del
significado de la información.
 Importancia relativa al receptor: ¿Trata sobre alguna cuestión importante? se
refiere al grado en que cambia la actitud o la conducta de los individuos.
 Vigencia: ¿Es actual o desfasada? En la práctica la vigencia de una
información es difícil de evaluar, ya que en general acceder a una información
no permite conocer de inmediato si dicha información tiene o no vigencia.
 Validez: ¿El emisor es fiable o puede proporcionar información falsa?
 Valor: ¿Qué tan útil resulta la información para el destinatario?

USOS DE LA INFORMACIÓN

Se considera que la generación y/o obtención de información persigue estos


objetivos:

 Aumentar o mejorar el conocimiento del usuario.


 Reducir la incertidumbre existente sobre un conjunto de alternativas
lógicamente posibles.
 Facilitar la gestión y toma decisiones
 Proporcionar elementos parta la evaluación y el control.

EL CONCEPTO DE CONOCIMIENTO

El conocimiento puede definirse como:

6
1. Hechos, información e ideas adquiridas por una persona a través de la
experiencia o la educación, la comprensión teórica o práctica de un tema.
2. Lo que se conoce en un campo determinado o en su totalidad.
3. Conciencia o familiaridad adquirida por la experiencia de un hecho o
situación.

La adquisición de conocimiento implica procesos


cognitivos complejos: percepción, aprendizaje, comunicación, asociación y
razonamiento.

Las ciencias constituyen uno de los principales tipos de conocimiento. Las ciencias
son el resultado de esfuerzos sistemáticos y metódicos de investigación en busca
de respuestas a problemas específicos, al funcionamiento y relación de los
fenómenos, y cuya elucidación procura ofrecernos una representación adecuada
del universo.

Hay también, muchos tipos de conocimiento que, sin ser científicos, no dejan de
estar perfectamente adaptados a sus propósitos: el saber hacer en la artesanía, el
saber nadar, entre otros; el conocimiento de la lengua, de las tradiciones,
leyendas, costumbres o ideas de una cultura particular; el conocimiento que los
individuos tienen de su propia historia: su propio nombre, la historia de sus padres,
su pasado, etc., o aún los conocimientos comunes a una sociedad dada, incluso a
la humanidad: saber para qué sirve un martillo, saber que el agua extingue el
fuego, etc.

Los conocimientos se adquieren mediante una pluralidad de procesos


cognitivos: percepción, memoria, experiencia, razonamiento, enseñanza-
aprendizaje, testimonio de terceros, etc. Estos procesos son objeto de estudio de
la ciencia cognitiva. Por su parte, la observación controlada, la experimentación, la
modelización, la crítica de fuentes, las encuestas y otros procedimientos que son
específicamente empleados por las ciencias, pueden considerarse como un
refinamiento o una aplicación sistemática de los anteriores.

7
El conocimiento se deriva de la información, así como la información se deriva de
los datos. Para que la información se convierta en conocimiento es necesario
realizar acciones como:

 Comparación con otros elementos.


 Predicción de consecuencias.
 Búsqueda de conexiones.
 Conversación con otros portadores de conocimiento.

RECOLECCIÓN, CLASIFICACIÓN Y ANÁLISIS DE DE DATOS


LA RECOLECCIÓN DE DATOS

La recolección de datos se refiere al uso de una gran diversidad


de técnicas y herramientas que pueden ser utilizadas por el acopio de datos, que
permitan desarrollar sistemas de información, los cuales pueden ser entrevistas,
encuestas, cuestionario, observaciones, diagramas de flujo, censos, registros,
entre otros.

Todos estos instrumentos se aplican en un momento determinado, con la finalidad


de buscar información que será útil a una investigación particular.

CLASIFICACIÓN DE DATOS

Las características o propiedades de los organismos o entidades que son


recolectados en forma de datos, son el producto de las observaciones o
mediciones que se hace sobre ellos.
8
Los datos o características de fenómenos u objetos, los cuales una vez
organizados y analizados dan información sobre su estado, pueden
ser clasificados en cualitativos, cuantitativos, cronológicos y geográficos

Los datos cualitativos: representan características de clase o tipo y no de


cantidad. Ejemplo: Si se desea clasificar a los estudiantes que cursan una
determinada asignatura por su estado civil, observamos que pueden existir
solteros, casados, divorciados, viudos, en unión libre o concubinato.

Los datos cuantitativos: son aquellos cuyo valor representa diferentes magnitudes.
Ejemplo: Se clasifican los estudiantes por sus notas y se observa que los valores
de los notas representan diferentes magnitudes, así mismo pueden clasificarse por
su estatura, peso, velocidad, entre otros.

Los datos cronológicos: cuando los valores de los datos varían en diferentes
instantes o períodos de tiempo, los datos son reconocidos como cronológicos.
Ejemplo: Al registrar los promedios de notas de los Alumnos en diferentes
semestres.

Los datos geográficos: cuando los datos están referidos a una localidad geográfica
se dicen que son datos geográficos. Ejemplo: El número de estudiantes de
educación superior en las distintas regiones del país.

ESTADÍSTICA: CONCEPTOS GENERALES

La estadística es una disciplina utilizada para lograr el conocimiento o el estado de


un hecho o fenómeno, así como para inferir el comportamiento futuro del mismo.
Lo anterior permite la toma de decisiones.

POBLACIÓN

Una población es un conjunto finito o infinito de individuos, hechos u objetos que


presentan características comunes o comportamientos afines. El tamaño que tiene
una población es un factor de suma importancia en

9
el proceso de investigación estadística, y este tamaño vienen dado por el número
de elementos que constituyen la población, según el número de elementos la
población puede ser finita o infinita.

Cuando el número de elementos que integra la población es muy grande, se


puede considerar a esta como una población infinita, Cuando la población es muy
grande, es obvio que la observación de todos los elementos se dificulta en cuanto
a esfuerzo, tiempo y costos necesario para hacerlo. Para solucionar este
inconveniente se utiliza una muestra estadística.

MUESTRA

Muestra a una parte de la población que presenta las mismas características y que
la representa. Las conclusiones que se obtengan de dicha muestra solo podrán
referirse a la población en referencia. Una muestra representativa contiene las
características relevantes de la población en las mismas proporciones que están
incluidas en tal población.

A través de la estadística se analizan datos, previamente recolectados, de una


muestra. La información generada se utiliza para describir el estado actual de las
características de una población (estadística descriptiva) o para inferir y predecir
su comportamiento futuro (estadística inferencial)

MUESTREO

El muestreo es el procedimiento o técnica para obtener una o más muestras de


una población. Este se realiza una vez que se ha establecido un marco de
muestreo representativo de la población. Así se procede a la selección de los
elementos de la muestra. Al tomar varias muestras de una población,
los estadísticos que calculamos para cada muestra no necesariamente
serán iguales, y lo más probable es que variaran de una muestra a otra.

TIPOS DE MUESTREO

El muestreo no aleatorio o de juicio se basa, para la elección de la muestra, en la


experiencia de alguien con la población. Algunas veces una muestra de juicio se
usa como guía o muestra tentativa para decidir como tomar una muestra aleatoria

10
más adelante. Las muestras de juicio evitan el análisis estadístico para hacer
muestras de probabilidad.

En el muestreo aleatorio o de probabilidad, todos los elementos de la población


tienen la oportunidad de ser escogidos en la muestra.

VARIABLES Y ATRIBUTOS

Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos
que pueden ser expresados mediante números. Son caracteres susceptibles
de medición. Como por ejemplo, la estatura, el peso, el salario, la edad, etc.

Una variable es un símbolo, tal como X, Y, Hx, que puede tomar


un valor cualquiera de un conjunto determinado de ellos. Si la variable puede
tomar solamente un valor, se llama constante.

Todos los elementos de la población poseen los mismos tipos de caracteres, pero
generalmente estos no suelen presentarse con la misma intensidad, por lo que las
variables toman distintos valores. Los distintos números o medidas que toman los
caracteres son los "valores de la variable". Todos ellos juntos constituyen una
variable.

Los atributos también llamados caracteres cualitativos, son aquellos que no son
susceptibles de medición, es decir que no se pueden expresar mediante un
número, por ejemplo; profesión, estado civil, sexo, nacionalidad, etc.

Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas


variaciones son susceptibles de ser medidas cuantitativamente, es decir, que
pueden expresar numéricamente la magnitud de dichas variaciones. Por intuición
y por experiencia sabemos que pueden distinguirse dos tipos de variables; las
continuas y las discretas

Las variables continuas se caracterizan por el hecho de que para todo tipo de
valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el
tiempo empleado para realizar un trabajo, etc.) Una variable es continua, cuando
puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por
ejemplo, la estatura, el peso, la temperatura.

11
Las variables discretas serán aquellas que pueden tomar solo un número limitado
de valores separados y no continuos; son aquellas que solo toman un determinado
números de valores, porque entre dos valores consecutivos no pueden tomar
ningún otro; por ejemplo el número de estudiantes de una clase es una variable
discreta ya que solo tomará los valores 1, 2, 3, 4... no es posible encontrar valores
como 1.5 estudiantes

FORMAS DE OBSERVAR LA POBLACIÓN.

Observación directa: cuando se tiene un contacto directo con los elementos o


caracteres en los cuales se presenta el fenómeno que se pretende investigar, y los
resultados obtenidos se consideran datos estadísticos originales.

Observación Indirecta: cuando se hace uso de datos estadísticos ya conocidos en


una investigación anterior, o de datos observados por un tercero (persona o
entidad). Con el fin de deducir otros hechos o fenómenos.

Observación continúa: cuando se lleva acabo de un modo permanente.

Observación periódica: cuando se lleva a cabo a través de períodos de tiempo


constantes (semanal, trimestral, semestral, anual, etc.).

Observación circunstancial: cuando se efectúa en forma ocasional o esporádica.

Observación Exhaustiva: cuando la observación es efectuada sobre la totalidad de


los elementos de la población se habla de una observación exhaustiva.

Observación Parcial: dados que las poblaciones en general son grandes, la


observación de todos sus elementos se ve imposibilitada. La solución para superar
este inconveniente es observar una parte de esta población.

Observación Mixta: en este tipo de observación se combinan adecuadamente la


observación exhaustiva con la observación parcial. Por lo general, este tipo de
observaciones se lleva a cabo de tal manera que los caracteres que se consideran

12
básicos se observan exhaustivamente y los otros mediante una muestra; o bien
cuando la población es muy grande, parte de ella se observa parcialmente.

CENSO

Se entiende por censo aquella numeración que se efectúa a todos y cada uno de
los caracteres componentes de una población.

ENCUESTA

Se entiende por encuesta las observaciones realizadas por muestreo, es decir son
observaciones parciales. Esta se efectúa a través de cuestionarios verbales o
escritos que son aplicados a un determinado número de personas.

ESTADÍSTICA DESCRIPTIVA

Tienen por objeto fundamental describir y analizar las características de un


conjunto de datos, obteniéndose de esa manera conclusiones sobre las
características de dicho conjunto y sobre las relaciones existentes con otras
poblaciones, a fin de compararlas. No obstante puede no solo referirse a la
observación de todos los elementos de una población (observación exhaustiva)
sino también a la descripción de los elementos de una muestra (observación
parcial).

ESTADÍSTICA INDUCTIVA O INFERENCIAL

Está fundamentada en los resultados obtenidos del análisis de una muestra de


población, con el fin de inducir o inferir el comportamiento o característica de la
población, de donde procede, por lo que recibe también el nombre de Inferencia
estadística.

MEDICIÓN DE CARACTERES

MEDICIÓN

Existen diversas definiciones del término "medición", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la

13
cuantificación y el proceso mismo de la construcción de
una escala o instrumento de medición.

En general, se entiende por medición la asignación de números a elementos u


objetos para representar o cuantificar una propiedad. El problema básico está
dado por la asignación de un numeral que represente la magnitud de la
característica que queremos medir y que dicho números pueden analizarse por
manipulaciones de acuerdo a ciertas reglas.

Por medio de la medición, los atributos de nuestras percepciones se transforman


en entidades conocidas y manejables llamadas "números". Es evidente que
el mundo resultaría caótico si no pudiéramos medir nada. En este caso cabría
preguntarse de que le serviría al físico saber que el hierro tiene una
alta temperatura de fusión.

NIVELES O ESCALAS DE MEDICIONES

Escala Nominal o de clase: consiste en la asignación, puramente arbitraria de


números o símbolos a cada una de las diferentes categorías en las cuales
podemos dividir el carácter que observamos, sin que puedan establecerse
relaciones entre dichas categorías, a no ser el de que cada elemento pueda
pertenecer a una y solo una de estas categorías.

Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a
la misma sean equivalentes respecto del atributo o propiedad en estudio, después
de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar
de denominaciones, se le atribuyan números, puede ser una de las razones por
las cuales se le conoce como "medidas nominales".

Escala Ordinal: En caso de que puedan detectarse diversos grados de un atributo


o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces
puede recurrirse a la propiedad de "orden" de los números asignándolo a los
objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la
de B, puede inferirse que A posee un mayor grado de atributo que B.

14
La asignación de números a las distintas categorías no puede ser completamente
arbitraria, debe hacerse atendiendo al orden existente entre éstas.

Los caracteres que posee una escala de medida ordinal permiten, por el hecho
mismo de poder ordenar todas sus categorías, el cálculo de las medidas
estadísticas de posición, como por ejemplo la mediana.

Escalas de intervalos iguales: está caracterizada por una unidad de medida


común y constante que asigna un número igual al número de unidades
equivalentes a la de la magnitud que posea el elemento observado. Es importante
destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta
escala, además de poseer las características de la escala ordinal, encontramos
que la asignación de los números a los elemento es tan precisa que podemos
determinar la magnitud de los intervalos (distancia) entre todos los elementos de la
escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera
escala verdaderamente cuantitativa y a los caracteres que posean esta escala de
medida pueden calculársele todas las medidas estadísticas a excepción del
coeficiente de variación.

Ejemplo:

El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-2001.

Escala de coeficientes o Razones: El nivel de medida más elevado es el de


cocientes o razones, y se diferencia de las escalas de intervalos iguales
únicamente por poseer un punto cero propio como origen; es decir que el valor
cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se
observa una carencia total de propiedad, se dispone de una unidad de medida
para el efecto. A iguales diferencias entre los números asignados corresponden
iguales diferencias en el grado de atributo presente en el objeto de estudio.
Además, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos
decir que A tiene dos, tres o cuatro veces la magnitud de la propiedad presente en
B.

15
Ejemplo:

En una encuesta realizada en un barrio de esta localidad se observó que hay


familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de
hijos que aquellas que tienen 3 hijos.

MÉTODO PARA LA RECOLECCIÓN DE DATOS:

En estadística se emplean una variedad de métodos distintos para obtener


información de los que se desea investigar.

La entrevista personal: los datos estadísticos necesarios para una investigación,


se reúnen frecuentemente mediante un proceso que consiste en enviar un
entrevistador o agente, directamente a la persona investigada. El investigador
efectuará a esta persona una serie de preguntas previamente escritas en
un cuestionario o boleta, donde anotará las respuestas correspondientes. Este
procedimiento que se conoce con el nombre de entrevista personal, permite
obtener una información más veraz y completa que la que proporcionan otros
métodos, debido a que al tener contacto directo con la persona entrevistada, el
entrevistador podrá aclarar cualquier duda que se presente sobre el cuestionario o
investigación.

Desventajas: si el entrevistador no obra de buena fe o no tiene


un entrenamiento adecuado, puede alterar las respuestas por las personas
entrevistadas. Alto costo, ya que resulta bastante oneroso el entrenamiento de los
agentes y los supervisores de estos, sobre todo si se trata de una investigación
extensa.

Cuestionarios por correo: consiste en enviar por correo el cuestionario


acompañado por el instructivo necesario, dando en este no solo las instrucciones
pertinentes para cada una de las preguntas, sino también una breve explicación
del objeto de la encuesta con el fin de evitar interpretaciones erróneas.

Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento,
puesto que no hay que incluir gastos de entrenamiento de personal, el único gasto
sería el de franqueo postal.

16
Dentro de las desventajas de este procedimiento podemos señalar que solo un
porcentaje bastante bajo de estos es devuelto, en algunos casos no
estamos seguros de que los formularios hayan sido recibidos por sus destinatarios
y que hayan sido respondido por ellos mismos. Lo que trae como consecuencia
que la información se obtenga con una serie de errores difíciles de precisar por el
investigador.

Entrevista por teléfono: como lo indica su nombre, este método consiste en


telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este
método es bastante simple y económico, ya que el entrenamiento y supervisión de
las personas encargadas de efectuar las preguntas es siempre fácil.

Entre las limitaciones que presenta este método podemos señalar el número de
preguntas que pueden formularse es relativamente limitado; además las
investigaciones efectuadas por este método tienen un carácter selectivo, debido a
que muchas de las personas que potencialmente podrían ser investigadas no
posee servicio telefónico, por lo que quedan sin la posibilidad de ser entrevistados.

INSTRUMENTOS PARA LA RECOLECCIÓN DE DATOS:

Cuestionarios:

Cualquiera que sea el método por el que se decida el investigador para recabar
información, es necesario elaborar un estudio de preguntas.

Los cuestionarios en general, constan de las siguientes partes:

a. La identificación del cuestionario: nombre del patrocinador de la encuesta,


(oficial o privada), nombre de la encuesta, número del cuestionario, nombre
del encuestador, lugar y fecha de la entrevista.
b. Datos de identificación y de carácter social del encuestado: apellidos,
nombres, cédula de identidad, nacionalidad, sexo, edad o fecha de
nacimiento, estado civil, grado de instrucción, ocupación actual, ingresos, etc.
c. Datos propios de la investigación, son los datos que interesa conocer para
construir el propósito de la investigación.

17
Como es natural, estas partes, así como las preguntas, varían de acuerdo a la
finalidad de la encuesta. En algunos tipos de investigación, la parte referente a los
datos personales es eliminada por no tener ningún tipo de interés para el estudio.

Consideraciones que debemos tomar en cuenta:

 El cuestionario debe ser conciso; tratar en lo posible de que con el menor


número de preguntas, se obtenga la mejor información.
 Claridad de la redacción; evitar preguntas ambiguas o que sugieran respuestas
incorrectas, por lo que deben estar formuladas las preguntas de la forma más
sencilla.
 Discreción: un cuestionario hecho a conciencia, no debe tener preguntas
indiscretas o curiosas, sobre datos personales que puedan ofender al
entrevistado.
 Facilidad de contestación: se deben evitar, en lo posible, las preguntas de
respuestas libres o abiertas y también la formulación de preguntas que
requieran cálculos numéricos por parte del entrevistado.
 Orden de las preguntas: estas deben tener una secuencia y un orden lógico,
agruparlas procurando que se relacionen unas con otras.

TIPOS DE MUESTREO

Muestreo probabilístico: consiste en elegir una muestra de una población al


azar. Podemos distinguir varios tipos de muestreo:
Muestreo aleatorio simple
Para obtener una muestra, se numeran los elementos de la población y se
seleccionan al azar los “n” elementos que contiene la muestra.
Muestreo aleatorio sistemático
Se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los
demás hasta completar la muestra.

Por ejemplo si tenemos una población formada por 100 elementos y queremos
extraer una muestra de 25 elementos, en primer lugar debemos establecer el

18
intervalo de selección que será igual a 100/25 = 4. A continuación elegimos el
elemento de arranque, tomando aleatoriamente un número entre el 1 y el 4, y a
partir de él obtenemos los restantes elementos de la muestra.

2, 6, 10, 14,..., 98

Muestreo aleatorio estratificado


Se divide la población en clases o estratos y se escoge, aleatoriamente, un
número de individuos de cada estrato proporcional al número de componentes de
cada estrato. En una fábrica que consta de 600 trabajadores queremos tomar una
muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B,
150 en la C y 100 en la D.

La operación señalada es:

200 x 20 / 600= 6.6 ≈ 7

150 x 20 / 150= 5

150 x 20 /150= 5

100 x 20 /100= 3.3 ≈ 3

Un muestreo puede hacerse con o sin reposición, y la población de partida


puede ser infinita o finita.

En todo nuestro estudio vamos a limitarnos a una población de partida infinita o


a muestreo con reposición.

19
Si consideremos todas las posibles muestras de tamaño n en una población,
para cada muestra podemos calcular un estadístico (media, desviación típica,
proporción) que variará de una a otra.

Así obtenemos una distribución del estadístico que se llama distribución


muestral.

TABLA DE NÚMEROS ALEATORIOS

4251 5149 4751 4847 4249 4648 5047 4847 5156 8789 7227 0104 4141 1521 9104 5563 1392 8238 4882 2324
4849 5051 5046 4756 4738 5350 4746 4847 4846 2346 8506 6348 4612 8252 1062 1757 0964 2983 2244 7654
5692 9870 3583 8997 1533 6466 8830 7271 3809 4256 5086 0303 7423 3298 3979 2831 2257 1508 7642 1245
2080 3828 7880 0586 8482 7811 6807 3309 2729 2235 3690 2492 7171 7720 6509 7549 2330 5733 4730 4534
1039 3382 7600 1077 4455 8806 1822 1669 7501 8330 0813 6790 6858 1489 2669 3743 1901 4971 8280 0835
6477 5289 4092 4223 6454 7632 7577 2816 9002 2365 6905 7127 5933 1137 7583 6450 5658 7678 3444 3754
4554 6146 4846 4647 5034 4646 5139 5355 5249 2224 8387 5323 3753 1859 6043 0294 5110 6340 9137 6323
0772 2160 7236 0812 4195 5589 0830 8261 9232 0902 4094 4957 0163 9717 4118 4276 9465 8820 4127 0202
0092 1629 0377 3590 2209 4839 6332 1490 3092 2390 4951 3781 5101 1815 7068 6379 7252 1086 8919 2093
7315 3365 7203 1231 0546 6612 1038 1425 2709 3092 9047 0199 5068 7447 1664 9278 1708 3625 2864 0204
5775 7517 8974 3961 2183 5295 3096 8536 9442 2392 7274 9512 0074 6677 8676 0222 3335 1976 1645 3203
5500 2276 6307 2346 1285 7000 5306 0414 3383 2303 9192 4011 0255 5458 6942 8043 6201 1587 0972 0243
3251 8902 8843 2112 8567 8131 8116 5270 5994 9092 0554 1690 6333 1931 9433 2661 8690 2313 6999 3094
4675 1435 2192 0874 2897 0262 5092 5541 4014 2113 9231 5627 1815 7171 8036 1832 2031 6298 6073 9044
3543 6130 4247 4859 2660 7852 9096 0578 0097 1324 3995 9677 7765 3194 3222 4191 2734 4469 8617 3233
3521 8772 6612 0721 3899 2999 1263 7017 8057 3443 2402 6250 9362 7373 4757 1716 1942 0417 5921 5345
5573 9396 3464 1702 9204 3389 5678 2589 0288 6343 5295 7385 5474 2123 7035 9983 5192 1840 6176 5756
7478 7569 7551 3380 2152 5411 2647 7242 2800 3432 5177 1191 2106 3351 5057 0967 4538 1246 3374 0304
3339 2854 9691 9562 3252 9848 6030 8472 2266 3255 4344 4044 4549 4443 4249 4948 4151 5152 4240 4737
5505 8474 3167 8552 5409 1556 4247 4652 2953 9854 7343 4706 4440 4646 4548 4742 4746 5253 4749 4689
6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
5484 3900 3485 0741 9069 5920 4326 7704 6525 1249

20
TABLA DE FRECUENCIAS

Definición

Las tablas de frecuencias o tabla de relaciones es una herramienta estadística que


se usa para ordenar o tabular datos o valores, que previamente fueron obtenidos
de una o más variables de una muestra. Con ellas, un conjunto de datos
desordenados pasa a ser una colección ordenada e inteligible. Para construir
cualquier tipo de histograma o representación gráfica se necesita primero agrupar
los datos en una tabla la cual se conoce como tabla de frecuencias.

En el caso de datos numéricos continuos (ejemplo: 9.5, 6.7, 8.4) los datos se
agrupan en intervalos. Un intervalo es un conjunto de números que se
corresponden con los puntos de una recta o segmento, en el que se encuentra un
ordenamiento interno entre ellos. El intervalo es el espacio que se da de un punto
a otro en el cual se toman en cuenta todos los puntos intermedios.

Ejemplo: en una recta tenemos un intervalo: [-2,2] entre este espacio se


encuentran los números (-2-1,0,1,2), esto es un intervalo.....ya que el espacio
abarca una serie de números consecutivos que se corresponden entre sí.

Los intervalos deben poseer las siguientes características:

1. Todos deben ser del mismo ancho.


2. No se deben solapar.
3. Todos los datos deben caer en uno de los intervalos.
4. Deben haber un total de entre 5 y 15 intervalos (en dependencia del
fenómeno de estudio)

21
La frecuencia indica el número de repeticiones de cualquier hecho, fenómeno o
suceso, la frecuencia de un intervalo es el número de datos que se encuentran en
él.

Construcción de una tabla de frecuencias

Las tablas de frecuencia sirven para preparar representaciones gráficas como el


histograma de frecuencias:

Un histograma es una representación gráfica de una variable en forma de barras,


donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En este gráfico en su eje vertical (Y) se representan las
frecuencias y en el eje horizontal (X) los valores de las variables, normalmente
señalando las marcas de clase, es decir, la mitad del intervalo en el que están
agrupados los datos. Las representaciones gráficas se usan para resaltar la
diferencia entre las clases en que se han agrupado los datos.

El histograma se utiliza cuando se estudia una variable continua, como franjas de


edades o altura de la muestra, y, por comodidad, sus valores se agrupan en
clases, es decir, valores continuos. Los histogramas son más frecuentes en
ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y
permite la comparación de los resultados de un proceso.

Para preparar la tabla de frecuencia para un histograma se procede con los


siguientes pasos:

Primero, se establece el número de intervalos que se desea tener.

Segundo, se debe determinar el ancho común de los intervalos. Para esto, se


calcula la diferencia del dato mayor y el dato menor, y se divide entre el número de
intervalos deseados. Este resultado se redondea al entero mayor más cercano.

Por ejemplo, si se desea tener 10 intervalos y encontramos que el dato mayor es


35 y el menor es 12. El ancho común se determina: 35-12= 23/10= 2.3 o 2

22
Tercero, se determina el límite superior de cada intervalo. Este valor sirve como
demarcador y corresponde al valor mayor que se encontrará en el intervalo. Para
determinar el límite superior de cada intervalo procedemos de la manera siguiente:

Ejemplo 1: Al preparar una tabla de frecuencia de cinco intervalos para el conjunto


de los siguientes 20 datos: 5, 7, 8, 3, 7, 7, 1, 9, 6, 8 5, 6, 7, 8, 7, 9, 6, 8, 6, 6

1. Definición de ancho de intervalo: Dato mayor- dato menor / número de


intervalos deseados 9-1=8 / 5= 1.6 = 2

Como el dato menor es 1, seleccionaremos a 2 como límite superior del primer


intervalo. Entonces, el límite superior del segundo intervalo será 2 + 2 = 4; el del
segundo será 4+ 2 = 6 y así sucesivamente, obtenemos que los límites superiores
para los restantes intervalos son: 8, 10, 12. Por tanto, la tabla de frecuencia es:

Frecuencia Frecuencia
Datos Intervalo Frecuencia absoluta relativa %
1/20= 0.05 5
1 0-2 1
1/20 = 0.05 5
3 2-4 1
7/20= 0.35 35
5 4-6 7
9/20= 0.45 45
5 6-8 9
2/20= 0.1 10
6 8-10 2
6
6
6
6
7
7
7
7
7
8
8
8
8
9
9
100

23
Determinación de la frecuencia en Excell

En Excel se puede calcular de manera automática la tabla de frecuencia de un


conjunto de datos.

Paso 1: Ingresar los números en la columna A, empezando en A1. Presione la


tecla "ENTER" después de cada uno de los datos.

Paso 2: Calcule el ancho común de los cinco intervalos y las límites superiores de
cada uno:

Dato mayor = 9, Dato menor = 1, por tanto


Los límites superiores son: 2, 4, 6, 8, 10.

Paso 3: En la columna B, empezando en B1 ingrese 2, 4, 6, 8.

No es necesario ingresar el límite superior del último intervalo 10. Esto se debe a
que en Excel, se entiende que el último intervalo contendrá a todos los valores
mayores que el límite superior del intervalo anterior. De la misma forma Excel
sobre entiende que el primer intervalo incluye todos los valores menores que su
límite inferior.

Paso 4: Como el histograma tendrá 5 intervalos, se seleccionan 5 celdas


contiguas: c3:c7.

Paso 5: En la barra menú seleccione la opción “fórmulas”, seleccione el submenú


“más funciones”, posteriormente “estadísticas” y el botón de frecuencia:

=frequencia(a1:a20, b1:b4)

Observe que la primera parte contiene la lista de datos entre la a1 y la a20.


Después se coloca una coma y un espacio. La segunda parte contiene la lista de
límites superiores de cada intervalo b1:b4.

24
En la barra de “datos” se ingresan los valores de la columna a (a1:a20) y en la de
“grupos” los valores de la columna b (b1:b4), se presiona “aceptar”.

Paso 6: Presione simultáneamente las teclas Control-Shift-Enter.

Verá que se desplegarán una lista de cinco números. Estos corresponden a la


frecuencia de cada intervalo.

Ejercicios:

1. Para cada uno de los siguientes, se indica el número de intervalos deseados,


el dato mayor y el dato menor. Determine el ancho común de los intervalos.
1. Número de intervalos deseados es 5; dato mayor = 20; dato menor = 4.
2. Número de intervalos deseados es 5; dato mayor = 30; dato menor = 8.
3. Número de intervalos deseados es 8; dato mayor = 20; dato menor = 4.
4. Número de intervalos deseados es 10; dato mayor = 100; dato menor = 8.
5. Número de intervalos deseados es 10; dato mayor = 50; dato menor = 20.

Histograma de frecuencias

En estadística un histograma es una representación gráfica de una variable en


forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados. En el eje vertical se representan las frecuencias, y
en el eje horizontal los valores de las variables.

Tipos de histograma

Diagramas de barras simples. Representa la frecuencia simple (absoluta o


relativa) mediante la altura de la barra la cual es proporcional a la frecuencia
simple de la categoría que representa.

25
Polígono de frecuencias. Es un gráfico de líneas que se usa para presentar las
frecuencias absolutas de los valores de una distribución en el cual la altura del
punto asociado a un valor de las variables es proporcional a la frecuencia de dicho
valor.

Construcción de un histograma

Paso 1 Determinar el rango de los datos. Rango es igual al dato mayor


menos el dato menor.

Ejemplo: 9-1= 8

Paso 2 Obtener los números de clases, existen varios criterios para


determinar el número de clases (o barras), sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de cómo estén los datos y cuántos sean. Un criterio usado
frecuentemente es que el número de clases debe ser aproximadamente a la
raíz cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30
(número de datos) es mayor que cinco, por lo que se seleccionan seis
clases. Ejemplo: 20 datos, raíz de 20= 4.47 = 5 clases

Paso 3 Establecer la longitud de clase: es igual al rango dividido por el


número de clases. Ejemplo: 8/5= 1.6 =2

Paso 4 Construir los intervalos de clases: Los intervalos resultan de dividir


el rango de los datos en relación al resultado del PASO 2 en intervalos
iguales. 2

Paso 5 Graficar el histograma: En caso de que las clases sean todas de la


misma amplitud, se hace un gráfico de barras, las bases de las barras son
los intervalos de clases y altura son la frecuencia de las clases. Si se unen
los puntos medios de la base superior de los rectángulos se obtiene el
polígono de frecuencias.

26
Elaboración de un histograma de frecuencias en Excell

Una vez que está disponible la tabla de frecuencias en el programa Excell, se


hace click en “datos”, opción del menú superior. En datos se busca la opción
“análisis de datos”, si no se encuentra disponible, se carga siguiendo las
indicaciones de ayuda.

Una vez instalado la opción “análisis de datos”, se hace click y se selecciona la


opción “histograma”, colocando en la celda “Rango de entrada” el total de los
datos de la columna A1 y en la celda “Rango de clases” los datos de la columna B,
damos click en crear gráfico y nos despliega una representación como la
siguiente:

Histograma
10
8
Frecuencia

6
4
2 Frecuencia
0
2 4 6 8 y mayor...
Clase

Polígono de frecuencias

Un polígono de frecuencias es un gráfico que se realiza a través de la unión de los


puntos más altos de las columnas de un histograma de frecuencia. Un polígono de
frecuencias permite representar, por ejemplo, las temperaturas máximas promedio
de un país en un periodo de tiempo. En el eje X (horizontal), pueden señalarse los
meses del año (enero, febrero, marzo, abril, etc.) En el eje Y (vertical), se indican

27
las temperaturas máximas promedio de cada mes (24°, 25°, 27°, etc.). El polígono
de frecuencias se crea al unir, con una línea, todas las temperaturas máximas
promedio.

Elaboración de un Polígono de frecuencias en Excell

Una vez que disponemos del histograma de frecuencias, se coloca en cursor


sobre el gráfico y se presiona el botón derecho del mouse. En el menú que se
despliega se puede observar la opción “cambiar tipo de gráfico”, se hace click y se
selecciona el gráfico deseado, el cual puede quedar como la siguiente imagen.

Polígono de Frecuencia
10
Frecuencia

Frecuencia
0
2 4 6 8 10
Clase

28
Tabla de frecuencia e histograma en Excell
A B

29
DIAGRAMA DE PARETO: HERRAMIENTA BÁSICA PARA LA MEJORA
DE LA CALIDAD

Concepto de Diagrama de Pareto

El diagrama de Pareto es una herramienta que se utiliza para priorizar los


problemas o las causas que los generan. El nombre de Pareto fue dado por el Dr.
Juran en honor del economista italiano WILFREDO PARETO (1848-1923) quien
realizó un estudio sobre la distribución de la riqueza, en el cual descubrió que la
minoría de la población poseía la mayor parte de la riqueza y la mayoría de la
población poseía la menor parte de la riqueza.

El Dr. Juran aplicó este concepto a la calidad, obteniéndose lo que hoy se conoce
como la regla 80/20. Según este concepto, si se tiene un problema con muchas
causas, podemos decir que el 20% de las causas resuelven el 80 % del problema
y el 80 % de las causas solo resuelven el 20 % del problema.

Se recomienda el uso del diagrama de Pareto para:

 Identificar oportunidades para mejorar


 Identificar un producto o servicio para el análisis de mejora de la calidad.
 Si se requiere llamar la atención a los problemas o causas de una forma
sistemática.
 Analizar las diferentes agrupaciones de datos.
 Al buscar las causas principales de los problemas y establecer la prioridad
de las soluciones
 Evaluar los resultados de los cambios efectuados a un proceso
comparando sucesivos diagramas obtenidos en momentos diferentes,
(antes y después)
 Cuando los datos puedan clasificarse en categorías
 Cuando el rango de cada categoría es importante
 Para comunicar fácilmente a otros miembros de la organización las
conclusiones sobre causas, efectos y costes de los errores.

30
Los propósitos generales del diagrama de Pareto son:

 Analizar las causas


 Estudiar los resultados
 Planear una mejora continua
 La Gráfica de Pareto es una herramienta sencilla pero poderosa al permitir
identificar visualmente en una sola revisión las minorías de características
vitales a las que es importante prestar atención y de esta manera utilizar
todos los recursos necesarios para llevar a cabo una acción de mejora sin
malgastar esfuerzos en problemas triviales.
Algunos ejemplos de tales minorías de características vitales serían:

 La minoría de clientes que representen la mayoría de las ventas.


 La minoría de productos, procesos, o características de la calidad
causantes del grueso de desperdicio de los costos de re-trabajo.
 La minoría de rechazos que representa la mayoría de quejas de los
clientes.
 La minoría de vendedores que está vinculada a la mayoría de partes
rechazadas.
 La minoría de problemas causantes del grueso del retraso de un proceso.
 La minoría de productos que representan la mayoría de las ganancias
obtenidas.
 La minoría de elementos que representan la mayor parte del costo de un
inventario etc.

Ejemplo de aplicación del diagrama de Pareto:

Un fabricante de accesorios plásticos desea analizar cuáles son los defectos más
frecuentes que aparecen en las unidades al salir de la línea de producción. Para
esto, empezó por clasificar todos los defectos posibles en sus diversos tipos:

31
Tipo de defecto Detalle del problema

Mal color El color no se ajusta a lo requerido por el cliente

Fuera de medida Ovalización mayor a la admitida

Mal terminación Aparición de rebabas

Rotura El accesorio se quiebra durante la instalación

Desbalanceo El accesorio requiere contrapesos adicionales

Aplastamiento El accesorio se aplasta durante la instalación

Incompleto Falta alguno de los insertos metálicos

Mal alabeo Nivel de alabeo no aceptable

Otros Otros defectos

Posteriormente, un inspector revisa cada accesorio a medida que sale de la


producción registrando sus defectos de acuerdo con dichos tipos. Al finalizar la
jornada, se obtuvo una tabla como esta.

Tipo de Detalle del problema Frec Frec. Acum


defecto rel % %

Aplastamiento El accesorio se aplasta durante la 40 42.6 42.6


instalación

Rotura El accesorio se quiebra durante la 35 37.2 79.8


instalación

Fuera de Ovalización mayor a la admitida 8 8.5 88.3


medida

Mal color El color no se ajusta a lo requerido 3 3.2 91.5

Mal alabeo Nivel de alabeo no aceptable 3 3.2 94.7

Mal Aparición de rebabas 2 2.1 96.8


terminación

32
Incompleto Falta alguno de los insertos metálicos 2 2.1 98.9

Desbalanceo El accesorio requiere contrapesos 1 1.1 100


adicionales

Otros Otros defectos 0 0 100

TOTAL 94

La tercera columna muestra el número de accesorios que presenta cada tipo de


defecto, es decir, la frecuencia con que se presenta cada defecto. En lugar de la
frecuencia numérica podemos utilizar la frecuencia porcentual, es decir, el
porcentaje de accesorios en cada tipo de defecto, lo cual se indica en la cuarta
columna. En la última columna vamos acumulando los porcentajes

Para hacer más evidente los defectos que aparecen con mayor frecuencia hemos
ordenado los datos de la tabla en orden decreciente de frecuencia. Vemos que la
categoría “otros” siempre debe ir al final, sin importar su valor. De esta manera, si
hubiese tenido un valor más alto, igual debería haberse ubicado en la última fila.

Podemos ahora representar los datos en un histograma como el siguiente:

33
Ahora resulta evidente cuales son los tipos de defectos más frecuentes. Podemos
observar que los 2 primeros tipos de defectos se presentan en el 79,8 % de los
accesorios con fallas. Por el Principio de Pareto, concluimos que: La mayor parte
de los defectos encontrados en el lote pertenece sólo a 2 tipos de defectos (los
“pocos vitales”), de manera que si se eliminan las causas que los provocan
desaparecería la mayor parte de los defectos.

Otro análisis complementario y sumamente útil e interesante, es calcular los


costos de cada problema, con lo cual podríamos construir un diagrama similar a
partir de ordenar las causas por sus costos.

Este análisis combinado de causas y costos permite obtener la mayor efectividad


en la solución de problemas, aplicando recursos en aquellos temas que son
relevantes y alcanzando una mejora significativa.

REPASO No. 1

Concepto Breve descripción

1 Dato Representación simbólica de un atributo o característica de un objeto


(ser o fenómeno)

2 Información Conjunto de datos significativos y relevantes que describen hechos,


sucesos (eventos o fenómenos)

3 Conocimiento Conjunto de informaciones e ideas adquiridas y ejercidas por cada


persona

4 Variable Característica o atributo de clase no numérica, ejemplos: estado civil,


cualitativa color de piel, idioma, religión.

5 Variable Característica o atributo descrito en magnitudes ejemplos: altura,


cuantitativa velocidad, temperatura, luminosidad, distancia, peso, número de
integrantes

6 Estadística Disciplina que describe el estado (conjunto de datos) sobre un hecho o


descriptiva fenómeno

7 Estadística Disciplina que infiere, predice o estima el comportamiento futuro de un

34
inferencial hecho o fenómeno

8 Población Conjunto finito o infinito de individuos (objetos o seres) que presentan


características o comportamientos similares: arboles, piedras, artículos,
etc.

9 Muestra Parte de una población con características similares

10 Censo Indagatoria sobre las características de todos los individuos de una


población

11 Encuesta Registro de observaciones sobre una muestra de personas

12 Escala nominal Nivel que agrupar, nombrar o categoriza objetos o fenómenos similares
ejemplo: grupo de tornillos, clavos, hojas, escritorios, etc. Sin definir
magnitudes

13 Escala ordinal Nivel que ordena objetos o fenómenos de acuerdo a sus características
o atributos, usa magnitudes

14 Escala de Nivel que organiza objetos o fenómenos en rangos o lapsos (años,


intervalo edades, ingresos)

15 Escala de razón Nivel que organiza datos a partir de un punto cero (ausencia de
característica), ejemplo: cantidad de hijos 0, 3, 6

16 Tabla de Herramienta estadística para organizar (agrupar) o tabular datos de


frecuencias hechos o fenómenos

17 Intervalo Espacio que existe entre un punto y otro, tomando en cuenta los puntos
intermedios

18 Variable Característica o atributo que muestra valores intermedios (medidas,


continua velocidades, temperatura, etc)

19 Variable Característica o atributo que no muestra valores intermedios (número de


discreta personas o cosas, etc)

20 Grafico Representación esquemática de un conjunto de datos para facilitar su


observación

35
TAREA No. 1

Nombre:_______________________________________________________

1. Señala con una X si la variable mencionada es cualitativa o cuantitativa. Si es


cuantitativa, indica con una X si es variable discreta o continua.

Variable Cualitativa Cuantitativa Discreta Continua

Presencia de brigadas de emergencia en


empresas

Peso en kg de plástico recuperado

Número de trabajadores afiliados al IMSS

Número de empresas certificadas como


“empresas limpias”

Vida útil en horas de focos ahorradores

Estado civil de los integrantes de una


población

Registros de la precipitación en mm en
Querétaro

Diámetro del tallo de una población de


árboles

Categoría de preferencia sexual de una


población humana

Defunciones por accidentes automovilísticos


en Querétaro

2. Un funcionario público de la Junta de Agua Potable está interesado en


conocer el nivel de cuidado del agua que tienen los habitantes que poseen cisterna
o aljibe en sus casas. Está planeando entrevistar a 300 de esos habitantes: Define
la población de estudio y menciona cual es la muestra:

Elabora tres preguntas cuantitativas y tres cualitativas para responder a la inquietud


planteada.

36
MÉTODOS ESTADÍSTICOS

PRIMER EXAMEN

N0MBRE_________________________________________________________

Uno. Coloca el número del concepto que corresponda a la definición apropiada

1 Estadística descriptiva 8 Estado civil, preferencia sexual, opinión,


religión, idioma.

2 Población 10 Métodos y herramientas que permiten estimar


la situación o comportamiento futuro de
hechos, poblaciones o fenómenos.

3 Ejemplos de variables 6 Atributo, característica de un individuo,


cuantitativas muestra o población que no es constante.

4 Ejemplos de variable 5 Conjunto de valores entre dos puntos de una


discreta recta.

5 Intervalo 1 Métodos y herramientas que permiten


indagar y describir el comportamiento de
hechos, poblaciones o fenómenos.

6 Variable 9 Porción de una población.

7 Ejemplos de variable 3 Temperatura, velocidad, longitud, altura,


continua luminosidad.

8 Ejemplos de variables 7 Grados centígrados, metros, coordenadas


cualitativas geográficas.

9 Muestra 2 Conjunto de individuos con características


similares que ocupan un espacio y tiempo
determinado.

10 Estadística inferencial 4 Automóviles, seres humanos, cabezas de


ganado.

Dos. Un centro de acopio de residuos generados por actividades humanas recibió


durante 50 días diversas cantidades de materiales residuales, los valores

37
fluctuaron entre 57 y 132 kg por día, el responsable desea saber cuál es la
cantidad más frecuente. Define el ancho del intervalo si:

 Se desean 5 intervalos de clase. = 15


 Se desean 6 intervalos de clase. = 12
 Se desean 7 intervalos de clase. = 11
 Se desean 8 intervalos de clase. = 9
 Se desean 9 intervalos de clase. = 8

Tres. En la tabla siguiente se presentan las cantidades en kilogramos de basura que


depositan cotidianamente en un tiradero a cielo abierto:

687 700 723 776 824


834 838 851 855 855
862 863 871 873 879
896 902 908 912 914
925 927 929 929 941
942 946 949 957 974
975 980 987 1008 1017
1019 1044 1055 1083 1096

El histograma resultante es:

Histograma
35

30

25
Frecuencia

20

15
Frecuencia
10

0
800 1000 1100 y mayor...
Clase

Interpreta brevemente el gráfico:

38
MEDIDAS DE TENDENCIA CENTRAL

La tendencia central se refiere al punto medio de una distribución de datos, las


medidas de tendencia central también se conocen como medidas de posición. Con
ellas localizamos el centro de una base de datos.

La media o promedio, la moda y la mediana son las tres principales medidas de


tendencia central utilizadas en la estadística descriptiva, sirven para describir una
población o una muestra.

La media aritmética o promedio

La media es el valor obtenido sumando todas las observaciones y dividiendo el


total por el número de observaciones que hay en el grupo. La media resume en un
valor las características de una variable teniendo en cuenta todos los valores o
datos.

Esta medida se simboliza con ẋ (x con raya superior) cuando representa la media
muestral (estadístico muestral) y µ para representar la media poblacional
(parámetro poblacional). La media “ẋ” o “µ” es la suma de todos los valores de la
muestra o población, divididos por el número de casos.

Por ejemplo, los resultados de 5 alumnos en una evaluación fueron:

39
Alumno Resultado

1 6.0

2 5.4

3 3.1

4 7.0

5 6.1

Primero: se suman las notas: 6.0+5.4+3.1+7.0+6.1 = 27.6


Segundo: el total se divide entre la cantidad de alumnos: 27.6/5=5.52
Tercero: La media aritmética en este ejemplo es 5.52

Definición formal

Dado un conjunto numérico de datos, x1, x2, ..., xn, se define su media aritmética
como

Esta definición varía, aunque no sustancialmente, cuando se trata de variables


continuas, esto es, también puede calcularse para variables agrupadas en
intervalos.

40
Propiedades

Las principales propiedades de la media aritmética son:

 Su cálculo es muy sencillo y en él intervienen todos los datos.


 Su valor es único para una serie de datos.
 Se usa con frecuencia para comparar poblaciones, aunque es más
apropiado acompañarla de una medida de dispersión.

Inconvenientes de su uso

Este parámetro, aún teniendo múltiples propiedades que aconsejan su uso en


situaciones muy diversas, tiene también algunos inconvenientes, como son:

 Para datos agrupados en intervalos (variables continuas) su valor oscila en


función de la cantidad y amplitud de los intervalos que se consideren.

 Es una medida a cuyo significado afecta sobremanera la dispersión, de


modo que cuanto menos homogéneos sean los datos, menos información
proporciona. Dicho de otro modo, poblaciones muy distintas en su
composición pueden tener la misma media. Por ejemplo, un equipo de
baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente,
tendría una estatura media de 1,95 m, valor que representa fielmente a esta
población homogénea. Sin embargo, un equipo de jugadores de estaturas
más heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo,
tendría también, como puede comprobarse, una estatura media de 1,95 m,
valor que no representa a casi ninguno de sus componentes.

 En el cálculo de la media no todos los valores contribuyen de la misma


manera. Los valores altos tienen más peso que los valores cercanos a cero.
Por ejemplo, en el cálculo del salario medio de un empresa, el salario de un
alto directivo que gane 1.000.000 € tiene tanto peso como el de diez
empleados "normales" que ganen 1.000 €. En otras palabras, se ve muy
afectada por valores extremos.

41
 Una debilidad de la media aritmética es que es sensible a valores extremos
de la distribución y que carece de sentido para variables medidas con un
nivel nominal u ordinal.

Moda

La moda es el dato más repetido, el valor de la variable con mayor frecuencia


absoluta. En cierto sentido la definición matemática corresponde con la locución
"estar de moda", esto es, siempre que sea lo más usado.

La moda es la medida de tendencia central más fácil de calcular y también es la


más sujeta a fluctuaciones cuando cambian unos pocos valores de la distribución.
Por esta razón la moda se suele usar para una evaluación rápida de la tendencia
central. La moda se define como “el valor más frecuente de una distribución”. En
una tabla de frecuencias, la frecuencia mayor es la que contiene la moda. Su
cálculo es sencillo, pues sólo necesita un recuento.

Por ejemplo, el número de personas en distintos vehículos en una carretera: 5-7-4-


6-9-5-6-1-5-3-7. El número que más se repite es 5, entonces la moda es 5.

Hablaremos de una distribución bimodal de los datos, cuando encontremos dos


modas, es decir, dos datos que tengan la misma frecuencia absoluta máxima.
Cuando en una distribución de datos se encuentran tres o más modas, entonces
es multimodal. Por último, si todas las variables tienen la misma frecuencia
diremos que no hay moda.

Propiedades

Sus principales propiedades son:

42
 Cálculo sencillo.
 Interpretación muy clara.
 Al depender sólo de las frecuencias, puede calcularse para variables
cualitativas. Este es el parámetro más utilizado cuando al resumir una
población no es posible realizar otros cálculos, por ejemplo, cuando se
enumeran en medios periodísticos las características más frecuentes de
determinado sector social.
 Esta medida se usa más y tiene más sentido cuando se describen datos
nominales, de hecho es la única medida de tendencia central que funciona
con este tipo de escala.

Inconvenientes

 Su valor es independiente de la mayor parte de los datos, lo que la hace


muy sensible a variaciones muestrales. Por otra parte, en variables
agrupadas en intervalos, su valor depende excesivamente del número de
intervalos y de su amplitud.
 Usa muy pocas observaciones, de tal modo que grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.
 No siempre se sitúa hacia el centro de la distribución.
 Puede haber más de una moda en el caso en que dos o más valores de la
variable presenten la misma frecuencia (distribuciones bimodales o
multimodales).

La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas.

Por ejemplo: Hallar la moda de la distribución:

Datos: 2, 3, 3, 4, 4, 4, 5, 5

Mo= 4

43
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa
frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene
varias modas. Datos: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9

Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay


moda. Datos: 2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el


promedio de las dos puntuaciones adyacentes. Datos: 0, 1, 3, 3, 5, 5, 7, 8

3+5=8/2=4 Mo = 4

Cálculo de la moda para datos agrupados, si todos los intervalos tienen la misma
amplitud.

Li es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.

fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.

ai es la amplitud de la clase.

Ejemplo

Calcular la moda de una distribución estadística que viene dada por la


siguiente tabla:

44
66= Limite inferior de la clase modal (Li)

18= frecuencia absoluta inmediatamente inferior a la clase modal (fi-1)

42= Frecuencia absoluta de la clase modal (fi)

27= frecuencia absoluta inmediatamente posterior a la clase modal (fi+1)

3= amplitud de la clase (ai)

Mediana

En el ámbito de la estadística, una mediana es el valor de la variable que deja el


mismo número de datos antes y después que él, una vez ordenados estos. De
acuerdo con esta definición el conjunto de datos menores o iguales que la

45
mediana representarán el 50% de los datos, y los que sean mayores que la
mediana representarán el otro 50% del total de datos de la muestra.

La mediana “Me” de un conjunto de mediciones “ x1, x2, x3,…..xn” es el valor de “x”


que se encuentra en el punto medio o centro cuando se ordenan los valores de
menor a mayor.

Por ejemplo, la mediana del número de hijos de un conjunto de trece familias,


cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que,
una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la
posición central es 2:

Me = (n+1) / 2

Me = (13+1) / 2

Me = 14 / 2=7

En caso de un número par de datos, la mediana no correspondería a ningún valor


de la variable, por lo que se conviene en tomar como mediana el valor intermedio
entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los
anteriores:

Se toma como mediana

46
Existen dos estrategias para calcular la mediana: considerando los datos en forma
individual, sin agruparlos, o bien utilizando los datos agrupados en intervalos de
clase. A continuación se describe un ejemplo con datos sin agrupar.

Datos sin agrupar

Sean los datos de una muestra ordenada en orden creciente y


designando la mediana como Me, distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posición una vez que


los datos han sido ordenados (en orden creciente o decreciente), porque éste es el

valor central. Es decir: .

Por ejemplo, si tenemos 5 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8,

x5 = 9 => El valor central es el tercero: . Este valor, que es la


mediana de ese conjunto de datos, deja dos datos por debajo (x1, x2) y otros dos
por encima de él (x4, x5).

b) Si n es par, la mediana es la media aritmética de las dos observaciones


centrales. Cuando n es par, los dos datos que están en el centro de la muestra

ocupan las posiciones y . Es decir: .

Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8,

x5 = 9, x6 = 10 => Hay dos valores que están por debajo del y otros

dos que quedan por encima del siguiente dato . Por tanto, la
mediana de este grupo de datos es la media aritmética de estos dos datos:

47
Propiedades e inconvenientes

Las principales propiedades de la mediana son:

Es menos sensible que la media a oscilaciones de los valores de la variable. Un


error de transcripción en la serie del ejemplo anterior en, pongamos por caso, el
último número, deja a la mediana inalterada.

No se ve afectada por la dispersión. De hecho, es más representativa que la


media aritmética cuando la población es bastante heterogénea. Suele darse esta
circunstancia cuando se resume la información sobre los salarios de un país o una
empresa. Hay unos pocos salarios muy altos que elevan la media aritmética
haciendo que pierda representatividad respecto al grueso de la población. Sin
embargo, alguien con el salario "mediano" sabría que hay tanta gente que gana
más dinero que él, como que gana menos.

Sus principales inconvenientes son que en el caso de datos agrupados en


intervalos, su valor varía en función de la amplitud de estos. Por otra parte, no se
presta a cálculos algebraicos tan bien como la media aritmética.

Comparación entre las diferentes medidas de tendencia central

Las tres medidas de tendencia central: media, mediana y moda, no son


igualmente útiles para obtener la tendencia central de una distribución o conjunto
de valores (datos). Cada una de las medidas tiene características que hacen que
su empleo sea una ventaja en ciertas condiciones y en otras no.

48
Medida de Ventajas y desventajas
tendencia
central

Media Incorpora todos los datos de la variable y su valor suele ser más estable. Su valor
es único para una serie de datos. Se usa con frecuencia para comparar
poblaciones, es más apropiada acompañarla de una medida de dispersión. La
afecta sobremanera la dispersión, cuanto menos homogéneos son los datos,
menos información proporciona. Es sensible a valores extremos de la distribución y
carece de sentido para variables medidas con un nivel nominal u ordinal.

Moda Cálculo sencillo. Recomendada para variables cualitativas. Se usa más y tiene más
sentido para datos nominales. Su valor es independiente de la mayor parte de los
datos, lo que la hace muy sensible a variaciones muestrales. No siempre se sitúa
hacia el centro de la distribución.
Mediana Preferida cuando se emplea una escala ordinal (situación donde el valor asignado
sólo indica el orden entre los casos). Es menos sensible que la media a
oscilaciones de los valores de la variable. No se ve afectada por la dispersión. No
se presta a cálculos algebraicos tan bien como la media aritmética.

Para calcular la media, moda y mediana a través de excell, se realizan los


siguientes pasos:

1. Se puede utilizar la vía de establecer la formula en la barra de


función de la siguiente manera:

=PROMEDIO(----------) dentro del paréntesis se colocan los valores,


seleccionándolos con el cursor.

=MODA(-----------) dentro del paréntesis se colocan los valores,


seleccionándolos con el cursor.

=MEDIANA(-----------) dentro del paréntesis se colocan los valores,


seleccionándolos con el cursor.

=DESVEST(----------) dentro del paréntesis se colocan los valores,


seleccionándolos con el cursor.

49
=VAR(------------)dentro del paréntesis se colocan los valores, seleccionándolos
con el cursor.

La otra ruta es presionar el botón FORMULAS, posteriormente el de MAS


FUNCIONES y allí seleccionar la función deseada: media, moda o mediana,
etc.

En cada una de ellas aparece un cuadro denominado ARGUMENTO DE


FUNCIÓN, en cuya barra inicial se seleccionan todos los valores a procesar, se
da clik en aceptar y el resultado aparece en la casilla seleccionada para tal
efecto.

Otra vía es utilizar “insertar función” fx, se despliega un menú como el siguiente,
donde se selecciona la función deseada:

50
MEDIDAS DE DISPERSIÓN O VARIABILIDAD

Las medidas de variabilidad indican la dispersión de los datos de una distribución.


Las medidas de dispersión son “intervalos”, distancias o un número de unidades
en la escala de medición. Este tipo de medida se complementa con las medidas
de tendencia central o centralidad y ambas permiten describir a la mayoría de las
distribuciones.

Las medidas de dispersión describen la distribución de los valores de la serie,


analizando si estos se encuentran más o menos concentrados, o más o menos
dispersos. Las más comunes son: el rango, la desviación estándar y la varianza.

El rango

El rango, recorrido o amplitud de un conjunto de mediciones, es la diferencia entre


el valor mayor y el valor menor, indica el número necesario y mínimo de unidades,
en la escala de medición, para incluir los valores mínimo y máximo. Cuanto más
grande es el rango, mayor será la dispersión de los datos de una distribución. El
rango es adecuado para medir la variación de pequeños conjuntos de datos.

La desviación estándar

La desviación estándar es la medida de dispersión más ampliamente usada y es la


más estable ya que depende de todos los valores de la distribución. “La raíz
cuadrada de la suma de las desviaciones alrededor de la media, elevadas al
cuadrado y divididas entre el número de casos menos uno”.

Cuando se trabaja con muestras la desviación estándar se simboliza con una “S” y
con la letra sigma minúscula “σ” cuando se usan datos de una población. Se
calcula como la raíz cuadrada de la varianza:

σ = √ ∑n1 (xi-µ)2 / N S= √ ∑ n1 (xi -ẋ)2 / n-1

51
“∑” en mayúscula se utiliza para indicar sumatoria:

∑1n xi = x1 + x2 + x3 + x4+……xn

Donde “x” es el valor de cada medición de la variable de estudio e “i” un índice que
varía de “1 a n”. El número de datos de la muestra se identifica con la letra “n” y de
la población con “N”.

La desviación estándar se interpreta como la cantidad o el cuánto se desvía de la


media un conjunto de valores. Este valor se grafica como un intervalo, solo se
utiliza con variables continuas u ordinales.

Ejemplo de cálculo de desviación estándar “S”, datos no agrupados:

S=√((55-76.1)2+(62-76.1)2+(67-76.1)2+(68-76.1)2+69-76.1)2+(79-76.1)2+(88-
76.1)2+(89-76.1)2+(92-76.1)2+(92-76.1)2) /9

S= 13.6

La varianza

La varianza mide la distancia existente entre los valores de la serie y la media. Se


calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tamaño de la muestra.

La varianza es la desviación estándar elevada al cuadrado y se simboliza como


“S2” cuando es muestral y “σ2” cuando es poblacional. Esta es una medida que se
usa en muchas pruebas de hipótesis estadísticas inferenciales. Para fines
descriptivos de prefiere usar la desviación estándar.

S2= ∑(x-ẋ)2 / n-1

La varianza siempre será mayor que cero. Mientras más se aproxima al cero, más
concentrados están los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, más dispersos están.

52
Para calcular la la desviación estándar y la varianza a través de excell, se
realizan los siguientes pasos:

1. Se puede utilizar la vía de establecer la formula en la barra de


función de la siguiente manera:

=DESVEST(----------) dentro del paréntesis se colocan los valores,


seleccionándolos con el cursor.

=VAR(------------)dentro del paréntesis se colocan los valores, seleccionándolos


con el cursor.

La vía rápida para el cálculo de los estadísticos de tendencia central y dispersión


es el uso de botón DATOS, posteriormente el de ANÁLISIS DE DATOS, que se
ubica en la parte superior derecha. Si no está disponible se carga de la siguiente
manera:

Se presiona el ícono de Microsoft, ubicado en la parte superior izquierda y se


despliega el menú.

Se elige el botón de “opciones de excell” ubicado en la parte inferior de la pantalla


anterior.

En el menú de opciones de excell se elige “complementos”.

En “ver y administrar complementos de excell se presiona “ir” ubicado en la parte


inferior y se da “aceptar”.

En complemento, colocar el curso en la casilla de “análisis de datos” dar clik y


“aceptar”.

Posteriormente se carga el complemento y podemos usarlo.

Ya ubicados en “análisis de datos” elegimos “estadística descriptiva” damos


“aceptar”, colocamos los datos en la casilla de “rango de entrada”, se marca
“resumen de estadísticas”, finalmente presionamos “aceptar”

53
El resultado es el siguiente:

Columna1
Media 76.5
Mediana 74
Moda 92
Desviación estándar 13.19301162
Varianza de la muestra 174.0555556
Rango 37
Mínimo 55
Máximo 92
Suma 765
Cuenta o número de datos de la
distribución 10

Coeficiente de variación de Pearson

El coeficiente de variación o CV, es un cociente entre la desviación estándar y la


media de los datos, expresado en porcentaje.

CV= (S/ ẋ) 100

Este coeficiente permite comparar la variabilidad de diferentes muestras en una


misma variable o la variabilidad existente entre variables diferentes.

Interpretación de las medidas de tendencia central y de dispersión o


variabilidad

Al describir los datos de una distribución deben interpretarse de manera conjunta


las medidas de tendencia central y de dispersión. Con la media y la desviación
estándar se pueden construir intervalos donde supuestamente están l mayoría de
los datos. La moda, la mediana y el rango pueden completar la información sobre
los datos y así comprender lo que sucede con la variable de estudio.
En una variable continua:

La media, la mediana y la moda son puntos en una recta

La desviación estándar y el rango son intervalos.

54
REPASO No. 2

Identifiquen y nombren los siguientes signos o formulas:

“ẋ” Media de la muestra

“µ” Media de la población

Formula de la media

Formula de la mediana par

Formula de la mediana impar

“S” Desviación estándar de la muestra

“σ” Desviación estándar de la población

Formula de la Moda

n 2
σ=√∑ 1 (xi-µ) / N Formula de la desviación estándar de la población

n 2
S= √ ∑ 1 (xi -ẋ) / n-1 Formula de la desviación estándar de la muestra

“∑” Signo de sumatoria

55
2
“S ” Varianza muestral

2
“σ ” Varianza poblacional

2 2
S = ∑(x-ẋ) / n-1 Formula de la varianza muestral

Identifica los valores de los siguientes conceptos en la tabla:

Li es el límite inferior de la clase modal=


fi es la frecuencia absoluta de la clase modal=
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal=
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal=
ai es la amplitud de la clase=

Amplitud de Frecuencia
clase absoluta

(60,63) 5

(63.66) 18

(66.69) 42

(69.72) 27

(72,75) 8

Explica el cuadro siguiente:

Estadística descriptiva
Media 76.5
Mediana 74
Moda 92
Desviación estándar 13.1
Rango 37
Mínimo 55
Máximo 92
Suma 765
Cuenta 10

56
TAREA No. 2

Nombre:_______________________________________________________

Medidas de tendencia central


a) Un fabricante de filtros para chimeneas debe decidir cuál de dos modelos
diferentes de filtros tiene una mayor eficiencia. El fabricante basará su decisión
en los resultados de cinco pruebas para ambos modelos bajo las mismas
condiciones de operación donde el mejor filtro será aquel que presente un
menor porcentaje de luz filtrada. Los resultados son los siguientes:

Prueba
Filtros 1 2 3 4 5
A 13.2 13.1 13.1 18.2 13.2
B 13.4 13.5 13.5 13.6 13.5

 Con base en los datos anteriores ¿cuál de los dos filtros debe elegir el
fabricante? ¿por qué?
 ¿Debería ser diferente la selección si el fabricante supiera que hubo un cambio
en la intensidad de la energía luminosa durante la cuarta medición del modelo
A? ¿por qué?

b) Suponga que, por un error, se registra un conjunto de datos que contiene la


DQO para una muestra de agua de 713, 715, 714, 713, 716, 716 y 176 mg/L,
donde el último valor debió haber sido 716 en vez de 176. Muestre que tanto
se ven afectadas la media y la mediana por el error cometido.

c) Un fabricante de focos ahorradores de energía tomó una muestra de 13 piezas


de la producción de un día y las utilizó en forma continua hasta que
comenzaron a fallar. El resultado en días de funcionamiento fue:
1142, 1226, 1117, 1345, 1064, 1251, 1349, 1431, 1312, 1066, 1292, 1362,
1098.
 Calcule la media y la mediana. ¿Qué medida descriptiva parece ser la mejor?
¿Por qué? ¿De qué forma le puede ser útil esta información al fabricante?

d) Examinando los registros del número de extintores sujetos a mantenimiento a


la semana por un prestador de este servicio, un auditor toma una muestra de
20 de estos registros:
8, 27, 19, 12, 34, 19, 5, 4, 12, 22, 11, 28, 12, 11, 10, 11, 8, 6, 7, 16
 Calcule la media y la mediana.
57
TEORÍA DE CONJUNTOS

DEFINICIONES DE CONJUNTOS

Algunas definiciones de conjunto son:

 Un conjunto es la reunión en un todo de objetos bien definidos y


diferenciables entre sí, que se llaman elementos del mismo.
 Un conjunto es una colección de elementos que se agrupan mediante
algunas características en común y que solo aparecen una sola vez en el
grupo respectivo.
 Es una colección bien definida de objetos o cosas, donde, “bien definida”
significa distinguir con claridad los elementos que forman parte del
conjunto.
 Son colecciones, agrupaciones o reuniones de elementos a los cuales
identificamos por tener propiedades en común.
 Es una colección de objetos; en los que a cada uno de los objetos que
componen ese conjunto se le denomina elemento del mismo.

De lo dicho anteriormente, se introduce la relación de pertenencia. El símbolo


usual para representar esta relación es el símbolo , una versión de la letra
griega ε (épsilon). Los segundos argumentos de la relación son llamados
conjuntos, y los primeros argumentos son llamados elementos. Así, si la
fórmula

Para representar que un elemento "a" pertenece al conjunto "A" se aplica el


símbolo de pertenencia (). De esta forma a  A y se lee: "a" pertenece a "A".
Esta relación se conoce como relación de pertenencia, señala la relación entre
elementos y conjuntos exclusivamente.

58
Si un elemento no pertenece a un conjunto se denota por (), por ejemplo si “b”
no pertenece a A se expresara como b  A, que se lee: b no pertenece a A.

Algunos ejemplos de pertenencia son:

Conjuntos Elementos Pertenencia

D = Un día de la semana lD


m = mayo

M = Un mes del año


l = lunes
mM
Z = Un número entero
n=2
NZ

Entonces se puede decir que el símbolo  se utiliza para comparar o relacionar un


conjunto respecto de un elemento y nos permite relacionar la pertenencia o no, de
un elemento en un conjunto. No es correcto utilizar este símbolo para
comparar dos conjuntos si no que exclusivamente para relacionar elementos
respecto de un conjunto.

59
Formas de describir un conjunto

1).- Enumerando todos los elementos del conjunto (solo se puede hacer si el
conjunto es finito)

2).- Por medio de una propiedad característica de los elementos que forman a ese
conjunto, esta propiedad puede expresarse de forma ordinaria o utilizando alguna
simbología lógica.

Nota: Los conjuntos se nombran con letras mayúsculas latinas, los elementos se
colocan entre llaves, por ejemplo:

A ={0,1,2,3,4,5,6,7,8,9}

B = {a,v,e,s}

C = {Las soluciones de la ecuación }

N = {1,2,3,4,5,6,...} = {los números naturales}

L={ donde n=1,2,3,4,...}

Sin embargo, existen formas más formales para describir el contenido de un


conjunto como son las formas tabular o extensiva y la constructiva o por
comprensión.

DETERMINACIÓN DE UN CONJUNTO

Para determinar la forma de describir cómo han de agruparse los conjuntos


comúnmente se utilizan dos formas: la tabular o extensiva y la constructiva o por
comprensión.

60
La forma tabular o extensiva. Es cuando el conjunto es determinado por
extensión (o enumeración), cuando se da una lista que comprende a todos los
elementos del conjunto y sólo a esos elementos.

Ejemplos:

A = { a, e, i, o, u }

B = { 0, 2, 4, 6, 8 }

C = { c, o ,n , j, u, t, s }

D = {A, B, E, C, D, R, I, O}

La forma constructiva o por comprensión. Es cuando un conjunto de elementos


poseen una característica o propiedad, la cumplen para todos los elementos del
conjunto.

Ejemplos:

A = { x l x es número entero}

B = { x I x es un número par menor que 10}

C = { x I x es una letra de la palabra conjuntos}

D = {x I x es una mujer de nacionalidad mexicana}

E = {x I x es color básico}

Cuadro comparativo de cómo describir dos conjuntos mediante la forma


tabular o extensión y la forma constructiva o por comprensión.

POR EXTENSIÓN
POR COMPRENSIÓN
A = { x I x es una vocal}
A = { a, e, i, o, u }

61
B = { x I x es un número par menor que 10 }
B = { 0, 2, 4, 6, 8 }
C = { x I x es un número impar menor que 10 }
C = {1, 3, 5, 7, 9 }
D = { x I x es una letra de la palabra conjuntos }
D = { c, o, n, j, u, t, s}
E = { x I x es una consonante }
E = { b, c, d, f, g, h, j, .. . }
F = {x I x es médico y está en la clase}
F = { Laura, Javier }
G = {x I x es un metal líquido }
G = {mercurio}

Los axiomas de Zermelo-Fraenkel

La teoría de conjuntos de Zermelo-Fraenkel toma como primitivos los conceptos


de conjunto y de pertenencia y consiste de los diez axiomas siguientes:

 Axioma de extensionalidad. Dos conjuntos X e Y son iguales (lo que se


representa por X = Y) si contienen los mismos elementos. Más
formalmente, y en la simbología usual,

 Conjunto vacío. Existe un conjunto (representado por Ø) sin elementos.


Esto es,

 Axioma de pares. Dados cualesquiera conjuntos x e y, existe otro


conjunto, representado por {x,y}, cuyos elementos son únicamente x e y.
Esto es,

62
 Axioma de la unión. Dada cualquier colección (conjunto) de conjuntos C,
existe un conjunto, representado por y llamado unión de C, que
contiene todos los elementos de cada conjunto de C. Esto es,

 Axioma del conjunto potencia Para cualquier conjunto x existe otro

conjunto, representado por , que contiene todos los subconjuntos de


x. En símbolos,

 Esquema axiomático de especificación. Sea φ(v) una fórmula de un


lenguaje de primer orden que contenga una variable libre v. Entonces, para
cualquier conjunto x existe un conjunto y cuyos elementos son aquellos
elementos a de x que cumplen φ(a). Formalmente,

 Esquema axiomático de reemplazo. Si φ(a,b) es una sentencia tal que

para cualquier elemento a de un conjunto x el conjunto


existe, entonces existe una función

tal que f(a) = y. Formalmente, si

entonces

63
 Axioma de infinitud. Existe un conjunto x tal que y tal que si

, entonces . En símbolos,

 Axioma de regularidad. Para todo conjunto no vacío x existe un conjunto

tal que . Esto es, en términos formales,

 Axioma de elección. El producto cartesiano de cualquier familia no vacía


de conjuntos no vacíos es no vacío. Este axioma puede expresarse en
términos formales al igual que los otros, aunque resulta más extenso.

Los axiomas anteriores, excepto el último, constituyen la teoría de Zermelo-


Fraenkel, que se representa por ZF. Existen otros axiomas consistentes con los de
ZF, como el axioma de constructibilidad y el axioma de elección. Una vez
incorporado el axioma de elección a la teoría ZF, la teoría de conjuntos resultante
se denota por ZFC.

Resumen de los axiomas

 Dos conjuntos son iguales, sí y solamente sí tienen los mismos elementos.


 Existe un conjunto sin elementos llamado vacío.
 Si A y B son dos conjuntos, existe un conjunto cuyos únicos elementos son
A y B.
 La reunión de un conjunto de conjuntos es un conjunto.
 Para todo conjunto A existe un conjunto que tiene por elementos las partes
de A.
 El producto de una familia de conjuntos no vacíos es un conjunto no vacío
(axioma de elección).
 Ningún conjunto es elemento de sí mismo.

64
CONJUNTOS FINITOS E INFINITOS

Un conjunto es finito si consta de un cierto número de elementos distintos, es


decir si al contar los diferentes elementos del conjunto el proceso de contar puede
acabar. En caso contrario, el conjunto es infinito.

Ejemplos:

M = { x / x es un río de la tierra } Conjunto finito

N = { 0, 1, 2, 3, 4, 5, 6, 7, 8, ... } Conjunto infinito

P = { x / x es un país de la tierra } Conjunto finito

V = { 3, 6, 9, 12, 15, 18, 21, 24, 27, ... } Conjunto infinito

DIAGRAMA DE VENN-EULER

El matemático y lógico británico, John Venn (1834 – 1923) es especialmente


conocido por su método de representación gráfica de proposiciones (según su
cualidad y cantidad) y silogismos. Los diagramas de Venn permiten, además, una
comprobación de verdad o falsedad de un silogismo. Entre sus obras destaca
Lógica Simbólica y los principios de la lógica empírica o inductiva. Sin embargo,
también fue importante la participación de Euler en la esquematización de las
representaciones de algunas operaciones.

Cada conjunto de elementos se encuentra encerrado dentro de un circulo, o figura


geométrica, y estos a su vez están encerrados dentro de otra figura, por lo general
está es un rectángulo, se pueden dibujar cada elemento del conjunto o bien solo
se puede indicar su existencia. Los diagramas de Venn son una buena
herramienta, que nos permite realizar las operaciones entre los diversos conjuntos
del universo de una forma más sencilla.

65
OPERACIONES ENTRE CONJUNTOS

UNIÓN DE CONJUNTOS. La unión de los conjuntos A y B es el conjunto formado


por todos los elementos que pertenecen a A o a B o a ambos. Se denota: A U B.
La unión de conjuntos se define como:

A U B = {x I x  A o x  B}

El gráfico es la representación de la unión A Ụ B

INTERSECCIÓN ENTRE CONJUNTOS. Se define la intersección de dos


conjuntos A y B al conjunto de elementos que son comunes a A y B. Se denota
por A B, que se lee: A intersección B. La intersección de A y B también se puede
definir: A B={x/x Ayx B } y mediante un diagrama de Venn-Euler:

El gráfico es la representación de la intersección

66
DIFERENCIA ENTRE CONJUNTOS. Se denomina diferencia de dos conjuntos A
y B al conjunto formado por todos los elementos de A pero que no pertenecen a B.
La diferencia se denota por: A - B que se lee: A diferencia B o A menos B. Se
define la diferencia de dos conjuntos también como:

A - B = {x / x Ayx B}

El gráfico representa la diferencia entre conjuntos:

INCLUSIÓN ENTRE CONJUNTOS: Sean A y B dos conjuntos. El conjunto A está


incluido en el conjunto B si se verifica que cada elemento de A pertenece a B. Se
lee A es un subconjunto de B. No confundir pertenencia con inclusión: La
pertenencia vincula un elemento con un conjunto. La inclusión vincula dos
conjuntos.

El conjunto A está incluido en el conjunto B.

El conjunto A es un subconjunto del conjunto B.

67
Cuando dos conjuntos no tienen ningún elemento en común se dice que son
disjuntos.

Cuando los conjuntos tienen algunos elementos en común:

68
Cuando todos los elementos de un conjunto están contenidos en el otro, no es
necesario que los conjuntos sean iguales:

TEOREMAS BÁSICOS DE UNIÓN E INTERSECCIÓN:

Los conjuntos cuentan con algunas operaciones que son análogas al álgebra y
que pueden ser demostradas.

Sean A,B,C cualquier conjunto entonces:

OPERACIÓN Propiedad

a) A  A = A ; A  A =A IGUALATIVA

b) A  B = A  B; A  B = B  A CONMUTATIVA

c) (A  B)  C = A  (B  C) ; (A  B)  C = A  (B  C) ASOCIATIVA

d) A ( B  C) = (A  B)  (A  C) ; DISTRIBUTIVA

A  ( B  C) = (A  B)  (A  C)

69
Elaboración de diagramas de Venn con Word, Excell o Power point

Un diagrama de Venn emplea círculos cuyas intersecciones ilustrar similitudes,


diferencias y relaciones entre grupos o conjuntos. Las similitudes se representan
en las partes de intersección de los círculos, mientras que las diferencias se
representan en las partes que no lo hacen. Para realizar los gráficos se pueden
crear usando SmartArt de Word (botón de insertar en el menú superior). Al usar
un elemento gráfico SmartArt, puede crear un diagrama de Venn e incluirlo en una
hoja de cálculo, un mensaje de correo electrónico, una presentación o un
documento.

Crear un diagrama de Venn

1. En el boton Insertar en el grupo Ilustraciones, haga clic en SmartArt.

2. En la galería Elegir un gráfico SmartArt, haga clic en Relación, haga clic en un


diseño de diagrama de Venn (por ejemplo Venn básico) y, a continuación, en
Aceptar.
3. Para escribir texto para definir un círculo, siga uno de estos procedimientos:
 Haga clic en [Texto] en el panel de texto y, a continuación, escriba el texto.
 Copie texto desde otra ubicación o programa, haga clic en [Texto] en el
panel de texto y, a continuación, pegue el texto.

70
NOTA Si el panel de texto no está visible, haga clic en el control.

 Haga clic en un círculo en el elemento gráfico SmartArt y, a continuación,


escriba el texto

Agregar o eliminar círculos en el diagrama de Venn

1. Haga clic en el elemento gráfico SmartArt al que desea agregar otro círculo.
2. Haga clic en el círculo existente que se encuentre más cerca del lugar donde
desea agregar el nuevo círculo.
3. En Herramientas de SmartArt, en la ficha Diseño del grupo Crear gráfico, haga
clic en Panel de texto.

Si no ve las fichas Herramientas de SmartArt o Diseño, asegúrese de que


ha seleccionado un elemento gráfico SmartArt.

4. Siga uno de estos pasos:


 Para insertar un círculo detrás del círculo seleccionado, que se superpondrá
al mismo, haga clic en Agregar forma detrás.

71
 Para insertar un círculo delante del círculo seleccionado, que se
superpondrá al mismo, haga clic en Agregar forma delante.

NOTAS

 Cuando necesite agregar un círculo al diagrama de Venn, pruebe a agregar


formas detrás o delante del círculo seleccionado para obtener la ubicación que
desea para el nuevo círculo. Es sencillo solucionar los errores de SmartArt
habituales.
 Para agregar un círculo desde el panel de texto, haga clic en círculo existente,
mueva el cursor antes o después del texto al que desea agregar el círculo y, a
continuación, presione ENTRAR.
 Para eliminar un círculo del diagrama de Venn, haga clic en el círculo que desea
eliminar y, a continuación, presione SUPRIMIR.

Mover un círculo en el diagrama de Venn

 Para mover un círculo, haga clic en él y, a continuación, arrástrelo a su nueva


ubicación.
 Para mover un círculo en incrementos muy pequeños, presione CTRL mientras
presiona las teclas de flecha del teclado.

Cambiar a un diseño de diagrama de Venn diferente

1. Haga clic con el botón secundario en el diagrama de Venn que desea modificar y,
a continuación, en Cambiar diseño.
2. Haga clic en Relación y, a continuación, siga uno de estos procedimientos:
 Para mostrar las relaciones superpuestas en una secuencia, haga clic en
Venn lineal.

72
 Para mostrar las relaciones resaltando el tamaño o la gradación, haga clic en
Venn apilado.

 Para mostrar las relaciones superpuestas y la relación en una idea central,


haga clic en Venn radial.

NOTA También puede cambiar el diseño del elemento gráfico SmartArt. Para

ello, haga clic en la opción de diseño en el grupo Diseños de la ficha Diseño en


Herramientas de SmartArt. Al señalar una opción de diseño, el elemento gráfico
SmartArt cambia para mostrar una vista previa del aspecto que tendría con ese
diseño.

Cambiar los colores del diagrama de Venn

Para agregar fácilmente una apariencia y retoques profesionales al elemento


gráfico SmartArt, puede cambiar los colores o aplicar un estilo SmartArt al
diagrama de Venn. También puede agregar efectos, como resplandores, bordes
suaves o efectos 3D. Mediante las presentaciones de PowerPoint 2007 podrá
animar el diagrama de Venn.

Puede aplicar combinaciones de colores derivadas de los colores del tema a los
círculos del elemento gráfico SmartArt.

1. Haga clic en el elemento gráfico SmartArt cuyo color desea cambiar.


2. En Herramientas de SmartArt, en el grupo Estilos SmartArt de la ficha Diseño,
haga clic en Cambiar colores.

73
Si no ve las fichas Herramientas de SmartArt o Diseño, asegúrese de que
ha seleccionado un elemento gráfico SmartArt.

SUGERENCIA Al colocar el puntero sobre una miniatura, puede ver cómo

afectan los colores al elemento gráfico SmartArt.

Cambiar el color de la línea o el estilo del borde de un círculo

1. En el elemento gráfico SmartArt, haga clic con el botón secundario del mouse en
el borde del círculo que desea cambiar y, a continuación, en Formato de forma.
2. Para cambiar el color del borde del círculo, haga clic en Color de línea, en Color

y, a continuación, en el color que desea.


3. Para cambiar el estilo del borde del círculo, haga clic en Estilo de línea y, a
continuación, elija los estilos de líneas que desea.

Cambiar el color de fondo de un círculo en el diagrama de Venn

1. Haga clic en el elemento gráfico SmartArt que desea cambiar.


2. Haga clic con el botón secundario del mouse en el borde del círculo y, a
continuación, en Formato de forma.
3. Haga clic en Relleno y, a continuación, en Relleno sólido.

4. Haga clic en Color y, a continuación, en el color que desea.

Para cambiar el fondo de un color que no exista en los colores del tema, haga clic
en Más colores y, a continuación, haga clic en el color que desea en la ficha
Estándar o cree un color personalizado en la ficha Personalizado. Los colores
personalizados y los colores de la ficha Estándar no se actualizarán si cambia
más adelante el tema del documento.

74
Para especificar cuánto se puede ver a través del color de fondo, mueva el control
deslizante Transparencia o escriba un número en el cuadro situado junto a dicho
control. El porcentaje de transparencia puede oscilar entre 0% (completamente
opaco, el valor predeterminado) y 100% (completamente transparente).

Aplicar un estilo SmartArt al diagrama de Venn

Un estilo SmartArt es una combinación de distintos efectos, por ejemplo estilo de


línea, bisel o 3D, que se puede aplicar a los círculos del elemento gráfico SmartArt
para crear una apariencia única y de diseño profesional.

1. Haga clic en el elemento gráfico SmartArt que desea cambiar.


2. En Herramientas de SmartArt, en el grupo Estilos SmartArt de la ficha Diseño,
haga clic en el estilo SmartArt que desee.

Para ver más estilos SmartArt, haga clic en el botón Más .

NOTAS

 Al colocar el puntero sobre una miniatura, puede ver cómo afecta el estilo
SmartArt al elemento gráfico SmartArt.
 También puede personalizar el elemento gráfico SmartArt; para ello, puede mover
círculos, cambiar el tamaño de los círculos, agregar un relleno o un efecto y
agregar una imagen.

Animar el diagrama de Venn

Si usa Microsoft Office PowerPoint 2007, puede animar el diagrama de Venn para
resaltar cada círculo.

75
1. Haga clic en el diagrama de Venn que desea animar.
2. En la ficha Animaciones, en el grupo Animaciones, haga clic en Animar y, a
continuación, en Una a una.

NOTA Si copia un diagrama de Venn con animación aplicada a otra diapositiva,

también se copiará la animación.

REPASO NUM. 3

1. ¿Qué es un conjunto?

2. Define unión entre conjuntos

3. Define la intersección entre conjuntos.

4. ¿Cuál es la diferencia entre una intersección y una unión?

5. ¿Cuál es conjunto formado por la intersección de los conjuntos:

{e, x, i, t, o} y {t, r, i, u, n, f, o}; {l, u, n, a} y B= {t, r, i, u, n, f, o}

6. Sean los conjunto: A = { 1, 2, 3, 4, 5 }; B = { 1, 2 };C = { 1, 5 }:D = { 1,

4 };E = { 1 } ¿Cuál de todos ellos es subconjunto de todos los

demás?

7. Dados los siguientes conjuntos: A = {2,4,6,8,10}, B = {0,1,2,3 },C = {

-2,-1, 0,3}, construye los siguientes diagramas de Venn y descríbelos

formalmente a).- AUB, b).- AUC, c).- BUC

76
8. Dados los siguientes conjuntos: A = {2,4,6,8,10}, B = {0,1,2,3 }, C =

{ -1,-2, 0,3}, construye los diagramas de Venn y descríbelos

formalmente: a).- AB, b).- AC, c).- BC

9. Sean A ={1,2,3,4}; B ={2,4,6,8}; C ={3,4,5,6}

Hallar a).- A U B; b).- A U C; c).- B U C; d).- B U B

77
TEORIA DE PROBABILIDAD

INTRODUCCIÓN

La teoría de la probabilidad es un área de las matemáticas. Se utiliza para el


análisis y entendimiento de la ocurrencia de oportunidad; con ella se estudian los
fenómenos o experimentos aleatorios. Un experimento aleatorio es aquel que
cuando se repite bajo las mismas condiciones iniciales, el resultado que se obtiene
no siempre es el mismo. El ejemplo más sencillo y cotidiano de un experimento
aleatorio es el de lanzar una moneda, un dado o jugar naipes.

En un experimento aleatorio, en principio, no sabemos cuál será el resultado, por


lo que conviene agrupar en un conjunto a todos los resultados posibles, ese
conjunto, espacio muestral o espacio muestra de un experimento aleatorio es el
lugar de todos los posibles resultados del experimento, y se le denota
generalmente por la letra griega Ω (omega). Algunos textos prefieren la letra S
para denotar al espacio muestral. Esta letra proviene del término “sampling space”
o espacio muestral. Por otro lado, llamaremos evento a cualquier subconjunto del
espacio muestral y denotaremos a los eventos por las primeras letras del alfabeto
en mayúsculas: A, B, C, etc.

Ejemplo. Si un experimento aleatorio consiste en lanzar un dado y observar el


número que aparece en la cara superior, entonces claramente el espacio muestral
es el conjunto Ω = {1, 2, 3, 4, 5, 6}. Como ejemplo de un evento para este
experimento podemos definir el conjunto A = {2, 4, 6}, que corresponde al suceso
de obtener como resultado un número par. Si al lanzar el dado una vez se obtiene
el número “4”, decimos entonces que se observó la ocurrencia del evento A, y si
se obtiene por ejemplo el resultado “1”, decimos que no se observó la ocurrencia
del evento A.

78
Entonces:
 Espacio muestral o sampling space: Ω o S: universo de posibles
resultados del experimento
 Evento o suceso: subconjunto del espacio muestral, se denota con A, B, C,
etc.

La probabilidad se utiliza para pronosticar o predecir científicamente la ocurrencia


de fenómenos, eventos, comportamientos, hechos, etc. Entenderlos y realizar
acciones en consecuencia (toma de decisiones) como: negocios, construir
infraestructura, describir el comportamiento de los fenómenos meteorológicos, el
deporte, etc.

En la antigüedad también se predecía el futuro con base en observaciones de los


chamanes, videntes, sacerdotes, etc. En el altiplano central los temporaleros,
graniceros o especialistas del tiempo basaban sus acciones predictivas en las
observaciones del comportamiento de los fenómenos meteorológicos: lluvias,
serpientes de agua (tornados), nevadas, heladas, etc.

Los conceptos de espacio muestral y evento involucran forzosamente la


terminología de conjuntos, por lo que el espacio muestral designado con la letra
omega Ω de un experimento aleatorio es una especie de conjunto universal, y

cualquier elemento de Ω lo denotaremos por ω (omega minúscula). El conjunto

vacío lo denotaremos por ᶲ. Otros símbolos usuales son los de pertenencia (∈ ), o

no pertenencia (∈ ) de un elemento en un conjunto. Recordamos a continuación


las operaciones básicas de conjuntos: unión, intersección, diferencia y
complemento:

Unión: A ∪ B Intersección: A ∩ B
Diferencia: A − B Complemento: A B

79
Mediante un diagrama de Venn ilustramos gráficamente las operaciones de unión,
intersección, diferencia y complemento.

¿Qué es una probabilidad?

Una probabilidad (p) es la cualidad de probable, es decir que un evento o


fenómeno pueda o no suceder:

La probabilidad mide la frecuencia con la que aparece un resultado determinado


cuando se realiza el experimento aleatorio, el resultado puede ser el éxito (P) o el
fracaso (Q).

 Probabilidad de éxito (P), representa la ocurrencia del evento de interés.


 Probabilidad de fracaso (Q), representa la no ocurrencia del evento de
interés.

80
Fórmula general para presentar una probabilidad

p(de éxito) = No. De éxito = No. Resultados exitosos posibles


No. De ensayos No. Total de resultados posibles

Donde p (de éxito) = probabilidad del “evento de interés”

Ejemplos:
Una moneda cualquiera tiene dos lados: águila o sol, cara o cruz

El espacio muestral Ω=(Sol y Águila); Al lanzar una sola moneda ¿cuál es la


probabilidad de obtener Sol?
p(cara) = No. Caras _________ = 1= .5000
No. De posibles resultados 2

Un paquete de cartas de poker se distribuye de la siguiente manera:

Total ♣ ♠ ♥ ♦
4 As As As As
4 2 2 2 2
4 3 3 3 3
4 4 4 4 4
4 5 5 5 5
4 6 6 6 6
4 7 7 7 7
4 8 8 8 8
4 9 9 9 9
4 10 10 10 10
4 Jota Jota Jota Jota
4 Quina Quina Quina Quina
4 Rey Rey Rey Rey
52 13 13 13 13

81
El espacio muestral Ω= (52 cartas diferentes); Cuando se toma una sola carta al
azar de un paquete estándar de 52 cartas

p(rey) = No. De reyes en el paquete = 4 = .0769


Total e cartas en el paquete 52

p(7) = No. De 7 en el paquete __ = 4 = .0769


Total e cartas en el paquete 52

p(7) = No. De 7 en el paquete = 4 = .0769


Total e cartas en el paquete 52

p(♥) = No. De ♥ en el paquete = 13 = .2500


Total e cartas en el paquete 52

REGLAS BÁSICAS DE LA TEORÍA DE LA PROBABILIDAD

Regla 1. Las probabilidades siempre oscilan en 0 y 1

Puesto que las probabilidades son proporciones, su límite numérico inferior es


cero, es decir el evento no puede suceder y su límite numérico superior es 1, esto
es el evento debe suceder. Las probabilidades siempre se calculan entre 0 y 1 (0
% y 100%).

Algunos eventos tienen un probabilidad cero de ocurrencia, es decir nunca


suceden, por ejemplo: permanecer vivo bajo el agua durante 24 horas sin
dispositivos de sobrevivencia. Otros eventos ocurren con una probabilidad del
100% (siempre suceden), por ejemplo que el sol salga mañana. Muchos eventos,
sin embargo, no están tan definidos; sus probabilidades de ocurrencia están en
alguna parte entre nunca y siempre.

2. De adición para eventos alternativos

Esta regla establece que la probabilidad de eventos alternativos es igual a la suma


de las probabilidades de los eventos individuales. Por consiguiente:

p (rey o as) = p (rey) + p (as)

82
= No. De reyes en el paquete + No de ases en el paquete
No. de cartas en el paquete No. de cartas en el paquete

= 4 + 4 = 8 = .1538 (aproximadamente 15%)


52 52 52

En la regla de adición debe sustituirse la letra o por un signo de adición +. La


regla de adición lleva a un punto importante: la probabilidad de éxito o fracaso
debe ser 1; es decir, P + Q = 1. De esto se desprende que si conocemos P,
entonces Q puede calcularse rápidamente:

Q= 1-P; P= 1-Q

Por ejemplo, si P=p (rey o as), entonces

Q= p (cualquier carta distinta de rey o as) = 1 - p= - .1538 = .8462


(aproximadamente 85%). En otras palabras, si tenemos cerca del 15% de
oportunidad de sacar un rey o un as, entonces tenemos aproximadamente 85 %
de oportunidad de no sacarlos.

Regla 3. Ajuste para las ocurrencias conjuntas

A veces el éxito para un evento no es directo porque un resultado en particular es


exitoso en más de una manera. Por ejemplo, al sacar una sola carta de un
paquete estándar de 52, existe un problema en el siguiente cálculo que usa la
regla de adición.

p (rey o reina o corazón) = p (rey) + p (reina) + p (corazón)

= No. De reyes + No. De reinas + No de corazones = 21 = .4038 (incorrecto)


No. Total de cartas en el paquete 52

Esta respuesta es incorrecta. Si tomamos un paquete de cartas y contamos


“cartas de éxito” (reyes, reinas y corazones), encontramos 19, no 21. Este es el
caso porque cuando sumamos las probabilidades separadas, contamos al rey y a

83
la reina de corazones dos veces. Siendo un rey y un corazón, el rey de corazones
es exitoso dos veces.

Cuando tenemos un evento que tiene doble éxito o une dos aspectos de éxito, se
denomina ocurrencia conjunta. Para calcular la probabilidad correcta, debemos
restar cada ocurrencia conjunta para eliminar ese doble conteo.

= (p (rey) + p (reina) + p (corazón) ) –( p ocurrencias conjuntas)

= No. De reyes + No. De reinas + No de corazones en el paquete – 2 ocurrencias conjuntas


No. Total de cartas en el paquete No. Total de cartas en el paquete

= 21 - 2 = 19 = .3654 (correcto)
52 52 52

Regla 4. Multiplicativa para eventos compuestos

Algunos eventos tienen dos o más partes. A estos eventos con partes múltiples los
llamamos eventos compuestos, es decir que está compuesto de dos o mas
elementos. Por ejemplo, definimos el éxito como sacar un par de ases del
paquete de cartas, es decir, sacar un as, regresándolo, barajar una vez más (es
decir al azar), y entonces sacar de nuevo un as. La regla multiplicativa para
eventos compuestos señala que la probabilidad de un evento compuesto es
igual al múltiplo de las probabilidades de las partes separadas del evento. Así,

p (as luego as) = p (as) x p (as)

= 4 x 4 = 16 = .0059
52 52 2704

Nota: se cambia la palabra luego por el símbolo de multiplicación

El simple caso de arrojar una moneda utilizando la regla multiplicativa.


Calculemos la probabilidad de lanzar una moneda dos veces y obtener cara
ambas veces.

p (cara luego cara) = p (cara) x p (cara)

84
= .5 x .5 = .2500 (1 de 4)

Regla 5. Explicación del reemplazamiento con eventos compuestos

En el caso de la regla 4, se mencionó que la primera carta obtenida sería devuelta


al paquete antes de sacar la segunda. Esta estipulación para calcular la
probabilidad de un evento compuesto se llama “con reemplazamiento”. Si no se
devuelve la primera carta, el cálculo se habría realizado “sin reemplazamiento” y la
probabilidad calculada habría sido diferente.

p (as luego as) sin reemplazamiento = p (as) x p (as)

= 4 x 3 = 12 = .0045
52 51 2652

La probabilidad del primer as es la misma con o sin reemplazamiento porque el


evento empieza con 52 cartas y cuatro ases. Pero si la primera carta obtenida es
un as y no hay reemplazamiento, entonces al sacar la segunda solo hay 51 cartas
en el paquete, y solo tres son ases.

Nota: en cuestiones de reemplazamientos en eventos compuestos. Se ajustan


numeradores y denominadores consecuentemente. Por ejemplo:

p (as luego rey luego as) sin reemplazamiento = p (as) x p (rey) x p (as)

= 4 x 4 x 3 = 48 = .0004
52 51 50 132600

Probabilidad de sucesos

Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar
dos sucesos entre sí, así como de las posibles relaciones que se pueden
establecer entre los mismos. Vamos a ver ahora cómo se refleja esto en el cálculo
de probabilidades.

85
a) Un suceso puede estar contenido en otro: entonces, la probabilidad del
primer suceso será menor que la del suceso que lo contiene.

Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el número 6,


y b) que salga un número par. Dijimos que el suceso a) está contenido en el
suceso b). P(A) = 1/6 = 0,166 P(B) = 3 / 6 = 0,50

Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es
menor que la probabilidad del suceso que lo contiene, suceso b).

b) Dos sucesos pueden ser iguales: en este caso, las probabilidades de ambos
sucesos son las mismas.

Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga


número par, y b) que salga múltiplo de 2. Las soluciones coinciden en ambos
casos. P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50

c) Intersección de sucesos: es aquel suceso compuesto por los elementos


comunes de los dos o más sucesos que se intersectan. La probabilidad será igual
a la probabilidad de los elementos comunes.

Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga


número par, y b) que sea mayor que 3. La intersección de estos dos sucesos tiene
dos elementos: el 4 y el 6.

Su probabilidad será por tanto: P(A ᴖ B) = 2 / 6 = 0,33

d) Unión de dos o más sucesos: la probabilidad de la unión de dos sucesos es


igual a la suma de las probabilidades individuales de los dos sucesos que se unen,
menos la probabilidad del suceso intersección

Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga


número par, y b) que el resultado sea mayor que 3. El suceso unión estaría
formado por los siguientes resultados: el 2, el 4, el 5 y el 6.

86
P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50

Por lo tanto,

P (A u B) = (0,50 + 0,50) - 0,33 = 0,666

e) Sucesos incompatibles: la probabilidad de la unión de dos sucesos


incompatibles será igual a la suma de las probabilidades de cada uno de los
sucesos (ya que su intersección es el conjunto vacio y por lo tanto no hay que
restarle nada).

Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un


número menor que 3, y b) que salga el número 6.

La probabilidad del suceso unión de estos dos sucesos será igual a:

P(A) = 2 / 6 = 0,333 P(B) = 1 / 6 = 0,166

Por lo tanto,

P(A u B) = 0,33 + 0,166 = 0,50

f) Sucesos complementarios: la probabilidad de un suceso complementario a un


suceso (A) es igual a 1 - P(A)

Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un número par,
luego su complementario, suceso (B), es que salga un número impar.
La probabilidad del suceso (A) es igual a :

P(A) = 3 / 6 = 0,50

Luego, la probabilidad del suceso (B) es igual a:

P(B) = 1 - P(A) = 1 - 0,50 = 0,50

87
Se puede comprobar aplicando la regla de "casos favorables / casos posibles":

P(B) = 3 / 6 = 0,50

g) Unión de sucesos complementarios: la probabilidad de la unión de dos


sucesos complementarios es igual a 1.

Ejemplo: seguimos con el ejemplo anterior: a) que salga un número par, y b) que
salga un número impar. La probabilidad del suceso unión de estos dos sucesos
será igual a:

P(A) = 3 / 6 = 0,50 P(B) = 3 / 6 = 0,50

Por lo tanto,

P(A U B) = 0,50 + 0,50 = 1

88
REPASO # 4

Completa las siguientes afirmaciones:

1. La probabilidad toma valores entre ________________


2. Los resultados de la probabilidad también pueden ser anotado
como__________________________
3. Un suceso imposible tendrá una probabilidad de_____________________
4. Un suceso seguro tendrá una probabilidad de_______________________
5. Probabilidad de que al lanzar un dado salga el número 2: el caso
favorable es tan sólo uno (que salga el dos), mientras que los casos
posibles son seis (puede salir cualquier número del uno al seis). Por lo
tanto: P(A) =
6. Probabilidad de que al lanzar un dado salga un número par: en este
caso los casos favorables son tres (que salga el dos, el cuatro o el seis),
mientras que los casos posibles siguen siendo seis. Por lo tanto: P(A) =
7. Probabilidad de que al lanzar un dado salga un número menor que 5:
en este caso tenemos cuatro casos favorables (que salga el uno, el dos, el
tres o el cuatro), frente a los seis casos posibles. Por lo tanto: P(A) =
8. Probabilidad de que nos toque el "Gordo" de Navidad: tan sólo un caso
favorable, el número que jugamos (¡qué triste...¡), frente a 100.000 casos
posibles. Por lo tanto: P(A) =
9. Que en un paquete completo de naipes previamente barajados
obtengamos:

p (As de ♦)=
p (Rey ♠)=
p (Jota ♣)=
p (6 ♥)=
p (♥)=

10. Que un paquete completo de naipes previamente barajados obtengamos:

p (As de ♦ o Rey ♠ o Jota ♣ o 6 ♥)=

Menciona cual es la probabilidad de Q (fracaso) para el ejemplo anterior

PROBABILIDAD CONDICIONAL

La probabilidad condicional se refiere probabilidad de ocurrencia del evento A,


dada información acerca de la ocurrencia de otro evento B.

89
La probabilidad de A dado B es igual a la probabilidad de A y B dividida por la
probabilidad de B.

P(A B) = P(A y B)
P(B)

La probabilidad de B dado A es igual a la probabilidad de A y B dividida por la


probabilidad de A.

P(B A) = P(A y B)
P(A)

Donde: P(A y B) = probabilidad conjunta de A y B

P(A)= probabilidad de A
P(B)= probabilidad de B

Ejemplo: De 250 hogares donde se planeo comprar un televisor, en 200 realmente


se compro. Por lo tanto la probabilidad de que en un hogar realmente se compre
un equipo de televisión dado que lo planeo comprar es:

P(realmente compro planeó comprar) = planeó comprar y realmente compró


planeó comprar

= 200 = 0.80
250

90
DISTRIBUCIÓN DE PROBABILIDAD

La distribución de probabilidad de una variable aleatoria, es una función (fx) que


asigna a cada suceso definido, sobre la variable aleatoria, la probabilidad de que
dicho suceso ocurra. Indica la gama de valores que pueden representarse como
resultado de un experimento.

Así mismo describe la probabilidad de que un evento se realice en el futuro,


constituye una herramienta fundamental para la prospectiva, puesto que se puede
diseñar un escenario de acontecimientos futuros considerando las tendencias
actuales de diversos fenómenos naturales.

Una variable es una característica que al ser medida en diferentes individuos es


susceptible de adoptar diferentes datos. Los datos son los valores observados de
las variables, éstas pueden ser:

Cualitativas: Son las variables que expresan distintas cualidades, características o


modalidades. Cada modalidad que se presenta se denomina atributo o categoría y
la medición consiste en una clasificación de dichos atributos. Las variables
cualitativas pueden ser dicotómicas cuando sólo pueden tomar dos valores
posibles como sí y no, hombre y mujer o son politómicas cuando pueden adquirir
tres o más valores. Dentro de ellas podemos distinguir:

 Variable cualitativa ordinal: puede tomar distintos valores ordenados


siguiendo una escala establecida, aunque no es necesario que el intervalo
entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.

 Variable cualitativa nominal: En esta variable los valores no pueden ser


sometidos a un criterio de orden como por ejemplo los colores o el lugar de
residencia.

91
Cuantitativas o numéricas

Son las variables que se expresan mediante cantidades numéricas. Las variables
cuantitativas pueden ser:

 Variable discreta: Es la variable que presenta separaciones o


interrupciones en la escala de valores que puede tomar. Estas
separaciones o interrupciones indican la ausencia de valores entre los
distintos valores específicos que la variable pueda asumir. Ejemplo: El
número de hijos (1, 2, 3, 4, 5).

 Variable continua: Es la variable que puede adquirir cualquier valor dentro


de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg,
2,4 kg, 2,5 kg, etc.) o la altura (1,64 m, 1,65 m, 1,66 m, etc.), que solamente
está limitado por la precisión del aparato medidor, en teoría permiten que
siempre exista un valor entre dos cualesquiera.

DISTRIBUCIÓN DE VARIABLE DISCRETA O DISTRIBUCIÓN DE


PROBABILIDADES DISCRETA

Se denomina distribución de variable discreta a aquella cuya función de


probabilidad sólo toma valores positivos en un conjunto de valores de X finito o
infinito numerable. La distribución de probabilidad discreta más utilizada es la
binomial.

DISTRIBUCIÓN DE PROBABILIDAD BINOMIAL

La distribución de probabilidad binomial (de dos números o dicotómica) se utiliza


cuando la variable aleatoria discreta (donde no hay decimales) es el número de
éxitos en una muestra compuesta de n observaciones.

1. La muestra se compone de un número fijo de observaciones, n.

92
2. Cada observación se clasifica en una de dos categorías mutuamente
excluyentes, denominadas éxito (p) o fracaso (q).
3. La probabilidad de que una observación se clasifique como éxito (p), es
constante de una observación a otra, de la misma forma, la probabilidad de
que una observación se clasifique como fracaso (q) o 1-p, es constante en
todas las observaciones.
4. El resultado (es decir, el éxito o fracaso) de cualquier observación es
independiente del resultado de cualquier otra observación. Para garantizar la
independencia, las observaciones se deben seleccionar de manera aleatoria,
ya sea de una población infinita sin reemplazo o de una población finita con
reemplazo.

Cuando se cumple estas condiciones, la distribución binomial proporciona cada


resultado posible de los N ensayos y la probabilidad de obtener cada uno de estos
resultados. La ecuación que se utiliza para representar la distribución de la
probabilidad binomial y calcular el número de éxitos (X), dados los valores n y p,
es:

Donde: P(X) = probabilidad de X éxitos dados los parámetros n y p


n = tamaño de la muestra o número de observaciones
p = probabilidad de éxito
1 – p = probabilidad de fracaso
X = numero de éxitos en la muestra (X = 0, 1, 2, …….. n)

El término indica la probabilidad de obtener X éxitos de n


observaciones en una secuencia específica.

El término indica cuantas combinaciones de los X éxitos entre n


observaciones son posibles. Entonces dado el número de observaciones n y la
probabilidad de éxito p, la probabilidad de X éxitos es:

93
P(X) = (numero de de secuencia posibles) x (probabilidad de un secuencia
especifica)

Ejemplo:

Supóngase que en cierta población el 52 por ciento de todos los nacimientos que
se registraron son varones. Si aleatoriamente se escogen 5 registros de
nacimientos dentro de esa población, ¿cuál es la probabilidad de que exactamente
3 de ellos sean varones?

Tenemos los siguientes datos:

n = 5, número de ensayos, tamaño de muestra o registros

X= 3, número de éxitos (probabilidad de que sean varones)

p = 0.52, la probabilidad de éxito

x n-x
P(x)= n! p (1-p)
(n-x)! x!
3 5-3
P(x=20)= 5! (0.52) (1-0.52)
(5-3)! 3!

P(x=20)= 120 (0.140608) (0.2304)


(2) 6

En excell se usa la siguiente fórmula: =(A1/(B1*C1))*(D1*E1)

O bien de la siguiente manera:

1. Seleccionamos Insertar función fx


2. Seleccionamos DISTRIB. BINOM. y seleccionamos ACEPTAR
3. Ingresamos la información del problema y listo. P(X=3) = 0.3239

94
PROBLEMA

Hay una campaña en un centro médico, sobre paternidad responsable a un grupo


de mujeres. Una vez finalizada la charla se les entrega un papelito con una única
pregunta:

¿Desearía usted ser esterilizada?

1. Si 2. No

Estamos interesada en investigar si las charlas tienen un efecto favorable en el


sentido de que las mujeres se decidan a ser sometidas a la esterilización.

Ante este tipo de situaciones, tenemos que acudir a las Distribuciones de


Probabilidades. En nuestro ejemplo, la variable “Deseo ser esterilizada”, es una
variable cualitativa, discreta. Por lo tanto se requieren de las Distribuciones de
Probabilidades Discretas.

VARIABLE ALEATORIA

Una variable se dice que es aleatoria, si los posibles valores que puede tomar son
determinados por el azar. Es decir se sabe qué valores puede tomar la variable
pero no se tiene certeza de su ocurrencia, sólo se sabe que puede ocurrir con una
cierta probabilidad. Por ejemplo, en una epidemia de cólera, se sabe que una
persona cualesquiera puede enfermar o no (eventos), pero no se sabe cuál de los

95
dos eventos va a ocurrir. Solamente se puede decir que existe una probabilidad de
que la persona enferme.

Las variables aleatorias se clasifican:

1. Discretas: aquellas que resultan de contar el número de casos en los que el


evento de interés ocurre, por ejemplo: numero de hijos de una familia,
número de veces que llega una paciente al servicio de emergencia, etc.
2. Continuas: aquellas que resultan producto de una medición, por ejemplo: el
peso, el nivel de hemoglobina, etc.

VALOR ESPERADO

El valor esperado se llama también esperanza matemática. Se trata de un


operador matemático que al ser aplicado a la función probabilidad permite el
cálculo de ese valor en el caso discreto, mientras que en el caso continuo se lo
aplica a la función frecuencia:

Sigamos con nuestro ejemplo del centro médico. Nuestra variable de interés seria:

“Deseo ser esterilizada”.

Supongamos que a la charla asistieron tres mujeres, entonces definimos como


variable aleatoria a:

X : Número de mujeres que desearían ser esterilizadas.

Antes de hacerles la pregunta sobre su deseo de ser esterilizadas, puede


considerar las posibles respuestas:

X = 0 (Ninguna desearía ser esterilizada)

X = 1 (Sólo una de las mujeres desearía)

X = 2 (Dos mujeres desearían)

X = 3 (Las tres mujeres desearían)

Antes de verificar las respuestas de las 3 mujeres seleccionada; no sabe cuántas


estarán de acuerdo en ser esterilizadas, pero si conociera las probabilidades de

96
ocurrencia de cada uno de los posibles valores de la variable podría predecir su
ocurrencia con una cierta probabilidad. El conjunto de las probabilidades de
ocurrencia de los posibles valores de la variable aleatoria se denomina distribución
de probabilidades.

DISTRIBUCION BINOMIAL

Esta distribución se basa en el proceso de Bernoulli. Se denominan procesos de


tipo Bernoulli, a todo experimento consistente en una serie de pruebas repetidas,
caracterizadas por tener resultados que se pueden clasificar en si verifican o no
cierta propiedad o atributo, siendo aleatorios e independientes.

Para identificar un proceso Bernoulli en una serie de pruebas repetidas, se deben


verificar tres condiciones:

1. Resultados dicotómicos: Los resultados de cada prueba se pueden


clasificar en "éxito" si verifican cierta condición, o "fracaso" en el caso
contrario.
2. Independencia de las pruebas: El resultado de una prueba cualquiera es
independiente del resultado obtenido en la prueba anterior, y no incide en el
resultado de la prueba siguiente.
3. Estabilidad de las pruebas: La probabilidad p de obtener un resultado
considerado como un éxito se mantiene constante a lo largo de toda la serie
de pruebas.

Cuando en un proceso del tipo Bernoulli se desea saber la probabilidad de obtener


exactamente r éxitos, en una serie de n pruebas, con una probabilidad de éxito p,
se puede aplicar la fórmula de la probabilidad binomial:

X = 0, 1, 2, ……, n.

97
Veamos el siguiente ejemplo:

Sea el caso de una droga X, con una dosis mortal de 1g/100 ml para cobayos
experimentales, en el 25% de los casos. Aplicando esta dosis a cien cobayos se
desea saber cuánto vale la probabilidad de que mueran veinte de ellos.

Primero analizaremos si este caso cumple los supuestos básicos de una


distribución binomial:

 Los cobayos mueren (éxito) o sobreviven (fracaso).


 Que un cobayo muera con la dosis, no significa que lo hará el siguiente
(independencia) pues no se trata de una epidemia.
 La probabilidad de que mueran se mantiene constante a lo largo de la serie de
pruebas (p = 0,25).

Entonces, como si cumple los supuestos básicos, aplicamos la formula:

x=20 n=100 p= 0.25

O bien desglosando el ejemplo:


x n-x
P(x)= n! p (1-p)
(n-x)! x!
20 100-20
P(x=20)= 100! (0.25) (1-0.25)
(100-20)! 20!

157 -13 -10


P(x=20)= 9.3326x10 (9.09495 x 10 ) (1.01135 x 10 )
118 18
(7.1569 x 10 ) 2.4329 x 10

98
Para calcular el factorial (!) se utiliza excell, insertar función (Fx), categoría
“matemáticas y trigonométricas”, seleccionar “fact”, insertar el número
seleccionado y dar aceptar. Para calcular la potencia se sigue el mismo
procedimiento y se selecciona “potencia” se inserta el número y la potencia, se da
“aceptar”.

157
9.3326x10
118 18
(7.1569 x 10 ) 2.4329 x 10

Para resolver la ecuación también se utiliza Excel

Insertar función (fx) = =(A1/(B1*C1))

= (5.35983 x 1020) (9.09495 x 10-13) (1.01135 x 10-10)

=0.0493≈ 49%

Todo lo anterior se resuelve con Excel de la siguiente forma:

Veamos otro ejemplo:

En una farmacia se ha calculado la probabilidad de venderle a un cliente con obra


social es del 20%. Se eligen al azar 15 clientes de ese tipo que ingresan al
negocio y se desea calcular la probabilidad de concretar menos de tres ventas.

Si se cumple los supuestos básicos de la distribución binomial, entonces:

P(x<3) = P(x=0) + P(x=1) + P(x=2)

99
Matemáticamente esto se resuelve así:

Entonces: P(x<3) = 0.0352 + 0.1319 + 0.2309 = 0.398; Ahora con Excel.

Matemáticamente P(x<3) = P(x≤ 2) . El Excel calcula siempre o igualdad o menor


igual. Cuando queremos menor igual, en la opción de acumulado ingresamos
VERDADERO.

Entonces P(x<3) = 0.398

EJERCICIOS DE PROBABILIDAD BINOMIAL

El 60% de los estadounidenses leen sus contratos de trabajo, incluyendo las letras
pequeñas. Suponga que el número de empleados que leen cada una de las palabras de
su contrato se puede modelar utilizando la distribución binomial. Considerando un grupo
de cinco empleados, encuentre cual es la probabilidad de que:

100
a) Los cinco lean cada una de las palabras de su contrato

b) Al menos tres lean cada una de las palabras de su contrato

c) Menos de dos lean cada una de las palabras de su contrato

d) ¿Cuáles serían sus respuestas para los incisos a), b) y c) si la probabilidad


de que un empleado lea cada una de las palabras de su contrato es de
0.80?

Variables:

a) x=5 n=5 p= 0.60


b) x=3 n=5 p= 0.60
x=4 n=5 p= 0.60
x=5 n=5 p= 0.60
c) x=1 n=5 p= 0.60
x=0 n=5 p= 0.60

x n-x
a) P(x)= n! p (1-p)
(n-x)! x!
2 5-5
P(x=5)= 5! (0.60) (1-0.60)
(5-5)! 5!
= 0.0778

x n-x
b) P(x)= n! p (1-p)
(n-x)! x!
P(x≥3)
3 5-3
P(x=3)= 5! (0.60) (1-0.60)
(5-3)! 3!
= 0.3456
2 5-4
P(x=4)= 5! (0.60) (1-0.60)
(5-4)! 4!
= 0.2592

5 5-5
P(x=5)= 5! (0.60) (1-0.60)
(5-5)! 5!
= 0.0778

P(x≥3) = P(x=3) + p(x=4)+ p(x=5)


P(x≥3) = 0.3456+0.2592+0.0778 = 0.6826

101
x n-x
c) P(x)= n! p (1-p)
(n-x)! x!
P(x˂2)
1 5-1
P(x=1)= 5! (0.60) (1-0.60)
(5-1)! 1!
= 0.0768
0 5-0
P(x=0)= 5! (0.60) (1-0.60)
(5-0)! 0!
= 0.0102
P(x˂2) = P(x=1) + p(x=0)
P(x˂2) = 0.0768+0.0102 = 0.0870

Tabla de resultados en Excel

distribución
binomial solución
Ejercicio n! n-x! x! (a2/(b2*c2)) px 1-p n-x d2*e2*f2 en Excel en libro
a 120 1 120 1 0.07776 1 0.0778 0.0778 0.0778
b 120 1 120 1 0.07776 1 0.0778 0.0778 0.6826
120 2 6 10 0.216 0.16 0.3456 0.3456
120 1 24 5 0.1296 0.4 0.2592 0.2592
c 120 24 1 5 0.6 0.0256 0.0768 0.0768 0.0870
120 120 1 1 1 0.01024 0.0102 0.0102

Un estudiante presenta un examen de opción múltiple, en el que cada pregunta tiene


cuatro opciones. Suponga que el él no conoce la respuesta correcta de ninguna de las
preguntas, y que decidió utilizar una estrategia en la que colocará cuatro pelotas (A, B, C,
y D) dentro de una caja. Ahora, para responder cada pregunta, selecciona una pelota de
manera aleatoria y la devuelve a la caja. La letra de la pelota determinara su respuesta a
la pregunta. El examen se compone de cinco preguntas de opción múltiple. ¿Cuál es la
probabilidad de que él obtenga?

a) Cinco respuestas correctas? b) Al menos cuatro respuestas


correctas?
b) Ninguna respuesta correcta? c) No más de dos respuestas
correctas?

102
Variables:

a) x=5 n=5 p= 0.25


b) x=4 n=5 p= 0.25
x=5 n=5 p= 0.25
c) x=0 n=5 p= 0.25
d) x=2 n=5 p= 0.25
x=1 n=5 p= 0.25
x=0 n=5 p= 0.25

x n-x
a) P(x)= n! p (1-p)
(n-x)! x!
5 5-5
P(x=5)= 5! (0.25) (1-0.25)
(5-5)! 5!

5 5-5
b) P(x=5)= 5! (0.25) (1-0.25)
(5-5)! 5!
4 5-4
P(x=4)= 5! (0.25) (1-0.25)
(5-4)! 4!

0 5-0
c) P(x=0)= 5! (0.25) (1-0.25)
(5-0)! 0!
2 5-2
d) P(x=2)= 5! (0.25) (1-0.25)
(5-2)! 2!
1 5-1
P(x=1)= 5! (0.25) (1-0.25)
(5-1)! 1!
0 5-0
P(x=0)= 5! (0.25) (1-0.25)
(5-0)! 0!

Tabla de resultados en Excel

Distribución
binomial
Ejercicio n! n-x! x! (a2/(b2*c2)) px 1-p n-x d2*e2*f2 en Excel Suma
A 120 1 120 1 0.0009 1 0.0010 0.0010
B 120 1 120 1 0.0009 1 0.0010 0.0010 0.0156
120 1 24 5 0.0039 0.75 0.0146 0.0146
C 120 120 1 1 1 0.2373 0.2373 0.2373
D 120 6 2 10 0.0625 0.4218 0.2637 0.2637 0.8965
120 24 1 5 0.25 0.3164 0.3955 0.3955
120 120 1 1 1 0.2373 0.2373 0.2373

103
DISTRIBUCIÓN DE PROBABILIDAD CONTINUA

La función de densidad de probabilidad continua es una expresión matemática que


define la distribución de los valores para una variable aleatoria continua como el
tiempo, la estatura, la distancia, la temperatura, la presión, entre otras; es decir
variables que se miden pero no se cuentan.

LA DISTRIBUCIÓN NORMAL

La distribución normal o gaussiana, es la distribución continua que se utiliza más


comúnmente en estadística, ésta es importante por tres razones:

 Muchas variables continuas comunes en el mundo de los negocios tienen


distribuciones que se asemejan estrechamente a la distribución normal.

 La distribución normal sirve para acercarse a diversas distribuciones de


probabilidad discreta como la distribución binomial y la distribución de
Poisson.

 La distribución normal proporciona las bases para la estadística inferencial


clásica por su relación con el teorema del límite central.

La distribución normal se representa por la clásica gráfica en forma de campana,


con ella se puede calcular la probabilidad de que varios valores ocurran dentro de
ciertos rangos o intervalos. Sin embargo, la probabilidad exacta de un valor
particular dentro de una distribución normal, es cero. Esta propiedad distingue a
las variables continuas, que son medidas (temperatura, peso, velocidad, presión),
de las variables discretas, las cuales son contadas (número de autos, cantidad de
personas). Por tanto es factible determinar, por ejemplo, que la probabilidad de
que el tiempo de descarga para una página de la web esté entre 7 y 10 segundos,
entre 8 y 9 segundos o que la probabilidad de que el tiempo de descarga este

104
entre 7.99 y 8.01. Sin embargo, la probabilidad de que el tiempo de descarga sea
exactamente de 8 segundos es cero.

Distribución normal estándar

La más simple de todas las distribuciones normales, es la distribución normal


estándar, denominada distribución Z, está se encuentra distribuida alrededor de
una media (µ=0) con una desviación estándar (σ=1). Así por ejemplo, el valor
Z=1.5 está 1.5 desviaciones estándar por encima de la media y, en general:

Cada valor Z es el número de desviaciones estándar separado de la media.

Distribución normal general

Una distribución normal puede tener cualquier µ y cualquier desviación estándar σ.


La distribución normal es simétrica y con forma de campana, lo que implica que la
mayoría de los datos tiende a agruparse alrededor de la media, la cual por su
forma simétrica, es igual a la mediana. Aunque desde el punto de vista teórico los
valores en una distribución normal pueden clasificarse del infinito negativo (-∞) al

infinito positivo (+∞), la forma de la distribución hace poco posible que ocurran
valores extremadamente grandes o muy pequeños.

La expresión matemática que representan la función de densidad de probabilidad


continua está indicada con el símbolo f(X).Para la distribución normal, la función
de densidad de la probabilidad normal se da en la ecuación

f(X) = _____1_____ e - (1/2)((X-µ)/σ)2


√ 2πσ

e= es contante matemática: 2.71828


π= constante matemática: 3.1416
µ
= es la media
σ= es la desviación estándar
x= es cualquier valor de la variable continua

105
Puesto que “e” y “π” son constantes matemáticas, las probabilidades de una
variable aleatoria X dependen sólo de dos parámetros de la distribución normal: la
µ
media y la desviación estándar σ. Cada vez que se especifique una

combinación particular de la media y la desviación estándar, se genera una


distribución de probabilidad normal diferente.

La expresión matemática antes descrita es tediosa de calcular y requiere de


cálculo integral. Para evitar eso se usan las tablas de probabilidad normal. El
primer paso para encontrar probabilidades normales es usar la fórmula de
transformación, para convertir cualquier variable aleatoria normal X en una
variable aleatoria normal estandarizada Z.

Fórmula de transformación

µ
El valor Z es igual a la diferencia entre X y la media , dividida por la desviación
estándar σ.

µ
Z= X-
σ

Aunque los datos originales para la variable aleatoria X tenían una media y una
desviación estándar, la variable aleatoria estandarizada Z siempre tendrá una
media=0 y una desviación estándar=1.

Al sustituir media=0 y desviación estándar=1 en la ecuación de función de


densidad de la probabilidad de una variable normal estandarizada Z. Dicha
función está dada en la siguiente ecuación:

- (1/2)Z 2

f(X) = _____1_____ e
√ 2π

106
Cualquier conjunto de valores distribuidos normalmente son susceptibles de
convertirse a su forma estandarizada. Entonces se determinan las probabilidades
deseadas usando la Tabla de Distribución normal estandarizada acumulativa.

Problema
Suponga que desea encontrar la probabilidad de que el tiempo de descarga para
µ
un sitio Web sea menor a 9 segundos. La media es =7 y la desviación estándar
σ =2
µ
Primero utiliza la ecuación Z= X-
σ

Encontrar P (X≤9)
Para transformar X=9 a unidades estandarizadas Z. Puesto que X=9 es una
desviación estándar por arriba de la media 7+2= 9, Z= +1.00.

Z= 9-7 = 2 = +1.00
2 2

En seguida se utiliza la Tabla de distribución normal estandarizada para encontrar


el área acumulativa bajo la curva normal calculada menor que Z=+1.00 (es decir a
la izquierda de Z.

Para leer la probabilidad o área bajo la curva menor que Z=+1.00 se revisa la
columna Z de la tabla, hasta localizar el valor Z de interés (en décimos) en la fila Z
de 1.0. A continuación se lee a través del renglón hasta que intercepte la columna
que contiene el lugar del valor Z en los centésimos.

Por lo tanto, en el cuerpo de la tabla, la probabilidad tabulada para Z=1.00


corresponde con la intersección de la fila Z=1.0 con la columna Z=.00, esta
probabilidad es de 0.8413, es decir hay un 84.13% de posibilidad de que el tiempo
de descarga sea menor a 9 segundos.

107
Encontrar P (X˃9)
¿Cuál es la probabilidad de que el tiempo de descarga sea de más de 9
segundos?

Solución: La probabilidad de que el tiempo de descarga sea menor a 9 segundos


es de 0.8413. Así, la probabilidad de que el tiempo de descarga sea mayor a 9
segundos es el complemento de que sea menor a 9 segundos, 1-0.8413= 0.1587.
Figura 1.

Figura 1.

108
Encontrar P (7˂X˂9)

¿Cuál es la probabilidad de que el tiempo de descarga esté entre 7 y 9 segundos?

Solución: Ya se determino que la probabilidad de que el tiempo de descarga sea


menor a 9 segundos es de 0.8413. Ahora se determina la probabilidad de que el
tiempo de descarga sea menor a 7 segundos y sustraer esto de la probabilidad de
que el tiempo de descarga sea menor a 9 segundos.

µ
Usando la ecuación Z= X-
σ

Z= 7-7 = 0.00
2

Al utilizar la tabla de distribución normal estandarizada acumulativa, se sabe que


el área bajo la curva normal menor que la media de Z=0.00 es de 5.000. Por lo
tanto, el área bajo la curva entre Z=0.00 y Z=1.00 es de 0.8413-0.5000 = 0.3413.
Figura 2.

Figura 2.

109
Encontrar P (X˂7 O X˃9)

¿Cuál es la probabilidad de que el tiempo de descarga sea menor a 7 segundos o


mayor a 9 segundos?

Solución: La probabilidad de que el tiempo de descarga sea entre 7 y 9 segundos


es de 0.3413; ahora la probabilidad de que el tiempo de descarga esté por debajo
de los 7 segundos o por arriba de los 9 segundos es su complemento, 1-0.3413=
0.6587.

Otra manera de resolver el problema es el siguiente. Se calcula de forma


separada la probabilidad de tiempo de descarga menor a 7 segundos y la
probabilidad mayor de 9 segundos, y después sumar estas dos probabilidades
para obtener el resultado deseado.

Puesto que la media y la mediana son la misma para los datos distribuidos
normalmente, el 50% de los tiempos de descarga están por debajo de los 7
segundos. Como se calculó, en el primer ejercicio, la probabilidad del tiempo de
descarga de más de 9 segundos P (X˃9) es de 0.1587. Por lo tanto, la
probabilidad de que el tiempo de descarga esté por debajo de 7 o por arriba de 9
segundos, P (X˂7 O X˃9), es 0.5000+0.1587= 0.6587. Figura 3.

Figura 3.

110
Encontrar P (5˂X˂9)
¿Cuál es la probabilidad de que el tiempo de descarga este entre 5 y 9 segundos,
es decir P (5˂X˂9)?

Solución: Considerando que el área de interés se localiza entre los valores 5 y 9.


Siga los siguientes pasos:

1. Determine la probabilidad de menos de 9 segundos


2. Determine la probabilidad de menos de 5 segundos
3. Sustraiga el resultado menor del mayor

El área bajo la curva normal menor que 9 segundos es, como se mencionó
anteriormente, 0.8413. Para encontrar el área bajo la curva menor que 5 segundos
(paso 2)

Z= 5-7 = -1.00
2

En la tabla busque Z= -1.00 y encuentre 0.1587. Para el paso tres, la probabilidad


de que el tiempo de descarga sea entre 5 y 9 segundos es 0.8413-0.1587 =
0.6826. Figura 4.

Figura 4.

111
Tabla distribución normal estandarizada acumulativa

Normal 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99896 0.99900
3.1 0.99903 0.99906 0.99910 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.99940 0.99942 0.99944 0.99946 0.99948 0.99950
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.99960 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.99970 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.99980 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.99990 0.99990 0.99990 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995

112
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
4 0.999968329 0.999969641 0.999970901 0.999972112 0.999973274 0.999974391 0.999975464 0.999976493 0.999977482 0.999978431
4.1 0.999979342 0.999980217 0.999981056 0.999981862 0.999982635 0.999983376 0.999984088 0.999984770 0.999985425 0.999986052
4.2 0.999986654 0.999987231 0.999987785 0.999988315 0.999988824 0.999989311 0.999989779 0.999990226 0.999990655 0.999991066
4.3 0.999991460 0.999991837 0.999992199 0.999992545 0.999992876 0.999993193 0.999993497 0.999993788 0.999994066 0.999994332
4.4 0.999994587 0.999994831 0.999995065 0.999995288 0.999995502 0.999995706 0.999995902 0.999996089 0.999996268 0.999996439
4.5 0.999996602 0.999996759 0.999996908 0.999997051 0.999997187 0.999997318 0.999997442 0.999997561 0.999997675 0.999997784
4.6 0.999997888 0.999997987 0.999998081 0.999998172 0.999998258 0.999998340 0.999998419 0.999998494 0.999998566 0.999998634
4.7 0.999998699 0.999998761 0.999998821 0.999998877 0.999998931 0.999998983 0.999999032 0.999999079 0.999999124 0.999999166
4.8 0.999999207 0.999999245 0.999999282 0.999999317 0.999999351 0.999999383 0.999999413 0.999999442 0.999999470 0.999999496
4.9 0.999999521 0.999999545 0.999999567 0.999999589 0.999999609 0.999999629 0.999999648 0.999999665 0.999999682 0.999999698
5 0.999999713 0.999999728 0.999999742 0.999999755 0.999999767 0.999999779 0.999999790 0.999999801 0.999999811 0.999999821
5.1 0.999999830 0.999999839 0.999999847 0.999999855 0.999999863 0.999999870 0.999999877 0.999999883 0.999999889 0.999999895
5.2 0.999999900 0.999999906 0.999999911 0.999999915 0.999999920 0.999999924 0.999999928 0.999999932 0.999999935 0.999999939
5.3 0.999999942 0.999999945 0.999999948 0.999999951 0.999999954 0.999999956 0.999999958 0.999999961 0.999999963 0.999999965
5.4 0.999999967 0.999999968 0.999999970 0.999999972 0.999999973 0.999999975 0.999999976 0.999999977 0.999999979 0.999999980
5.5 0.999999981 0.999999982 0.999999983 0.999999984 0.999999985 0.999999986 0.999999987 0.999999987 0.999999988 0.999999989
5.6 0.999999989 0.999999990 0.999999990 0.999999991 0.999999991 0.999999992 0.999999992 0.999999993 0.999999993 0.999999994
5.7 0.999999994 0.999999994 0.999999995 0.999999995 0.999999995 0.999999996 0.999999996 0.999999996 0.999999996 0.999999996
5.8 0.999999997 0.999999997 0.999999997 0.999999997 0.999999997 0.999999998 0.999999998 0.999999998 0.999999998 0.999999998
5.9 0.999999998 0.999999998 0.999999998 0.999999998 0.999999999 0.999999999 0.999999999 0.999999999 0.999999999 0.999999999
6 0.999999999 0.999999999 0.999999999 0.999999999 0.999999999 0.999999999 0.999999999 0.999999999 0.999999999 0.999999999

113
Para valores negativos de Z

Normal 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0 0.5 0.496010644 0.492021686 0.488033527 0.484046563 0.480061194 0.476077817 0.47209683 0.468118628 0.464143607
-0.1 0.460172163 0.456204687 0.452241574 0.448283213 0.444329995 0.440382308 0.436440537 0.432505068 0.428576284 0.424654565
-0.2 0.420740291 0.416833837 0.412935577 0.409045885 0.405165128 0.401293674 0.397431887 0.393580127 0.389738752 0.385908119
-0.3 0.382088578 0.378280478 0.374484165 0.370699981 0.366928264 0.363169349 0.359423567 0.355691245 0.351972708 0.348268273
-0.4 0.344578258 0.340902974 0.337242727 0.333597821 0.329968554 0.32635522 0.32275811 0.319177509 0.315613697 0.312066949
-0.5 0.308537539 0.305025731 0.301531788 0.298055965 0.294598516 0.291159687 0.287739719 0.284338849 0.280957309 0.277595325
-0.6 0.274253118 0.270930904 0.267628893 0.264347292 0.2610863 0.257846111 0.254626915 0.251428895 0.24825223 0.245097094
-0.7 0.241963652 0.238852068 0.235762498 0.232695092 0.229649997 0.226627352 0.223627292 0.220649946 0.217695438 0.214763884
-0.8 0.211855399 0.208970088 0.206108054 0.203269392 0.200454193 0.197662543 0.194894521 0.192150202 0.189429655 0.186732943
-0.9 0.184060125 0.181411255 0.17878638 0.176185542 0.17360878 0.171056126 0.168527607 0.166023246 0.163543059 0.16108706
-1 0.158655254 0.156247645 0.15386423 0.151505003 0.14916995 0.146859056 0.1445723 0.142309654 0.14007109 0.137856572
-1.1 0.135666061 0.133499513 0.131356881 0.129238112 0.127143151 0.125071936 0.123024403 0.121000484 0.119000107 0.117023196
-1.2 0.11506967 0.113139446 0.111232437 0.109348552 0.107487697 0.105649774 0.103834681 0.102042315 0.100272568 0.098525329
-1.3 0.096800485 0.095097918 0.093417509 0.091759136 0.090122672 0.088507991 0.086914962 0.085343451 0.083793322 0.082264439
-1.4 0.080756659 0.079269841 0.077803841 0.07635851 0.0749337 0.07352926 0.072145037 0.070780877 0.069436623 0.068112118
-1.5 0.066807201 0.065521712 0.064255488 0.063008364 0.061780177 0.060570758 0.059379941 0.058207556 0.057053433 0.055917403
-1.6 0.054799292 0.053698928 0.052616138 0.051550748 0.050502583 0.049471468 0.048457226 0.047459682 0.046478658 0.045513977
-1.7 0.044565463 0.043632937 0.042716221 0.041815138 0.040929509 0.040059157 0.039203903 0.03836357 0.03753798 0.036726956
-1.8 0.035930319 0.035147894 0.034379502 0.033624969 0.032884119 0.032156775 0.031442763 0.030741909 0.030054039 0.02937898
-1.9 0.02871656 0.028066607 0.02742895 0.026803419 0.026189845 0.02558806 0.024997895 0.024419185 0.023851764 0.023295468
-2 0.022750132 0.022215594 0.021691694 0.02117827 0.020675163 0.020182215 0.01969927 0.019226172 0.018762766 0.0183089
-2.1 0.017864421 0.017429178 0.017003023 0.016585807 0.016177383 0.015777607 0.015386335 0.015003423 0.014628731 0.014262118
-2.2 0.013903448 0.013552581 0.013209384 0.012873721 0.012545461 0.012224473 0.011910625 0.011603792 0.011303844 0.011010658
-2.3 0.01072411 0.010444077 0.010170439 0.009903076 0.00964187 0.009386706 0.009137468 0.008894043 0.008656319 0.008424186
-2.4 0.008197536 0.00797626 0.007760254 0.007549411 0.007343631 0.007142811 0.006946851 0.006755653 0.006569119 0.006387155
-2.5 0.006209665 0.006036558 0.005867742 0.005703126 0.005542623 0.005386146 0.005233608 0.005084926 0.004940016 0.004798797
-2.6 0.004661188 0.004527111 0.004396488 0.004269243 0.004145301 0.004024589 0.003907033 0.003792562 0.003681108 0.003572601
-2.7 0.003466974 0.00336416 0.003264096 0.003166716 0.003071959 0.002979763 0.002890068 0.002802815 0.002717945 0.002635402
-2.8 0.00255513 0.002477075 0.002401182 0.0023274 0.002255677 0.002185961 0.002118205 0.002052359 0.001988376 0.001926209
-2.9 0.001865813 0.001807144 0.001750157 0.00169481 0.001641061 0.00158887 0.001538195 0.001488999 0.001441242 0.001394887
-3 0.001349898 0.001306238 0.001263873 0.001222769 0.001182891 0.001144207 0.001106685 0.001070294 0.001035003 0.001000782
-3.1 0.000967603 0.000935437 0.000904255 0.000874032 0.000844739 0.000816352 0.000788846 0.000762195 0.000736375 0.000711364
-3.2 0.000687138 0.000663675 0.000640953 0.000618951 0.000597648 0.000577025 0.000557061 0.000537737 0.000519035 0.000500937
-3.3 0.000483424 0.00046648 0.000450087 0.00043423 0.000418892 0.000404058 0.000389712 0.000375841 0.000362429 0.000349463
-3.4 0.000336929 0.000324814 0.000313106 0.000301791 0.000290857 0.000280293 0.000270088 0.000260229 0.000250707 0.00024151
-3.5 0.000232629 0.000224053 0.000215773 0.00020778 0.000200064 0.000192616 0.000185427 0.000178491 0.000171797 0.000165339
-3.6 0.000159109 0.000153099 0.000147302 0.000141711 0.000136319 0.00013112 0.000126108 0.000121275 0.000116617 0.000112127
-3.7 0.0001078 0.00010363 9.96E-05 9.57E-05 9.20E-05 8.84E-05 8.50E-05 8.16E-05 7.84E-05 7.53E-05
-3.8 7.23E-05 6.95E-05 6.67E-05 6.41E-05 6.15E-05 5.91E-05 5.67E-05 5.44E-05 5.22E-05 5.01E-05

114
-3.9 4.81E-05 4.61E-05 4.43E-05 4.25E-05 4.07E-05 3.91E-05 3.75E-05 3.59E-05 3.45E-05 3.30E-05
-4 3.17E-05 3.04E-05 2.91E-05 2.79E-05 2.67E-05 2.56E-05 2.45E-05 2.35E-05 2.25E-05 2.16E-05
-4.1 2.07E-05 1.98E-05 1.89E-05 1.81E-05 1.74E-05 1.66E-05 1.59E-05 1.52E-05 1.46E-05 1.39E-05
-4.2 1.33E-05 1.28E-05 1.22E-05 1.17E-05 1.12E-05 1.07E-05 1.02E-05 9.77E-06 9.34E-06 8.93E-06
-4.3 8.54E-06 8.16E-06 7.80E-06 7.46E-06 7.12E-06 6.81E-06 6.50E-06 6.21E-06 5.93E-06 5.67E-06
-4.4 5.41E-06 5.17E-06 4.94E-06 4.71E-06 4.50E-06 4.29E-06 4.10E-06 3.91E-06 3.73E-06 3.56E-06
-4.5 3.40E-06 3.24E-06 3.09E-06 2.95E-06 2.81E-06 2.68E-06 2.56E-06 2.44E-06 2.32E-06 2.22E-06
-4.6 2.11E-06 2.01E-06 1.92E-06 1.83E-06 1.74E-06 1.66E-06 1.58E-06 1.51E-06 1.43E-06 1.37E-06
-4.7 1.30E-06 1.24E-06 1.18E-06 1.12E-06 1.07E-06 1.02E-06 9.68E-07 9.21E-07 8.76E-07 8.34E-07
-4.8 7.93E-07 7.55E-07 7.18E-07 6.83E-07 6.49E-07 6.17E-07 5.87E-07 5.58E-07 5.30E-07 5.04E-07
-4.9 4.79E-07 4.55E-07 4.33E-07 4.11E-07 3.91E-07 3.71E-07 3.52E-07 3.35E-07 3.18E-07 3.02E-07
-5 2.87E-07 2.72E-07 2.58E-07 2.45E-07 2.33E-07 2.21E-07 2.10E-07 1.99E-07 1.89E-07 1.79E-07
-5.1 1.70E-07 1.61E-07 1.53E-07 1.45E-07 1.37E-07 1.30E-07 1.23E-07 1.17E-07 1.11E-07 1.05E-07
-5.2 9.96E-08 9.44E-08 8.95E-08 8.48E-08 8.03E-08 7.60E-08 7.20E-08 6.82E-08 6.46E-08 6.12E-08
-5.3 5.79E-08 5.48E-08 5.19E-08 4.91E-08 4.65E-08 4.40E-08 4.16E-08 3.94E-08 3.72E-08 3.52E-08
-5.4 3.33E-08 3.15E-08 2.98E-08 2.82E-08 2.66E-08 2.52E-08 2.38E-08 2.25E-08 2.13E-08 2.01E-08
-5.5 1.90E-08 1.79E-08 1.70E-08 1.60E-08 1.51E-08 1.43E-08 1.35E-08 1.27E-08 1.20E-08 1.14E-08
-5.6 1.07E-08 1.01E-08 9.55E-09 9.01E-09 8.50E-09 8.02E-09 7.57E-09 7.14E-09 6.73E-09 6.35E-09
-5.7 5.99E-09 5.65E-09 5.33E-09 5.02E-09 4.73E-09 4.46E-09 4.21E-09 3.96E-09 3.74E-09 3.52E-09
-5.8 3.32E-09 3.12E-09 2.94E-09 2.77E-09 2.61E-09 2.46E-09 2.31E-09 2.18E-09 2.05E-09 1.93E-09
-5.9 1.82E-09 1.71E-09 1.61E-09 1.51E-09 1.43E-09 1.34E-09 1.26E-09 1.19E-09 1.12E-09 1.05E-09
-6 9.87E-10 9.28E-10 8.72E-10 8.20E-10 7.71E-10 7.24E-10 6.81E-10 6.40E-10 6.01E-10 5.64553E-

115
ESTIMACIÓN DE INTERVALO DE CONFIANZA

En el contexto de estimar un parámetro poblacional, un intervalo de confianza es


un rango de valores (calculado en una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada.

Se llama intervalo de confianza a un par de números entre los cuales se estima


que estará cierto valor desconocido con una determinada probabilidad de acierto.
Formalmente, estos números determinan un intervalo, que se calcula a partir de
datos de una muestra, y el valor desconocido es un parámetro poblacional.

INTERVALO DE CONFIANZA: Se llama así a un intervalo en el que sabemos


que está un parámetro, con un nivel de confianza específico

La probabilidad de éxito en la estimación se denomina nivel de confianza y se


simboliza (1 – α) x 100.

NIVEL DE CONFIANZA: Probabilidad de que el parámetro a estimar se


encuentre en el intervalo de confianza. Los valores que se suelen utilizar
para el nivel de confianza son el 95%, 99% y 99,9%

α (alfa) es el llamado error aleatorio o nivel de significación o de significancia,


esto es, una medida de las posibilidades de fallar o equivocar en la estimación
mediante tal intervalo.

Para la construcción de un determinado intervalo de confianza es necesario


conocer la distribución teórica que sigue el parámetro a estimar. Es habitual que el
parámetro se distribuya normalmente.

Según diferentes niveles de confianza el coeficiente de Z varía, así:

1- α =90%, Z=1.64; 1- α =95%, Z=1.96


1- α =97.5%, Z=2.24; 1- α =99%, Z=2.58

116
Para determinar el valor de Z, se realiza el siguiente procedimiento:

Nivel de Nivel de Nivel de Sumatoria Buscar en la Tabla de distribución


confianza confianza significancia normal acumulativa y unir los
1- α + α/2 valores de la columna y renglón de
% 1- α α/2 Z=Valor crítico

50 0.50 0.25 0.75 Z=0.67

68.27 0.6827 0.1586 0.8413 Z=1.00

80 0.80 0.10 0.90 Z=1.28

90 0.90 0.05 0.95 Z= 1.64

95 0.95 0.025 0.975 Z= 1.96

95.45 0.9545 0.02275 0.97725 Z=2.00

96 0.96 0.02 0.98 Z=2.06

97.5 0.975 0.0125 0.9875 Z= 2.24

98 0.98 0.01 0.99 Z=2.33

99 0.99 0.005 0.995 Z= 2.58

99.73 0.9973 0.00135 0.9986 Z=2.99

La notación α/2, representa que estamos en una gráfica de dos colas, por esta
razón α (alfa) o nivel de significancia se divide entre dos.

Se llama valor crítico al valor de Z necesario para construir un intervalo de


confianza para la distribución. El 95% de confianza corresponde a un valor de α de
0.05. El valor crítico Z correspondiente al área acumulativa de 0.9750 es 1.96.

117
Este valor nos dice que la media de la muestra se encuentran en un 95% de los
casos como máximo a 1.96 desviaciones típicas de la media buscada.

Estimación del intervalo de confianza para la media (σ conocida)

Formula de intervalo de confianza para la media (σ conocida)

ẋ ± Z σ/√n o ẋ - Z σ/√n ≤ µ ≤ ẋ - Z σ/√n

Ejemplo estimación del intervalo de confianza para la media con 95% de


confianza

Un fabricante de papel tiene un proceso de producción continuo. Se espera que el


papel tenga una media de longitud de 11 pulgadas y una desviación estándar de
0.02 pulgadas. Se selecciona una muestra para determinar si la media es igual a
11 pulgadas. Se selecciona una muestra aleatoria de 100 hojas; la media de
longitud de papel es de 10.998 pulgadas. Construya una estimación de intervalo
de confianza del 95% para la media poblacional de la longitud del papel.

ẋ ± Z σ/√n

= 10.998 ± (1.96) 0.02


√100

= 10.998±0.00392

El intervalo de confianza es:

10.99408 ≤ µ ≤ 11.00192

Se concluye que con un 95% de confianza, se concluye que la media poblacional


está entre 10.99408 y 11.00192 pulgadas. Como el intervalo incluye al 11, valor
que indica que el proceso de producción funciona adecuadamente, no hay razón
para creer que algo está mal.

118
Ejemplo estimación del intervalo de confianza para la media con 99% de
confianza

ẋ ± Z σ/√n

= 10.998 ± (2.58) 0.02 = 10.998 ± 0.00516


√100

El intervalo de confianza es: 10.99284 ≤ µ ≤ 11.00316

Una vez más, puesto que el 11 está incluido dentro de la amplitud de intervalo, no
hay razón para creer que algo está mal.

Problemas a resolver

1.- El Ayuntamiento, para planificar su política social, ha realizado una encuesta


en un barrio, basada en un muestreo aleatorio a 36 adultos, sobre los ingresos
medios mensuales, obteniéndose 728 pesos de media y 120 pesos de desviación
estándar. Estimar el valor medio de los ingresos en dicho barrio con un intervalo
de confianza del 95% y del 99%.
2.- Una encuesta realizada sobre 40 aviones comerciales, revela que la
antigüedad media de estos es de 13,41 años, con una desviación estándar de la
muestra es s=8,28
¿Cuál es con un 90% de confianza la antigüedad media de toda la flota
comercial?
3.- En una muestra de 50 jóvenes encontramos que la dedicación media diaria al
ocio es de 400 minutos y la desviación estándar de la muestra de 63 minutos.
Calcular el intervalo de confianza de la media de la población al 95% de nivel de
confianza.
4.- Una muestra aleatoria de 60 personas tiene una media de 235 mg/dl
(miligramos por decilitro) en medidas de colesterol. Suponiendo que la desviación

119
estándar de la variable que mide las unidades de colesterol es s=28 mg/dl, se
pide:
a) Calcular el intervalo de confianza, con un nivel de confianza 0'95 para la media
de la población.

Estimación del intervalo de confianza para la media (σ desconocida)

Así como la media poblacional µ suele ser desconocida, rara vez se conoce la
desviación estándar real de la población σ. Por lo tanto se requiere desarrollar una
estimación del intervalo de confianza de µ usando solo los estadísticos de
muestra: ẋ y S (media y desviación estándar de la muestra).

La distribución t (de t-Student) es una distribución de probabilidad que surge del


problema de estimar la media de una población normalmente distribuida cuando el
tamaño de muestra es pequeño.

Se utiliza para la determinación de las diferencias entre dos medias muestrales y


para la construcción del intervalo de confianza cuando se desconoce la desviación
estándar de una población y ésta debe ser estimada a partir de los datos de una
muestra

Formula de intervalo de confianza para la media (σ desconocida)

ẋ ± tn-1 S/√n o ẋ - tn-1 S/√n ≤ µ ≤ ẋ + tn-1 S/√n

Ejercicio:

Una empresa de remodelaciones selecciona una muestra de 100 facturas de la


población de facturas de ventas durante el mes; la media de la muestra de las 100
facturas de ventas es de $110.27, con una desviación estándar de $28.95. Para
un nivel de confianza del 95% y 99 grados de libertad.

120
Para determinar el valor crítico (tn-1) se busca en la Tabla de valores críticos de t
(ver tabla al final) Las columnas de la tabla representan el área de la cola
superior de la distribución t. Cada fila representa el valor t determinado para cada
grado de libertad específico.

Por ejemplo, con 99 grados de libertad, si se quiere un nivel de confianza del 95%
significa que el 2.5% de los valores, es decir un área de 0.025, se encuentra en
cada extremo de la distribución. Buscando en la columna para un área de la cola
superior de 0.025 y en la fila correspondiente a 99 grados de libertad, se obtiene
un valor crítico para t de 1.9842 (ver figura). Entonces sustituimos:

ẋ ± tn-1 S/√n = 110.27± (1.9842) 28.95


√100

=110.27± (1.9842) 2.895 =110.27± 5.74 $104.53 ≤ µ ≤ $116.01

121
122
123
PRUEBA DE HIPOTESIS

Una hipótesis es una proposición aceptable que ha sido formulada a través de la


recolección de información y datos, aunque no está confirmada sirve para
responder de forma tentativa a un problema con base científica.

Una hipótesis puede usarse como una propuesta provisional que no se pretende
demostrar estrictamente, o puede ser una predicción que debe ser verificada por
el método científico. En el primer caso, el nivel de veracidad que se otorga a una
hipótesis dependerá de la medida en que los datos empíricos apoyan lo afirmado
en la hipótesis. Esto es lo que se conoce como contrastación empírica de la
hipótesis o bien proceso de validación de la hipótesis. Este proceso puede
realizarse mediante confirmación (corroborar, dar validez) o mediante verificación
(demostrar o comprobar que es verdadera una cosa de la que se dudaba).

Hipótesis nula y alternativa

En un trabajo de investigación generalmente se plantean dos hipótesis


mutuamente excluyentes: la hipótesis nula o hipótesis de nulidad (H0) y la
hipótesis alternativa o de investigación (H1).

La hipótesis nula (H0), siempre es una de status quo: expresa que el fenómeno o
proceso está funcionando de manera adecuada, de acuerdo con la norma o las
especificaciones.

La hipótesis de investigación (H1), es una afirmación especial cuya validez se


pretende demostrar, si las pruebas empíricas no apoyan decididamente la
hipótesis de investigación se aceptará la hipótesis nula y se abandona la hipótesis
de investigación. La hipótesis alternativa es opuesta a la hipótesis nula, la primera
es cierta si la segunda es falsa.

El análisis estadístico de los datos servirá para determinar si se puede o no


aceptar H1. Cuando se rechaza H0, significa que el factor estudiado ha influido
significativamente en los resultados y es información relevante para apoyar la

124
hipótesis de investigación H1. Plantear hipótesis de investigación (H1) que no sea
excluyente con H0 supondría una aplicación incorrecta del razonamiento
estadístico.

Ejemplo:

¿Es el peso medio de las cajas de cereal incluidas en la muestra de una empresa
de cereales un valor congruente con lo que usted esperaría si la media de toda la
población de cajas de cereales es de 368 gr? ¿o puede usted inferir que la media
poblacional no es igual a 368 gramos porque la media muestral es
significativamente diferente a 368 gramos?.

Hipótesis nula (H0): El llenado medio concuerda con la especificación de 368


gramos. H0: µ = 368

Hipótesis de investigación o alternativa (H1): El llenado medio no concuerda con la


especificación de 368 gramos. H1: µ ǂ 368

En la metodología de prueba de hipótesis, no poder rechazar la hipótesis nula no


comprueba que sea cierta. Usted nunca podrá demostrar que la hipótesis nula es
correcta, porque la decisión se basa solo en información de la muestra, no en
toda la población. Por lo tanto, si no se rechaza la hipótesis nula, solo puede
concluir que no existe evidencia suficiente para garantizar su rechazo.

Los siguientes puntos fundamentales resumen las hipótesis nula y alternativa.

 La hipótesis nula H0 representa al status quo o creencia actual en una


situación
 La hipótesis alternativa H1 es lo opuesto a la hipótesis nula H0 y representa
una afirmación de investigación o inferencia específica que quisiera
demostrar.
 Si se rechaza la hipótesis nula, tiene una prueba estadística de que la
hipótesis alternativa es correcta.

125
 Si no se rechaza la hipótesis nula, entonces no ha podido demostrar la
hipótesis alternativa. El no poder demostrar la hipótesis alternativa no
quiere decir que haya demostrado la hipótesis nula.
 La hipótesis nula siempre se refiere a un valor específico del parámetro
poblacional µ, no a un estadístico de muestra (ẋ).
 El enunciado que describe la hipótesis nula siempre contiene un signo de
igual relacionado con el valor específico del parámetro poblacional.
 El enunciado que describe la hipótesis alternativa nunca contiene un signo
de igual relacionado con el valor específico del parámetro poblacional.

Valor crítico del estadístico de prueba

La lógica subyacente a la metodología de prueba de hipótesis radica en


determinar qué tan probable es que la hipótesis nula sea cierta, considerando la
información recabada en una muestra. El estadístico (ẋ) es una estimación del
parámetro poblacional (µ). Si la hipótesis nula es cierta cabe esperar que el
estadístico (ẋ) sea cercano al parámetro (µ). Si ẋ es cercano a µ, no se cuenta con
evidencia suficiente para rechazar H0. Pero si existe una gran diferencia entre µ y ẋ
establecida en la hipótesis, usted concluirá que ésta última es falsa.

Regiones de rechazo y aceptación

La distribución muestral del estadístico de muestra ẋ, se divide en dos regiones:


una de rechazo o región crítica y una de aceptación o no rechazo.

Si el estadístico de prueba queda en la región de aceptación o de no rechazo, no


rechace la hipótesis nula. Por el contrario si queda en la región de rechazo, se
rechaza la hipótesis nula.

126
Error tipo I y II

Al utilizar un estadístico de muestra para tomar decisiones sobre el parámetro


poblacional, existe el riesgo de llegar a una conclusión equivocada, se puede
cometer error tipo I y el error tipo II.

El error tipo I se presenta cuando se rechaza la hipótesis nula H0 siendo cierta y


no debería rechazarse. La probabilidad de que se presente un error tipo I es ɑ.

El error tipo II se presenta cuando no se rechaza la hipótesis nula H0 siendo falsa


y debería rechazarse. La probabilidad de que se presente un error tipo II es β.

La probabilidad de cometer un error tipo denotado por ɑ, se denomina nivel de


significancia del estadístico de prueba, por lo general se seleccionan nivel de
0.01, 0.5 o 0.10. Después de especificar el valor de ɑ, usted conoce el tamaño de
la región de rechazo, porque ɑ es la probabilidad de rechazo bajo la hipótesis nula.
A partir de este hecho, se determina el valor o valores críticos que dividen las
zonas de rechazo y aceptación.

El complemento de la probabilidad de un error tipo I (1- ɑ) se denomina


coeficiente de confianza. Al multiplicarlo por cien (1- ɑ) x 100, el coeficiente de
confianza produce el nivel de confianza. El coeficiente de confianza (1- ɑ),
expresa la probabilidad de que la hipótesis nula no se rechace cuando es cierta y
no debe rechazarse. El nivel de confianza de una prueba de hipótesis es (1- ɑ) x
100.

127
La posibilidad de cometer el error tipo II (β) depende de la diferencia que existe
entre los valores hipotéticos y real del parámetro poblacional. Si la diferencia que
existe entre los valores hipotético y real del parámetro poblacional es grande, β es
pequeña y si la diferencia entre los valores hipotético y real del parámetro
poblacional es pequeño β es mayor.

Prueba Z de hipótesis para la media con σ conocida

Cuando se conoce la desviación estándar poblacional (σ), y si tiene una


distribución normal se utiliza la prueba de Z de hipótesis para la media (σ
conocida):

Z= ẋ-µ
σ
√n

Si la población no tiene una distribución normal, todavía se puede utilizar la prueba


Z si el tamaño de la muestra es lo bastante grande como para que tenga efecto el
teorema del límite central. La ecuación anterior define el estadístico de prueba Z
para determinar la diferencia que existe entre la media muestral ẋ y la media
poblacional µ cuando se conoce la desviación estándar poblacional σ.

El resultado obtenido de la prueba Z, se compara con los valores críticos. Si se


utiliza un nivel de significancia de 0.05, este valor de divide entre dos 0.05/2=
0.025. De esta forma la distribución normal tiene como resultado un área
acumulada de 0.025 bajo el valor crítico inferior (izquierda de la gráfica) y un área
acumulada de 0.975 bajo el valor critico superior. Con este nivel de confianza, de
acuerdo a la Tabla de distribución normal estandarizada acumulativa los valores
críticos que dividen las regiones de rechazo y aceptación son -1.96 y + 1.96. Los
valores de Z mayores que + 1.96 y menores que -1.96 indican que la media
muestral ẋ está muy alejada de la media poblacional µ, por lo que sería muy poco
probable que se presentara uno de estos valores si Ho fuera verdadera.

128
Por lo tanto la regla de decisión es:

Rechace Ho si Z˃ +1.96 o si Z˂ -1.96


De lo contrario, no rechace Ho.

Ejemplo:

Una empresa de empaquetado de cereales quiere determinar si el proceso de


llenado de cereal funciona de manera adecuada, es decir sus paquetes presentan
los 368 gramos especificados y no requiere acción correctiva. Para evaluar esto,
se toma una muestra aleatoria de 25 cajas, pesa cada una y define una hipótesis
nula y alternativa:

Hipótesis nula (H0): El llenado medio concuerda con la especificación de 368


gramos. H0: µ = 368

Hipótesis de investigación o alternativa (H1): El llenado medio no concuerda con la


especificación de 368 gramos. H1: µ ǂ 368

El resultado del pesado de las 25 cajas indica una media muestral de ẋ=372.5
gramos y que la desviación estándar de la población es de 15 gramos

129
Z= ẋ-µ = 372.5-368 = +1.50
σ 15
√n √25

Puesto que el estadístico de prueba Z= +1.50 se encuentra entre 11.96 y + 1.96,


no se rechaza Ho, la conclusión se redacta de la siguiente manera: “no existe
suficiente evidencia de que el llenado medio sea diferente a 368 gramos”

Prueba t de hipótesis para la media (σ desconocida)

En la mayoría de las situaciones de prueba de hipótesis que implican datos


numéricos, no se conoce la desviación estándar poblacional σ. En su lugar, se
utiliza la desviación estándar de la muestra S. Si se supone que la población tiene
una distribución normal, la distribución muestral de la media seguirá una
distribución t con n-1 grados de libertad. Si la población no tiene una distribución
normal se puede utilizar la prueba t si el tamaño es suficientemente grande (˃
120).

La ecuación siguiente define al estadístico prueba t para determinar la diferencia


que existe entre la media muestral ẋ y la media poblacional µ cuando se utiliza la
desviación estándar muestral S.
t= ẋ- µ
S
√n
130
En los últimos cinco años una empresa presenta un monto medio por factura de
120 pesos. Se utiliza la prueba de hipótesis para tratar de demostrar que el monto
medio por factura está aumentando o disminuyendo.

Paso 1. Definir hipótesis nula y de investigación.

Ho: µ= 120 H1: µǂ 120

La hipótesis de investigación H1 contiene la información que se trata de


comprobar, si se rechaza la hipótesis nula, se tendrán evidencias estadísticas de
que la cantidad media por factura no supera los 120. Si la conclusión estadística
es “no rechazar H0”, entonces se concluirá que existe n evidencias suficientes
para demostrar que la cantidad media es distinta de la media a largo plazo de 120.

Paso 2. Se selecciona un tamaño de muestra, que en este caso es n= 12. Se


decide utilizar un nivel de significancia ɑ=0.05

Paso 3. Puesto que no se conoce σ, se utiliza la distribución t y el estadístico de


prueba t. Se supone que la población de facturas tiene una distribución normal.

Paso 4. Para una muestra de tamaño n, el estadístico de prueba t sigue una


distribución t con n-1 grados de libertad. En la tabla “valores críticos de t”. Para
localizar el área de cola superior, el nivel de significancia se divide entre dos:
ɑ=0.05/2= 0.025, con este dato y n-1 grados de libertad= 12-1=11, se localiza

131
Determinación del valor crítico para un área de 0.025 en cada cola, con 11
grados de libertad, a partir de la tabla de valores críticos de t.

Puesto que la hipótesis de investigación H1 de que µǂ120 es no direccional, el


área en la región de rechazo de la cola izquierda (inferior) de la distribución t es
0.025, y el área en la región de rechazo de la cola derecha (superior) de la
distribución t es de 0.025.

A partir de la tabla t, los valores críticos son ± 2.201. La regla de decisión es:

Rechazar Ho si t ˂ -t11 = - 2.201 O si t ˂ -t11 = + 2.201

Paso 5. Los siguientes datos son las cantidades de la muestra de 12 facturas, con
la media ẋ y la desviación estándar S:

110.59 108.98
75.71 93.32
127.46 152.22
128.58 91.97
107.26 111.45
135.11 111.56
Media 112.85 20.79 desviación estándar

132
t= ẋ- µ
S
√n

=112.85-120 =-1.19
20.80
√12

Paso 6. Puesto que – 2.201˂ t=-1.19˂+2.201, no se rechaza la hipótesis nula. No


existen evidencias suficientes para concluir que la cantidad media por factura no
supera los 120. Debe sugerirse que el monto medio por factura no ha cambiado.

REGRESIÓN LINEAL SIMPLE

INTRODUCCIÓN
Si se presenta una relación entre una variable denominada dependiente y otra
denominada independiente, como, por ejemplo, las existentes entre la experiencia
profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de
personas, la producción agraria y la cantidad de fertilizantes utilizados, etc., puede
darse el problema de que la variable dependiente asuma múltiples valores para
una combinación de valores de las variables independientes.

La variable dependiente es la variable que desea predecir. La variable


independiente es aquélla que es manipulada por el investigador en un
experimento con el objeto de estudiar cómo incide sobre la expresión de la
variable dependiente.

Variable dependiente e independiente

133
 Una variable independiente a aquélla que es manipulada por el
investigador en un experimento con el objeto de estudiar cómo incide sobre
la expresión de la variable dependiente. Esto significa que las variaciones,
ejercidas por el investigador sobre la variable independiente repercutirán
en variaciones en la variable dependiente. También se la conoce como
variable explicativa y suele denotarse como X
 A la variable dependiente se la conoce como variable explicada. Esta
dependen de los valores que tome la otra variable. En una función suele
estar representada por Y, en el eje ordenadas (vertical).
 La variable Y está en función (depende) de la variable X, que es la variable
independiente.

Ejemplos

El precio que pagamos por frutas, verduras u otra mercancía depende del número
de kilogramos que compremos.

x = Kg de mercancía 1 2 3 4 5

y = P r ec i o e n $ 2 4 6 8 10

El eje de ordenadas o eje Y es el eje vertical de un sistema de coordenadas


cartesianas, el eje de las abscisas, o eje X, es el eje horizontal.

134
Si se dan las relaciones descritas, se suele recurrir a los estudios de regresión
en los cuales se obtiene una nueva relación pero de un tipo especial
denominado función, en la cual la variable independiente se asocia con un
indicador de tendencia central de la variable dependiente. Cabe recordar que
en términos generales, una función es un tipo de relación en la cual para cada
valor de la variable independiente le corresponde uno y sólo un valor de la
variable dependiente.

Además de predecir los valores de la variable dependiente, el análisis de regresión


también permite identificar el tipo de relación matemática que existe entre la
variable dependiente e independiente, para cuantificar el efecto que los cambios
ejercidos sobre la variable independiente tienen sobre la variable dependiente.

REGRESIÓN LINEAL SIMPLE


La regresión lineal simple y la correlación son dos técnicas estadísticas que se
pueden utilizar para solucionar problemas comunes en los negocios. Muchos
estudios se basan en la creencia de que es posible identificar y cuantificar alguna
relación funcional entre dos o más variables, donde una variable depende de la
otra variable. Se puede decir que Y depende de X, en donde Y y X son dos
variables cualquiera en un modelo de Regresión Simple.

"Y es una función de X"


Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
135
X es la variable independiente.

En el Modelo de Regresión es muy importante identificar cuál es la variable


dependiente y cuál es la variable independiente. Este modelo establece que Y es
una función de sólo una variable independiente y se representa así:

Y = f (X)
"Y está regresando por X"

La variable dependiente Y es la variable que se desea explicar o predecir.


También se le llama regresando o variable de respuesta. La variable
independiente X se le denomina variable explicativa o regresor y se le utiliza para
explicar Y.

ANÁLISIS ESTADÍSTICO: REGRESIÓN LINEAL SIMPLE


En el estudio de la relación funcional entre dos variables poblacionales, una
variable X, llamada independiente, explicativa o de predicción y una variable Y,
llamada dependiente o variable respuesta, presenta la siguiente notación:

Yi = β0 + β1 Xi + ei

Donde:

Yi = variable dependiente (de respuesta)


β0 = intersección en Y para la población
β1= pendiente para la población
Xi = variable independiente (explicatoria)
ei= error aleatorio en Y para la observación i

ECUACIÓN DE REGRESIÓN LINEL SIMPLE

136
Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir,
encontrar los valores de a y b con los datos observados de la muestra. El método
de estimación es el Método de Mínimos Cuadrados, mediante el cual se obtiene:

Luego, la ecuación de regresión muestral estimada es: Yi=bo + b1Xi


Que se interpreta como:

Yi= valor predicho de Y para la observación i


Xi= valor de X para la observación i
bo= intersección de la muestra en Y
b1= pendiente de la muestra
a es el estimador de a
Está expresado en las mismas unidades de Y por cada unidad de X. Indica el
número de unidades en que varía Y cuando se produce un cambio, en una unidad,
en X (pendiente de la recta de regresión). Un valor negativo de b sería
interpretado como la magnitud del decremento en Y por cada unidad de aumento
en X.

PROBLEMA
Se desea pronosticar las ventas anuales para todas las tiendas nuevas de una
marca, con base en el tamaño de los establecimientos. Para examinar la relación
entre la superficie de la tienda (en pies cuadrados) y las ventas anuales, se
selecciono una muestra de 14 tiendas (ver tabla).

137
TIENDA PIES 2 VENTAS ANUALES

1 1.7 3.7
2 1.6 3.9
3 2.8 6.7
4 5.6 9.5
5 1.3 3.4
6 2.2 5.6
7 1.3 3.7
8 1.1 2.7
9 3.2 5.5
10 1.5 2.9
11 5.2 10.7
12 4.6 7.6
13 5.8 11.8
14 3 4.1

Para realizar el análisis por el Método de mínimos cuadrados mediante Excel, se


hace de la siguiente forma: 1) En la barra de menú seleccionar Datos, 2) Análisis
de datos, 3) Regresión, 4) Aceptar, 5) En rango Y de entrada colocar variables
dependientes (ventas anuales), 6) En rango X de entrada colocar variables
independientes (pies2), 7) marcar con √ nivel de confianza, residuos, residuos
estándares, gráficos residuales, curva de regresión ajustada y gráfico de
probabilidad normal; dar “aceptar”.

138
8) los resultados obtenidos con Excel son los siguientes:

Tabla 1. Estadísticas de regresión

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.95088
Coeficiente de determinación R^2 0.90418
R^2 ajustado 0.89619
Error típico 0.96638
Observaciones 14.00000
Tabla 2. Análisis de varianza (ANOVA)
Grados de Suma de Valor crítico de
libertad cuadrados Promedio de los cuadrados F F
Regresión 1.00000 105.74761 105.74761 113.23351 0.00000
Residuos 12.00000 11.20668 0.93389
Total 13.00000 116.95429

Tabla 3. Tabla de coeficientes

Error Estadístico Inferior Superior Inferior Superior


Coeficientes Probabilidad
típico t 95% 95% 95.0% 95.0%
Intercepción 0.96447 (b0) 0.52619 1.83293 0.09173 -0.18200 2.11095 -0.18200 2.11095
Variable X 1 1.66986 (b1) 0.15693 10.64112 0.00000 1.32795 2.01177 1.32795 2.01177

139
En la tabla 3 se observan los coeficientes b0= 0.964 y b1= 1.669. Por lo tanto, la
línea de predicción para estos datos es: Yi= 0.964 + 1.669i

La pendiente b1 es+ 1.669. Esto significa que para cada incremento de 1 unidad
en X, se estima que el valor promedio de Y se incrementará por 1.669 unidades.
En otras palabras por cada incremento de 1.0 mil pies cuadrados en el tamaño de
la tienda, se estima que la media de ventas anuales se incrementará por 1.669
millones. Por lo tanto la pendiente representa la porción de las ventas anuales que
se estima que variará de acuerdo con el tamaño de la tienda.

Variable X 1 Curva de regresión ajustada


14

12
VENTAS ANUALES

10

8
Y

6 Y
4 Pronóstico para Y

0
0 1 2 3 4 5 6 7
Variable X 1 SUPERFICIE DE LA TIENDA

140
GRÁFICOS DE CONTROL

Las gráficas de control son una herramienta ampliamente utilizada para analizar el
proceso de recolección secuencial de datos, permiten monitorear la variación de
una característica de productos o servicios a lo largo del tiempo. Con ellas se
estudia el desempeño pasado, se evalúan las condiciones presentes o predicen
las condiciones futuras. La información obtenida al analizar una gráfica de control,
constituye la base para el proceso de mejoramiento. Con ellas se analizan
variables categóricas, discretas y continuas. Las gráficas de control hacen énfasis
en separar las causas de variación especiales de las causas comunes de
variación.

De esta forma la idea convencional de inspeccionar el producto final y eliminar las


unidades que no cumplen con las especificaciones una vez terminado el proceso,
es reemplazada por una estrategia más económica de prevención antes y durante
del proceso, con el fin de lograr que precisamente estos productos o servicios
lleguen al consumidor sin defectos. Pues las variaciones de calidad producidas
antes y durante el proceso pueden ser detectadas y corregidas gracias al empleo
masivo de Gráficas de Control.

Como se menciono, para el enfoque de las gráficas de control existen dos tipos de
variación. El primer tipo es una variabilidad aleatoria debido a "causas al azar" o
"causas comunes". Estas representan cambios que existen en un proceso, son
fluctuaciones que operan aleatoriamente o por casualidad.

El segundo tipo de variabilidad, en cambio, representan un cambio real en el


proceso atribuible a "causas especiales" o “causas asignables de variación”, las
cuales, por lo menos teóricamente, pueden ser identificadas y eliminadas.
Representan grandes fluctuaciones en los datos que no son inherentes al
proceso.

141
De esta forma, un proceso se encuentra bajo control estadístico cuando la
variabilidad se debe sólo a "causas comunes" y está fuera de control cuando se
debe a “causas especiales”.

La distinción entre las dos causas de variación es importante porque las causas
especiales no forman parte del proceso y son corregibles, sin cambiar el sistema,
Las causas comunes se reducen cambiando el sistema.

Errores comunes en las gráficas de control

El primer tipo de error implica la creencia de que un valor observado representa


una causa especial, cuando en realidad se debe a una causa común; tratar una
causa común como especial tiene como consecuencia el sobreajuste o
manipulación de un proceso, lo que aumenta la variación del proceso.

El segundo tipo de error implica tratar una causa especial como si fuera común y
da como resultado no tomar una acción correctiva inmediata cuando es necesaria.

Situaciones de las gráficas de control

Para cada uno de los gráficos de control, existen dos situaciones diferentes; a)
cuando no existen valores especificados y b) cuando existen valores
especificados. Antes de utilizar las Gráficas de Control por variables, debe tenerse
en consideración lo siguiente:

 El proceso debe ser estable y los datos o deben obedecer a una


distribución normal
 El número de datos a considerar debe ser de aproximadamente 20 a 25
subgrupos con un tamaño de muestras de 4 a 5, para que las muestras
consideradas sean representativas de la población.
 Los datos deben ser clasificados teniendo en cuenta que, la dispersión
debe ser mínima dentro de cada subgrupo y máxima entre subgrupos
 Se deben disponer de tablas estadísticas

142
Construcción de gráficos de control

Para construir un gráfico de control, se recolectan muestras (subgrupos) de las


salidas de un proceso a lo largo del tiempo. Para cada subgrupo o muestra se
calcula un estadístico asociado con una variable: Los estadísticos utilizados
incluyen la fracción disconforme1, la media y el rango de una variable numérica.
Entonces se grafican los valores contra el tiempo y se agregan los límites de
control a la gráfica. La forma más común de grafica de control establece limites de
control que están ± 3 desviaciones estándar de la medida estadísitica de interés.

La ecuación media del proceso ± 3 desviaciones estándar define, en general,


los límites de control superior e inferior para la gráficas de control. El límite
superior (LCS o UCL) es = media del proces + 3 desviaciones estándar, y el
límite inferior (LIC o LCL) = media del proceso - 3 desviaciones estándar.

Entonces se grafican los valores contra el tiempo y se agregan los límites de


control a la gráfica.

Patrones de las gráficas de control

1
El porcentaje o fracción disconforme se define como el cociente del número de artículos
disconformes de una población entre el número total de artículos que contiene ésta última. Los
artículos pueden tener varias características de calidad que el inspector examina simultáneamente.
Si no está conforme con el estándar de una o más características, se clasificará como disconforme.

143
Panel A. No existe un patrón aparente de los valores a lo largo del tiempo y no hay
puntos que caigan fuera del límite de control de 3 desviaciones estándar. El
proceso parece estable y contiene causas comunes de variación.

Panel B. Contiene dos puntos que caen fuera de los límites de control de las 3
desviaciones estándar. Se debe investigar estos puntos para tratar de determinar
las causas especiales que llevan a su ocurrencia.

Panel C. No tienen ningún punto fuera de los límites de control, tiene una serie de
puntos consecutivos por arriba del valor promedio y una serie de puntos
consecutivos por debajo del valor promedio. Además se observa claramente una
tendencia global descendente, se debe investigar para determinar que ha causado
este patrón.

Tipos de control de procesos

Cuando una gráfica de control exhibe un punto fuera de los límites de control o
una tendencia (como en B y C) está fuera de control y es impredecible. Un
proceso fuera de control contiene tanto causas comunes de variación como
causas especiales y estas últimas no forman parte del diseño del proceso, si las
causas especiales de variación actúan en detrimento del producto o servicio, se
requiere elaborar planes para eliminar la causa; por el contrario si éstas
incrementan la calidad del producto o servicio, se debe cambiar el proceso para
incorporarla dentro del diseño del proceso.

Un proceso bajo control, contiene únicamente causas comunes de variación


puesto que son inherentes al proceso en sí mismo. Un proceso bajo control es
predecible. En ocasiones se denomina que están en un estado de control
estadístico.

144
Tipos de gráficas de control

La gráfica p, control para la proporción de artículos disconformes

Las graficas de atributos se utilizan para variables categóricas o discretas, como la


gráfica p, que se utiliza cuando los elementos que son muestreados se clasifican
de acuerdo a si se conforman o no con los requerimientos definidos
operacionalmente. La gráfica p ayuda a monitorear y analizar la proporción de
elementos disconformes que están en muestras repetidas (subgrupos) que se
seleccionan de un proceso.

Una empresa hotelera quiere conocer la proporción de habitaciones con ausencia


de comodidad o mal funcionamiento de electrodomésticos. Se recolectaron los
datos de las disconformidades de una muestra de 200 habitaciones (tabla 1)
durante 28 días.

Fórmula de límites de control para la gráfica:

p± 3 √p (1-p)
n

Límite superior de control (LSC)= p+ 3 √p (1-p)


n

Límite inferior de control (LIC)= p- 3 √p (1-p)


n

k
p= Ʃpi
i=1
k

En donde:

Pi= xi/ni = proporción de elementos disconformes en el subgrupo i


n= tamaño promedio del subgrupo
k= número de subgrupos seleccionados

145
Tabla 1

Habitaciones Habitaciones no proporción


Día
estudiadas preparadas =c2/b2

1 200 16 0.080
2 200 7 0.035
3 200 21 0.105
4 200 17 0.085
5 200 25 0.125
6 200 19 0.095
7 200 16 0.080
8 200 15 0.075
9 200 11 0.055
10 200 12 0.060
11 200 22 0.110
12 200 20 0.100
13 200 17 0.085
14 200 26 0.130
15 200 18 0.090
16 200 13 0.065
17 200 15 0.075
18 200 10 0.050
19 200 14 0.070
20 200 25 0.125
21 200 19 0.095
22 200 12 0.060
23 200 6 0.030
24 200 12 0.060
25 200 18 0.090
26 200 15 0.075
27 200 20 0.100
28 200 22 0.110
k=28 n=200 2.315
pi=2.315

146
Para los datos de la tabla anterior

k=28
k
Pi= 2.315

n= 200 p= Ʃ pi

k= 28 i=1

p= Ʃ pi =2.315
=0.0827

i=1
28

0.0827±√ (0.0827)(0.9173) = 0.0584


p± 3 √p (1-p) 200
n

LSC= 0.0827+0.0584= 0.1411

LIC= 0.0827-0.0584=0.0243

147
Grafica p, control para la proporción
de artículos disconformes
0.140
0.120
0.100
0.080
0.060
0.040
0.020
0.000
1 3 5 7 9 11 13 15 17 19 21 23 25 27

La figura presenta un proceso en estado de control estadístico, con los puntos


individuales alrededor de p sin ningún patrón y con todos los puntos dentro de los
límites de control. Por lo tanto cualquier mejoría en el proceso analizado deberá
provenir de la reducción de la causa común de variación. Tal reducción requiere
un cambio en el proceso.

Procedimiento para realizar la gráfica p en Excel

Una vez que se tiene la base de datos como la tabla 1 se elige el menú “insertar”,
posteriormente dentro de éste se seleccionan “gráficos de línea”, allí se opta por
“gráficas de línea con marcadores”.

148
Una vez seleccionada la opción anterior aparece un recuadro en blanco, se coloca
el cursor sobre éste y se da clik en el botón derecho, allí parece un menú y se
elige “seleccionar datos”

Aparecerá la siguiente ventana, donde se selecciona “agregar”

Y subsecuentemente la ventana siguiente:

149
En la línea de nombre de la serie se colocan para éste caso los “días” y en
“valores de las serie” los datos de proporción y finalmente se arregla el formato de
la gráfica.

Grafíca p para control de la proporción de artículos


disconformes
0.140

0.120

0.100

0.080

0.060

0.040

0.020

0.000
Días

Como se observa en la gráfica la línea de 0.080 corresponde al valor de p, el


límite superior de control esta en 0.1411 y el límite inferior de control está en
0.0243.

150
Gráfica de control para el rango y la media

Las variables numéricas comunes incluyen tiempo, dinero y peso, las gráficas de
control de variables son más sensibles para detectar la variación por causas
especiales respecto a la gráfica p. Las gráficas de control, generalmente se usan
en parejas, una permite monitorear la dispersión o variabilidad, y la otra monitorea
el promedio del proceso.

Primero se debe examinar la gráfica de dispersión porque, si indica la presencia


de condiciones fuera de control, la interpretación del diagrama para la media será
falseada.

La gráfica R

Se utiliza la gráfica de rango únicamente cuando el tamaño de muestra sea de 10


o menos, si es mayor de 10 es preferible utilizar una gráfica de desviación
estándar. La gráfica R permite determinar si la variabilidad en un proceso está
bajo control o si los cambios en la cantidad de variabilidad se están dando a lo
largo del tiempo.

Si el rango del proceso está bajo control, entonces la cantidad de variación en el


proceso es consistente a lo largo del tiempo, y los resultados de la gráfica R serán
útiles para desarrollar los límites de control del promedio.

Para desarrollar los límites de control para el rango, se requiere una estimación
del rango promedio y de la desviación estándar del rango. Estos límites dependen
de dos constantes: factor d2, que representa la relación entre la desviación
estándar y el rango para tamaños de muestra que varían, y el factor d3, que
representa la relación entre la desviación estándar y el error estándar del rango
para tamaños de muestra que varían.

Límites de control para el rango

R±3R d3
d2

151
Límite de control superior (LCS)= R+3R d3
d2

Límite de control inferior (LCI)= R-3R d3


d2

Donde: R= Ʃ Ri
i=1
k

Problema:

Se definió operacionalmente la cantidad de tiempo para entregar el equipaje. Se


registraron datos durante un periodo de 4 semanas. Se seleccionaron subgrupo
(muestras) de cinco entregas del turno de la tarde de cada día (ver tabla 2).

Tabla 2. TIEMPOS DE ENTREGA DE EQUIPAJE EN MINUTOS

DIA A B C D E MEDIA RANGO


1 6.7 11.7 9.7 7.5 7.8 8.68 5
2 7.6 11.4 9 8.4 9.2 9.12 3.8
3 9.5 8.9 9.9 8.7 10.7 9.54 2
4 9.8 13.2 6.9 9.3 9.4 9.72 6.3
5 11 9.9 11.3 11.6 8.5 10.46 3.1
6 8.3 8.4 9.7 9.8 7.1 8.66 2.7
7 9.4 9.3 8.2 7.1 6.1 8.02 3.3
8 11.2 9.8 10.5 9 9.7 10.04 2.2
9 10 10.7 9 8.2 11 9.78 2.8
10 8.6 5.8 8.7 9.5 11.4 8.8 5.6
11 10.7 8.6 9.1 10.9 8.6 9.58 2.3
12 10.8 8.3 10.6 10.3 10 10 2.5
13 9.5 10.5 7 8.6 10.1 9.14 3.5
14 12.9 8.9 8.1 9 7.6 9.3 5.3
15 7.8 9 12.2 9.1 11.7 9.96 4.4
16 11.1 9.9 8.8 5.5 9.5 8.96 5.6
17 9.2 9.7 12.3 8.1 8.5 9.56 4.2

152
18 9 8.1 10.2 9.7 8.4 9.08 2.1
19 9.9 10.1 8.9 9.6 7.1 9.12 3
20 10.7 9.8 10.2 8 10.2 9.78 2.7
21 9 10 9.6 10.6 9 9.64 1.6
22 10.7 9.8 9.4 7 8.9 9.16 3.7
23 10.2 10.5 9.5 12.2 9.1 10.3 3.1
24 10 11.1 9.5 8.8 9.9 9.86 2.3
25 9.6 8.8 11.4 12.2 9.3 10.26 3.4
26 8.2 7.9 8.4 9.5 9.2 8.64 1.6
27 7.1 11.1 10.8 11 10.2 10.04 4
28 11.1 6.6 12 11.5 9.7 10.18 5.4
Sumas: 265.38 97.5

k= número de subgrupos seleccionados = 28

k
Ʃ Ri = sumatoria de rangos = 97.5
i=1

k
R= Ʃ Ri = 97.5 = 3.482
i=1 28
k
n= 5

R±3R d3 LCS= R+3R d3 LCI= R-3R d3


d2 d2 d2

Constantes

d2= 2.362 d3= 0.864

153
3.482±3 (3.482) [ 0.864 ] = 3.482±3.880
2.326

Por lo tanto

LCS= 3.482+3.880= 7.362


LCI= 3.482-3.880˂0

El LCI no existe porque es imposible obtener un rango negativo.

La gráfica ẋ

La gráfica de control ẋ utiliza subgrupos cada uno de tamaño n para k periodos


consecutivos de tiempo. Para calcular los límites de control para el promedio, se
necesita calcular la media de los promedios de los subgrupos (denominada ẋ), y la
desviación estándar de la media (que se denomina error estándar de la media σ ẋ).
El estimado de la desviación estándar de la media es una función del factor d2 ,

154
que representa la relación entre la desviación estándar y el rango para tamaño de
muestras variables.

Límite de control para la gráfica ẋ

=X±3 R___ LCI= X-3 R___


d2 √n LCS= X+3 R___ d2√n
d2√n

Donde
k k
R= Ʃ Ri
X= Ʃ Xi
i=1
i=1
k
k

A partir de los datos de la Tabla 2 “tiempos de entrega de equipaje en minutos”

k= número de subgrupos seleccionados = 28

k
Ʃ Xi = sumatoria de las medias de los subgrupos seleccionados = 265.38
i=1

k
Ʃ Ri = sumatoria de los rangos de los subgrupos seleccionados= 97.5
i=1

= k k

X= Ʃ Xi = 265.38 = 9.478 R= Ʃ Ri = 97.5 = 3.482


i=1 28 i=1 28
k k

155
Aplicando

LCS= X+3 R___ LCI= X-3 R___


=X±3 R___ d2√n d2√n
d2 √n

= 9.478 ± 3 3.482 =
2.362√5
= 9.478 ± 2.008

Por tanto:
LCS= 9.478 + 2.008 = 11.486
LCI= 9.478 - 2.008 = 7.470

Graficando

Gráfica X barra para los tiempos de entrega de


equipaje
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

La gráfica no revela ningún punto fuera de los límites de control así como tampoco
una tendencia. Aunque existe una cantidad considerable de variabilidad entre las
medias de los 28 subgrupos, y como ambas gráficas R y X barra están bajo
control, el proceso de entrega de equipaje se encuentra en estado de control
estadístico. Si se desea reducir la variación o la media del tiempo de entrega,
entonces se necesita cambiar el proceso.
156

También podría gustarte