Está en la página 1de 87

ANÁLISIS CUANTITATIVO I

LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

ÍNDICE
MENSAJE DE BIENVENIDA ................................................................................................. 3
REFERENCIAS DE ÍCONOS................................................................................................. 4
UNIDAD I ............................................................................................................................... 5
DEFINICIONES Y CONCEPTOS ESTADÍSTICOS ................................................................ 5
1.1. INTRODUCCIÓN......................................................................................................... 5
1.2. DEFINICIONES BÁSICAS ........................................................................................... 5
1.3. JUSTIFICACIÓN DEL USO DEL MUESTREO ............................................................ 7
1.4. RELEVAMIENTO DE DATOS ................................................................................... 10
1.5. TIPOS DE VARIABLES Y CLASIFICACIÓN.............................................................. 11
1.6. PRESENTACIÓN DE LA INFORMACIÓN ................................................................. 15
ACTIVIDAD I .......................................................................................................................................... 19
UNIDAD II .............................................................................................................................................. 20
ANÁLISIS DESCRIPTIVO UNIVARIADO .............................................................................................. 20
2.1. DISTRIBUCIONES DE FRECUENCIAS .................................................................... 20
2.2. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN .......................................... 25
2.3. MEDIDAS DE VARIABILIDAD ................................................................................... 32
2.4. FORMAS DE LA DISTRIBUCIÓN ............................................................................. 36
2.5. GRAFICOS................................................................................................................ 38
ACTIVIDAD II ......................................................................................................................................... 44
UNIDAD III ............................................................................................................................................. 48
TEORIA DE LA PROBABILIDAD .......................................................................................................... 48
3.1. INTRODUCCIÓN....................................................................................................... 48
3.2. DEFINICIONES BÁSICAS ......................................................................................... 48
3.3. DEFINICIÓN DE PROBABILIDAD ............................................................................. 49
3.4. CÁLCULO DE PROBABILIDADES ............................................................................ 50
3.5. ESTRATEGIAS PARA EL CALCULO DE PROBABILIDADES .................................. 53
3.6. TEOREMA DE BAYES .............................................................................................. 58
ACTIVIDAD III ........................................................................................................................................ 59
UNIDAD IV ............................................................................................................................................. 61
DISTRIBUCION DE PROBABILIDADES .............................................................................................. 61
4.1. VARIABLE ALEATORIA ............................................................................................ 61
4.2. VARIABLES ALEATORIAS DISCRETAS .................................................................. 61
4.3. VARIABLES ALEATORIAS CONTINUAS ................................................................. 68
ACTIVIDAD IV ....................................................................................................................................... 73
BIBLIOGRAFÍA ...................................................................................................................................... 76
ANEXO I: TABLA DE DISTRIBUCION BINOMIAL PUNTUAL.............................................................. 77
ANEXO II: TABLA DE DISTRIBUCION BINOMIAL ACUMULADA ....................................................... 80
ANEXO III: TABLA DE DISTRIBUCION POISSON .............................................................................. 83
ANEXO IV: TABLA DE DISTRIBUCION NORMAL ............................................................................... 87

2
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

MENSAJE DE BIENVENIDA

Estimados alumnos, bienvenidos al curso de Análisis Cuantitativo I modalidad distancia, de la


Licenciatura en Comercialización.

Durante el transcurso del mismo aprenderemos los conceptos básicos y herramientas


fundamentales para poder llevar a cabo un completo procesamiento y descripción de un
conjunto de datos. Esto nos permitirá conocer las características más sobresalientes del
mismo, determinar cómo se comportan estos datos, cuáles son sus valores de referencia y de
esta forma llevar a cabo un análisis e interpretación de resultados adecuado y acorde al
problema que estemos estudiando.

Para lograr esto, el curso se encuentra dividido conceptualmente en dos bloques teóricos. El
primero de ellos comprende las unidades I y II y el segundo las unidades III y IV.

Durante el transcurso del primer bloque aprenderemos las herramientas y métodos de


procesamiento estadístico más comunes, que involucran desde la identificación del tipo de
dato, su adecuada presentación en forma gráfica y en tablas, como así también la descripción
mediante medidas numéricas resumen, según la forma en que se encuentren disponibles los
datos. Llevar a cabo estos pasos nos permitirá trasladarnos desde un simple “conjunto de
datos” a obtener “información” potencialmente útil para luego ser interpretada y analizada.
Por último, aprenderemos a “leer” la información e interpretar los resultados más
sobresalientes, siempre dentro del contexto del problema a resolver.

En el segundo bloque aprenderemos conceptos que nos permitirán profundizar aún más en
nuestro análisis de datos. Conoceremos algunas de las herramientas para “modelizar” datos
con el fin de poder generar y extraer un mayor conocimiento de la información. La
modelización en estadística permite no solo describir más detalles de los datos, sino también
predecir comportamientos o patrones que a simple vista pueden parecer ocultos.
Aprenderemos a identificar y resolver problemas reales, mediante modelos de variables
específicos tales como la Distribución Binomial, Poisson e Hipergeométrica y conoceremos la
principal variable de modelización de la estadística clásica, la Distribución Normal. Esta última
es de vital importancia ya que nos permitirá adentrarnos en otros tipos de modelos y resolver
una gran variedad de situaciones.

Es importante destacar que el conocimiento adquirido en este curso, puede ser aplicado en
diversas áreas de la ciencia y situaciones que ameriten el manejo de datos, de allí la
importancia del mismo.

Espero que durante la lectura del presente módulo, puedan disfrutar de este aprendizaje y
puedan aprovechar este nuevo conocimiento para aplicarlo en futuras situaciones del ámbito
profesional. Los aliento a esforzarse y les deseo mucho éxito durante este camino que están
a punto de emprender.

3
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

REFERENCIAS DE ÍCONOS

Actividad en el Foro.

Actividad de Reflexión no obligatoria.

Actividad Grupal.

Actividad Individual.

Trabajo Práctico Actividad Obligatoria. Debe ser


enviada para su evaluación.

Atención.

Audio

Bibliografía. Lecturas Complementarias.

Glosario.

Página web - Internet.

Sugerencia.

Video.

4
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

UNIDAD I
DEFINICIONES Y CONCEPTOS ESTADÍSTICOS

1.1. INTRODUCCIÓN
La estadística es una ciencia con base matemática referente a la recolección, análisis e
interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo
aleatorio. Es transversal a una amplia variedad de disciplinas, desde la física hasta las
ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para
la toma de decisiones en áreas de negocios o instituciones gubernamentales. Se puede
definir como una disciplina que recolecta, clasifica y analiza información, para luego
poder interpretar los resultados.

Personas y organizaciones usan la estadística para entender datos y tomar decisiones


en ciencias naturales y sociales, medicina, negocios y otras áreas. La estadística es
entendida generalmente no como un sub-área de las matemáticas sino como una
ciencia diferente “aliada”. Utiliza diferentes métodos y es un instrumento del método
científico. Su campo de acción es el de la incertidumbre medible, hallando resultados
que no son exactos pero si probables, es decir busca “cuantificar la incertidumbre”.

1.2. DEFINICIONES BÁSICAS


Estadística es la disciplina que comprende un conjunto de teorías, métodos y técnicas
para obtener, describir e interpretar datos, con el objeto de tomar decisiones y predecir
fenómenos que pueden expresarse en forma cuantitativa.

“En un sentido amplio, la estadística se define como el arte y la ciencia de reunir


datos, analizarlos, presentarlos e interpretarlos”

Se clasifica en:

 ESTADÍSTICA DESCRIPTIVA: Comprende todos los métodos tabulares,


gráficos y numéricos para resumir datos y no implica generalizaciones. En líneas
generales consta de los siguientes pasos:
Recopilación => Organización => Presentación => Análisis => Interpretación.

La estadística descriptiva tiene por objetivo organizar y describir las


características principales del conjunto de datos

 ESTADÍSTICA INFERENCIAL: Comprende los métodos por el cual se pueden


determinar las características y propiedades presentes en una población, a partir
de una muestra. Es un método que permite generalizar, pero hay que tener en
cuenta que solo podemos generalizar sobre la población de la cual fue extraída
la muestra.

Hacer inferencia estadística, es generalizar o extrapolar los resultados


observados en una muestra y obtener conclusiones para dicha población
5
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Toda investigación estadística es un procedimiento sistemático que tiene las


siguientes etapas:

1. Formulación del problema: Debe determinarse en forma precisa el objeto


de la investigación, es decir "el qué" y "el para qué" se investiga. Deben
indicarse los sujetos del estudio (unidades de observación) y las
características de interés (variables).

2. Diseño del experimento: Se denomina "experimento" a la observación


planeada de un fenómeno de cualquier índole con la finalidad de describir su
comportamiento y/o tomar una decisión. Formulado el problema, el
investigador debe decidir si estudia toda la población (universo) o sólo una
parte de ella (muestra). En el Primer caso deberá realizar un censo
(enumeración completa de la población). Si elige una muestra, deberá
diseñar el procedimiento adecuado para obtener una muestra representativa
de la población.
3. Relevamiento de datos: Se procede a recopilar los datos de las distintas
fuentes disponibles utilizando los distintos métodos de recolección.

4. Organización y presentación de datos: Los datos organizados y


presentados en tablas y/o gráficos se convierten en información útil para
facilitar la lectura y el análisis de la misma.

5. Análisis: Según sea el objetivo de la investigación, el análisis puede ser


descriptivo o inferencial.

6. Interpretación: Los resultados obtenidos, que están expresados en lenguaje


estadístico, deben ser "traducidos" al lenguaje de la disciplina científica en la
cual se investiga. La interpretación permite la elaboración de conclusiones y
la toma de decisiones.

Los elementos que intervienen en esta disciplina son:

 Población: Es el conjunto de todas las unidades de interés o de análisis que


presentan características comunes o similares, en donde los resultados del
estudio deberán extrapolarse y acerca de los cuales intentamos sacar
conclusiones.
 Muestra: Es un subconjunto de la población, que brinda información sobre las
características de la población. Esta debe ser representativa, aleatoria, que
permita proyectar los resultados a la población y que tenga poco error.
 Variable: Característica o atributo de interés de las unidades del estudio. Es una
magnitud susceptible de ser medida
 Unidad de observación/análisis: Son los individuos o entidades sobre los
cuales se miden las características o atributos (las variables) del estudio, es decir
se reúnen los datos.
 Dato: Es el resultado de la medición.
 Parámetro: Es una medida resumen de una característica o atributo medido
sobre toda la población. Es una magnitud fija y desconocida.

6
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

 Estimador (o estadístico): Es una expresión matemática que se aplica a la


muestra y trata de dar respuesta sobre un parámetro, es decir aproximar o
estimar dicho valor. No es una magnitud fija, varía de muestra en muestra.

1.3. JUSTIFICACIÓN DEL USO DEL MUESTREO


Emplear correctamente las técnicas de muestreo resulta de vital importancia para
garantizar la validez de los resultados y la representatividad que se desea obtener de
las características de la población.
Seleccionar una muestra en lugar de analizar toda la población, permite obtener
resultados de manera aproximada con poco error y principalmente reducir de manera
significativa los tiempos y costos del estudio llevado a cabo. Muchas veces por esto
último, permite conocer o indagar más características de la población que si se realizara
un censo (medir a todas las unidades de la población).
Los tipos de muestreo hacen referencia a los diferentes procedimientos a través de los
cuales se obtiene una muestra de una población determinada.

Muestreo Probabilístico

 Es una muestra de la población que se apoya en la teoría de las probabilidades.


 Asegura representatividad a partir de asignarle un probabilidad de selección
conocida y no nula a cada unidad de la población.
 Elimina sesgos de selección e intencionalidad humana.
 Permite emplear la inferencia estadística para proyectar y analizar los resultados.
 Permite cuantificar la incertidumbre, el riesgo y la validez que podemos poner en
los resultados.

Algunos Muestreos de este tipo son:

 Muestreo simple al azar


 Muestreo sistemático
 Muestreo estratificado
 Muestreo por conglomerados
 Muestreo Multietápico
 Muestreo Proporcional a Tamaño
 Muestreo en Fases

Muestreo NO Probabilístico:

 El método de selección no emplea la teoría de probabilidades.


 No se conoce (o muy poco) la probabilidad de que una unidad sea seleccionada
para la muestra.
 Se hace mal uso de la Aleatoriedad.
 No se puede evaluar “precisión” en términos probabilísticos.
 No garantiza “representatividad”.

7
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Algunos Muestreos de este tipo son:

 Muestreo de voluntarios
 Muestreo con intención o conveniencia
 Muestreo por cuotas
 Muestreo de Redes

A continuación se presentan brevemente los principales métodos de muestreo:

 Muestreo simple al azar: Se seleccionan los elementos de la muestra n entre


los N elementos de la población, de modo que todas las muestras posibles de
tamaño n tienen la misma probabilidad de ser elegidas. La probabilidad de que
un elemento de la población pertenezca a la muestra es de n/N.

 Muestreo Sistemático: Los elementos son seleccionados en una manera


ordenada, que dependen del número de elementos incluidos en la población N
y el tamaño de la muestra n. La selección sistemática se realiza de la siguiente
manera: El primer paso es seleccionar al azar el primer elemento de la muestra
entre los primeros k elementos. El resto de la muestra es determinada tomando
sistemáticamente, cada k-ésima unidad hasta completar el tamaño n. Por
ejemplo supongamos que deseamos seleccionar una muestra sistemática de
n=30 viviendas en barrio que tiene en total N=300 viviendas: aquí
k=N/n=300/30=10.

 Muestreo Estratificado: Consiste en dividir la población en subpoblaciones


o grupos en base a algún criterio determinado, donde los elementos dentro de
un grupo sean similares entre sí y entre grupos existan diferencias. Se
seleccionan los elementos de la muestra mediante algún procedimiento aleatorio
dentro de cada uno de estos estratos. Comúnmente el procedimiento más
empleado es el simple al azar.

 Muestreo por conglomerados: Consiste en formar con las unidades de la


población, grupos de mayor cantidad de elementos, de manera que estos estén
formados por unidades heterogéneas, para que cada uno de estos
conglomerados represente mejor a la población. En el caso más simple, al
seleccionar un conglomerado se incluyen todas las unidades contenidas en
dicho conglomerado. Por ejemplo supongamos que las manzanas de un barrio
son los conglomerados y se seleccionaron 3 conglomerados, cada uno con 80,
60 y 120 viviendas, el tamaño de muestra total es de 260 viviendas.

 Muestreo Multietápico: Cuando resulta imposible obtener una muestra directa


de las unidades de la población, es necesario seleccionar en etapas, unidades
definidas como “agregaciones de las unidades de la población”. Por ejemplo, el
caso más frecuente es seleccionar una muestra de conglomerados (primera
etapa) y posteriormente realizar una selección dentro de cada conglomerado
(segunda etapa). Este mecanismo se puede llevar a cabo para más de dos
etapas.

 Muestreo Proporcional a Tamaño: El muestreo simple al azar y sistemático


consideran que las unidades tienen la misma probabilidad de ser seleccionadas.
Es decir que a los fines prácticos, todas las unidades tienen la misma
importancia. En la práctica esto no siempre es lo más adecuado. Considere un
estudio relacionado a supermercados y almacenes de barrio: el tamaño e
8
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

impacto que tienen los supermercados resulta muy importante (y diferente) al


momento de obtener mediciones de productos, por lo tanto no sería apropiado
considerar para la muestra, que los supermercados tienen igual “importancia o
peso” que los almacenes de barrio. Para este tipo de situaciones se puede
seleccionar las unidades de la muestra, con una probabilidad proporcional a una
“medida de tamaño”, por ejemplo el “monto de facturación” o “cantidad de
empleados”.

 Muestreo en fases: Consiste en tomar una muestra preliminar (suficientemente


grande) para obtener información que sirva de base para la selección de otra
que es la que finalmente se empleará para llevar a cabo el estudio.

 Muestreo de voluntarios: Cuando los elementos de la muestra son personas


(generalmente) que se ofrecen para el estudio en cuestión. Comúnmente
empleado en investigaciones clínicas/farmacológicas.

 Muestreo con intención o conveniencia: Cuando por razones de tiempo o


logística se decide seleccionar las unidades más “fáciles de obtener y/o medir”.
Por ejemplo en un muestreo de unidades de un producto comercial, resulta más
conveniente y deliberado seleccionar de un lote, aquellas unidades que están
“arriba” porque son más fáciles de obtener.

 Muestreo por cuotas: Consiste en seleccionar las unidades hasta “cubrir o


alcanzar” el tamaño necesario en cada “cuota” (fracción de la muestra). Por
ejemplo, en una encuesta en la vía pública se deben encuestar 30 mujeres entre
20 y 50 años (esto se define como una “cuota”) y 50 varones en el mismo rango
de edad. Para la primera cuota, el encuestador selecciona solo mujeres y realiza
la encuesta en aquellas que cumplen con el rango de edad establecido, hasta
alcanzar las 30 mujeres. El mismo procedimiento sigue para la segunda cuota.

 Muestreo de Redes: Se emplea para los casos de poblaciones “raras o poco


frecuentes”. Comúnmente el procedimiento consiste en: Si se detecta una unidad
de esta población, se la encuesta y luego se le pide que brinde información para
contactar a otras unidades similares que puedan pertenecer a la población de
estudio. De esta forma se construye la “red” de unidades que forman la muestra.
Se aplica comúnmente en enfermedades raras o estudios sociodemográficos
con temáticas “sensibles” de medir.

9
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

1.4. RELEVAMIENTO DE DATOS


El relevamiento consiste en la recopilación de datos de diversas fuentes existentes o
por medio de encuestas y estudios experimentales.
 Fuentes internas: En algunos casos los datos que se necesitan para una
determinada aplicación ya existen. Por ejemplo, las empresas cuentan con
diversas bases de datos sobre sus empleados, clientes y operaciones de
negocios. Este tipo de fuente se encuentran dentro de la organización.
 Fuentes externas: También se pueden obtener los datos de fuentes externas,
comprando los datos o accediendo a otras bases de datos mediante acuerdos
con otras empresas. Otra forma de obtener datos es mediante los organismos
de estadísticas u otras dependencias del estado. Por ejemplo INDEC,
particularmente permite obtener datos del censo poblacional 2010 u otras
estadísticas económicas. En Salta se puede consultar a la Dirección General de
Estadísticas.
 Fuentes primarias: Son fuentes originarias de datos. Se denominan primarias
porque los datos son obtenidos de una publicación editada por el recopilador
original.
Como los datos se recopilan por primera vez, en ellos generalmente se emplean
experimentos estadísticos y encuestas como métodos de recolección. Por
ejemplo, la EPH (Encuesta Permanente de Hogares) de INDEC, constituye una
fuente primaria para este organismo.
 Fuentes secundarias: Son aquellas que proporcionan toda la información
existente
sobre el tema bajo estudio. Se denominan secundarias porque los datos son
obtenidos de una reimpresión, que es publicada por una persona u organización
distinta al recopilador original.

Estudios experimentales y Encuestas: Comúnmente los estudios estadísticos


más usuales para obtener datos se clasifican como Experimentales y
Observacionales. En el primer caso, el estudio más común es el experimento, que
consiste en poder controlar muchas variables para poder medir correctamente una
variable de interés (Un experimento estadístico es un proceso de recolección de
datos donde se ejerce un control sobre algunos o todos los factores que pueden
influir
sobre la variable bajo estudio). En el segundo, el estudio más común son las
encuestas, donde no se controlan las variables (Una encuesta estadística es el
proceso de recopilación de datos relacionados con las características de elementos,
sin un control especial que influya sobre la variable de interés).
La utilización de fuentes primarias o secundarias depende de la necesidad y
disponibilidad de datos, como así también del costo y la confiabilidad. Las fuentes
primarias son más costosas, pero pueden ser más confiables. Si se utiliza una
encuesta, ésta debe ser cuidadosamente planteada ya que hay que establecer
objetivos, diseñar la muestra, preparar a los encuestadores, realizar pruebas pilotos;
todo esto lleva tiempo y dinero. Las fuentes secundarias tienen costos de búsqueda
más bajos, pero se debe evaluar la confiabilidad de las mismas, ya que los datos
pueden estar desactualizados, parcialmente publicados o pueden contener errores
de impresión.

10
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

1.5. TIPOS DE VARIABLES Y CLASIFICACIÓN

Recordemos que una variable es una propiedad o característica de un objeto de estudio


que puede asumir distintos valores según el “tipo de medición empleado”.
En general las variables pueden ser clasificadas de diferentes formas, pero existe un
tipo de clasificación fundamental que debe estar siempre presente durante el trabajo de
investigación, la clasificación según la “Escala de Medida”. Además de esta clasificación
se desprende una de las formas más comunes, basadas en su “naturaleza” cuantitativa
o cualitativa. Por último, existe una clasificación según el “rol o papel” que cumple dentro
del tipo de estudio que se lleva a cabo en la investigación.

Clasificación según la “escala de medida”


Las escalas de las variables son posibles por la relación entre lo que nosotros podemos
establecer con los “aspectos” de los individuos o unidades de estudio, y los números
reales que les asignamos para representarlos. Los aspectos determinan las operaciones
empíricas de: Igualdad; Igualdad de Orden; Igualdad de Diferencias; Igualdad de
Razones. El tipo de escala alcanzado depende del carácter de las operaciones
empíricas básicas que se pueden establecer. Esta clasificación es importante, ya que
los estadísticos y por lo tanto los métodos de análisis admisibles, dependen de la escala
en la que están medidas las variables. Por todo esto, es la principal clasificación que se
debe tener presente en todo estudio.

Clasificación Algunos estadísticos


según Escala Operación Empírica admisibles
Nominal Determinación de Frecuencias ; Modo ;
Igualdad Coeficiente de Asociación
Ordinal Determinación de Mediana ; Cuantiles ;
Igualdad de Orden Correlación de Rangos
Intervalo Determinación de Media ; Varianza ;
Igualdad de Diferencias Correlación de Pearson
Razón Determinación de Coeficiente de Variación
Igualdad de Razones

Este cuadro debe interpretarse como acumulativo, en donde cada escala posee
las propiedades de las que la preceden

11
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Algunos comentarios sobre las escalas:

 Nominal:
o Es la escala más “débil”
o Los números son usados únicamente como rótulos o etiquetas y las
palabras o letras también se usan.
o Forma de asignación: Enumeración de clases, donde cada individuo de
una clase es asignado con el mismo número (Sexo, Nacionalidad, etc)
o Se establece una determinación de igualdad entre los aspectos, es decir
una relación de equivalencia.
 Ordinal:
o Además de la relación de equivalencia, se puede establecer una relación
de orden entre los aspectos de los individuos.
o Al igual que la escala anterior, se asignan números a las distintas clases,
pero preservando también el orden.
 De Intervalo:
o Constituye formalmente una escala “cuantitativa”.
o Posee todas las propiedades de la escala ordinal, y ahora también se
puede determinar la distancia exacta entre las mediciones dos individuos.
o Casi todos los estadísticos son admisibles en esta escala, exceptuando
aquellas que exigen el conocimiento del valor cero u origen “verdadero”.
o El punto cero en esta escala es un tema de convención o conveniencia,
ya que el valor cero NO indica ausencia del atributo (Por ejemplo
variables de temperatura).
o No se puede decir que un valor es el doble, o cualquier otra proporción,
como consecuencia del origen arbitrario que posee. Si se pueden
comparar diferencias o intervalos, porque se cancela el efecto del origen
arbitrario.
 De Razón:
o Comúnmente se encuentran en el área de la física.
o Solo se alcanzan cuando se pueden establecer las cuatro operaciones
empíricas.
o El valor cero está siempre presente aunque en algunos casos no se
pueda producir (Por ejemplo Temperatura absoluta).
o Todo tipo de estadístico es admisible, incluido el Coeficiente de
Variación.

Clasificación según la “naturaleza” Cuantitativa o Cualitativa

 Las variables cualitativas son aquellas que expresan propiedades de los


fenómenos que se pueden describir cualitativamente y no numéricamente. Por
ejemplo el Sexo, Nacionalidad, Estado Civil, etc. Las escalas de medida
“Nominal” y “Ordinal” están asociadas a esta clasificación cualitativa. Por ello lo
correcto es clasificar a la variable en cuestión como “cualitativa nominal” o
“cualitativa ordinal”.

 Las variables cuantitativas permiten la medición numérica para expresar las


propiedades de los fenómenos y pueden aplicarse operaciones aritméticas sobre
sus valores, ya que constituyen formalmente una escala numérica. Por ejemplo
la Edad, Peso, Altura. Las variables cuantitativas pueden ser “Discretas” o
“Continuas” según el proceso de medición.

12
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

o Discretas:
Son aquellas que pueden tomar sólo ciertos valores en el intervalo
determinado y no admiten valores intermedios. Generalmente son
valores enteros asociados a “conteos”. Por definición, la variable toma
“finitos o infinitos valores numerables”. Por ejemplo, la variable “cantidad
de materias aprobadas” puede tomar los valores 0,1, 2..., pero no algún
valor intermedio.
o Continuas:
Son aquellas que pueden tomar cualquier valor en el intervalo
determinado. Por definición, la variable toma “infinitos valores NO
numerables” entre dos valores. Por ejemplo, entre 0.1 y 0.11 existen
infinitos valores que se pueden observar 0.105, 0.10859, etc… y es
imposible enumerar a todos.

Clasificación
Cualitativa Nominal
Cualitativa Ordinal
Cuantitativa Discreta
Cuantitativa
Contínua

Clasificación según “el rol” que cumple en el estudio

Según el tipo de participación que tengan las variables en el estudio, las podemos
clasificar en “independientes”, “dependientes” o “confundidoras”.

Clasificación
según el Rol Características
Independiente Es aquella que al modificarse, produce un cambio
en otra variable
Dependiente Es aquella que cambia cuando una variable
independiente se modifica
Confundidora Es cualquier otra variable diferente de la variable
independiente, que puede afectar una variable
dependiente.

Algunos comentarios:
 Independiente:
Es de interés principal para el investigador, ya que “a priori” se piensa “explican”
o determinan los cambios observados en la variable dependiente. Se tienen en
cuenta porque se desea conocer las relaciones entre estas variables.
 Dependiente:
Es de interés principal para el investigador, ya que “a priori” se piensa es
“explicada” por los cambios observados en la variable independiente. Se tienen
en cuenta porque se desea conocer los motivos y relaciones con las variables
independientes que determinan diversos escenarios de análisis.
13
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

 Confundidora:
No todas las variables confundidoras pueden ser controladas o tenidas en cuenta
en el análisis. Muchas veces las investigaciones llevadas a cabo no perciben la
presencia de estas variables confundidoras.

Por ejemplo:

1. Calentar Agua en una pava:

Calor de la Temperatura del Altura sobre el


hornalla Agua nivel del mar
(Independiente) (Dependiente) (Confundidora)
=> <=

2. Presión Arterial:

Presión Presión arterial de Velocidad de


barométrica oxígeno respiración
(Independiente) (Dependiente) (Confundidora)
=> <=

Es importante destacar que una variable puede ser pensada originalmente de una
determinada clasificación, pero para propósitos del estudio o bien por motivos de
medición o relevamiento, la variable se redefine de otra manera. Pensar por
ejemplo la “Edad”, “Edad en años cumplidos”, “Edad definida como: menores,
jóvenes, Adultos”, en todos los casos estamos hablando y midiendo la edad pero
su clasificación, forma de relevamiento y métodos analíticos admitidos son
distintos. Por ello tener siempre presente y recordar:

“EL TIPO DE VARIABLE DEPENDE PRINCIPALMENTE DEL PROCESO DE


MEDICION, NO DE LA PROPIEDAD QUE SE MIDE”

14
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

1.6. PRESENTACIÓN DE LA INFORMACIÓN


En función de los datos recolectados y el procesamiento llevado a cabo, la información
generalmente se presenta a través de medidas numéricas, gráficos y tablas
convenientemente construidas para tal fin. Hay que tener en cuenta que diferentes tipos
de datos conducen a diferentes tipos de representaciones gráficas y resúmenes
numéricos.
Cuando medimos el valor de una variable en una unidad de estudio, y medimos
nuevamente en varias unidades del estudio, se observa que los valores en general
varían entre unidades. La variabilidad o variación es una característica presente en
los datos, es decir es esperable que los valores de la variable sean diferentes.
La distribución de una variable provee los posibles valores que la variable puede
tomar y con qué ocurrencia estos valores se presentan. Por lo tanto, la distribución
muestra el patrón de variación de la variable. Esta distribución es la que se pretende
resumir en forma gráfica, tabular y numérica.

Resumen TABULAR
La técnica de los cuadros consiste en arreglos de los datos, divididos por uno o más
sistemas de clasificación, en columnas e hileras.

Cuando el cuadro tiene una sola clasificación se denomina de clasificación simple,


cuando se confecciona con dos o más clasificaciones se llama cuadro de clasificación
cruzada o de doble entrada.

En los cuadros de doble entrada debe tenerse especial cuidado en el orden y disposición
de las clasificaciones. Demasiadas divisiones y subdivisiones pueden tornar confusa la
información, siendo preferibles varios cuadros simples en lugar de uno con clasificación
cruzada.

La construcción de una tabla depende de la utilización, del tipo de análisis que se


realice y la clasificación de la variable. Para que una tabla sea efectiva, debe ser clara
y precisa para posibilitar su lectura. Se deben evitar tablas complicadas y largas.

Una tabla completa debe contener los siguientes elementos estructurales o partes:

15
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

a) Título: El título describe el contenido de la tabla. Debe ser completo y preciso.


b) Nota del encabezado: Es una aclaración o amplitud del título ya sea para
detallar algún elemento importante o para expresar la unidad de medida de los
datos. Se coloca debajo del título y entre paréntesis.
c) Encabezado: Contiene los títulos de las clasificaciones ubicadas en las
columnas.
d) Columna Matriz: Contiene los títulos de las clasificaciones ubicadas en las filas.
e) Cuerpo: Es el contenido de los datos estadísticos arreglados de acuerdo a las
descripciones de los encabezados. Cada dato se consigna en una celda que es
la intersección entre una fila y una columna.
f) Notas al pie: Se utiliza para explicar o aclarar algunos elementos del cuadro.
Ayudan al análisis e interpretación.
g) Fuente: Indica la procedencia de los datos. Permite conocer quién recopiló la
información y evaluar la confiabilidad de la fuente. Además, saber dónde recurrir
si se necesita información adicional sobre el tema

Consideraciones sobre los cuadros

 Es importante que en cada celda se registre algo. Si el dato es cero, este cero
debe ser anotado en la celda. Si la información no está disponible, debe indicarse
con ND o bien con una aclaración al pie. Si la celda se deja en blanco, no se
sabe si el dato es cero, no está disponible o hubo alguna omisión.
 Cuando en un informe o texto se presentan varias tablas, se hace necesario
numerar las mismas por orden de aparición a fin de facilitar la referencia de las
mismas. El número se coloca antes del título.
 Cuando se quieren analizar relaciones estadísticas entre variable-dependiente e
independiente, es conveniente ubicar la primera en la columna matriz.
 Deben ser incluidas las unidades específicas de medida que corresponden a los
datos.
 El título de la tabla debe ser claro, conciso y exacto. Un buen título responderá
a las preguntas: ¿qué? ¿cuándo? ¿dónde?.
 Presentación en porcentajes: Cuando se presentan datos en porcentajes, se
pueden utilizar tres distintas opciones que dependerán del análisis y/o
comparación que se desee realizar sobre los datos:
o Porcentajes generales o conjuntos
o Porcentajes filas u horizontales
o Porcentajes columnas o verticales

Considere el siguiente ejemplo de una tabla que tiene el número de empleados


por sexo y categoría en cifras absolutas. Se puede realizar el análisis porcentual
general o por filas o columnas:

16
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

CIFRAS ABSOLUTAS

PORCENTAJE GENERAL

PORCENTAJE FILAS

PORCENTAJE COLUMNAS

17
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Resumen GRÁFICO

El gráfico depende del tipo de variable y el concepto a representar. Hay algunas


consideraciones a seguir en la construcción:
 Aquel tipo de gráfico que alcance su objetivo con la máxima sencillez será el más
efectivo. No debe contener más líneas o símbolos que los que el ojo puede
cómodamente seguir.
 Todo gráfico debe explicarse por sí mismo. Por lo tanto debe estar correctamente
indicado el título, origen, escala y claves explicativas o leyendas.
 El lugar del título es libre. Por lo general va al pie del gráfico.
 Cuando se representa más de una variable, cada una debe ser claramente
diferenciada por medio de aclaraciones o leyendas.
 El diagrama progresa de izquierda a derecha y de abajo arriba

Algunos de los gráficos que se explicarán apropiadamente y más en detalle en la


siguiente unidad son:

 Variables Cualitativas: Gráficos de Barras, Gráficos de torta.


 Variables Cuantitativas: Gráficos de frecuencias (Bastones), Boxplots,
Histogramas, Gráficos de series temporales.
 Relación entre variables cuantitativas: Gráfico de Dispersión.

Resumen NUMÉRICO

Al igual que en los gráficos, las medidas numéricas admisibles, dependen del tipo de
variable y su clasificación según la escala de medida.
Algunas medidas más comunes y que se desarrollarán más en detalle en la siguiente
unidad son:

 Medidas de Tendencia Central y de Posición:


o Media Aritmética, Geométrica, Armónica
o Mediana
o Moda
o Cuartiles, Deciles, Percentiles
 Medidas de Variabilidad:
o Rango
o Varianza
o Desvío Estándar
o Coeficiente de Variación

18
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Actividad I

Realice las siguientes actividades prácticas:

1) Para las siguientes situaciones identifique la o las variables estudiadas, indicando tipo de
variable, valores posibles (dominio), unidades, individuo, si se trata de una muestra o de la
población y el tamaño.

a) Un profesor de Matemática contabiliza la cantidad de alumnos que aprobaron la materia


por curso, en cada uno de los 7 cursos que dictó en el último cuatrimestre. Los cursos
poseen a lo sumo 50 alumnos.
b) Se miden los consumos mensuales efectuados con tarjeta de crédito por 100 personas.
c) Una compañía farmacéutica comercializa un antibiótico en frascos de 50 comprimidos.
Como parte del control de calidad, periódicamente se abren 10 frascos y se controla:
1. La concentración del antibiótico en cada comprimido
2. La cantidad de comprimidos que superan la concentración máxima permitida.
d) En una encuesta política se indaga a 500 individuos sobre el candidato al que votarían
en las próximas elecciones. Además se registra:
1. El género
2. El nivel socioeconómico de los encuestados.
e) Una empresa decide lanzar al mercado una nueva gaseosa diet, pero previamente
decide determinar el nivel de aceptación del nuevo producto. Con tal fin, un grupo de 50
panelistas efectúan una degustación del nuevo producto y luego completan la siguiente
encuesta:
1. Otorgue un puntaje de 0 a 10 al sabor de la gaseosa que probó.
2. ¿Con qué frecuencia compraría la gaseosa en caso de que se lance al mercado?
i. No la compraría nunca
ii. La compraría ocasionalmente
iii. La compraría frecuentemente

2) Formule y clasifique las variables en los siguientes casos:


a) Desarrolle 3 preguntas de variables cualitativas y 2 preguntas de variables cuantitativas
para una encuesta política.
b) Desarrolle 4 preguntas de variables cuantitativas y 2 preguntas de variables cualitativas
para una encuesta de personas que realizan compras por internet

19
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

UNIDAD II
ANÁLISIS DESCRIPTIVO UNIVARIADO

2.1. DISTRIBUCIONES DE FRECUENCIAS


Los datos son colecciones de un número cualquiera de observaciones relacionadas
entre sí. Para que sean útiles se deben organizar de manera que faciliten su análisis,
se puedan seleccionar tendencias, describir relaciones, determinar causas y efectos y
permitan llegar a conclusiones lógicas y tomar decisiones bien fundamentadas.

Recordar que la distribución de una variable provee los posibles valores que la variable
puede tomar y con qué ocurrencia estos valores se presentan. Una forma de sintetizar
los datos consiste en armar una tabla en la que los datos se disponen en agrupamientos
o categorías, con el fin de clasificar los datos según su magnitud. En la tabla se indica
el número de veces que aparece cada uno de los valores. Cuando se dispone de un
gran número de valores discretos o cuando las variables son continuas, tiene sentido
formar una tabla que presente la distribución de frecuencias de los datos agrupados en
intervalos o clases, de igual tamaño si es posible.

En general, en la práctica existen 3 situaciones en las cuales vamos a disponer de los


datos para poder trabajarlos:

 Serie simple de datos sin agrupar


 Tablas de Frecuencias simple
 Tablas de Frecuencias con intervalos de clase

Serie simple de datos sin agrupar


Es el caso que se presenta cuando disponemos de todos los datos de la
variable, identificados de manera individual para cada individuo o elemento.

Por ejemplo, se tienen datos de dos variables, la edad y el sexo, en un curso de grado
de Estadística de 10 alumnos:

Alumno Edad Sexo


1 18 F
2 20 M
3 22 M
4 19 F
5 19 F
6 22 F
7 21 F
8 22 F
9 23 M
10 26 F

20
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Tabla de Frecuencias simple


Es el caso que se presenta cuando se dispone del número de veces que aparece
cada valor o categoría de la variable

Para armar la distribución de la variable se debe contar el número de veces que


aparece cada valor o categoría de la variable. Esta frecuencia se denomina
“frecuencia absoluta” y se indica con f.
Sin embargo, comúnmente lo que interesa conocer es la proporción o porcentaje de
elementos en cada valor o categoría:
 La “frecuencia relativa” de una categoría o valor es la proporción de casos
que pertenecen a dicha categoría o valor y se indica con fr. En un conjunto
de datos con n observaciones, la fr = f/n.
 La “frecuencia porcentual” de una categoría o valor es la frecuencia relativa
multiplicada por 100. En general se indica con f% y se calcula como f% =
fr * 100.
La suma de las frecuencias absolutas es siempre igual al número de observaciones n,
la suma de las frecuencias relativas es siempre igual a 1, la suma de las frecuencias
porcentuales es siempre igual a 100.
Es conveniente construir este tipo de tablas cuando se tienen variables cualitativas y
variables cuantitativas con pocos valores diferentes.
Para el mismo ejemplo de los alumnos del curso de grado, se tendrán las siguientes
distribuciones de frecuencias para cada variable:

Tabla de Frecuencias con intervalos de clase

Es el caso que se presenta cuando se dispone de una variable cuantitativa con


muchos valores diferentes y resulta necesario construir intervalos de valores
para agrupar los datos y poder resumirlos e interpretarlos adecuadamente.

Para este caso es necesario tener en cuenta los siguientes aspectos: Determinar la
cantidad de intervalos o clases, el ancho de cada uno de ellos, los límites y el punto
medio (o marca). Todos estos aspectos son orientativos y muchas veces se obtienen
mediante prueba y error hasta encontrar la combinación que mejor representa los datos.

21
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

1. Determinar la cantidad de intervalos: En general se recomienda usar entre 5


y 20 intervalos, según el tamaño del conjunto de datos. Se pretende tener una
cantidad adecuada de intervalos para poder detectar la variación en los datos.
2. Determinar la amplitud de cada intervalo: En general, cuanto mayor sea la
cantidad de intervalos, menor debe ser la amplitud de éstos y viceversa. La
amplitud aproximada se calcula identificando previamente el mayor y menor
valor del conjunto de datos y la diferencia entre éstos se divide por la cantidad
de intervalos, es decir Amplitud = (Xmax - Xmin) / Cantidad de Intervalos.
3. Determinar los límites del intervalo: Cada dato debe pertenecer a uno y solo
uno de los intervalos. El Límite Inferior (LI) del intervalo indica el menor valor de
los datos que pertenecen a dicho intervalo. De la misma forma, el Límite Superior
(LS) del intervalo indica el mayor valor de los datos que pertenecen a dicho
intervalo. Otra forma muy común para definir los límites es considerar corchetes
y paréntesis para indicar los valores que están incluidos. Por ejemplo, “[k” en el
LI para indicar que k está incluido en dicho intervalo, y “m)” en el LS para indicar
que m NO está incluido en dicho intervalo. Esto se conoce como “intervalo
cerrado” e “intervalo abierto” respectivamente. Las distintas variantes para un
intervalo son:
a. [k ; m] : Intervalos Cerrados
b. [k ; m) : Intervalo cerrado por izquierda y abierto por derecha
c. (k : m] : Intervalo abierto por izquierda y cerrado por derecha
d. (k ; m) : Intervalos Abiertos
4. Determinar el punto medio (o marca) del intervalo: Es el valor que se
encuentra a la mitad entre el LI y LS del intervalo, es decir PM = (LI + LS) / 2

Las distribuciones de frecuencias absolutas, relativas y porcentuales se definen de la


misma forma que en el caso de “Tabla de Frecuencias simple”.

Para el ejemplo de la variable edad de los alumnos del curso de grado, la distribución
de frecuencias es la siguiente:

Alternativamente:

22
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Distribuciones Acumuladas
En la tabla de distribución de frecuencias simples o con intervalos, se puede incluir
información adicional, la distribución de frecuencia acumulada.
En lugar de indicar la frecuencia (de cada valor, categoría o intervalo) la distribución de
frecuencia acumulada muestra la cantidad de datos que tienen un valor menor o
igual al límite superior de cada intervalo. Esta frecuencia se indica con F.
En el caso de variables cualitativas solo es correcto emplearlas cuando la escala de
medida de la variable es Ordinal.
Al igual que las frecuencias ya presentadas anteriormente, se puede construir:
 La frecuencia relativa acumulada (Fr), que indica la proporción de todos los
datos que tienen un valor menor o igual al límite superior de cada intervalo.
 La frecuencia porcentual acumulada (F%), que indica el porcentaje de todos
los datos que tienen un valor menor o igual al límite superior de cada intervalo.

Para el ejemplo de la variable edad de los alumnos del curso de grado, la distribución
de frecuencias es la siguiente:

Algunas consideraciones sobre las distribuciones de frecuencias:

 El armado de las tablas depende de la naturaleza y cantidad de datos.


Los intervalos deben seleccionarse adecuadamente para que la configuración
de la distribución no resulte confusa. Al construir las tablas de frecuencias se
pierde un poco de información, pero las mismas ofrecen ventajas al momento
del análisis y la interpretación.
 El número de clases no debe ser ni muy grande ni muy pequeño. Cuando hay
muchos intervalos, la amplitud de los mismos es pequeña, por lo tanto cada uno
tendría pocos datos o ninguno. Por el contrario, si hay pocas clases con
intervalos amplios, puede resultar que queden cifras relativamente significativas
concentradas en unas cuantas clases.
 Los intervalos deben tener la misma amplitud a efectos de poder hacer
comparaciones. En algunas situaciones pueden presentarse intervalos de
distinta amplitud, pero se dificulta la interpretación de la distribución. En otros
casos se debe recurrir a intervalos abiertos:

o Intervalos con amplitudes desiguales: Esto sucede cuando la variable


de interés tiene algunas observaciones extremas altas. En lugar de definir
pocos intervalos con igual tamaño, pero muy amplios; o bien muchos
intervalos de igual tamaño, pero más estrechos, es frecuente
definir tamaños variables para los intervalos de clase. Se debe tener
cuidado al representar gráficamente este tipo de distribuciones ya que se
23
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

pueden construir gráficos inadecuados o que distorsionan la


interpretación del mismo. La forma adecuada para graficar consiste en
representar la frecuencia en una base de “frecuencia por intervalo
estándar”, definiendo la amplitud “estándar”.

o Intervalos abiertos: Cuando el conjunto de datos tiene observaciones


muy extremas, en lugar de intervalos desiguales se pueden emplear los
intervalos abiertos. Estos son aquellos intervalos en los cuales no se
encuentra definido uno de los límites. Las clases abiertas se utilizan con
fines de presentación, pero presentan dificultades para los cálculos,
como así también para su representación gráfica y en general estos
intervalos no se grafican.

En las siguientes secciones se presentan las métricas más comunes para el análisis de
datos. Las medidas descriptivas son valores que resumen la información de una
distribución. Se utilizan para describir ciertas características de los datos, permitiendo
una comprensión más precisa. Junto con estas medidas resúmenes y los gráficos
adecuados, se podrán detectar patrones y extraer conclusiones para un análisis más
profundo. Las medidas que se presentan en este curso son:

 Medidas de tendencia central y posición


 Medidas de dispersión o variabilidad
 Medidas de asimetría (sesgo)
 Medidas de apuntamiento (kurtosis)

24
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

2.2. MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIÓN


Media Aritmética

La media aritmética o promedio es la medida de tendencia o localización más empleada


para resumir los datos. Brinda una medida de la localización central de los datos, ya que
tiende a ubicarse en el centro de la distribución.

La media aritmética es la suma de todos los valores del conjunto de datos,


dividido por el número de observaciones

Las fórmulas de cálculo ya sea de una población o muestra, varían según las 3
situaciones en las que disponemos los datos:

Recordar el ejemplo de la variable edad de los alumnos del curso de grado:

25
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

La edad promedio se calcula como:


En los primeros dos casos el valor coincide y es igual a 21.2 años, mientras que en el
último caso el valor es 21.6 años. Esto se debe a que las fórmulas empleadas en las
tablas de frecuencias con intervalos son aproximadas (en este caso está influenciado
por el valor de la Marca o Punto Medio).

COMENTARIOS
 El promedio es sensible a valores extremos que puedan estar presentes en el
conjunto de datos. En esta situación no es recomendable emplear esta medida
resumen.
 Se calcula empleando todos los valores del conjunto de datos.
 Tiene la siguiente propiedad, “la suma de los desvíos respecto a la media es
siempre cero”:

Moda
La moda o modo es el valor que se presenta con mayor frecuencia

Donde:

 Linf : Extremo inferior del intervalo modal (el que tiene mayor frecuencia absoluta)
 fi : Frecuencia del intervalo modal
 fi-1 : Frecuencia del intervalo anterior al modal
 fi+1 : Frecuencia del intervalo posterior al modal
 Ai : Amplitud del intervalo

Para el ejemplo de la variable edad de los alumnos del curso de grado, el modo se
calcula como:

 Mo = 22 años, que se obtiene de fmax = 3.

 Mo = 21.6 años, que se obtiene de

26
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

COMENTARIOS

 Puede ocurrir que la mayor frecuencia se presenta con dos o más valores
distintos del conjunto de datos. Cuando esto ocurre (hay más de una moda) y si
los datos contienen “dos modas” se dice que los datos son bimodales. Si
contienen más de dos modas, son multimodales. Pero en realidad es más
correcto decir que el conjunto de datos no contiene moda (recordar la
definición!!!).
 Se calcula empleando solo un valor del conjunto de datos.

Mediana
La mediana es otra medida de localización central. Es el valor situado a la mitad de los
datos ordenados de menor a mayor (en forma ascendente).

Si la cantidad de observaciones es impar, la mediana es el valor que está situado


a la mitad del conjunto de datos.
Si la cantidad de observaciones es par, la mediana es el valor promedio de las
dos observaciones situadas a la mitad del conjunto de datos.

En el caso de datos sin agrupar:

 La posición de la mediana se puede calcular como Pos=(n+1)/2, donde n es la


cantidad de observaciones
 Caso 1: Si el resultado es un valor entero, la mediana es el valor que se
encuentra en dicha posición.
 Caso 2: Si el resultado no es un valor entero, la mediana será el promedio entre
los valores que ocupan dichas posiciones.

Donde:
 n/2: Posición de la mediana
 Linf: Extremo inferior del “intervalo de cálculo” (donde se encuentra la mediana
y se “cubre” la posición n2n2)
 Fi−1: Frecuencia acumulada del intervalo anterior al “intervalo de cálculo”
 fi: Frecuencia absoluta del “intervalo de cálculo”
 Ai: Amplitud del intervalo

27
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Para el ejemplo de la variable edad de los alumnos del curso de grado, ordenados
previamente de manera ascendente:

La mediana se calcula como:

 Ejemplo de datos sin agrupar:


1. Primero buscamos la posición Pos = (n+1)/2 = (10+1)/2 = 5.5
2. Como no es un valor entero, se calcula el promedio entre 21 y 22 años,
es decir que la Mediana es Me = (21+22)/2 = 21.5 años
 Ejemplo de datos agrupados:

, y el resultado es Me = 21.6 años

COMENTARIOS

 La mediana no emplea en su cálculo todos los valores del conjunto de datos.


 Es más “robusta” o insensible a valores extremos, por ello se recomienda su uso
en reemplazo de la media aritmética.

Percentiles y Cuartiles

Un percentil aporta información acerca de la dispersión o concentración de los datos.


En un conjunto de datos previamente ordenados de menor a mayor (en forma
ascendente), el percentil divide a los datos en dos partes.

El percentil p es un valor tal que por lo menos p por ciento de las observaciones
son menores o iguales que este valor y por lo menos (100−p) por ciento de las
observaciones son mayores o iguales que este valor

28
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

En el caso de datos sin agrupar:

 La posición del percentil se puede calcular como Pos=(k∗n)/100, siendo k el


percentil deseado y n la cantidad de observaciones
 Caso 1: Si el resultado NO es un valor entero, se debe redondear al entero
superior y el percentil será el valor que ocupa dicha posición.
 Caso 2: Si el resultado es un valor entero, el percentil será el promedio entre los
valores que ocupa dicha posición y la siguiente.

Donde:
 k*n/100: Posición del percentil k
 Linf: Extremo inferior del “intervalo de cálculo” (donde se encuentra el percentil y
se “cubre” la posición k*n/100)
 Fi−1: Frecuencia acumulada del intervalo anterior al “intervalo de cálculo”
 fi: Frecuencia absoluta del “intervalo de cálculo”
 Ai: Amplitud del intervalo

Es una práctica muy común el dividir al conjunto de datos en cuatro partes, donde cada
una de ellas contiene el 25% de las observaciones. Así se definen los cuartiles:

 Q1 es el primer cuartil, correspondiente al Percentil 25


 Q2 es el segundo cuartil, correspondiente al Percentil 50 (Mediana)
 Q3 es el tercer cuartil, correspondiente al Percentil 75

Notar que se presentó a la mediana como aquel valor situado a la mitad del conjunto de
datos ordenados de manera ascendente. Esta mitad corresponde al 50% de los datos,
es decir al percentil 50 y coincide con la definición del segundo cuartil, por ello:

Me = P50 = Q2

Además, la mediana es un caso particular de percentil (k=50), por ello las fórmulas en
datos agrupados son las mismas, considerando que k*n/100 = 50*n/100 = n/2 es la
expresión que aparece en la fórmula de la mediana.

Para el ejemplo de la variable edad de los alumnos del curso de grado:

 Ejemplo de datos sin agrupar:


1. Primero buscamos la posición Pos = (k*n)/100 = (85*10)/100 = 8.5
2. Como no es un valor entero, se redondea a la posición 9, es decir que el
percentil 85 es P85 = 23 años
 Ejemplo de datos agrupados:

o , y el resultado es P85 = 23.7 años

o , y el resultado es P25 = 19.88 años


29
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Media Geométrica

La media geométrica G se define como la raíz n-ésima de los productos de los


valores de un conjunto de datos:

Por ejemplo, para los valores 4 - 7 - 25, la media geométrica es 8.88

Se emplea comúnmente en progresiones geométricas (Cuando un número es obtenido


multiplicando el número anterior por la razón promedio, la secuencia de los números se
denomina progresión geométrica) para determinar tasas de crecimiento.

Por ejemplo:
“En un conjunto de datos se tienen las razones de los valores de ventas respecto del
inmediato anterior y la progresión de ventas”:

La media geométrica de las razones es , es decir que los


valores de las ventas constituyen una progresión geométrica con una razón promedio
de 1.552234.

Identificando los elementos de la progresión geométrica se tiene:

 Po: Valor del primer período (período base)


 Pn: valor del último período
 n: número de valores excluyendo el primero de ellos
 G: La razón promedio (media geométrica de las razones).

 En general el valor final del n-esimo período es:


 Despejando G de la expresión anterior, se puede expresar G como
 La tasa promedio de crecimiento es: G% - 100%

Para este ejemplo la tasa promedio de crecimiento es 1.55223*(100) - 100 = 155.223 -


100 = 55.223%

30
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

COMENTARIOS

 Es una medida que emplea todos los datos.


 Es susceptible de tratamiento algebraico. Si se conocen dos de los tres términos
de la expresión, el tercero puede ser determinado.
 La media geométrica es afectada por los valores extremos pero en menor
cantidad que lo es a la media aritmética.
 Es siempre menor que la media aritmética.

Media Armónica

Se define la Media Armónica (H) como el inverso de la media aritmética de los


inversos de los valores de la variable:

Por ejemplo, para los valores 2 - 3 - 6 - 8, la media armónica es 3.56

COMENTARIOS

 Es una medida que emplea todos los datos.


 La media armónica es afectada por los valores extremos pero en menor cantidad
que lo es a la media geométrica.
 Es siempre menor que la media geométrica.
 Resumiendo:

31
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

2.3. MEDIDAS DE VARIABILIDAD


Además de las medidas de localización, suele ser útil considerar las medidas de
variabilidad o de dispersión. Cuando medimos el valor de una variable en una unidad de
estudio, y medimos nuevamente en varias unidades del estudio, se observa que los
valores en general varían entre unidades. La variabilidad o variación es una
característica natural presente en los datos, es decir es esperable que los valores de la
variable sean diferentes.

Recordar que la distribución de una variable provee los posibles valores que la variable
puede tomar y con qué ocurrencia estos valores se presentan. Por lo tanto, la
distribución de una variable muestra el patrón de variación de la misma. Ya vimos
como presentar la distribución de una variable de manera tabular. Ahora vamos a ver
como resumir en forma numérica esta variabilidad de los datos.

Rango

Es la medida de variabilidad más simple. Se define como:

RANGO = “Mayor Valor” - “Menor Valor”

En el ejemplo de la variable edad de los alumnos: Rango = 26 - 18 = 8

COMENTARIOS
 Aunque es la medida de dispersión más simple, rara vez se usa como única
medida. Esto se debe a que emplea solo dos observaciones y no permite “captar
la variación” en todo el conjunto de datos y termina siendo poco informativa.
 El rango es muy sensible a valores extremos.
 En general su uso se limita a conjuntos de datos pequeños.
 Es una medida de variabilidad absoluta

Rango Intercuartílico

El rango intercuartílico es el rango que se encuentra en el 50% central de los datos. Se


define como la diferencia entre el tercer cuartil y el primer cuartil, es decir:

Rango Intercuartílico (RI): Q3 - Q1

En el ejemplo de la variable edad de los alumnos: Q1=19 y Q3=22, por lo tanto RI = 3

COMENTARIOS

 Mide la variabilidad del 50% de los datos centrales.


 No se ve afectada por valores extremos.
 Es una medida de variabilidad absoluta

32
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Varianza

La varianza está basada en la diferencia entre el valor de cada observación y la media


del conjunto de datos. A cada diferencia se la llama desviación y para calcular la
varianza, estas desviaciones respecto de la media se elevan al cuadrado. Por último, se
divide por la cantidad de datos N (caso población) y n-1 (caso muestra). Estas
corresponden a la varianza poblacional y varianza muestral respectivamente.

Las fórmulas de cálculo ya sea de una población o muestra, varían según la situación
en las que disponemos los datos:

En el ejemplo de la variable edad de los alumnos (caso muestra) la varianza se calcula


como:

 Ejemplo de datos sin agrupar:

Y el resultado es 5.511 años2

 Ejemplo de datos agrupados:

Y el resultado es 4.1 años2

COMENTARIOS

 Es una medida que emplea todos los datos


 Debido a que se elevan al cuadrado las diferencias, la unidad de medida está al
cuadrado, con lo cual se dificulta la interpretación
 Es una medida de variabilidad absoluta

33
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Desvío Estándar

El Desvío Estándar se define como la raíz cuadrada positiva de la varianza

Población (Desvío Estándar Poblacional) Muestra (Desvío Estándar Muestral)


𝝈= √𝝈𝟐 𝑺 = √𝑺𝟐

En el ejemplo de la variable edad de los alumnos del curso de grado:

 Ejemplo de datos sin agrupar:


El resultado de la varianza es de 5.511 años2, por lo tanto la raíz cuadrada
aplicada a este valor es 2.348 años.
 Ejemplo de datos agrupados:
De la misma forma, la varianza es de 4.1 años2, por lo tanto la raíz cuadrada
aplicada a este valor es 2.025 años.

COMENTARIOS

 Es una medida que emplea todos los datos


 La unidad de medida del desvío estándar es la misma que los datos originales
de la variable, por lo tanto es más fácil interpretar y comparar con otras medidas
 Es una medida de variabilidad absoluta

Coeficiente de Variación

En algunas ocasiones se requiere una medida que indique cuán grande es la desviación
estándar en relación con la media. Esta medida es el coeficiente de variación y
generalmente se expresa como porcentaje:

Coeficiente de Variación (CV):

Como guía de interpretación se sugiere:

Coeficiente de
Precisión
Variación
CV <= 2,5% Muy buena
2,5% < CV <= 5,0% Buena
5,0% < CV <= 7,5% Bastante buena
7,5% < CV <= 10,0% Regular
10,0% < CV <= 15,0% Bastante mala o poco precisa
15,0% < CV <= 20,0% Mala o muy poco precisa
CV > 20,0% Muy mala

34
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

En el ejemplo de la variable edad de los alumnos, el resultado del promedio es 21.2


años y el desvío estándar es 2.348 años, por lo tanto el coeficiente de variación es CV
= 2.348 / 21.2 ∗ 100 y su resultado es 11.08% del valor de la media.

COMENTARIOS

 Se emplea para comparar dos o más conjuntos de datos con o sin las mismas
unidades de medida. Por ejemplo se puede comparar cuál de las variables
“Edad” y “Altura” tiene más variación.
 Soluciona el “problema” de magnitud de la varianza y el desvío estándar: Por
más pequeños que sean estos valores, ¡no podemos asegurar que tengan poca
variación hasta compararlos con sus promedios!
 Ampliamente usado en la práctica por ser de fácil interpretación y con valores ya
establecidos como referencias.
 Es una medida de variabilidad relativa

Ver ejemplo interactivo de Medidas de Posición y Medidas de Variabilidad:


https://shiny.rstudio.com/gallery/explore-panel-data.html

35
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

2.4. FORMAS DE LA DISTRIBUCIÓN

Simetría – Asimetría

Una medida importante para describir la forma de la distribución es el sesgo.

Cuando una distribución respecto de su medida central (o centro) presenta la


misma “forma” o estructura por izquierda y derecha de su centro, se dice que la
distribución es Simétrica

Alejamientos respecto a esta condición indican que la distribución es Asimétrica.

Una forma de calcular la asimetría con el conjunto de datos es mediante la fórmula del

Otra medida es el coeficiente de asimetría de Pearson. Sólo se puede utilizar en


distribuciones uniformes, unimodales y moderadamente asimétricas. Se basa en que en
distribuciones simétricas la media de la distribución es igual a la moda. Su estimación
para un conjunto de datos muestrales es:

Si:
 Pa=0 : Distribución Simétrica
 Pa>0 : Distribución Asimétrica Positiva
 Pa<0 : Distribución Asimétrica Negativa

36
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Por otra parte, también se puede identificar la asimetría gráficamente, observando y


comparando la ubicación del promedio, modo y mediana:

Kurtosis

La kurtosis es otra característica de la forma de la distribución. Mide el grado de


apuntamiento o “pico” de la distribución.

Una kurtosis grande implica mayor concentración de los valores de la variable cerca de
la media de la distribución (o centro), generando un pico en dicho valor. Lejos de este,
en las colas de la distribución existe relativamente menor frecuencia de datos.

En general se suele comparar las distribuciones respecto a una Distribución Normal, y


las tres formas más comunes de describir la curtosis son:

 Leptocúrtica: Alto apuntamiento. Más apuntada y con colas más gruesas que
la normal.
 Mesocúrtica: Apuntamiento intermedio. Cuando tiene una distribución normal.
 Platicúrtica: Poco apuntamiento o achatada. Menos apuntada y con colas
menos gruesas que la normal.

37
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

2.5. GRAFICOS
Gráfico de Barras
Un gráfico de barras se emplea para representar datos de variables cualitativas
nominales y/o ordinales de una distribución de frecuencias absolutas, relativas o
porcentuales.
En uno de los ejes se indican las etiquetas (categorías) y en otro eje se emplea una
escala adecuada para representar las frecuencias. Para cada categoría con el mismo
ancho de la barra, la altura se extiende hasta la frecuencia correspondiente.
Se pueden representar una (barras simples) o varias (barras múltiples) series de datos
simultáneamente, como así también apilarse.

SIMPLE

MULTIPLE

APILADO

38
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Gráfico de Torta

Un gráfico de torta se emplea para representar datos de variables cualitativas


nominales de una distribución de frecuencias absolutas, relativas o porcentuales. Para
este tipo de gráficos es conveniente que dicha variable tenga pocas categorías para
facilitar la interpretación.

Primero se dibuja un círculo que representa todos los datos y luego se emplea la
frecuencia relativa para subdividir el círculo en sectores correspondientes a dicha
frecuencia relativa de la categoría en cuestión. La subdivisión de cada categoría es un
ángulo X° correspondiente a fr*360° = X°

Por ejemplo, si una categoría tiene fr=0.7, le corresponde un ángulo de 0.7*360=252°

Gráfico de Puntos / Bastones

El gráfico de puntos es útil generalmente para variables cuantitativas discretas o


continuas con pocos valores diferentes. En el eje horizontal se presenta el rango de
datos de la variable y cada dato se representa por un punto colocado sobre este eje.
Los puntos apilados representan las frecuencias de casos de cada valor de la variable.

Si se traza una línea vertical entre las frecuencias de cada valor, se obtiene un “bastón”,
por eso se conoce también como “Gráfico de Bastones”.

39
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Diagrama de Tallo y Hojas

El gráfico conocido como diagrama de tallo y hojas muestra en forma simultánea el


orden jerárquico de los datos y la forma del conjunto de datos. Es útil generalmente para
variables cuantitativas discretas o continuas con pocos valores diferentes. Para
construir un diagrama de tallo y hoja, se inicia acomodando los primeros dígitos de cada
uno de los datos a la izquierda de una línea vertical. A la derecha de la línea vertical se
anota el último dígito de cada dato. Los números a la izquierda de la línea forman
el tallo y cada dígito a la derecha es una hoja. Este gráfico también se puede hacer de
manera horizontal.

Para este ejemplo “|” indica el punto decimal. El primer valor es 18.0 y los siguiente son
19.0, 19.0 (dos veces, por eso la frecuencia 00), etc…

Histograma y Polígono de Frecuencias

El Histograma es uno de los gráficos más empleados para el caso de variables


cuantitativas y sirve para visualizar la distribución de frecuencias absolutas, relativas o
porcentuales.

En el eje horizontal se sitúan los valores de la variable de interés (los intervalos) y en el


eje vertical la frecuencia absoluta, relativa o porcentual. Para cada intervalo se dibuja
un rectángulo (barra) que respeta los límites del intervalo y altura igual a la frecuencia
correspondiente. Los rectángulos entre intervalos consecutivos no tienen separación, es
decir se encuentran unidos.

El polígono de frecuencias que acompaña al histograma se construye marcando las


frecuencias ubicadas en los puntos medios (o marca) y uniendo mediante segmentos
lineales.

Ver ejemplo interactivo de Histograma: https://shiny.rstudio.com/gallery/faithful.html

40
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Gráficos para frecuencias acumuladas: Ojiva - Escalonado

El gráfico de Ojiva se emplea para representar las distribuciones acumuladas. Los


valores de la variable se sitúan en el eje horizontal y las frecuencias acumuladas,
relativas acumuladas o porcentuales acumuladas, en el eje vertical.

La ojiva se construye al graficar cada una de las frecuencias acumuladas del intervalo,
indicando con puntos los límites de los intervalos y dichos puntos conectados mediante
líneas rectas. Cuando se trata de variables discretas, el gráfico presenta un patrón
escalonado.
OJIVA

ESCALONADO

41
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Box Plot
También conocido como diagrama de caja y bigotes (Box and Whisker plot), es un
resumen gráfico para variables cuantitativas basado en el resumen de cinco números.

La clave para la elaboración de un diagrama de caja es el cálculo de la mediana y de


los cuartiles Q1 y Q3. También se necesita el rango intercuartílico RI.

Este gráfico es muy útil, ya que permite ver la forma de los datos, la dispersión y detectar
valores extremos (outliers).
Los pasos para elaborar un diagrama de caja son los siguientes:

1. Se dibuja una caja cuyos extremos se localicen en el primer y tercer cuartil. Esta
caja contiene el 50% de los datos centrales.

2. En el punto donde se localiza la mediana se traza una línea vertical.

3. Usando el rango intercuartílico (RI) se localizan los límites para detectar valores
extremos, generalmente 1.5xRI.

a. Por lo tanto el límite inferior es Q1-1.5xRI y el límite superior es


Q1+1.5xRI.
b. Se trazan líneas desde Q1 y Q3 hasta los límites correspondientes. Los
datos que quedan fuera de estos límites se consideran valores extremos
(outliers). Estas líneas se conocen como los bigotes.

4. Mediante un asterisco (o cualquier símbolo) se indica la localización de los


valores extremos (si existen en el conjunto de datos).

42
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

43
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Actividad II

Realice las siguientes actividades prácticas:

1) Dada la siguiente distribución de frecuencias:

Clase Frecuencia Relativa (fr)


A 0.22
B 0.18
C 0.4
D

a) ¿Cuál es la frecuencia relativa de la clase D?


b) El tamaño de la muestra es 200. ¿Cuál es la frecuencia de la clase D?
c) Calcular y completar la distribución de frecuencia y frecuencia porcentual.

2) En 30 comercios del mismo ramo, se averiguó el total de unidades vendidas del producto P durante la
última semana, obteniéndoselas siguientes cantidades:

6 6 4 5 9 7 6 8 3 4
5 5 7 4 9 8 8 5 6 9
9 8 8 7 6 6 6 7 5 3

a) Definir la población y el tamaño de la muestra.


b) Definir la variable en estudio, el tipo y campo de variación o dominio.
c) Ordenar los datos mediante una tabla de frecuencias.
d) Elegir la quinta fila de la tabla y analizar el significado de cada una de las frecuencias y expresarlo en
lenguaje coloquial.
e) Representar gráficamente los datos

3) Los siguientes valores se refiere al peso de 30 saquitos de té en grs.

1,50 1,35 0,91 1,09 1,25 1,17 1,03 0,99 1,20 1,11
1,35 1,10 1,05 1,00 1,30 0,98 1,28 1,02 1,19 1,15
1,14 1,08 0,99 0,92 0,95 1,20 1,07 0,93 1,07 1,19

a) Identificar y definir la variable en estudio


b) Ordenar los datos y construir la tabla de frecuencias (amplitud 0,10)
c) Representar gráficamente las frecuencias absolutas y las frecuencias acumuladas relativas. Determinar
gráficamente el modo.
d) ¿Qué tipo de asimetría tiene esta distribución? Justifique.
e) ¿Es homogénea la variable en estudio? Justifique.

4) Una consultora de recursos humanos se halla analizando el número de despidos que efectuó la empresa
SAX.srl en los últimos doce meses y recopiló los siguientes datos:

18-15-14-23-20-18-17-18-16-20-18-15

a) Calcular el promedio de despidos, el desvío y la mediana.


b) Analizar si los datos son homogéneos

44
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

5) Se midieron los tiempos de espera, en minutos, de algunos clientes en una sucursal del Banco Río y en
el Banco Galicia en la ciudad de Salta.

Banco Río 6.5 6.6 6.7 6.8 7.1 7.3 7.4 7.7 7.7 7.7
Banco Galicia 4.2 5.4 5.8 6.2 6.7 7.7 7.7 8.5 9.3 10.0

¿De cuál Banco preferiría ser cliente en función a esta información?

6) Los siguientes datos corresponden a la cantidad de menores de edad que integran el grupo familiar en
una muestra de 40 familias:

Menores 0 1 2 3 4 5 6 8
Familias 1 4 9 8 7 6 4 1

a) Completar la tabla con todas las distribuciones de frecuencias


b) Calcular modo, mediana y el promedio de menores por familia. ¿Este último es representativo?
c) ¿En qué porcentaje de las familias hay:
1) ¿3 menores de edad?
2) ¿entre 1 y 4 menores de edad?
3) ¿a lo sumo 2 menores de edad?
4) ¿al menos 5 menores de edad?

7) En la siguiente tabla se muestra la distribución del peso en gramos de una partida de 200 paquetes de
pastillas:
Peso en gramos Cantidad de paquetes
30 – 32 28
32 – 34 36
34 – 36 43
36 – 38 51
38 – 40 27
40 – 42 11
42 – 44 4

a) Calcular modo y mediana.


b) Determinar si los datos anteriores son homogéneos.
c) ¿Cuál es el peso no superado por el 20% de los paquetes?
d) ¿Cuál es el peso sólo superado por el 10% de los paquetes?
e) ¿Qué porcentaje de los paquetes pesa:
1) hasta 40 gramos?
2) por lo menos 34 gramos?
3) como máximo 38,15 gramos?
4) como mínimo 33,50 gramos?

45
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

8) Se desea evaluar cuánto tiempo tarda un atleta en realizar una prueba en los juegos olímpicos. Se sabe
por olimpíadas anteriores que la duración de la misma prueba para un grupo de 50 individuos fue la
siguiente:
X (minutos) Atletas
10-15 8
15-20 21
20-25 10
25-30 7
30-35 4

a) ¿Los datos son homogéneos? Justificarla respuesta. Indicar el tipo de asimetría.


b) ¿Cuánto tiempo tarda el competidor más rápido del 15% de los competidores más lentos?
c) Sabemos que hay 10 medallas para ser entregadas a los competidores más veloces, indicar cuál será el
tiempo máximo que deberá tardar un competidor parta recibir una de ellas.

9) Los siguientes datos corresponden a la distribución de frecuencias del peso de caramelos (en gramos):

Peso de los caramelos 2,35-3,45 3,45-4,55 4,55-5,65 5,65-6,75 6,75-7,85


Cantidad de caramelos 5 14 25 10 6

a) Definir la variable
b) Construir la tabla de frecuencias
c) Calcular el peso medio y la variancia
d) Calcular el modo y la mediana
e) Grafique las frecuencias absolutas simples y las frecuencias acumuladas

10) El director de una biblioteca pública aplicó una encuesta para analizar la satisfacción de los usuarios.
Las 50 personas seleccionadas respondieron a la pregunta: ¿Cuál es la principal causa de queja en el
servicio de la biblioteca?. Las respuestas fueron:

Bibliografía desact. Bibliografía desact Trato del personal Bibliografía desact Bibliografía desact
Horario de atención Instalaciones Bibliografía desact Instalaciones Trato del personal
Sistema préstamos Trato del personal Bibliografía desact Trato del personal Bibliografía desact
Bibliografía desact. Bibliografía desact Sistema préstamos Bibliografía desact Instalaciones
Trato del personal Sistema préstamos Sistema préstamos Trato del personal Bibliografía desact
Bibliografía desact. Horario de atención Bibliografía desact Horario de atención Sistema préstamos
Instalaciones Trato del personal Trato del personal Sistema préstamos Horario de atención
Trato del personal Bibliografía desact Horario de atención Bibliografía desact Trato del personal
Trato del personal Bibliografía desact Trato del personal Trato del personal Bibliografía desact
Bibliografía desact Sistema préstamos Bibliografía desact Instalaciones Bibliografía desact

a) ¿Son fuentes internas o externas? ¿primarias o secundarias?


b) Clasificar la variable bajo estudio.
c) Presentar los datos en una tabla de frecuencias.
d) Graficar los datos.

46
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

11) Una fundación otorga una subvención para pagar una guardería infantil destinada a hijos de
familias donde el padre y la madre trabajan desde las 8.00 hasta las 16.00 horas. Actualmente beneficia
a niños de 200 familias cuyos ingresos totales mensuales no superan $25.000.

Ingresos familiares Cant. de familias


(en miles de $) (fi)
7-9 12
9-11 16
11-13 20
13-15 23
15-17 47
17-19 32
19-21 22
21-23 18
23-25 10
Total 200

Primera parte

a) ¿Las 200 familias constituyen una población o una muestra?


b) ¿Cuál es la amplitud del intervalo
c) Determinar las marcas de clase y las frecuencias relativas
d) Construir un histograma y un polígono de frecuencias relativas
e) Construir las tablas de frecuencias acumuladas relativas
f) Graficar la distribución de (d).

Segunda parte

a) ¿Qué porcentaje de familias tiene un ingreso mínimo de $17.000?


b) ¿Qué porcentaje de familias tiene un ingreso no mayor a $13.000?
c) ¿Qué porcentaje tiene un ingreso promedio de $22.000 o más?
d) ¿Cuál es el ingreso típico?
e) Determinar e interpretar el ingreso mediano.

47
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

UNIDAD III
TEORIA DE LA PROBABILIDAD

3.1. INTRODUCCIÓN

Las probabilidades pertenecen a la rama de la estadística matemática que estudia


ciertos experimentos llamados aleatorios, es decir regidos por el azar, en que se
conocen todos los resultados posibles, pero no es posible tener certeza de cuál será en
particular el resultado del experimento.

La estadística inferencial (concepto presentado en la unidad I) tiene como base la teoría


de probabilidades. Esto se debe a que las conclusiones y generalizaciones que se hacen
y las decisiones que se toman al respecto, se apoyan en la “probabilidad de su validez”
y de esta forma cuantificar la incertidumbre.

3.2. DEFINICIONES BÁSICAS


Experimento Aleatorio: Es todo aquel proceso repetible bajo las mismas condiciones,
cuyos resultados no pueden predecirse con exactitud en cada repetición, aunque es
posible definir cuáles son todos sus posibles resultados.
Espacio Muestral: Es el conjunto de todos los posibles resultados de un experimento
aleatorio.
Punto Muestral: Es cada uno de los posibles resultados de un experimento aleatorio.
Evento o Suceso Aleatorio: Es un conjunto de puntos muestrales.
Sucesos mutuamente excluyentes: Son aquellos sucesos que no pueden aparecer
juntos un una misma repetición de un experimento aleatorio.

Por ejemplo:

 Experimento: “Arrojar un dado y observar que número salió”


 Espacio Muestral : Los resultados posibles son S = {1, 2, 3, 4, 5, 6}
 Punto Muestral : Por ejemplo el 5
 Evento aleatorio: Por ejemplo “que el número sea par”: A = {2, 4, 6}

 Experimento: “Arrojar dos monedas y observar que salió”


 Espacio Muestral : Los resultados posibles son S = {cc, cx, xc, xx}
 Punto Muestral : Por ejemplo “salieron 2 cruces”: xx
 Evento aleatorio: Por ejemplo “ambas monedas son iguales”: A = {cc, xx}

48
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

3.3. DEFINICIÓN DE PROBABILIDAD


Probabilidad Clásica (o de Laplace)
Se denomina probabilidad de un suceso “A” a la relación entre el número total
de resultados que son favorables a este suceso y el número total de resultados
elementales, únicos e igualmente probables

En esta definición se asume que todos los posibles resultados se conocen de


antemano, por eso la probabilidad clásica se denomina “probabilidad a priori”. El
espacio muestral está constituido por puntos muestrales igualmente probables, es decir
cada uno de ellos tiene la misma probabilidad de ocurrencia. El problema es que en la
práctica no siempre es posible determinar las probabilidades del espacio muestral y por
lo tanto no se puede aplicar en esos casos.

Probabilidad Frecuentista

Se denomina probabilidad de un suceso “A” a la relación entre el número total


de experimentos o pruebas en las cuales “A” se ha presentado y el número total
de experimentos o pruebas realmente efectuadas

Probabilidad Subjetiva

La probabilidad de un evento es el grado de confianza que tiene una persona de


que ese evento ocurra en base a la evidencia disponible

Esta definición plantea un juicio personal sobre el valor de la probabilidad de un evento.


Muchas decisiones para problemas particulares requieren de probabilidades subjetivas
ya que no existen situaciones idénticas anteriores como referencias o bien no se pueden
calcular empleando las dos definiciones anteriores.

Este enfoque plantea probabilidades muy difíciles de validar y pueden ser muy
diferentes a las “reales desconocidas”, por ello se debe tratar de reunir toda la
información sobre el tema a efectos de tomar una cuantificación acertada.

Probabilidad Axiomática

Una probabilidad “A” es una función de conjunto que asigna un valor numérico,
no negativo a la ocurrencia de algún suceso perteneciente a un espacio muestral
correspondiente a un experimento aleatorio

1. P(A) ≥ 0 : Principio de no negatividad


2. P(S) = 1 : Donde S es el espacio muestral
3. P(A ∪ B) = P(A) + P(B) : Si “A” y “B” son mutuamente excluyentes

49
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

El primer punto indica que la probabilidad de cualquier evento debe ser siempre un valor
positivo o cero, en este último caso indica que el evento no ocurrirá.

El segundo punto indica que hay certeza que el evento (el espacio muestral en este
caso) ocurrirá, ya que incluye a todos los resultados posibles.

3.4. CÁLCULO DE PROBABILIDADES


Unión e Intersección de eventos

 Unión de Eventos: La unión de A y B es el evento que contiene todos los puntos


muestrales que pertenecen a A o a B, o a ambos. La unión se denota P(A ∪ B).

 Intersección de Eventos: La intersección de A y B es el evento que contiene


los puntos muestrales que pertenecen tanto a A como a B. La intersección se
denota P(A ∩ B).

Eventos excluyentes y no excluyentes

Recordemos nuevamente que los sucesos o eventos mutuamente excluyentes son


aquellos sucesos que no pueden aparecer juntos un una misma repetición de un
experimento aleatorio, es decir no tienen puntos muestrales en común.

50
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Para estos casos se aplica la “Regla de la Suma (Adición)” y se tiene que:

 Sucesos Mutuamente excluyentes : P(A ∪ B) = P(A) + P(B)


 Sucesos NO Mutuamente excluyentes : P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

Por ejemplo:

1. “Determinar la probabilidad de obtener una sota o rey en las 40 cartas


de la baraja española”.

Los eventos “sota” y “rey” no pueden ocurrir simultáneamente, por lo tanto son
eventos mutuamente excluyentes

P(sota ∪ rey) = P(sota) + P(rey) = 4/40 + 4/40 = 8/40

2. “Determinar la probabilidad de obtener una sota o una


carta de copa”.

Los eventos “sota” y “copa” si pueden ocurrir simultáneamente ya que se puede


obtener una sota de copa, por lo tanto son eventos no mutuamente excluyentes

P(sota ∪ copa) = P(sota) + P(copa) – P(sota ∩ copa) = 4/40 + 10/40 – 1/40 = 13/40

Probabilidades Condicionales

La definición de una probabilidad condicional entre dos eventos A y B es:

Esto indica que se está considerando la probabilidad del evento A dada la condición de
que el evento B ha ocurrido. Por tanto, la notación se lee “la probabilidad de A dado B”
(o dado que ocurrió B).

51
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Eventos Independientes y Dependientes

Dos eventos A y B son independientes si:

Para estos casos se aplica la “Regla de la Multiplicación” y se tiene que:

 Sucesos Independientes : P(A ∩ B) = P(A) ∗ P(B)


 Sucesos NO Independientes (Dependientes) : P(A ∩ B) = P(B) ∗ P(A / B)

Por ejemplo:

1. “Determinar la probabilidad de que se obtengan una sota y luego un rey teniendo


en cuenta que después de sacar la primera carta se la repone”.

Las probabilidades de “sota” y “rey” al haber reposición luego de la primera


selección (la carta vuelve al mazo), no cambian, es decir que el “rey” no está
condicionado por el evento “sota”

P(sota ∩ rey) = P(sota) * P(rey) = 4/40 * 4/40 = 1/100 = 0,01

2. “Determinar la probabilidad de que se obtengan una sota y luego un rey teniendo


en cuenta que después de sacar la primera carta NO se la repone”.

Las probabilidades de “sota” y “rey” al no haber reposición luego de la primera


selección (la carta no vuelve al mazo), cambian, por lo tanto la probabilidad de
sacar un “rey” está condicionado por sacar una “sota” previamente

P(sota ∩ rey) = P(sota) * P(rey / sota) = 4/40 * 4/39 = 16/1560 = 0,0103

52
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

3.5. ESTRATEGIAS PARA EL CALCULO DE PROBABILIDADES


Al asignar probabilidades es necesario saber identificar y contar los resultados
experimentales. A continuación se presentan diversas estrategias para identificar
probabilidades y aplicar reglas de conteo.

Tablas de Contingencia

En cada celda interna de la tabla se pueden observar las probabilidades conjuntas,


es decir la intersección de los dos eventos.

En las celdas que aparecen en los márgenes de la tabla (los totales) se pueden observar
las probabilidades marginales, es decir las probabilidades de cada uno de los eventos
por separado. Se llaman así porque están en los márgenes de la tabla.

En esta tabla ¡NO se incluyen las probabilidades condicionales! Si bien estas no


forman parte de la tabla, comúnmente son necesarias para obtener alguna de las
probabilidades de la tabla de contingencia, haciendo uso de la expresión dada por la
definición de probabilidad condicional. Por ejemplo, si la P(B) y P(A / B) son datos
conocidos:

1. Usando la definición P(A / B) = P(A ∩ B) / P(B) se puede despejar y obtener la


probabilidad de P(A ∩ B) como el producto P(A / B) * P(B)

2. Este resultado se incluye en la tabla de contingencia

Experimentos de pasos múltiples

La primera regla de conteo que se presenta sirve para experimentos de pasos múltiples.
Esta regla permite determinar el número de resultados experimentales sin tener que
enumerarlos.

Un experimento se describe como una sucesión de k pasos en los que hay n1


resultados posibles en el primer paso, n2 resultados posibles en el segundo
paso y así en lo sucesivo, entonces el número total de resultados
experimentales es (n1)*(n2)* . . .*(nk).

Ejemplo:

Si considera el experimento del lanzamiento de dos monedas como la sucesión de


lanzar primero una moneda (n1 = 2) y después lanzar la otra (n2 = 2), siguiendo la regla
de conteo (2)*(2) = 4, entonces hay cuatro resultados distintos. Estos resultados son
S:{(H,H),(H, T), (T, H), (T, T)}.

53
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Por ejemplo, el número de resultados experimentales del lanzamiento de seis monedas


es (2)*(2)*(2)*(2)*(2)*(2)=64 resultados distintos.

Diagrama de Árbol

Es una representación gráfica que permite visualizar un experimento de pasos múltiples.

Siguiendo el ejemplo del lanzamiento de dos monedas, se puede indicar:

 La secuencia de los pasos en el diagrama va de izquierda a derecha.


 El paso 1 corresponde al lanzamiento de la primera moneda, el paso 2 al de la
segunda moneda.
 En cada paso, los dos resultados posibles son cruz o cara. A cada uno de los
resultados posibles en el paso 1 pertenecen dos ramas por los dos posibles
resultados en el paso 2.
 Cada uno de los puntos en el extremo derecho del árbol representa un resultado
experimental.
 Cada trayectoria a través del árbol, desde el nodo más a la izquierda hasta uno
de los nodos en el extremo derecho del árbol, muestra una secuencia única de
resultados.

Esta estrategia del diagrama de árbol también se emplea para identificar probabilidades
condicionales y probabilidades conjuntas

54
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

EJEMPLO DE ARMADO DE UNA TABLA DE CONTINGENCIA

Se presentan 100 postulantes, 40 mujeres (M) y 60 varones (V) para un examen de


admisión a distintos cargos en una empresa. De las mujeres, aprobaron (A) el 90%,
mientras que el 20% de los varones desaprobaron (D) el examen.

Pasos:

1. Identificar en los datos, los tipos de probabilidades: marginales, conjuntas o


condicionales. Para este ejemplo, los datos permiten determinar:

- P (M) = 0,40 (40 / 100)


- P (A/M) = 0,90 (“De las mujeres, aprobaron (A) el 90%”)
- P (D/M) = 0,10 (sale por diferencia)
- P (V) = 0,60 (60 / 100)
- P (A/V) = 0,80 (“el 20% de los varones desaprobaron (D)”)
- P (D/V) = 0,20 (sale por diferencia)

2. Calcular las probabilidades conjuntas que falten para completar la tabla:

- Podemos guiarnos por la definición de probabilidad condicional o bien


armando un diagrama de árbol:

3. Completar la tabla. Recordar que en ella no se incluyen las probabilidades


condicionales.
Resultado del
Sexo Examen Total
A D
Varón 0,48 0,12 0,6
Mujer 0,36 0,04 0,4
Total 0,84 0,16 1
Calcular:
a) P(A)
b) P(V ∩ D)
c) P(V / A)
d) P( A / V)
e) Independencia entre Sexo y Resultado del examen

a) 0,84
b) 0,12
c) P(V / A) = 0,48 / 0,84 = 0,57
d) P(A / V) = 0,48 / 0,6 = 0,8
e) Hay que elegir algún evento entre sexo y resultado y ver si se cumple por ejemplo
P(M) = P(M / A) ?
P(M) = 0,4 y P(M / A) = 0,36 / 0,84 = 0,43. Los valores 0,4 y 0,43 no son iguales,
por lo tanto no son independientes

55
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Permutaciones

Las permutaciones consisten en cambiar el orden de un conjunto, y poder determinar


cuántas posibilidades de ver de distintas formas ordenadas del conjunto existen.

El número de permutaciones de n objetos es:

A este número se lo denomina factorial de n y lo simbolizamos como n!

Ejemplo:

“Determinar la cantidad de ordenamientos distintos del conjunto de libros de una


biblioteca de 5 libros”

Como n=5 se tiene que P5 = 5! = 5(4)(3)(2)(1) = 120 posibilidades distintas

Combinaciones

Es otra regla de conteo útil que permite contar el número de resultados experimentales
cuando el experimento consiste en seleccionar n objetos de un conjunto de N objetos y
el orden o ubicación de los objetos no es relevante.

El número de combinaciones de N objetos tomados de n en n es:

Se establece que 0! = 1

Ejemplo:

“Considere un procedimiento de control de calidad en el que un inspector selecciona al


azar dos de cinco piezas para probar que no tengan defectos. En un conjunto de cinco
partes, ¿cuántas combinaciones de dos partes pueden seleccionarse?”.

Como N=5 y n=2 se tiene que

Arreglos

Permite contar el número de resultados experimentales cuando el experimento consiste


en seleccionar n objetos de un conjunto de N objetos y el orden o ubicación de los
objetos si es relevante. Los mismos n objetos seleccionados en orden diferente se
consideran un resultado experimental diferente.

El número de arreglos de N objetos tomados de n es:

La regla de conteo para arreglos tiene relación estrecha con la de combinaciones, sin
embargo, con el mismo número de objetos, el número de arreglos que se obtiene en un

56
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

experimento es mayor que el número de combinaciones, ya que cada selección de n


objetos se ordena de n! maneras diferentes.

Ejemplo:

Retomando el ejemplo del procedimiento de control de calidad en el que un inspector


selecciona al azar dos de cinco piezas para probar que no tengan defectos, ¿Cuántos
arreglos puede seleccionar?

Como N=5 y n=2 se tiene que

A los arreglos también se los conoce como permutaciones de n objetos de un


conjunto de N, por ello comúnmente se los indica como

EJEMPLO DE USO DE REGLAS DE CONTEO

Una caja contiene 15 tarjetas, 6 rojas y 9 verdes. Se sacan 4 tarjetas aleatoriamente.

Determinar la probabilidad de que:


a) Sean 4 rojas o 4 verdes
b) Sean 2 rojas y 2 verdes

Pasos:

1. Calcular el número total de posibles resultados de sacar 4 tarjetas entre las 15.
Esto es una combinación de 15C4 = 1365

2. Para el punto “a”:


- El total de combinaciones de 4 rojas de un total de 6 es 6C4 = 15
- El total de combinaciones de 4 verdes de un total de 9 es 9C4 = 126
- Como se pide P(4 rojas o 4 verdes) es un caso de “unión” y hacemos uso
de la regla de la adición: 15 + 126 = 141
- La P(4 rojas o 4 verdes) = 141 / 1365 = 0,103

3. Para el punto “b”:


- El total de combinaciones de 2 rojas de un total de 6 es 6C2 = 15
- El total de combinaciones de 2 verdes de un total de 9 es 9C2 = 36
- Como se pide P(2 rojas y 2 verdes) es un caso de “intersección” y
hacemos uso de la regla de la multiplicación: 15 * 36 = 540
- La P(2 rojas y 2 verdes) = 540 / 1365 = 0,396

57
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

3.6. TEOREMA DE BAYES


En el análisis de probabilidades, específicamente de las probabilidades condicionales,
por lo general se suele iniciar el análisis con una estimación de probabilidad inicial
o probabilidad previa (a priori) de los eventos que interesan. Después, de fuentes
como una muestra, una información especial o una prueba del producto, se obtiene más
información sobre estos eventos. Dada esta nueva información, se modifican o revisan
los valores de probabilidad mediante el cálculo de probabilidades revisadas a las que
se les conoce como probabilidades posteriores (a posteriori). El teorema de Bayes
es un medio para calcular estas probabilidades.

El teorema de Bayes es aplicable cuando los eventos para los que se quiere calcular
la probabilidad revisada son mutuamente excluyentes y su unión es todo el
espacio muestral (si la unión de los eventos es todo el espacio muestral, los
eventos son exhaustivos).

En el caso de n eventos mutuamente excluyentes A1, A2, A3,…, An, cuya unión sea todo
el espacio muestral, el teorema de Bayes aplica para calcular cualquiera de las
probabilidades posteriores P(Ai / B) como se muestra a continuación:

Nótese que la expresión del denominador es la probabilidad de observar el evento B, es


decir P(B).

58
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Actividad III

Realice las siguientes actividades prácticas:

1) Sea el experimento que consiste en tirar un dado equilibrado y ver qué número sale en la cara superior.
a) Esquematizar el espacio muestral
b) Calcular la probabilidad de:

1) obtener un cuatro.
2) obtener un número par.
3) obtener un múltiplo de 3

2) En una empresa trabajan 80 personas. 30 son mujeres y 45 personas residen en zona Norte. Además hay
13 personas que son mujeres y residen en la zona Norte. Calcular la probabilidad de que si se selecciona
una persona al azar:

a) sea mujer o viva en la zona Norte


b) si vive en la zona Norte que sea varón

3) Para promocionar una nueva vacuna contra la hepatitis B, un laboratorio realiza una encuesta entre 40
mujeres de más de 40 años y 50 hombres de la misma edad, que se habían vacunado con la vacuna de
laboratorio. Encontraron que entre los hombres vacunados el 2% había contraído la enfermedad, mientras
que entre las mujeres vacunadas solo 16 habían contraído la enfermedad. Se elige una persona al azar que
está vacunada, cuál es la probabilidad:

a) De que se trate de un hombre enfermo.


b) Que sea mujer o esté enferma.
c) Si está enferma, que sea mujer.
d) Demostrar si los sucesos son estadísticamente independientes.
e) Si se toman dos personas al azar, cuál es la probabilidad de que sean del mismo sexo.

4) En una zona rural el 3 % de los habitantes contrae una enfermedad, que se detecta con un análisis el cual
da positivo en el 90% de las personas enfermas y en el 8% de las sanas. Si se le practica el análisis a una
persona, cuál es la probabilidad de que:

a) Esté enfermo y el análisis sea positivo


b) esté sano o el análisis le haya dado negativo
c) resulte positivo cuando está enferma realmente
d) que esté enferma o que el resultado sea negativo

5) Sabiendo que C, D y E son sucesos exhaustivos y que la probabilidad de C es el triple que la de D y esta
a su vez en el doble de la probabilidad de E. Calcular la probabilidad de cada uno de los sucesos.

6) Sabiendo que los sucesos A y B son independientes y que: P(A)=h, P (A U B)=0,6 y que la P(B)=0.2.
Se pide calcular el valor de h.

59
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

7) A un grupo de 300 personas que padecían una enfermedad viral que todavía no tenía un tratamiento
específico, se le suministraron tres tipos de vacunas y se analizó la inmunización a dicho virus:

Inmunización Vacuna I Vacuna II Vacuna III Totales


Inmunizó 30 70 50 150
No inmunizó 60 70 20 150
Totales 90 140 70 300

a) ¿Qué porcentaje de los individuos no fueron inmunizados con la vacuna II?


b) De los individuos no inmunizados ¿Qué porcentaje fue vacunado con la II?
c) ¿Cuál de las tres vacunas fue más efectiva?
d) Si se seleccionan tres individuos vacunados al azar ¿cuál es la probabilidad de que dos de ellos
inmunicen y el restante no?

8) Un fabricante de videograbadoras (RCV) compra un cierto microchip, a tres proveedores. Un 30 % de


los microcircuitos se compran a Electronic S:A ,un 20 % a Crown y el resto a Componentes CC. El
fabricante tiene historiales extensos de los tres proveedores y sabe que el 3 % de los microchip de Electronic
son defectuosos en tanto que los de Crown tienen un 5 % de defectuosos y un 4 % de los de Componentes
CC son defectuosos. Cuando los microcircuitos llegan al fabricante los coloca en un depósito, y no son
inspeccionados o identificados de algún modo por el proveedor. Calcular la probabilidad de que:
a) haya sido fabricado por Crown y sea defectuoso.
b) sea defectuoso
c) siendo defectuoso, corresponda a la partida enviada por Componentes CC.
d) si se extraen dos microcircuitos al azar, ambos sean del mismo proveedor

9) Se conoce por estudios recientes que la probabilidad de aprobar Estadística en UCASAL es de 0.7. Si se
seleccionan al azar 4 estudiantes, ¿cuál es la probabilidad de que 2 de ellos aprueben Estadística y los
restantes no?

10) Supongamos que una empresa manufacturera recibe embarques de partes de 2 proveedores distintos.
Actualmente el 65 % de las partes que compra la empresa provienen del proveedor que llamaremos A y el
resto del proveedor B. La calidad de las partes varía según su origen. Los niveles históricos de la calidad
de los proveedores indican que la probabilidad de que una parte sea considerada mala dado que proviene
del proveedor A es del 2 %, mientras que si proviene del proveedor B es del 5 %.

a) Determine la probabilidad de que la parte sea buena y provenga de A.


b) Calcule la probabilidad de que una parte sea mala.
c) Si la parte es considerada mala ¿cuál es la probabilidad de que provenga del proveedor B?

60
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

UNIDAD IV
DISTRIBUCION DE PROBABILIDADES

4.1. VARIABLE ALEATORIA


En esta unidad se continúa con el estudio de probabilidad y se introducen los conceptos
correspondientes a variable aleatoria y distribuciones de probabilidad.

Una variable aleatoria proporciona el medio para describir los resultados experimentales
empleando valores numéricos.

Una variable aleatoria es una descripción numérica del resultado de un


experimento

Deben tomar valores numéricos, por lo tanto es una función del Espacio Muestral que
asocia un valor numérico a cada uno de los resultados experimentales.

Una variable aleatoria puede ser discreta o contínua dependiendo del tipo de valores
que asuma.

Descargar aplicación de Distribuciones de Probabilidades “Probability Distributions”:


https://play.google.com/store/apps/details?id=com.mbognar.probdist&hl=es_AR

4.2. VARIABLES ALEATORIAS DISCRETAS


Una variable aleatoria que asume un número finito de valores o una cantidad
infinita de valores numerables (contables) es una variable aleatoria discreta.

Función de Probabilidad

En el caso de una variable aleatoria discreta X, la distribución de probabilidad o función


de probabilidad, está definida por: p(x) = P(X = x).

Esta función permite obtener la probabilidad de cada valor de la variable. La probabilidad


es la suma de las probabilidades de los puntos muestrales del Espacio Muestral que
tienen asignado el valor de “x”. Como la distribución de probabilidad es una función que
asigna probabilidades, a esto se debe que se la llame función de probabilidad.

Para que la variable X tenga función de probabilidad discreta deben cumplirse las
siguientes dos condiciones:

1. 0 ≤ p(x) ≤ 1 para toda x


2. ∑ p(x) = 1

61
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Esperanza o Valor Esperado de la variable aleatoria

El valor esperado, promedio o media de una variable aleatoria, es una medida de la


localización central. Para una variable aleatoria discreta se define como:

Varianza y Desvío de la variable aleatoria

La varianza de una variable aleatoria discreta se define como:

El desvío nuevamente se define como la raíz cuadrada de la varianza.

Por ejemplo, sea la variable X: Cantidad de miembros del hogar que trabajan

La media o valor esperado de X es:

E(X) = 1*(0.3) + 2*(0.4) + 3*(0.2) + 4*(0.1) = 2.1

La varianza y desvío de X es:

V(X) = (1 - 2.1)2*(0.3) + (2 - 2.1)2*(0.4) + (3 - 2.1)2*(0.2) + (4 - 2.1)2*(0.1) = 2.301

DE(X)= 1.52

A continuación se presentan las Distribuciones de Probabilidad Discretas más


habituales de encontrar en la práctica: D. Binomial, D. Poisson, D. Hipergeométrica

Distribución Binomial

La distribución de probabilidad binomial es una distribución de probabilidad que tiene


muchas aplicaciones. Un experimento binomial tiene las cuatro propiedades siguientes:

1. El experimento consiste en una serie de n ensayos idénticos.


2. En cada ensayo hay dos resultados posibles. A uno de estos resultados se le
llama éxito y al otro se le llama fracaso.
3. La probabilidad de éxito, que se denota p, no cambia de un ensayo a otro. Por
ende, la probabilidad de fracaso, que se denota 1-p=q, tampoco cambia de un
ensayo a otro.
4. Los ensayos son independientes.

La variable aleatoria bajo estudio es X: número de éxitos observados en n ensayos.

62
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Dado que el número de estos valores es finito, x es una variable aleatoria discreta. A la
distribución de probabilidad correspondiente a esta variable aleatoria se le
llama distribución de probabilidad binomial.

Considere el experimento que consiste en “lanzar una moneda ocho veces y observar
si la cara de la moneda que cae hacia arriba es cara o cruz”. Suponga que se desea
contar el número de caras que aparecen en los ocho lanzamientos. ¿Presenta este
experimento las propiedades de un experimento binomial? ¿Cuál es la variable aleatoria
que interesa?

1. El experimento consiste en ocho ensayos idénticos donde cada ensayo consiste


en lanzar una moneda.
2. En cada ensayo hay dos resultados posibles: cara (C) o cruz (X). En este
experimento se considera cara como éxito y cruz como fracaso.
3. La probabilidad de éxito y la probabilidad de fracaso son iguales en todos los
ensayos, siendo p=0.5 y q=0.5.
4. Los ensayos o lanzamientos son independientes porque al resultado de un
ensayo no afecta a lo que pase en los otros ensayos o lanzamientos.

Se satisfacen las propiedades de un experimento binomial. La variable aleatoria que


interesa es x: número de caras que aparecen en ocho ensayos. En este caso, x puede
tomar los valores 0, 1, 2, 3, 4, 5, 6, 7, 8.

Considere ahora un resultado particular del experimento:

 CCCCCXXXCCCCCXXX en n=8 posiciones, se obtuvo x = 5 caras y n-x = 8 -


5=3 cruces
 La probabilidad de obtener cara no cambia entre ensayos, por lo tanto para este
resultado particular se tiene

 Cualquier otro resultado es una posible combinación de “x caras” y “n-x cruces”


con la misma probabilidad de

 La cantidad de resultados posibles de obtener “x caras” está formado por el n°

combinatorio de con probabilidad

De esto último se deduce la fórmula de la distribución de probabilidad binomial:

Donde
 x = 0,1,2,..,n
 0≤p≤1

Valor Esperado y Varianza de la Distribución Binomial

 E(x) = np
 Var(x) = np(1−p) = npq

63
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Cálculo de probabilidades empleando las tablas de la Binomial

El cálculo de las probabilidades con la fórmula de la binomial resulta tedioso sobre todo
cuando n es grande. Esto se simplifica utilizando las tablas de la distribución binomial
para probabilidades puntuales y probabilidades acumuladas. Estas se encuentran en el
Anexo I y II.

Para calcular probabilidades hacemos los siguientes pasos:

1. Identificamos el tamaño de muestra del problema (n) y buscamos el encabezado


de la tabla correspondiente : “n=valor”
2. Identificamos en la primera columna, el número de éxitos (x) y nos paramos en
la fila que corresponde con el problema.
3. Identificamos desde la segunda columna en adelante, la probabilidad de éxito
(p) que corresponde con el problema.
4. El valor de probabilidad es la intersección de x y p.

Por ejemplo: “La selección argentina de fútbol jugará 10 partidos durante una gira. Se
sabe que en la región donde se realizarán los partidos el 20% de los días son
lluviosos”. Identificamos los parámetros que en este ejemplo son n=10 y p=0.2.

a. Definir la variable:
“Cantidad de partidos que la selección jugará con lluvia, sobre un total de 10
partidos”.
 La selección jugará con lluvia = es el “éxito” para este ejemplo
 “10 partidos” = es la cantidad de casos “n”

b. ¿Cuál es la probabilidad de que 5 partidos se jueguen en la lluvia?


P(x = 5 / n=10 y p=0,20) = 0,02642 (tabla de probabilidades puntuales)

c. Calcular la probabilidad de que no más de dos partidos se jueguen en la lluvia:


P(x<=2 / n=10 y p=0,20) = P(x = 0) + P(x = 1) + P(x = 2) = 0,10737 + 0,26844 +
0,30199 = 0,6778 (tabla de probabilidades puntuales)

En lugar de sumar las probabilidades puntuales, se puede utilizar la tabla que


contiene las probabilidades acumuladas:
P(x<=2 / n=10 y p=0,20) = 0,6778 (tabla de probabilidades acumuladas)

d. ¿Cuál es la probabilidad de que a lo sumo 4 partidos se jueguen en la lluvia?


P(x<=4 / n=10 y p=0,20) = 0,96721 (tabla de probabilidades acumuladas)

e. Determinar la probabilidad de que 3 o más partidos se jueguen en la lluvia:


P(x >= 3 / n=10 y p=0,20) (tabla de probabilidades puntuales)

Usando la tabla de probabilidades acumuladas, obtenemos la probabilidad de


que hasta 2 partidos se jueguen bajo la lluvia.
P(x<=2 / n=10 y p=0,20) = 0,6778, por lo tanto
P(x >= 3) = 1 - P (x <= 2) = 1 - 0,6778 = 0,3222

f. ¿Cuantos partidos se espera que se jueguen en la lluvia?


En este caso se pide el valor esperado de la variable E(X) = np = 10 * 0.2 = 2
Se espera que de los 10 partidos, 2 se jueguen con lluvia

64
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Distribución Poisson

En este caso interesa emplear una variable aleatoria discreta que permita conocer el
número de veces que sucede un hecho determinado (ocurrencias) en un intervalo de
tiempo o de espacio, volumen u otra unidad. Si se satisfacen las condiciones siguientes,
el número de ocurrencias es una variable aleatoria discreta, descrita por la distribución
de probabilidad de Poisson:

1. La probabilidad de ocurrencia es la misma para cualesquiera dos intervalos de


la misma magnitud.
2. La ocurrencia o no-ocurrencia en cualquier intervalo es independiente de la
ocurrencia o no-ocurrencia en cualquier otro intervalo.

La variable aleatoria bajo estudio es X: Cantidad de ocurrencias en un intervalo de


tiempo, espacio, volumen u otra unidad.

Una forma de determinar dicha distribución es considerando la situación límite de una


Distribución Binomial, cuando n es suficientemente grande y la probabilidad de éxito es
pequeña.

Considere el experimento de “observar la cantidad de accidentes en una semana”.

 Si se divide la semana en n subintervalos cada uno tan corto que a lo sumo


podría ocurrir un accidente con una determinada probabilidad, y a su vez la
ocurrencia de accidentes es independiente entre intervalos (se tiene una D.
Binomial)
 Si se divide la semana en una mayor cantidad n de subintervalos, la probabilidad
de que ocurra un accidente disminuye. En el límite de una probabilidad binomial
con p→0 y n→∞ se define λ=np

Se deduce la fórmula de la distribución de probabilidad Poisson:

Donde
 X = 0, 1, 2,…
 λ>0
 λ es el número medio de ocurrencias en el intervalo

Valor Esperado y Varianza de la Distribución Poisson

 E(x) = λ
 Var(x) = λ

65
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Cálculo de probabilidades empleando la tabla de Poisson

La tabla correspondiente a esta distribución se encuentra en el Anexo III. Para calcular


probabilidades puntuales hacemos los siguientes pasos:

1. Identificamos en la primera columna, la cantidad de ocurrencias (x) y nos


paramos en la fila que corresponde con el problema.
2. Identificamos desde la segunda columna en adelante, el número medio de
ocurrencias (λ) que corresponde con el problema.
3. El valor de probabilidad es la intersección de x y λ.

Por ejemplo: “En un banco de la ciudad de Salta, en promedio cinco personas utilizan
un cajero automático cada hora”. Identificamos el parámetro de este ejemplo λ =5.

a. Definir la variable:
“Cantidad de personas que utilizan el cajero automático en un lapso de 1 hora”.
 Lapso de 1 hora = es el “intervalo de tiempo” para este ejemplo

b. ¿Cuál es la probabilidad de que en una hora elegida


aleatoriamente, dos personas utilicen el cajero automático?”
P(x = 2 / λ =5) = (5)2 e(- 5) / 2! = 0.0842 (empleando la fórmula)
P(x = 2 / λ =5) = 0,0842 (tabla de probabilidades puntuales)

c. ¿Cuál es la probabilidad de que una hora elegida


aleatoriamente, una persona utilice el cajero automático?”
P(x = 1 / λ =5) = 0,0337 (tabla de probabilidades puntuales)

d. ¿Cuál es la probabilidad de que en una hora elegida


aleatoriamente, no más de dos personas utilicen el cajero automático?”
P(x <= 2 / λ =5) = P(x = 0) + P(x = 1) + P(x = 2) = 0.0067 + 0.0337 + 0.0842
(tabla de probabilidades puntuales – suma de probabilidades)

e. ¿Cuál es la probabilidad de que en media hora elegida


aleatoriamente, tres personas utilicen el cajero automático?”
 En este caso se plantea el cálculo de probabilidades en un
intervalo de media hora y NO en una hora.
 Para resolverlo, debemos encontrar un nuevo valor de λ* (número
medio de ocurrencias) en media hora.
 Hacemos uso de la información que ya conocemos, es decir λ = 5
y empleamos una regla de tres simple:

Calculamos la probabilidad con la tabla, empleando este nuevo


valor de λ*.
P(x = 3 / λ =2.5) = 0,2138 (tabla de probabilidades puntuales)

f. ¿Cuantas personas se espera que utilicen el cajero automático en una hora?


En este caso se pide el valor esperado de la variable E(X) = λ = 5
Se espera que en promedio, 5 personas por hora utilicen el cajero automático

66
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Distribución Hipergeométrica

La distribución de probabilidad hipergeométrica está estrechamente relacionada con la


distribución binomial, pero difieren en dos puntos:

 En la distribución hipergeométrica los ensayos no son independientes


 La probabilidad de éxito varía de ensayo a ensayo

La variable aleatoria es X: número de éxitos observados en una muestra n

En general en la distribución hipergeométrica, se indica con r al número de elementos


considerados como éxitos que hay en una población de tamaño N, y N-r indica el
número de elementos considerados como fracasos que hay en dicha población.

La función de probabilidad hipergeométrica se usa para calcular la probabilidad de que


en una muestra aleatoria de n elementos seleccionados sin reemplazo, se tengan x
éxitos y n-x fracasos.

Para que esto último ocurra, debe tener x éxitos de los r éxitos que hay en la población
y n-x fracasos de los N-r fracasos, es decir involucra conceptos de números
combinatorios.

La fórmula de la distribución de probabilidad Hipergeométrica:

Donde
 x=0,1,2,..,n sujeto a las restricciones
o x≤r
o n−x ≤ N−r

Representa el número de maneras en que es posible tomar una muestra de tamaño


n de una población de tamaño N.

Representa el número de formas en que se toman x éxitos de un total de r éxitos


que hay en la población.

Representa el número de maneras en que se puede tomar n-x fracasos de un


total de N-r que hay en la población.

Valor Esperado y Varianza de la Distribución Hipergeométrica

E(x) = n(r/N)
Var(x) = n(r/N)(1 – r/N)( (N−n)/(N−1) )

67
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Para el cálculo de probabilidades, esta distribución no cuenta con una tabla. Por ello los
cálculos deben realizarse empleando la fórmula de la distribución. Existen expresiones
que permiten hacer cálculos empleando la distribución Binomial, pero no se presentan
en este curso, solo nos limitaremos a emplear la función de distribución
Hipergeométrica.

Por ejemplo: “Una biblioteca posee 10 textos de Estadística, de los cuales 6 son de
autores extranjeros. Se eligen al azar 5 textos.

a. Definir la variable:
“Cantidad de textos de autores extranjeros en una muestra de 5 textos”
 textos de autores extranjeros = es el “éxito” para este ejemplo
 “5 textos” = es la cantidad de casos “n”

b. Identificamos los parámetros:


 N = 10
 r=6
 n=5

c. ¿Cuál es la probabilidad de que 3 textos sean de autores extranjeros?”.


(6)(10−6) (6)(4)
𝑃(𝑥 = 3) = 3 105−3 = 3102 = 0.47619
(5) (5)

4.3. VARIABLES ALEATORIAS CONTINUAS


Una variable aleatoria que asume cualquier valor numérico dentro de un
intervalo o colección de intervalos es una variable aleatoria contínua

Función de Distribución y Función de densidad

Como primer paso debemos definir que es una función de distribución de una variable
aleatoria contínua: F(X) = P(X ≤ x) para −∞<x<∞

Si X es una variable aleatoria contínua con función de distribución F(x), siempre que
exista la derivada, se puede determinar la función de densidad de probabilidad para la
variable X.

Al igual que en el caso discreto, el equivalente para que la variable X tenga función de
densidad contínua debe cumplir las siguientes dos condiciones:

Si la variable aleatoria X tiene función de densidad f(x), entonces la probabilidad de que


X esté en el intervalo [a , b] , es decir P(a ≤ X ≤ b) se calcula empleando integrales.

68
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Al igual que en el caso discreto, se puede definir la Esperanza y Varianza de la variable


X.

A continuación se presenta la Distribución de Probabilidad Contínua más importante, la


Distribución Normal. En base a esta se desarrollaron la mayoría de las técnicas
estadísticas clásicas y se aplica en diversos campos de la ciencia.

Distribución Normal

Características:
 Se emplea extensamente en la práctica para describir variables aleatorias
continuas
 La distribución normal tiene una importante aplicación en inferencia estadística
 Es una distribución con forma acampanada y simétrica
 Las colas de la curva normal se extienden al infinito en ambas direcciones y en
teoría jamás tocan el eje horizontal. Dado que es simétrica, la distribución normal
no es sesgada, su sesgo es cero
 Parámetros: μ ; σ2
 Dominio: −∞ ; +∞
 El punto más alto de una curva normal se encuentra sobre la media, la cual
coincide con la mediana y la moda
 La desviación estándar determina qué tan plana y ancha es la curva normal.
Desviaciones estándar grandes corresponden a curvas más planas y más
anchas, lo cual indica mayor variabilidad en los datos
 Puntos de inflexión: x = μ ± σ ; x = μ ± 2σ ; x = μ ± 3σ
 Para hallar la probabilidad de que una variable aleatoria normal esté dentro de
un determinado intervalo, se tiene que calcular el área que se encuentra bajo la
curva normal y sobre ese intervalo (aplicando integrales)

Una variable aleatoria X tiene Distribución Normal, si la función de densidad de X es:

Donde −∞ < x < +∞

A continuación se presenta la función de densidad normal que define la curva en forma


de campana de la Distribución Normal:

69
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

El efecto de la desviación estándar

Esperanza y Varianza de la Distribución Normal

 E(x)=μ
 Var(x)=σ2

Los porcentajes de los valores que se encuentran en algunos intervalos comúnmente


usados son:

1. 68.3% de los valores de una variable aleatoria normal se encuentran más o


menos una desviación estándar de la media.
2. 95.4% de los valores de una variable aleatoria normal se encuentran más o
menos dos desviaciones estándar de la media.
3. 99.7% de los valores de una variable aleatoria normal se encuentran más o
menos tres desviaciones estándar de la media.

70
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Distribución Normal Estándar

Es un caso particular cuando la Distribución Normal tiene Media cero y desvío uno:
 Parámetros: μ = 0 ; σ = 1
 Dominio: −∞ ; +∞
 Puntos de inflexión: z = μ ± σ ; z = μ ± 2σ ; z = μ ± 3σ
 En el caso de la distribución normal estándar ya se encuentran calculadas las
áreas bajo la curva normal y se cuenta con tablas que dan estas áreas y que se
usan para calcular las probabilidades.
 La variable estandarizada Z se interpreta como el número de desviaciones
estándar a las que está una variable aleatoria x de su media μ

La fórmula de Estandarización es:

En el Anexo IV puede encontrar los valores tabulados para una Distribución Normal
Estándar. Puede usar esta tabla para saber el área bajo la curva desde la línea central
(Z=0) hasta cualquier línea vertical (Z=z) hasta 3, en incrementos de 0.1. Se encuentra
tabulado hasta Z=3, debido a lo que se presentó anteriormente:

“99.7% de los valores de una variable aleatoria normal se encuentran más o


menos tres desviaciones estándar de la media”

Para el cálculo de probabilidades, se busca el área debajo de la curva correspondiente


a los valores Z (estandarizados) del problema en cuestión. Tener siempre en cuenta
algunas características de la distribución ya que pueden ayudar en el cálculo:

 El área total bajo la curva es igual a 1


 P(Z < 0 ) = 0.5 y P(Z > 0 ) = 0.5
 Por ser simétrica, la probabilidad de obtener un valor “mayor a z”, es decir
P(Z > z) es igual que la probabilidad de obtener un valor “menor a -z”, es
decir P(Z < -z)

71
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Ejemplo: “los ingresos mensuales de los empleados de una empresa de desarrollo de


software, con una media de $30000 y un desvío de $2500. Se quiere conocer la
probabilidad de que un empleado gane más de $34000”. Hacemos los siguientes pasos:

1. Identificamos los parámetros de la Normal y el valor de X: Del enunciado se tiene


que μ = 30000, σ = 2500 y X=34000.

2. Aplicamos la fórmula de estandarización, es decir “Estandarizamos” el valor de


X y pasamos a trabajar en una Distribución Normal Estándar. Para este ejemplo
se tiene que Z = (34000 – 30000) / 2500 = 1.6. Por lo tanto el problema consiste
en encontrar P(Z > 1.6).

3. Considerar siempre el área bajo la curva que debemos calcular para el problema
y que tipo de área bajo la curva nos muestra la tabla. De esto surge la mejor
estrategia para calcular la probabilidad.

Para este ejemplo, la tabla nos brinda el valor desde Z=0 hasta Z=1.6, es decir
P(0 < Z < 1.6) y nuestro interés es buscar P(Z > 1.6)
a.

Tabla: Interés

b. Teniendo en cuenta P(Z > 0 ) = 0.5 y la tabla P(0 < Z < 1.6), se tiene que:
P(Z > 1.6) = 0.5 - P(0 < Z < 1.6)

4. Buscamos en la tabla P(0 < Z < 1.6):


a. Nos ubicamos en la fila hasta encontrar el valor de “z= 1.6”
b. Nos movemos por columnas hasta encontrar el 2do decimal (si
corresponde). En este caso el 2do decimal es implícitamente “0” así que
nos quedamos en la primera columna. El valor correspondiente de
probabilidad es 0.4452. (Por ejemplo, si se hubiera tratado de z=1.66,
nos moveríamos a la columna 7 cuyo resultado es 0.4515)

5. El resultado final es P(Z > 1.6) = 0.5 – 0.4452 = 0.0548

72
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

Actividad IV

Realice las siguientes actividades prácticas:

1) El número de errores por hora que comete un administrativo en cierto trabajo es una variable aleatoria
que tiene la siguiente distribución:

Cantidad de errores 0 1 2 3

P(X) 0.4 0.3 0.2 0.1

a) Calcule el número medio de errores


b) Determine la probabilidad de que se cometa como mínimo un error.

2) Se van a extraer dos bolillas de una caja que contiene 3 bolillas numeradas (del 3 al 5). Construir la
distribución de probabilidad de la variable: “suma de los números de las dos bolillas” y calcular la media y
la varianza, considerando las extracciones con y sin reposición.

3) Un experimento consiste en tirar dos dados y anotar las sumas de las caras superiores:
a) Construir la distribución de probabilidad de la variable “suma de las caras de los dos dados”
b) Calcular la probabilidad de que la suma sea:
I) 4
II) seis o doce
III) superior a 5
IV) a lo sumo 4
V) más de 3

4) Se desea hacer una encuesta de mercado para estudiar cuál será la repercusión de un producto que será
lanzado en los próximos días. Se conoce por estudios anteriores que el porcentaje de aceptación sobre
productos similares es del 60%. Si se toma una muestra de 20 personas:
a) ¿Cuál es la probabilidad que exactamente diez personas compren el producto?
b) ¿Cuál es la probabilidad de que a lo sumo 12 personas compren el producto?
c) ¿Cuál es la probabilidad de que más de 9 personas no lo adquieran?
d) ¿Cuántas personas se espera que no compren el producto?

5) Se sabe por experiencias anteriores, que el 30% de los alumnos universitarios, trabaja más de 4 horas
por día. Si seleccionamos al azar 10 alumnos universitarios, ¿Cuál es la probabilidad de hallar?:
a) 4 alumnos que trabajan más de 4 horas.
b) Más de 2 alumnos que trabajen más de 4 horas.
c) A lo sumo 8 alumnos en iguales condiciones.

6) Por una esquina de Salta transitan en promedio 15 autos por minuto. Se desea calcular la probabilidad
de que
a) En un minuto pasen exactamente 11 autos
b) En un minuto pasen más de 12 autos.
c) Durante 30 segundos pasen 7 automóviles.
d) ¿Cuál es el lapso tal para que la probabilidad de que no pase ningún auto valga 0.2?

73
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

7) Entre los numerosos postulantes que se presentaron para cubrir un puesto administrativo en una
importante empresa se preseleccionaron catorce, de los cuales solamente cinco pueden acreditar experiencia
previa en tareas similares, y el director de Recursos Humanos de la empresa decidió elegir por sorteo los
siete postulantes preseleccionados que entrevistará en primer término. Calcular la probabilidad de que en
el grupo así elegido, haya:
a) Exactamente 3 postulantes con experiencia previa.
b) A lo sumo 2 postulantes con experiencia previa.
c) Como mínimo 4 postulantes con experiencia previa.
d) ¿Cuántos postulantes sin experiencia previa se esperaría encontrar en un grupo de tres postulantes?

8) En la sección Contaduría de una empresa, donde trabajan 8 empleados casados y 12 empleados solteros,
el jefe elige al azar un equipo de empleados para hacer horas extras el próximo sábado.
a) Si dicho equipo estuviera integrado por 4 empleados, ¿cuál sería la probabilidad de que más de la mitad
de los mismos fueran casados?
b) Si dicho equipo estuviera integrado por 9 empleados, ¿cuál sería la probabilidad de que menos de la
tercera parte de los mismos fueran solteros?

9) Una tienda recibe 4,2 reclamos de clientes por semana. Determinar la probabilidad de que en una
semana elegida al azar:
a) Ningún cliente haga un reclamo.
b) No menos de 5 clientes hagan reclamos.
c) No más de 1 cliente haga un reclamo.

10) El número de personas que ingresan a la unidad de cuidados intensivos de un hospital en cualquier día,
posee una distribución de probabilidad con una media igual a 5 personas.
a) ¿Cuál es la probabilidad de que el número de personas que ingresan a la unidad de cuidados intensivos
en un día particular sea igual a 2?
b) ¿Y a lo sumo 2?
c) ¿Cuántas personas se espera que entren durante 15 días?

11) Al comenzar las clases, en un curso de 80 alumnos en el que hay 24 recursantes, el profesor selecciona
al azar 10 alumnos para contestar un cuestionario a fin de evaluar los conocimientos previos que tienen
acerca de la materia. Calcular la probabilidad de que en el grupo de alumnos seleccionados haya:
a) Entre 2 y 5 recursantes.
b) Por lo menos 8 alumnos que cursan por primera vez la materia.
c) Algún recursante

12) Sabiendo que la recaudación diaria de cierto comercio minorista se distribuye normalmente con un
monto promedio de $830 y un desvío estándar de $125:
a) ¿Cuál es la probabilidad de que mañana se recaude menos de $885?
b) ¿Cuál es la probabilidad de que mañana se recaude más de $600?
c) ¿En qué porcentaje de los días se recauda entre $700 y $800?
d) ¿En qué porcentaje de los días se recauda entre $900 y $1500?
e) ¿Cuál es el monto no superado en el 20% de los días?
f) ¿Cuál es el monto sólo superado en el 30% de los días?

13) Las estaturas de un grupo de individuos de entre 18 y 20 años se distribuyen normalmente con una
media de 1,68 metros. Se sabe que el 95% mide menos de 1,78 metros.
a) Calcular el desvío estándar.
b) ¿Cuál es la probabilidad de que un individuo elegido al azar mida más de 1,8 metros?
c) ¿Cuál es la estatura máxima del 10% de los individuos más bajos?

74
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

14) El tiempo que tarda un operario en realizar una tarea, tiene distribución normal con promedio de 20
minutos y desvío de 4 minutos. El departamento técnico informa que el tiempo máximo tolerado para dicha
tarea es de 25 minutos, para evitar retrasos en todo el proceso; todo operario que exceda de ese tiempo debe
hacer un curso de capacitación.
a) ¿Qué porcentaje de operarios debería concurrir al curso?
b) El departamento de administración informa que por razones de presupuesto no se puede enviar al curso
a más del 5% del total de operarios de la empresa. ¿Qué empleados deberán tomar el curso?

15) Una máquina dosificadora de café llena bolsas que deben contener en promedio 250grs con un desvío
estándar de 20grs.cuando trabaja en condiciones normales. Suponga que los pesos de las bolsas de café
tienen distribución Normal.
a) ¿Cuál es la probabilidad de que al sacar una bolsa al azar esta pese menos de 244,36 grs. o más de
255.64 grs?
b) ¿Cuál es el peso superado por el 5% de las bolsas?

16) Las ventas mensuales de un producto tienen distribución normal. Se sabe que el 15% de los meses se
venden menos de 1.500 unidades, mientras que el 7% de los meses las ventas superan las 1800 unidades.
a) ¿Cuál es la probabilidad de que las ventas mensuales sean de 1600 unidades?
b) ¿Cuál es la venta garantizada el 90% de los meses?

17) Se ha comprobado que el tiempo que requiere un alumno para completar un examen tipo Múltiple
Choice se distribuye normalmente con promedio 43 minutos y desvío estándar igual a 16 minutos:
a) ¿Qué porcentaje de los alumnos que tardan como mínimo media hora para completar dicho examen, lo
terminan en menos de una hora?
b) Si el examen se toma a un grupo de 6 alumnos, ¿cuál es la probabilidad de que a lo sumo la tercera
parte del grupo necesite más de 50 minutos para completarlo?

18) Las exportaciones de productos agrícolas de nuestro país se distribuyen normalmente con un
promedio de 8.000 millones de dólares anuales y un desvío típico de 1.000 millones. Hallar:
a) P (X > 10.000)
b) P (X < 7.000)
c) P (X = 6.000)
d) P (9.000 < X < 11.000)
e) P (6.000 < X < 8.500)
f) P (X > 9.000 o X < 8.000)

75
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

BIBLIOGRAFÍA

BIBLIOGRAFÍA BÁSICA:
LUGAR Y AÑO
AUTOR TÍTULO EDITORIAL
DE EDICIÓN
Introducción a la Buenos Aires
Chao, Lincoln, Ed. Mc.Graw - Hill
Estadística 1993
Estadística para
Berenson, Mark y Levine, México
Administración y Pearson Educación
David, 2001
Economía
Estadística para
Lind D., Marchal, W., México
Administración y Ed. Alfaomega
Mason, R. 2004
Economía”
Estadística para las
México
Lincoln , L Chao Ciencias Ed. Mc.Graw - Hill
1993
Administrativas
BIBLIOGRAFÍA COMPLEMENTARIA:

Estadística Aplicada a
Kazmier, Leonard y Díaz Serie Schaum.
la Administración y México 1998
Mata, Alfredo, Mc.Graw - Hill
Economía.
Estadística Para
Bogotá
Mills , Richard L. Economía Y Mc.Graw - Hill
1980
Administración.
Estadística para
Mendenhall, W. Y Grupo Ed. México
Administración y
Renmuth, J. Iberoamericana. 1981
Economía
Schearffer, R. , Mendenhall, Elementos de Editorial Thompson Madrid
W. y Ott. Lyman. Muestreos. Paraninfo, 2007

76
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

ANEXO I: TABLA DE DISTRIBUCION BINOMIAL PUNTUAL

77
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

78
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

79
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

ANEXO II: TABLA DE DISTRIBUCION BINOMIAL


ACUMULADA

80
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

81
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

82
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

ANEXO III: TABLA DE DISTRIBUCION POISSON

83
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

84
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

85
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

86
LICENCIATURA EN COMERCIALIZACIÓN
ANÁLISIS CUANTITATIVO I

ANEXO IV: TABLA DE DISTRIBUCION NORMAL

87

También podría gustarte