Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Probabilidades
Programa de Administracin de Empresas III Semestre
UNIDAD No. 1
INTRODUCCION A LA ESTADISTICA
1.1. INTRODUCCION
Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin mayores
restricciones legales. El febril jugador De Mr consult al famoso matemtico y filosofo Blaise
Pascal (1623-1662) para que le revelara las leyes que controlan el juego de los dados, el cual,
interesado en el tema, sostuvo una correspondencia epistolar con el tmido Pierre de Fermat
(1601-1665, funcionario pblico apasionado por las matemticas; clebre porque no publicaba sus
hallazgos) dando origen a la teora de la probabilidad, la cual se ha venido desarrollando y
constituyndose en la base primordial de la estadstica.
En nuestros das, son de uso cotidiano las diferentes tcnicas estadsticas que partiendo de
observaciones muestrales o histricas, crean modelos lgico-matemticos que se "aventuran"
describir o pronosticar un determinado fenmeno con cierto grado de certidumbre medible.
El presente MODULO no pretende teorizar el saber estadstico, desde luego, no es un texto o gua
para estadsticos, ya que, adrede se obvia el rigor cientfico de lo expuesto en beneficio de la
sencillez necesaria para el nefito; con un lenguaje coloquial se conduce al lector a travs del
contenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados.
La estadstica, entonces, dej de ser una tcnica exclusiva de los estados, para convertirse en una
herramienta imprescindible de todas las ciencias, de donde proviene la desconcertante des-
uniformidad en las definiciones de los diferentes autores, ya que cada estudioso la define de
acuerdo con lo que utiliza de ella y tenemos definiciones como que: la estadstica es la tecnologa
del mtodo cientfico, o que es el conocimiento relacionado.
1.2. ETIMOLOGIA
En su origen, por tanto, la estadstica estuvo asociada al control de datos poblacionales por parte
de la administracin pblica. Este tipo de prcticas han sido analizadas por Michel Foucault como
una forma de biopoltica, un estilo de gobierno caracterizado por regular a las poblaciones a travs
del biopoder Por eso la raz etimolgica de la palabra estadstica proviene del latn status que
significa estado o situacin.
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos estadsticos
obtenidos en dos recuentos de la poblacin hebrea. El rey David por otra parte, orden a Joab,
general del ejrcito hacer un censo de Israel con la finalidad de conocer el nmero de la poblacin.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron
censos peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de
recursos y hombres disponibles). La investigacin histrica revela que se realizaron 69 censos
para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron emplear los
recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios
pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los
recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el
nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del
imperio.
Durante los mil aos siguientes a la cada del imperio Romano se realizaron muy pocas
operaciones Estadsticas, con la notable excepcin de las relaciones de tierras pertenecientes a la
Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo
IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el
Conquistador recopil el Domesday Book o libro del Gran Catastro para el ao 1086, un
documento de la propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer
compendio estadstico de Inglaterra.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo,
Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes operaciones al
mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y surgi como
fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos econmicos.
Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que
Enrique VII tena por la peste. Ms o menos por la misma poca, en Francia la ley exigi a los
clrigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que
apareci a fines de la dcada de 1500, el gobierno ingls comenz a publicar estadstica
semanales de los decesos. Esa costumbre continu muchos aos, y en 1632 estos Bills of
Mortality (Cuentas de Mortalidad) contenan los nacimientos y fallecimientos por sexo. En 1662, el
capitn John Graunt us documentos que abarcaban treinta aos y efectu predicciones sobre el
nmero de personas que moriran de varias enfermedades y sobre las proporciones de
nacimientos de varones y mujeres que cabra esperar. El trabajo de Graunt, condensado en su
obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Polticas
y Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el
anlisis estadstico.
Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de los recursos
nacionales, comprensiva de datos sobre organizacin poltica, instrucciones sociales, comercio y
podero militar. Durante el siglo XVII aport indicaciones ms concretas de mtodos de
observacin y anlisis cuantitativo y ampli los campos de la inferencia y la teora Estadstica.
Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como
resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica.
En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban
conocer las riquezas monetarias y el potencial humano de sus respectivos pases. El primer
empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo
de Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso
destruir la antigua creencia popular de que en los aos terminados en siete mora ms gente que
en los restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad.
Despus de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan
ms personas que en los dems. Los procedimientos de Neumann fueron conocidos por el
astrnomo ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio
de la vida humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan
todas las compaas de seguros.
Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis Maseres,
Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante durante cierto tiempo, la
teora de las probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII no
comenz a aplicarse a los grandes problemas cientficos.
Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora
de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de
promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la
aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la
ciencia.
Dentro de las escuelas estadsticas se pueden considerar grandes escuelas Estadsticas por su
importancia y que han contribuido enormemente al desarrollo de Estadstica.
Algunos consideran las siguientes escuelas como las menos importantes: la escandinava, la
norteamericana y la hind que tambin han contribuido a la fundamentacin de la Estadstica.
Tipo Descripcin
Esta clase de estadstica se utiliza con el propsito de recolectar, describir y
resumir un conjunto de datos obtenidos. Estos pueden visualizarse de manera
Descriptiva o
numrica y grfica. Sin embargo, su uso se acota slo al uso de la informacin
Deductiva obtenida. Es decir, que a partir de la misma no se puede realizar ningn tipo de
generalizacin.
Importancia
Es por tanto que las tcnicas estadsticas se utilizan en casi todos los aspectos de la vida:
Aplicacin
La estadstica es una ciencia de aplicacin prctica casi universal en todos los campos cientficos:
Para el planeamiento de una investigacin, por norma general, se siguen las siguientes etapas:
Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dnde queremos
llegar; en otras palabras, debemos fijar cules son nuestras metas y objetivos.
Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigedades y debe,
adems, establecerse diferenciacin entre lo de corto, mediano y largo plazo, as como entre los
objetivos generales y los especficos.
Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de estudio, y su
formulacin depende del conocimiento que el investigador posea sobre la poblacin investigada.
Una hiptesis estadstica debe ser susceptible de decimar, esto es, debe poderse probar para su
aceptacin o rechazo.
Una hiptesis que se formula acerca de un parmetro (media, proporcin, varianza, etc.), con el
propsito de rechazarla, se llama Hiptesis de Nulidad y se representa por Ho; a su hiptesis
contraria se le llama Hiptesis Alternativa (H1).
La unidad de observacin puede estar constituida por uno o varios individuos u objetos y
denominarse respectivamente simple o compleja.
El criterio sobre la unidad de medicin debe ser previamente definido y unificado por todo el equipo
de investigacin. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo
qu unidad se tomarn las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.
Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las
cuales se ha de efectuar la toma de la informacin.
Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aqu el trmino
infinito no est siendo tomado con el rigor semntico de la palabra; por ejemplo, los peces dentro
de un estanque son un conjunto finito; sin embargo, en trminos estadsticos, puede ser
considerado como infinito.
En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es
aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus
elementos, porque a veces es necesario destruir lo que se est midiendo, por ser demasiado
grande el nmero de sus componentes o no se pueden controlar; por eso se recurre al anlisis de
los elementos de una muestra con el fin de hacer inferencias respecto al total de la poblacin.
Existen diversos mtodos para calcular el tamao de la muestra y tambin para tomar los
elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente
que la muestra debe ser representativa de la poblacin y sus elementos escogidos al azar para
asegurar la objetividad de la investigacin.
1.7.6. La Recoleccin
Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede conseguir; es
determinar si la encuesta se debe aplicar por telfono, por correo, o si se necesitan agentes
directos que recojan la informacin; establecer su nmero ptimo y preparar su entrenamiento
adecuado.
1.7.8. La Tabulacin
Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece claridad al
lector sobre lo que se pretende describir; para su fcil interpretacin una tabla debe tener por lo
menos: Un ttulo adecuado el cual debe ser claro y conciso. La Tabla propiamente dicha con los
correspondientes subttulos internos y la cuantificacin de los diferentes tems de las variables, y
las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la tabla, u otorguen
los crditos a la fuente de la informacin.
1.7.9. La Presentacin
Una informacin estadstica adquiere ms claridad cuando se presenta en la forma adecuada. Los
cuadros, tablas y grficos facilitan el anlisis, pero se debe tener cuidado con las variables que se
van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos
redundantes que, antes que claridad, crean confusin. Adems la eleccin de determinada tabla o
grfico para mostrar los resultados, debe hacerse no slo en funcin de las variables que
relaciona, sino del lector a quien va dirigido el informe.
1.7.10. El Anlisis
La tcnica estadstica ofrece mtodos y procedimientos objetivos que convierten las
especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y
ofrecer una premisa medible en la toma de una decisin.
1.7.11. Publicacin
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros estudiosos del
mismo problema a quienes se les puede aportar informacin, conocimientos y otros puntos de vista
acerca de l.
UNIDAD No. 2
CONCEPTOS BASICOS DE ESTADISTICA
1.1. Definicin
La estadstica descriptiva (es la que se ver durante todo la ctedra) se centra en obtener
conclusiones o generalizaciones a partir de ellos.
La estadstica inductiva tiene por objeto establecer conclusiones o predicciones sobre una
poblacin, basndose en los resultados obtenidos de un conjunto de datos.
1.2. Poblacin: es un conjunto de medidas o el recuento de todos los elementos que presentan
una caracterstica comn. El trmino poblacin se usa para denotar el conjunto de elementos
del cual se extrae la muestra.
Los elementos que integran la poblacin o la muestra pueden corresponder a personas, objetos o
cosas. Adems, el elemento puede ser una entidad simple (una persona) o una entidad compleja
(una familia), y se denomina unidad investigativa.
Los elementos que integran la poblacin o la muestra pueden corresponder a personas, objetos o
cosas. Adems, el elemento puede ser una entidad simple (una persona) o una entidad compleja
(una familia), y se denomina unidad investigativa.
Estos son ejemplos de lo que podran denominarse elementos de una poblacin y caracterstica de
la misma:
Elementos Caracterstica
Personas Salarios
Personas Horas trabajadas
Personas Horas no laboradas
Personas Cargos
Riesgo Clase y/o tipo
Hogar Consumo
Matriz de riesgo Cantidad elaboradas
Es importante resaltar el hecho de que a pesar de encontrarse una poblacin constituida por un
grupo elementos, a la estadstica no le interesa el elemento en s, sino su caracterstica.
Segn sea el tamao, la poblacin puede considerarse como finita o infinita. Es finita cuando el
nmero de elementos que la componen es limitado; infinita cuando consta de infinitos elementos.
1.3. Muestra: se define como un conjunto de medidas o el recuento de una parte de los
elementos pertenecientes a la poblacin (la muestra por lo general en su nmero es menor
que el de la poblacin, esta es una recomendacin a tener en cuenta en el estudio
estadstico). Los elementos se seleccionan aleatoriamente, es decir, todos los elementos
tienen la misma posibilidad de ser seleccionados.
Las variables estadsticas se clasifican en cuantitativas (cuando el valor que toma la variable es
numrico) y cualitativas (cuando se trata de respuestas en palabras o frases, es decir, no son
datos numricos).
Nominales: su respuesta no indica un orden como tal o que la respuesta es una frase que
indica simplemente la caracterstica como tal de la variable. Ejemplo: color de los ojos, lugar de
nacimiento, municipio de procedencia, etc.
Ordinales: su respuesta indica un orden o hay una prioridad entre ellas. Ejemplo: medalla
olmpica, desempeo de un estudiante, rango militar, entre otros.
(I) En cada una de las siguientes situaciones, indica la Poblacin, muestra, variable estadstica y
tipo de variable.
a) Un grupo de estudiantes de Administracin de empresas se encuentra realizando un estudio
sobre el tipo de negocio o establecimiento comercial en el municipio de Villanueva La
Guajira. Para ello centran su estudio en los barrios las Delicias y Cafetal.
b) Por iniciativa del profesor de Educacin Fsica se quiere realizar un estudio estadstico acerca
del peso promedio y principal actividad realizada en el tiempo libre en los estudiantes de
noveno a once grado de una institucin educativa para as determinar el porcentaje de
sobrepeso. Hay un total de 500 estudiantes en dichos grados, en donde el 40% son de sexo
masculino y el otro 60% de sexo femenino. El estudio se centra en un 20% de los estudiantes
hombres y un 30% de las mujeres.
c) Un estudiante de Undcimo de grado realiz una encuesta para determinar la principal fuente
de ingresos en un determinado grupo de hogares de San Juan del Cesar. Inicialmente los
hogares en estudio son 800 pero por cuestiones de tiempo, se toma solamente un 8% de dicha
cantidad.
d) Una firma encuestadora de la ciudad de Valledupar fue contratada para analizar el ndice de
desempleo en el Sur Sur de la Guajira, donde hay aproximadamente 60.000 habitantes. Se
encuesto a un 25% de dicha cantidad y adems se les pregunt por el sexo, edad, nivel de
escolaridad y obviamente su situacin laboral.
(II) Clasificar las siguientes variables estadsticas en: Cuantitativa Discreta (CD), cuantitativa
contina (CC), cualitativa nominal (CN) y cualitativa ordinal (CO).
UNIDAD No. 3
TABLAS DE DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUALITATIVAS Y
CUANTITATIVAS
La Tabla de Distribucin de Frecuencias (TDF) tiene como finalidad presentar en forma ordenada
los valores que toman las diferentes caractersticas, en tal forma que permitan al lector tener una
visin de conjunto, ya sea aclarando el texto del informe o complementndolo. Bajo este principio
los datos se clasifican y ordenan de acuerdo con ciertas caractersticas cualitativas y cuantitativas,
indicndose el nmero de veces que se repite el atributo o la variable.
Xi fi hi Fi Hi %
(1) (2) (3) (4) (5) (6)
(1) Xi : es cada uno de los valores que toma la variable de estudio. En esta columna se colocan
todos los valores de la variable de estudio, sin repetirlos.
(2) fi: se denomina frecuencia absoluta. Es el nmero de veces que se repita cada valor que toma
la variable.
(3) hi: se denomina frecuencia relativa. Es el resultado de dividir cada fi entre el nmero total de
datos. Se recomienda que este valor tenga dos decimales y este correctamente aproximado
(para esto es necesario programar la calculadora en el modo FIX con dos decimales).
(4) Fi: se denomina frecuencia absoluta acumulada. Es la acumulacin de fi.
(5) Hi: se denomina frecuencia relativa acumulada. Es la acumulacin de hi.
(6) %: se denomina porcentaje. Se obtiene multiplicando cada hi por 100.
La sumatoria de la frecuencia relativa debe dar uno o un nmero que se aproxime a uno. Si la
sumatoria es 1 se dice que la TDF es EXACTA; si es aproximadamente 1 (es decir, 0.97, 0.98,
0.99, 1.01, 1.02, 1.03, etc) se hace referencia a una TDF ESTIMADA o APROXIMADA.
Las columnas de las frecuencias acumuladas (Fi y Hi) no se totalizan. El ltimo valor obtenido
en la frecuencia absoluta acumulada debe concordar con el nmero total de datos y el ltimo
valor de la frecuencia relativa acumulada debe coincidir con la sumatoria de hi.
Una vez elaborada y/o conformada la TDF, se puede representar grficamente la informacin o los
datos registrados en ella. A dichas representaciones grficas se les denomina GRAFICOS
ESTADISTICOS.
Hay numerosos tipos de grficas y, por lo general, se clasifican en cuatro grandes grupos, como
puede verse en la figura que se muestra a continuacin:
{
{
{
{
Estadsticamente hablando las grficas que son ms usuales, sin tener en cuenta la clasificacin
dada en la anterior grfica son:
Diagramas de frecuencias
Histogramas
Polgonos
Ojivas
Pictogramas
Cartogramas
Diagramas de barras verticales y horizontales
Diagramas circulares
Diagramas de lneas
Cuadrados y tringulos
Grficas de Gantt
Pirmides
Cuando la variable de estudio es de tipo cuantitativo, hay que diferencia entre dos situaciones
diferentes: datos cuantitativos no agrupados y datos cuantitativos agrupados.
TDF para datos cuantitativos no agrupados: este caso se da cuando los datos numricos en
estudio se encuentran muy cercas entre s. Por ejemplo: si nos encontramos analizando una
situacin referente al nmero de horas no laborados en 30 empleados durante una quincena y
tenemos respuestas como: 2, 3, 4, 1 y 5. Pues lgicamente los datos se encuentran muy
cercas entre s. La TDF a desarrollar en esta situacin es muy similar a la que se desarrolla
con variables cualitativas, la diferencia radica en que los datos en la columna Xi se ordenan de
menor a mayor.
TDF para datos cuantitativos agrupados: en este caso los datos numricos a analizar se
encuentran distantes entre s y es necesario agruparlos en intervalos para facilitar el respectivo
anlisis. Por ejemplo si se quiere hacer un estudio sobre las edades de 50 personas y tenemos
respuestas como: 10, 50, 38, 70, 41, etc; se recomienda realizar una agrupacin de datos.
(d) Se determina el tamao del intervalo o valor de la Amplitud (A), con la expresin:
(e) Con los valores de m y A, se calcula un nuevo rango (NR), con la expresin:
(f) Se establece la diferencia de rango (que es la cantidad en que ha sido alterado el recorrido, y
que no debe ser nunca superior a la amplitud), con la expresin:
Si es par, se le suma la mitad de dicho valor al Xmax (y pasara a ser el nuevo valor
mximo) y se le resta la otra mitad al Xmin (y pasara a ser el nuevo valor mnimo).
Si es impar, la reparticin de dicha cantidad se hace de tal manera que brinde una
buena presentacin a la distribucin de frecuencias, pero teniendo en cuenta que la
cantidad que se suma y se reste debe ser igual a . Si es igual 1, se recomienda
sumarle 1 al valor mximo y mantener el valor mnimo.
Si es igual a 0 (cero), no se quita ni se agrega nada a los valores mximo y mnimo y
por lo tanto se trabajara con ellos en la conformacin de los diferentes intervalos.
(h) Una vez establecido el nuevo rango, el nuevo valor mximo y valor mnimo, los valores de m y
de A, se procede a conformar la TDF de la siguiente manera:
intervalo
MC fi hi Fi Hi %
(1) (2) (3) (4) (5) (6) (7)
Se puede apreciar que en este nueva TDF hay unas nuevas columnas: columna (1) que es donde
se describen los diferentes intervalos de clase, y la columna (2) denominada Marca de clase.
En la conformacin de los diferentes intervalos (columna 1) se procede as: el lmite inferior del
primer intervalo es el nuevo valor mnimo y el lmite superior se obtiene al sumarle a dicho lmite
inferior el valor de la amplitud. El lmite inferior del segundo intervalo es el lmite superior del primer
intervalo y nuevamente se le suma el valor de A para obtener el lmite superior del segundo
intervalo y se contina con este proceso hasta que obtengamos como lmite superior el nuevo valor
mximo.
Para el clculo de las marcas de clase (Mc), se puede proceder de varias maneras:
I) Promediando los valores en cada intervalo. Para ello se suman los lmites del intervalo y se
divide entre dos.
II) Como la amplitud del intervalo (A) es constante, basta con obtener la primera marca de clase
por el mtodo anterior y se le va sumando el valor de A en cada uno de los siguientes
intervalos.
III) Se divide el valor de A entre dos y el resultado se le suma al lmite inferior o se le resta al lmite
superior del intervalo.
Ejemplo 2: Una empresa despulpadora de fruta busca optimizar su produccin de jugo de mango.
Para esto, inici un estudio en el cual midi los pesos (en gramos) de una muestra de 50 mangos
de diferentes tamaos.
a) Construir una tabla de frecuencias para agrupar los
74 103 106 98 95 datos y organizar la informacin
77 64 100 95 113 b) A partir de la tabla anterior, elaborar el histograma
84 117 113 61 106 que describa grficamente la situacin con su
112 88 118 117 96 respectivo polgono de frecuencias.
c) Responder las siguientes preguntas
118 115 73 118 83 1) Cuntos mangos pesan mximo 84 gramos?
101 117 88 108 62 2) Qu porcentaje de los mangos tienen un peso
95 118 71 107 93 mnimo de 94 gramos?
69 93 95 99 76 3) Qu porcentaje de los mangos tienen un peso
mayor a 102 gramos?
115 89 111 62 107 4) Cuntos mangos pesan al menos 76 gramos, pero
97 77 113 111 72 mximo 111 gramos? A qu porcentaje
corresponde dicha cantidad?
(l) Se determina el tamao del intervalo o valor de la Amplitud (A), con la expresin:
Dada cada una de las siguientes situaciones planteadas sobre caracterizacin de una variable
cualitativa y/o cuantitativa, realizar el respectivo anlisis estadstico realizando su tabla de
distribucin de frecuencia, grficos estadsticos (diagrama de barras vertical y polgono de
frecuencias) y determinacin del dato modal o de los datos modales.
N N N N C R Color de tintes:
R N R N N N N = negro
R N C N N C C = castao
C N N C R N R = Rubio
N C C C C R
b) En un estudio estadstico se pregunta a una serie de matrimonios por el nmero de hijos que
tienen, el resultado es:
2 1 1 2 2 2
3 3 2 3 1 2
1 1 1 1 1 2
3 3 2 4 3 1
2 1 4 1 1 4
c) En el barrio Las Delicias del municipio de Villanueva se realiz un estudio relacionado con el
nmero de cigarrillos que fuma un determinado grupo de personas durante un da. En el barrio
se pregunt a 27 personas fumadoras y se obtuvo la siguiente informacin: 5 personas se
fuman 4 cigarrillos, 3 personas se fuman 6 cigarrillos, 4 personas se fuman 5 cigarrillos, 4
personas se fuman 2 cigarrillos, 8 personas se fuman 3 cigarrillos y 3 personas se fuman 8
cigarrillos.
2 3 5 3 6
5 3 6 2 1
1 5 4 2 3
5 4 4 1 1
120 145 110 157 132 140 135 160 170 110 155
132 140 162 118 137 116 125 135 145 120 130
170 105 140 130 125 145 138 122 137 155 158
164 176 130 156 147 138 160 170 160 114 128
133 142 150 160 154 134 146 105 173 104 140
Realizar:
(1) Una TDF para datos agrupados o por intervalo.
(2) Un histograma con su respectivo polgono de frecuencias.
(3) Interpretar f3, h4, F2, H3, M4, M2, %1, %3.
(4) Responder las siguientes preguntas:
Cuntos estudiantes miden menos de 135 cm?
Cul es el porcentaje de estudiantes que miden por lo menos 157 cm?
Qu porcentaje de estudiantes tienen una estatura mxima de 145 cm?
Cuntos estudiantes tienen una estatura comprendida entre los 124 cm y los 168 cm?
72 49 107 104 64 48 47 46 60 54
48 47 83 38 48 83 64 66 45 80
36 24 85 88 77 49 86 120 49 70
110 49 39 49 44 49 49 80 36 74
79 49 58 39 116 103 34 39 50 39
80 35 49 58 41 39 35 48 59 36
Realizar:
(I) Una TDF para datos agrupados o por intervalo.
(II) Un histograma con su respectivo polgono de frecuencias.
(III) Interpretar f2, h3, F4, H3, M2, M5, %2, %5.
g) Se realiza un estudio de la cantidad de pasajeros que ingresan en el portal de TransMilenio y
abordan la ruta H73. La medicin se hizo durante todo el da cada vez que parta un bus a
hacer su ruta. Los resultados son los siguientes:
71 52 65 82 76 54 59 68 74 73 59 69 50 62
64 58 73 64 78 73 82 54 52 63 60 51 50 62
58 81 73 75 80 64 76 77 59 66 55 80 79 54
76 64 73 50 81 51 64 56 57 66 67 76 70 52
UNIDAD No. 4
MEDIDAS DE TENDENCIA CENTRAL
En las unidades anteriores se pudo evidenciar que la Estadstica cumple una funcin descriptiva
mediante el uso de cuadros (tablas de distribucin de frecuencias), grficas, ahora se completa
con la aplicacin e interpretacin de unas medidas de tendencia central (localizacin), que nos
permiten la descripcin de un hecho o un conjunto de observaciones.
Las medidas de tendencia de central (MTC), nos permiten determinar la posicin de un valor
respecto a un conjunto de datos, el cual se considera representativo o tpico, para el conjunto de
observaciones.
Estas medidas aplicadas a las caractersticas de las unidades en una muestra se les denomina
estimadores o estadgrafos. En cambio, aplicadas a las caractersticas de los elementos de una
poblacin se les conoce como parmetros o valores estadsticos de la poblacin.
Si con el resultado obtenido en una encuesta, aplicada en una zona o barrio de la ciudad o de un
municipio, afirmamos que el consumo promedio de leche por familia es dos litros por semana,
estamos representando una gama o variedad de consumos, que van desde familias que no
consumen, hasta un consumo superior a dos litros. Con esta informacin hacemos referencia al
comportamiento del consumo de leche en una zona de la ciudad o del municipio; tambin, el
resultado puede ser comparado con los consumos promedios de otros barrios, o el consumo
promedio por persona, o establecer la relacin que hay entre el consumo y los niveles de ingresos.
Las MTC, llamadas as porque tienden a localizarse en el centro de la informacin, son de gran
importancia en el manejo de las tcnicas estadsticas, sin embargo, su interpretacin no debe
hacerse aisladamente de las medidas de dispersin, ya que la representabilidad de ellas est
asociada con el grado de concentracin de la informacin.
Media Aritmtica
Mediana
Moda
Matemticamente, la media aritmtica se define como la suma de los valores observados entre el
nmero de observaciones.
Cuando se cuenta con los datos de manera Cuando la variable est agrupada en una
detallada (uno a uno): distribucin de frecuencias:
En donde:
En donde:
es la media aritmtica de la variable X Se debe multiplicar cada valor de por su
son los valores de la variable X respectiva frecuencia absoluta
n es el nmero de observaciones
Lunes: 18; Martes: 21; Mircoles: 22; Jueves: 21; Viernes: 20; Sbado: 19; Domingo: 19
Se utiliza la frmula empleada para datos no agrupados cuando la variable est agrupado en una
distribucin de frecuencias con la diferencia de es el valor cada marca de clase (MC).
Ejemplo 4: Una empresa despulpadora de fruta busca optimizar su produccin de jugo de mango.
Para esto, inici un estudio en el cual midi los pesos (en gramos) de una muestra de 50 mangos
de diferentes tamaos.
( ) ( )
( )
Antes de aplicar la frmula en referencia se debe primero ordenar los datos de menor a mayor sin
importar que se repitan. Una vez aplicada la frmula, lo que se obtiene en s es la posicin o
posiciones a buscar en los datos de estudio.
( )
Ejemplo 6: Consumo mensual de agua, en m3, por la fbrica de confecciones la hilacha. Enero=
10, Febrero= 12, Marzo= 15, Abril= 18 Mayo= 14, Junio= 19 Julio= 17, Agosto= 18,
Septiembre= 18, Octubre= 22,, Noviembre= 15,Diciembre= 13
Ordenando ascendentemente
( ) ( ) ( ) ( )
Por lo tanto:
Como se puede observar, en este caso la mediana no es un dato perteneciente a la informacin,
es un parmetro que divide la informacin dejando el 50% por encima y el 50%por debajo de ella.
En donde:
Me = Mediana
LI = lmite inferior del intervalo donde se cuenta la mediana (intervalo mediano), el cual se
determina observando en que clase se encuentra la posicin .
n = nmero de observaciones.
= frecuencia acumulada anterior al intervalo mediano.
= frecuencia del intervalo mediano.
A = amplitud del intervalo.
Antes de aplicar la frmula se debe determinar primero quien es el Intervalo Mediano y para esto
se determina el valor de y se busca en la columna de acumulada el primer valor que
sea mayor o igual que l.
Ejemplo 7: Una empresa despulpadora de fruta busca optimizar su produccin de jugo de mango.
Para esto, inici un estudio en el cual midi los pesos (en gramos) de una muestra de 50 mangos
de diferentes tamaos.
Se concluye que el 50% de los mangos pesan menos 99,4 gramos y 50% ms de 99,4 gramos.
Modo, moda o valor modal, como su nombre lo indica, es el valor ms comn (de mayor frecuencia
dentro de una distribucin). Una distribucin puede tener una moda (se llamara Unimodal), dos
modas (se llamara Bimodal), tres o ms modas (se llamara Multimodal). Y si todos los datos se
repiten de la misma manera, simplemente no hay moda.
La moda se determina dentro del intervalo 112-121 ya que es donde se encuentra la mayor
frecuencia.
A pesar que el valor 114,5 gramos no es un dato real de la informacin asumimos ese parmetro
como el de mayor ocurrencia.
Problemas de aplicacin:
1-Una compaa de aviacin que ofrece un vuelo diario a una determinada regin del pas no
cumpli con el horario de llegada en los ltimos 10 das de abril, con los siguientes minutos de
retraso o de anticipacin (nmero negativo):
-3 6 4 10 -4 124 2 -1 4 1
a-Si la compaa contratara un especialista en estadstica para mostrar el cumplimiento Cules
seran las medidas utilizadas?
b- Si el objetivo fuese mostrar un buen servicio (cumplimiento) Qu medida utilizara?
143
a) Media x 14,3 Minutos retardos
10
Mediana 4 3 1 1 2 4 4 6 10 124
6
Me 3 Minutos de retardos
2
Moda M o x J 4 Minutos de retardos
b) En este caso se utiliz la mediana, por ser el menor valor de los tres, de esta manera se
demuestra que hay un buen servicio. Para mostrar un mal servicio, se utiliz la media
aritmtica por ser el de mayor valor.
2-un grupo de 400 empleados, que tiene una compaa, se divide en operarios y tcnicos con un
salario promedio de $1.260.960. Los salarios promedio para cada uno de los grupos son de
$835.300 y de $1.320.856 respectivamente.
a- Cuntos operarios y cuantos tcnicos tiene la compaa?
b- si el gerente establece una bonificacin de $30.000 para los operarios y del 8% para los
tcnicos, Cul ser el salario promedio para los 400 empleados de la compaa?
857.300400 n2 1.320.856n2
1.260.960
400
3-Durante diez das se observ en un almacn de autos, el nmero de estos vendidos por su
empleado estrella,
Dia 1 2 3 4 5 6 7 8 9 10
Autos 3 4 2 1 3 2 4 6 5 4
Cada auto vale $18.500.000 y al empleado se la paga un sueldo de $270.000 bsico mensual ms
el 0,5% del valor de cada auto vendido. Cul ser el sueldo promedio para el vendedor estrella
en este lapso de 10 das?
1) Datos no agrupados:
(a) Los salarios mensuales en miles de pesos de 11 trabajadores de una misma empresa son:
580 600 590 700 850 600 800 900 600 500 680
2) Datos agrupados:
a) Determine el valor de m y A.
b) Determine los lmites y puntos medios (marcas de clase) de cada clase.
c) Por equivocacin de la persona que levant la informacin, se logr demostrar que el
salario inicial ms bajo era de U$ 18.500 La TDF tendra variaciones? Por qu?
3) Datos no agrupados:
(c) Los salarios mensuales en miles de pesos de 7 trabajadores de una misma empresa son:
4) Datos agrupados:
# empleados # de das de
ausentes ausencia
[20 29) 5
[29 38) 9
[38 47) 12
[47 56) 10
[56 65) 8
[65 74) 12
[74 83) 4
[83 92] 10
[800.000 850.000) 10
[850.000 900.000) 13
[900.000 950.000) 17
[950.000 1.000.000} 20
UNIDAD No. 5
MEDIDAS DE POSICION
Las medidas de posicin o tambin llamadas medidas de promedios, nos permiten determinar la
posicin de un valor respecto a un conjunto de datos, el cual consideramos como representativo o
tpico, para el total de las observaciones.
Muchos estadsticos y textos de matemticas, las relacionan con las Medidas de Tendencia
Central e inclusive argumentan que ellas (medidas de posicin) son parte de las medidas de
tendencia central.
Estas medidas aplicadas a las caractersticas de las unidades en una muestra se les denominan
estimadores o estadgrafos. En cambio, aplicadas a las caractersticas de los elementos de una
poblacin se les conoce como parmetros o valores estadsticos de la poblacin.
Dicho de otra forma: Las medidas de posicin son parmetros posicionales muy tiles en la
interpretacin porcentual de la informacin.
Cuartiles: son valores posicionales que dividen la informacin en cuatro partes iguales, el
primer cuartil deja el 25% de la informacin por debajo de l y el 75% por encima; el segundo
cuartil, al igual que la mediana, divide la informacin en dos partes iguales; y por ltimo el
tercer cuartil deja el 75% por debajo de s y el 25% por encima. Con lo anterior queda claro que
solo se pueden calcular tres cuartiles.
Grficamente:
Quintiles: son valores posicionales que dividen la informacin en cinco partes iguales,
agrupndolas en porcentajes de 20, 40, 60 y 80 por ciento, en consecuencia podemos calcular
cuatro quintiles.
Deciles: son valores posicionales que dividen la informacin en diez partes iguales, en
cantidad porcentuales de 10 en 10. Se pueden calcular nueve deciles.
Centiles o percentiles: obviamente los centiles dividen la informacin en 100 partes iguales,
lo cual facilita la interpretacin porcentual de una distribucin de frecuencias. Se puede
determinar el valor de noventa y nueve centiles o percentiles.
( )
En donde:
X Posicin
k nmero del percentil a calcular.
n nmero de datos
r nmero de partes de la medida de posicin
Una vez se haya aplicado la frmula y se obtuvo un valor entero (exacto), el valor de la medida de
posicin es aquel ubicado en la posicin referenciado en el nmero obtenido. Cuando el clculo
obtenido corresponde a un nmero decimal se procede de la siguiente manera:
Ejemplo: con los siguientes datos: 16 -10 - 4- 8 - 12 - 10 8 - 20 -4 -13- 12- 22- 16- 26- 20- se pide
determinar a-primer y tercer cuartil b- cuarto y sexto decil c-el 30 y 90 percentil
Lo primero que se debe hacer es, ordenar los datos de menor a mayor o viceversa:
4 4 8 8 10 10 12 12 13 16 16 20 20 22 26-
a -primer y tercer cuartil
( ) ( ) ( )
( ) ( ) ( )
b- cuarto y sexto decil
( ) ( ) ( )
Observemos que el proceso correspondiente al resultado obtenido es diferente a los dos
anteriores, pues aparece con la posicin de 6,4. Es decir que debe estar ente la sexta y sptima
posicin. 6=10 , 7=12 entonces 12-10=2, este resultado se multiplica por 0,4, as 2*(0,4)=0,8 y
se lo agregamos al valor anterior de 10, siendo D 4=10,8
( ) ( ) ( )
9=13 y 10=16 entonces 16-13=3 3*(0,6)= 1,8D6=14,8
c-el 30 y 90 percentil
( ) ( ) ( )
( ) ( ) ( )
23,6
En donde:
lmite inferior del intervalo percentil.
k nmero del percentil a calcular.
n nmero de datos
r nmero de partes de la medida de posicin
frecuencia absoluta acumulada anterior al intervalo percentil.
frecuencia absoluta del intervalo percentil.
A amplitud del intervalo.
Sin importar que la situacin planteada obedezca a datos no agrupados o agrupados, los datos
deben estar ordenados de menor a mayor.
Con relacin a los porcentajes base, son importantes al momento de la interpretacin de la medida
de posicin calculada.
Datos no agrupados:
(1) Los salarios mensuales en miles de pesos de 11 trabajadores de una misma empresa son:
580 600 590 700 850 600 800 600 590 900 850
Determine e interprete: Q2, QK1, QK4, D2, D5, D7, C10, C20, C76 y C80.
(2) Despus de preguntar por las edades de 40 nios de un mismo barrio en el municipio de San
Juan del Cesar, se obtuvieron los siguientes datos:
Determine e interprete: Q1, QK2, QK3, D3, D6, C25, C45, C50 y C95.
(3) En un almacn se hace un inventario y se pesan todos los paquetes que hay. El responsable
del almacn confecciona la siguiente tabla, donde relaciona intervalos de pesos con el nmero
de paquetes encontrados:
Determine e interprete: Q1, QK2, QK4, D4, D7, C15, C40, C70 y C85.
(4) Un estudio calcula el tiempo que tardan los trabajadores de una empresa en llegar de su casa
a la oficina. Los resultados obtenidos se muestran en la siguiente tabla:
21 28 7
28 35 13
35 42 15
Determine e interprete: Q1, Q3, QK1, QK2, D1, D4, D5, C30, C60, C75 y C94.
UNIDAD No. 6
MEDIDAS DE DISPERSION
Son medidas que se emplean para determinar el grado de variabilidad o de dispersin de los datos
con respecto a un promedio. Por lo general se les mide como promedio de las desviaciones
respecto a algn valor central o medida de posicin.
Para medir el grado de dispersin de una variable, se utilizan principalmente los siguientes
indicadores o medidas:
Rango o recorrido
Desviacin media
Varianza
Desviacin tpica o estndar
Coeficiente de variabilidad
Es la medida de dispersin ms sencilla ya que solo considera los dos valores extremos de una
coleccin de datos, sin embargo, su mayor utilizacin est en el campo de la estadstica no
paramtrica.
Sin importar que los datos sean no agrupados o agrupados, la frmula a emplear es la misma:
Este indicador mide la distancia absoluta promedio entre cada uno de los datos y el parmetro que
caracteriza la informacin (media aritmtica).
La desviacin media es una medida de dispersin bastante objetiva: cuanto mayor sea su valor
mayor es la dispersin de los datos; sin embargo, no proporciona una relacin matemtica precisa
entre su magnitud y la posicin de un dato dentro de la distribucin. Por otra parte, al tomar los
valores absolutos mide la desviacin de una observacin sin mostrar si est por encima o por
debajo de la media aritmtica.
La frmula a emplear es la siguiente:
Donde:
Cuando se trata de datos agrupados el valor a utilizar en xi es el valor de la marca de clase (Mc).
Esta medida es muy conocida y usada, pero su importancia radica especialmente en que da origen
a la medida de dispersin ms significativa, denominada desviacin tpica o estndar (s).
La varianza se simboliza indistintamente por: s2; V(x); V(y). Se define como: la media aritmtica de
los cuadrados de las desviaciones respecto a la media aritmtica.
Donde:
s2: varianza
xi: diferentes valores de la variable x
: media aritmtica de la informacin
fi: nmero de veces que se repite la
observacin xi
n: tamao de la muestra
m: nmero de agrupamientos o intervalos.
JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag
ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 44
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre
Cuando se trata de datos agrupados el valor a utilizar en xi es el valor de la marca de clase (Mc).
Esta medida de dispersin se simboliza por CV (en mayscula) o d (en minscula) y se obtiene
dividiendo a la desviacin tpica por su media aritmtica (en este caso se habla de coeficiente de
variabilidad relativo) y si el resultado de la divisin se multiplica por 100 (se habla de coeficiente de
variabilidad porcentual). Dicho de otra forma sera:
Xi fi | | | |
a) A continuacin se relacionan las edades de los 11 trabajadores del rea de servicios generales
de la Alcalda Municipal de Valledupar:
25 30 28 21 41 36 30 28 35 25 28
b) En la siguiente tabla se resume, los salarios bsicos que se pagan a los trabajadores de una
determinada empresa:
a) Los 100 empleados de una compaa se clasifican de acuerdo con los impuestos pagados de
acuerdo con los impuestos pagados (retencin en la fuente).
Problema de Aplicacin:
JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag
ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 46
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre
(1) Los salarios de 10 trabajadores suman en total $12.000.000 Cul es el valor de la varianza
sabiendo que el ?
II EXAMEN PARCIAL
5 7 8 9 10 10 12 7 8 9
4 10 11 6 7 8 5 9 10 11
2) A una convocatoria para Contadores Pblicos sin experiencia alguna, se presentaron 600
personas. La convocatoria como tal tiene como objetivo la presentacin de una prueba de
conocimientos con 100 preguntas y el comit de evaluacin present la siguiente informacin
con respecto a sus resultados:
(1) Una multinacional tiene 200 accionistas de tres pases diferentes (Colombia, Venezuela y
Brasil). El nmero de acciones promedio de los colombianos es de 170, de los venezolanos es
de 200 y de los brasileros es de 150. Se sabe que la cantidad de accionistas colombianos es
tres veces la cantidad de accionistas venezolanos y stos a su vez tienen 20 accionistas
menos que los brasileros.
VALORACION
Punto 1 2.0 Punto 2 1.0 Punto 3 2.0
PUEDE una varianza de 3,24 Cul de las dos tiendas presenta una distribucin de las ventas
mas recomendable? Valor 2.0
(1) Una empresa consta de tres secciones: En la seccin 1 hay 15 empleados con un salario
promedio de $800.000; en la seccin 2 hay 8 empleados ms que en la seccin 1 con un
salario promedio de $950.000 y en la seccin 3 hay el doble de empleados que en la seccin 2.
De cunto debe ser el salario promedio de los empleados de la seccin 3, para que todo el
conjunto de trabajadores tengan un salario promedio de $1.000.000? //VALOR 1.5//
(2) En una distribucin de datos el CV% es igual al 2.5%. Qu valor tiene la varianza en dicha
distribucin si el dato promedio es 12? //VALOR 1.5//
(3) En una compaa de seguros, se indaga por el tiempo (en aos) que tienen sus empleados de
estar trabajando en dicha compaa. Se cuenta con la siguiente informacin: 5 empleados
tienen 4 aos; 3 empleados tienen 2 aos; 7 empleados tienen 7 aos; 6 empleados tienen 3
aos; y 1 empleado tiene 9 aos. Determine las diferentes medidas de dispersin y de su
opinin de la media aritmtica y coeficiente de variacin porcentual. //VALOR 2.0//
EXAMEN DE HABILITACION
(1) En una distribucin de datos la varianza toma un valor de 1,26 y el coeficiente de variacin
porcentual es del 3,68%. Determine el valor de la media aritmtica asociada a dicha
distribucin. //VALOR 1.5//
(2) Se consult a un grupo de personas sobre el nmero de das no laborados en una quincena,
obteniendo los siguientes datos:
2 3 4 2 3 5 5 2 4
(3) En una fbrica de zapatos hay 45 trabajadores. Se sabe que una quinta parte de los
trabajadores son de sexo femenino y el restante es de sexo masculino. Si el salario mensual en
promedio de los hombres es de $800.000 y el de las mujeres es de $720.000. Cul es el valor
del salario promedio de todo el conjunto de los trabajadores? //VALOR 1.5//