Está en la página 1de 52

UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y

Probabilidades
Programa de Administracin de Empresas III Semestre

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 1
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

UNIDAD No. 1
INTRODUCCION A LA ESTADISTICA
1.1. INTRODUCCION

La palabra estadstica se origina, en las tcnicas de recoleccin, organizacin, conservacin, y


tratamiento de los datos propios de un estado, con que los antiguos gobernantes controlaban sus
sbditos y dominios econmicos. Estas tcnicas evolucionaron a la par con el desarrollo de las
matemticas, utilizando sus herramientas en el proceso del anlisis e interpretacin de la
informacin.

Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin mayores
restricciones legales. El febril jugador De Mr consult al famoso matemtico y filosofo Blaise
Pascal (1623-1662) para que le revelara las leyes que controlan el juego de los dados, el cual,
interesado en el tema, sostuvo una correspondencia epistolar con el tmido Pierre de Fermat
(1601-1665, funcionario pblico apasionado por las matemticas; clebre porque no publicaba sus
hallazgos) dando origen a la teora de la probabilidad, la cual se ha venido desarrollando y
constituyndose en la base primordial de la estadstica.

En nuestros das, son de uso cotidiano las diferentes tcnicas estadsticas que partiendo de
observaciones muestrales o histricas, crean modelos lgico-matemticos que se "aventuran"
describir o pronosticar un determinado fenmeno con cierto grado de certidumbre medible.

El presente MODULO no pretende teorizar el saber estadstico, desde luego, no es un texto o gua
para estadsticos, ya que, adrede se obvia el rigor cientfico de lo expuesto en beneficio de la
sencillez necesaria para el nefito; con un lenguaje coloquial se conduce al lector a travs del
contenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados.

El avance tecnolgico en la informtica ha contribuido enormemente al desarrollo de la estadstica,


sobre todo en la manipulacin de la informacin, pues en el mercado existen paquetes estadsticos
de excelente calidad, como el SAS, SPSS, SCA, STATGRAPHICS, amn de otros, que "corren"
en un ordenador sin mayores exigencias tcnicas, permitiendo el manejo de grandes volmenes
de informacin y de variables.

La estadstica, entonces, dej de ser una tcnica exclusiva de los estados, para convertirse en una
herramienta imprescindible de todas las ciencias, de donde proviene la desconcertante des-
uniformidad en las definiciones de los diferentes autores, ya que cada estudioso la define de
acuerdo con lo que utiliza de ella y tenemos definiciones como que: la estadstica es la tecnologa
del mtodo cientfico, o que es el conocimiento relacionado.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 2
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

1.2. ETIMOLOGIA

La palabra "estadstica" procede del latn statisticum collegium ("consejo de Estado") y de su


derivado italiano statista ("hombre de Estado" o "poltico"). El trmino alemn Statistik, introducido
por Gottfried Achenwall (1749), designaba originalmente el anlisis de datos del Estado, es decir,
"la ciencia del Estado". No fue hasta el siglo XIX cuando el trmino estadstica vino a designar la
coleccin y clasificacin de datos.

En su origen, por tanto, la estadstica estuvo asociada al control de datos poblacionales por parte
de la administracin pblica. Este tipo de prcticas han sido analizadas por Michel Foucault como
una forma de biopoltica, un estilo de gobierno caracterizado por regular a las poblaciones a travs
del biopoder Por eso la raz etimolgica de la palabra estadstica proviene del latn status que
significa estado o situacin.

1.3. BREVE HISTORIA DE LA ESTADISTICA

Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.

En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos estadsticos
obtenidos en dos recuentos de la poblacin hebrea. El rey David por otra parte, orden a Joab,
general del ejrcito hacer un censo de Israel con la finalidad de conocer el nmero de la poblacin.

Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron
censos peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de
recursos y hombres disponibles). La investigacin histrica revela que se realizaron 69 censos
para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.

Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron emplear los
recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios
pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los
recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el
nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del
imperio.

Durante los mil aos siguientes a la cada del imperio Romano se realizaron muy pocas
operaciones Estadsticas, con la notable excepcin de las relaciones de tierras pertenecientes a la

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 3
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo
IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el
Conquistador recopil el Domesday Book o libro del Gran Catastro para el ao 1086, un
documento de la propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer
compendio estadstico de Inglaterra.

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la


tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media.

Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo,
Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes operaciones al
mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y surgi como
fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos econmicos.

Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que
Enrique VII tena por la peste. Ms o menos por la misma poca, en Francia la ley exigi a los
clrigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que
apareci a fines de la dcada de 1500, el gobierno ingls comenz a publicar estadstica
semanales de los decesos. Esa costumbre continu muchos aos, y en 1632 estos Bills of
Mortality (Cuentas de Mortalidad) contenan los nacimientos y fallecimientos por sexo. En 1662, el
capitn John Graunt us documentos que abarcaban treinta aos y efectu predicciones sobre el
nmero de personas que moriran de varias enfermedades y sobre las proporciones de
nacimientos de varones y mujeres que cabra esperar. El trabajo de Graunt, condensado en su
obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Polticas
y Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el
anlisis estadstico.

Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de los recursos
nacionales, comprensiva de datos sobre organizacin poltica, instrucciones sociales, comercio y
podero militar. Durante el siglo XVII aport indicaciones ms concretas de mtodos de
observacin y anlisis cuantitativo y ampli los campos de la inferencia y la teora Estadstica.

Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como
resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica.

En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban
conocer las riquezas monetarias y el potencial humano de sus respectivos pases. El primer
empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo
de Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso
destruir la antigua creencia popular de que en los aos terminados en siete mora ms gente que
en los restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 4
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Despus de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan
ms personas que en los dems. Los procedimientos de Neumann fueron conocidos por el
astrnomo ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio
de la vida humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan
todas las compaas de seguros.

Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis Maseres,
Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante durante cierto tiempo, la
teora de las probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII no
comenz a aplicarse a los grandes problemas cientficos.

Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra


estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con sobrada razn, que los
datos de la nueva ciencia seran el aliado ms eficaz del gobernante consciente. La raz remota de
la palabra se halla, por otra parte, en el trmino latino status, que significa estado o situacin; Esta
etimologa aumenta el valor intrnseco de la palabra, por cuanto la estadstica revela el sentido
cuantitativo de las ms variadas situaciones.

Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora
de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de
promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la
aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la
ciencia.

Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos


fundamentales para la teora Estadstica; la teora de los errores de observacin, aportada por
Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace, Gauss y
Legendre. A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por Correlacin, que
tena por objeto medir la influencia relativa de los factores sobre las variables. De aqu parti el
desarrollo del coeficiente de correlacin creado por Karl Pearson y otros cultivadores de la ciencia
biomtrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios
sobre la medida de las relaciones.

Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior desarrollo del


clculo de probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se
ha demostrado que el determinismo fue reconocido en la Fsica como resultado de las
investigaciones atmicas y que este principio se juzga aplicable tanto a las ciencias sociales como
a las fsicas.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 5
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

1.4. ESCUELAS ESTADISTICAS

Dentro de las escuelas estadsticas se pueden considerar grandes escuelas Estadsticas por su
importancia y que han contribuido enormemente al desarrollo de Estadstica.

La Escuela Administrativa: Localizada en Alemania, cre la primera ctedra y cursos de


Estadstica, dndole importancia a la informacin requerida por el estado. Se consideran como
los principales representantes de esta escuela a: Vito de Seckendorff (1626 1689); Hermann
Conring, quien inici un curso de Estadstica en la Universidad de Helmstadt, preocupado por
los casos ms notables del estado, su discpulo Godofredo Achenwall quien le dio el nombre
de Estadstica y la separ de la Sociologa.

La Escuela Probabilstica: Algunos la consideran originaria de Italia, otros de Francia, dada la


atencin prestada a los juegos azar, que se efectuaban para la recreacin de la nobleza, con el
consiguiente desarrollo de la teora de la Probabilidades.
Sus principales representantes son: Pascal (1623- 1662); Fermat (1601 1665); Laplace (1749
1827), Poisson (1781 1840) Bernoulli y Gauss.
La Escuela Demogrfica: Creada en Inglaterra, se preocupaba por problemas actuariales.
Dentro de esta sobresalen: Sir William Petty, Edmund Halley, John Graunt, King y Devenaut,
entre otros. A principios de este siglo hay una gran preocupacin por su aplicacin en los
campos de la Agronoma y la Biometra, lo cual le da a la Estadstica mayor relevancia,
colocando as los cimientos y siendo sus principales exponentes: Galton, Karl Pearson, Gosset
y Fisher.

Algunos consideran las siguientes escuelas como las menos importantes: la escandinava, la
norteamericana y la hind que tambin han contribuido a la fundamentacin de la Estadstica.

1.5. TIPOS DE ESTADISTICA

La estadstica es una tcnica basada en la recoleccin, recuento, clasificacin, e


interpretacin de un conjunto de datos obtenidos a partir de la observacin, con el propsito
de poder llevar a cabo comparaciones y realizar estimaciones. Existen distintos tipos de
estadstica:

Tipo Descripcin
Esta clase de estadstica se utiliza con el propsito de recolectar, describir y
resumir un conjunto de datos obtenidos. Estos pueden visualizarse de manera
Descriptiva o
numrica y grfica. Sin embargo, su uso se acota slo al uso de la informacin
Deductiva obtenida. Es decir, que a partir de la misma no se puede realizar ningn tipo de
generalizacin.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 6
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

De manera contraria a la anterior, esta clase de estadstica tiene la


particularidad de que a partir de los datos muestrales que maneja, es posible
realizar conclusiones y predicciones que incluyan a toda la poblacin. Es decir,
Inferencial o
que los resultados obtenidos a partir del anlisis y conclusin podrn ser
Inductiva extrapolados, y de esta forma realizar un pronstico inclusivo. Las inferencias
pueden presentarse a travs de respuestas a preguntas del tipo si/no,
relaciones entre una serie de variables, estimaciones numricas, entre otras.

1.6. IMPORTANCIA Y APLICACIN DE LA ESTADSTICA

Importancia

La teora general de la estadstica es aplicable a cualquier campo cientfico en el cual se hacen


observaciones el estudio y aplicacin de los mtodos estadsticos son necesarios en todos (los
campos del saber, sean estos de nivel tcnico o cientfico). Es obvio que en cada campo se
aplican o desarrollan procedimientos especficos, como aplicaciones particulares a variantes de la
teora general. Las primeras aplicaciones de la estadstica fueron los asuntos de gobierno, luego
las utilizaron las compaas de seguros y los empresarios de juegos de azar, despus siguieron los
comerciantes, los industriales, los educadores, etc.

Es por tanto que las tcnicas estadsticas se utilizan en casi todos los aspectos de la vida:

Se disean encuestas para recoger informacin y as poder predecir algn suceso.


Los experimentos que se hacen para determinar el mtodo apropiado para
curar cierta enfermedad.
La duracin, intensidad, extensin de las lluvias, tormentas o granizos, las Temperaturas, la
intensidad y direccin del viento son variables aleatorias.

Aplicacin

Aunque comnmente se asocie a estudios demogrficos, econmicos y sociolgicos, gran parte de


los logros de la estadstica se derivan del inters de los cientficos por desarrollar modelos que
expliquen el comportamiento de las propiedades de la materia y de los caracteres biolgicos. La
medicina, la biologa, la fsica y, en definitiva, casi todos los campos de las ciencias emplean
instrumentos estadsticos de importancia fundamental para el desarrollo de sus modelos de
trabajo.

La estadstica es una ciencia de aplicacin prctica casi universal en todos los campos cientficos:

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 7
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

En las ciencias naturales: se emplea con profusin en la descripcin de modelos


termodinmicos complejos (mecnica estadstica), en fsica cuntica, en mecnica de fluidos o
en la teora cintica de los gases, entre otros muchos campos.
En las ciencias sociales y econmicas: es un pilar bsico del desarrollo de la demografa y la
sociologa aplicada.
En economa: suministra los valores que ayudan a descubrir interrelaciones entre mltiples
parmetros macro y microeconmicos.
En las ciencias mdicas: permite establecer pautas sobre la evolucin de las enfermedades y
los enfermos, los ndices de mortalidad asociados a procesos morbosos, el grado de eficacia
de un medicamento, etctera.

1.7. INVESTIGACION ESTADISTICA

El mtodo estadstico, parte de la observacin de un fenmeno, y como no puede siempre


mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que acten
libremente, pero se registran las diferentes observaciones y se analizan sus variaciones.

Para el planeamiento de una investigacin, por norma general, se siguen las siguientes etapas:

Planteamiento del problema.


Fijacin de los objetivos.
Formulacin de la hiptesis.
Definicin de la unidad de observacin y de la unidad de medida.
Determinacin de la poblacin y de la muestra.
La recoleccin.
Crtica, clasificacin y ordenacin.
Tabulacin.
Presentacin.
Anlisis.
Publicacin.

1.7.1. Planteamiento del Problema

Al abordar una investigacin se debe tener bien definido qu se va a investigar y por qu se


pretende estudiar algo. Es decir, se debe establecer una delimitacin clara, concreta e inteligible
sobre el o los fenmenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre
otras cosas, la revisin bibliogrfica del tema, para ver su accesibilidad y consultar los resultados
obtenidos por investigaciones similares, someter nuestras proposiciones bsicas a un anlisis
lgico; es decir, se debe hacer una ubicacin histrica y terica del problema.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 8
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

1.7.2. Fijacin de los Objetivos

Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dnde queremos
llegar; en otras palabras, debemos fijar cules son nuestras metas y objetivos.

Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigedades y debe,
adems, establecerse diferenciacin entre lo de corto, mediano y largo plazo, as como entre los
objetivos generales y los especficos.

1.7.3. Formulacin de las hiptesis

Una hiptesis es ante todo, una explicacin provisional de los hechos objeto de estudio, y su
formulacin depende del conocimiento que el investigador posea sobre la poblacin investigada.
Una hiptesis estadstica debe ser susceptible de decimar, esto es, debe poderse probar para su
aceptacin o rechazo.

Una hiptesis que se formula acerca de un parmetro (media, proporcin, varianza, etc.), con el
propsito de rechazarla, se llama Hiptesis de Nulidad y se representa por Ho; a su hiptesis
contraria se le llama Hiptesis Alternativa (H1).

1.7.4. Definicin de la Unidad de Observacin y de la Unidad de Medida

La Unidad de Observacin, entendida como cada uno de los elementos constituyentes de la


poblacin estudiada, debe definirse previamente, resaltando todas sus caractersticas; pues, al fin
de cuentas, es a ellas a las que se les har la medicin.

La unidad de observacin puede estar constituida por uno o varios individuos u objetos y
denominarse respectivamente simple o compleja.

El criterio sobre la unidad de medicin debe ser previamente definido y unificado por todo el equipo
de investigacin. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo
qu unidad se tomarn las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.

Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las
cuales se ha de efectuar la toma de la informacin.

1.7.5. Determinacin de la Poblacin y Muestra

Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos que poseen


una o varias caractersticas comunes. No se refiere esta definicin nicamente a los seres
vivientes; una poblacin puede estar constituida por los habitantes de un pas o por los peces de

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 9
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

un estanque, as como por los establecimientos comerciales de un barrio o las unidades de


vivienda de una ciudad.

Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aqu el trmino
infinito no est siendo tomado con el rigor semntico de la palabra; por ejemplo, los peces dentro
de un estanque son un conjunto finito; sin embargo, en trminos estadsticos, puede ser
considerado como infinito.

Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiar


las propiedades del conjunto del cual es obtenida.

En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es
aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus
elementos, porque a veces es necesario destruir lo que se est midiendo, por ser demasiado
grande el nmero de sus componentes o no se pueden controlar; por eso se recurre al anlisis de
los elementos de una muestra con el fin de hacer inferencias respecto al total de la poblacin.
Existen diversos mtodos para calcular el tamao de la muestra y tambin para tomar los
elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente
que la muestra debe ser representativa de la poblacin y sus elementos escogidos al azar para
asegurar la objetividad de la investigacin.

1.7.6. La Recoleccin

Una de las etapas ms importantes de la investigacin es la recoleccin de la informacin, la cual


ha de partir, a menos que se tenga experiencia con muestras anlogas, de una o varias muestras
piloto en las cuales se pondrn a prueba los cuestionarios y se obtendr una aproximacin de la
variabilidad de la poblacin, con el fin de calcular el tamao exacto de la muestra que conduzca a
una estimacin de los parmetros con la precisin establecida.

El establecimiento de las fuentes y cauces de informacin, as como la cantidad y complejidad de


las preguntas, de acuerdo con los objetivos de la investigacin son decisiones que se han de tomar
teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las
limitaciones que se tengan en la zona geogrfica, el grado de desarrollo, la ausencia de tcnica,
etc.

Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede conseguir; es
determinar si la encuesta se debe aplicar por telfono, por correo, o si se necesitan agentes
directos que recojan la informacin; establecer su nmero ptimo y preparar su entrenamiento
adecuado.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 10
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

1.7.7. Crtica, clasificacin y Ordenacin


Despus de haber reunido toda la informacin pertinente, se necesita la depuracin de los datos
recogidos. Para hacer la crtica de una informacin, es fundamental el conocimiento de la
poblacin por parte de quien depura para poder detectar falsedades en las respuestas,
incomprensin a las preguntas, respuestas al margen, amn de todas las posibles causas de
nulidad de una pregunta o nulidad de todo un cuestionario.

Separado el material de "desecho" con la informacin depurada se procede a establecer las


clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces
necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de
tabulacin de las diferentes variables que intervienen en la investigacin.

El avance tecnolgico y la popularizacin de los computadores hacen que estas tareas,


manualmente dispendiosas, puedan ser realizadas en corto tiempo.

1.7.8. La Tabulacin
Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece claridad al
lector sobre lo que se pretende describir; para su fcil interpretacin una tabla debe tener por lo
menos: Un ttulo adecuado el cual debe ser claro y conciso. La Tabla propiamente dicha con los
correspondientes subttulos internos y la cuantificacin de los diferentes tems de las variables, y
las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la tabla, u otorguen
los crditos a la fuente de la informacin.

1.7.9. La Presentacin
Una informacin estadstica adquiere ms claridad cuando se presenta en la forma adecuada. Los
cuadros, tablas y grficos facilitan el anlisis, pero se debe tener cuidado con las variables que se
van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos
redundantes que, antes que claridad, crean confusin. Adems la eleccin de determinada tabla o
grfico para mostrar los resultados, debe hacerse no slo en funcin de las variables que
relaciona, sino del lector a quien va dirigido el informe.

1.7.10. El Anlisis
La tcnica estadstica ofrece mtodos y procedimientos objetivos que convierten las
especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y
ofrecer una premisa medible en la toma de una decisin.

Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la determinacin de los


parmetros y estadsticos muestrales para las estimaciones e inferencias respecto a la poblacin,
el ajuste de modelos y las pruebas de las hiptesis planteadas, con el fin de establecer y redactar
las conclusiones definitivas.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 11
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

1.7.11. Publicacin

Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros estudiosos del
mismo problema a quienes se les puede aportar informacin, conocimientos y otros puntos de vista
acerca de l.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 12
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

UNIDAD No. 2
CONCEPTOS BASICOS DE ESTADISTICA

1.1. Definicin

La estadstica es la ciencia que trata de la recopilacin, organizacin, presentacin, anlisis e


interpretacin de datos, con el fin de hacer deducciones y previsiones a partir de ellos. Segn su
objetivo, la estadstica puede ser descriptiva o inductiva.

La estadstica descriptiva (es la que se ver durante todo la ctedra) se centra en obtener
conclusiones o generalizaciones a partir de ellos.

La estadstica inductiva tiene por objeto establecer conclusiones o predicciones sobre una
poblacin, basndose en los resultados obtenidos de un conjunto de datos.

1.2. Poblacin: es un conjunto de medidas o el recuento de todos los elementos que presentan
una caracterstica comn. El trmino poblacin se usa para denotar el conjunto de elementos
del cual se extrae la muestra.

Los elementos que integran la poblacin o la muestra pueden corresponder a personas, objetos o
cosas. Adems, el elemento puede ser una entidad simple (una persona) o una entidad compleja
(una familia), y se denomina unidad investigativa.

Los elementos que integran la poblacin o la muestra pueden corresponder a personas, objetos o
cosas. Adems, el elemento puede ser una entidad simple (una persona) o una entidad compleja
(una familia), y se denomina unidad investigativa.

Estos son ejemplos de lo que podran denominarse elementos de una poblacin y caracterstica de
la misma:

Elementos Caracterstica
Personas Salarios
Personas Horas trabajadas
Personas Horas no laboradas
Personas Cargos
Riesgo Clase y/o tipo
Hogar Consumo
Matriz de riesgo Cantidad elaboradas

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 13
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Es importante resaltar el hecho de que a pesar de encontrarse una poblacin constituida por un
grupo elementos, a la estadstica no le interesa el elemento en s, sino su caracterstica.

Segn sea el tamao, la poblacin puede considerarse como finita o infinita. Es finita cuando el
nmero de elementos que la componen es limitado; infinita cuando consta de infinitos elementos.

1.3. Muestra: se define como un conjunto de medidas o el recuento de una parte de los
elementos pertenecientes a la poblacin (la muestra por lo general en su nmero es menor
que el de la poblacin, esta es una recomendacin a tener en cuenta en el estudio
estadstico). Los elementos se seleccionan aleatoriamente, es decir, todos los elementos
tienen la misma posibilidad de ser seleccionados.

1.4. Variables o caractersticas estadsticas: corresponder a ciertos rasgos, cualidades o


propiedades que poseen los elementos que constituyen la poblacin o la muestra. Dicho de
otra forma, es la caracterstica que se desea estudiar en una poblacin.

Las variables estadsticas se clasifican en cuantitativas (cuando el valor que toma la variable es
numrico) y cualitativas (cuando se trata de respuestas en palabras o frases, es decir, no son
datos numricos).

Las variables cuantitativas pueden ser:

Discretas: es cuando la respuesta dada corresponde a un nmero cerrado (natural) o exacto y


adems por que puede tomar pocos valores: edad de una persona, nmero de trabajadores en
una empresa pequea, nmero de personas en un hogar, el nmero de viviendas en un barrio,
etc.
Continuas: es cuando la respuesta dada corresponde a un nmero decimal por lo general y
adems por que puede tomar cualquier valor intermedio: estatura de las personas, la velocidad
de un vehculo, el peso de una persona, entre otras.

Las variables cualitativas pueden ser:

Nominales: su respuesta no indica un orden como tal o que la respuesta es una frase que
indica simplemente la caracterstica como tal de la variable. Ejemplo: color de los ojos, lugar de
nacimiento, municipio de procedencia, etc.
Ordinales: su respuesta indica un orden o hay una prioridad entre ellas. Ejemplo: medalla
olmpica, desempeo de un estudiante, rango militar, entre otros.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 14
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

EJERCICIO DE APLICACIN No. 1

(I) En cada una de las siguientes situaciones, indica la Poblacin, muestra, variable estadstica y
tipo de variable.
a) Un grupo de estudiantes de Administracin de empresas se encuentra realizando un estudio
sobre el tipo de negocio o establecimiento comercial en el municipio de Villanueva La
Guajira. Para ello centran su estudio en los barrios las Delicias y Cafetal.
b) Por iniciativa del profesor de Educacin Fsica se quiere realizar un estudio estadstico acerca
del peso promedio y principal actividad realizada en el tiempo libre en los estudiantes de
noveno a once grado de una institucin educativa para as determinar el porcentaje de
sobrepeso. Hay un total de 500 estudiantes en dichos grados, en donde el 40% son de sexo
masculino y el otro 60% de sexo femenino. El estudio se centra en un 20% de los estudiantes
hombres y un 30% de las mujeres.
c) Un estudiante de Undcimo de grado realiz una encuesta para determinar la principal fuente
de ingresos en un determinado grupo de hogares de San Juan del Cesar. Inicialmente los
hogares en estudio son 800 pero por cuestiones de tiempo, se toma solamente un 8% de dicha
cantidad.
d) Una firma encuestadora de la ciudad de Valledupar fue contratada para analizar el ndice de
desempleo en el Sur Sur de la Guajira, donde hay aproximadamente 60.000 habitantes. Se
encuesto a un 25% de dicha cantidad y adems se les pregunt por el sexo, edad, nivel de
escolaridad y obviamente su situacin laboral.

(II) Clasificar las siguientes variables estadsticas en: Cuantitativa Discreta (CD), cuantitativa
contina (CC), cualitativa nominal (CN) y cualitativa ordinal (CO).

Variable Tipo de variable


Grado de un estudiante de bachillerato
Color de pantaln
Cantidad de estudiantes en un seminario
Nmero de horas que los alumnos estudian a la
semana
El peso que puede soportar un camin
Desempeo acadmico de un estudiante de bsica
secundaria.
Nmero de tos por parte de padre
Distancia entre dos lugares.
Contenido de los diferentes tamao de aguardiente
antioqueo
El rea de un terreno cultivado
Marca de Tablet
Comida con mayor preferencia en un restaurante
JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag
ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 15
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

UNIDAD No. 3
TABLAS DE DISTRIBUCION DE FRECUENCIAS PARA VARIABLES CUALITATIVAS Y
CUANTITATIVAS

La Tabla de Distribucin de Frecuencias (TDF) tiene como finalidad presentar en forma ordenada
los valores que toman las diferentes caractersticas, en tal forma que permitan al lector tener una
visin de conjunto, ya sea aclarando el texto del informe o complementndolo. Bajo este principio
los datos se clasifican y ordenan de acuerdo con ciertas caractersticas cualitativas y cuantitativas,
indicndose el nmero de veces que se repite el atributo o la variable.

3.1. TDF para variables cualitativas

Cuando la situacin en estudio implica el estudio de variables cualitativas, no importa el orden en


que se ordenen los distintos valores (atributos, cualidades) que toma la variable, pero muchos
crticos de la Estadstica sugieren que se ordenen de manera alfabtica para una mejor
presentacin de dicha TDF.

La TDF a elaborar presenta la siguiente forma o estructura:

Xi fi hi Fi Hi %
(1) (2) (3) (4) (5) (6)

A continuacin se hace una explicacin de cada uno de los componentes de la tabla de


distribucin de frecuencias:

(1) Xi : es cada uno de los valores que toma la variable de estudio. En esta columna se colocan
todos los valores de la variable de estudio, sin repetirlos.
(2) fi: se denomina frecuencia absoluta. Es el nmero de veces que se repita cada valor que toma
la variable.
(3) hi: se denomina frecuencia relativa. Es el resultado de dividir cada fi entre el nmero total de
datos. Se recomienda que este valor tenga dos decimales y este correctamente aproximado
(para esto es necesario programar la calculadora en el modo FIX con dos decimales).
(4) Fi: se denomina frecuencia absoluta acumulada. Es la acumulacin de fi.
(5) Hi: se denomina frecuencia relativa acumulada. Es la acumulacin de hi.
(6) %: se denomina porcentaje. Se obtiene multiplicando cada hi por 100.

En el diligenciamiento o conformacin de la TDF es importante tener en cuenta los siguientes


aspectos:

La sumatoria de la frecuencia absoluta debe dar el nmero total de datos en estudio.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 16
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

La sumatoria de la frecuencia relativa debe dar uno o un nmero que se aproxime a uno. Si la
sumatoria es 1 se dice que la TDF es EXACTA; si es aproximadamente 1 (es decir, 0.97, 0.98,
0.99, 1.01, 1.02, 1.03, etc) se hace referencia a una TDF ESTIMADA o APROXIMADA.
Las columnas de las frecuencias acumuladas (Fi y Hi) no se totalizan. El ltimo valor obtenido
en la frecuencia absoluta acumulada debe concordar con el nmero total de datos y el ltimo
valor de la frecuencia relativa acumulada debe coincidir con la sumatoria de hi.

Una vez elaborada y/o conformada la TDF, se puede representar grficamente la informacin o los
datos registrados en ella. A dichas representaciones grficas se les denomina GRAFICOS
ESTADISTICOS.

Hay numerosos tipos de grficas y, por lo general, se clasifican en cuatro grandes grupos, como
puede verse en la figura que se muestra a continuacin:

{
{

{
{

Estadsticamente hablando las grficas que son ms usuales, sin tener en cuenta la clasificacin
dada en la anterior grfica son:

Diagramas de frecuencias
Histogramas
Polgonos
Ojivas
Pictogramas
Cartogramas
Diagramas de barras verticales y horizontales
Diagramas circulares

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 17
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Diagramas de lneas
Cuadrados y tringulos
Grficas de Gantt
Pirmides

3.2. TDF para variables cuantitativas

Cuando la variable de estudio es de tipo cuantitativo, hay que diferencia entre dos situaciones
diferentes: datos cuantitativos no agrupados y datos cuantitativos agrupados.

TDF para datos cuantitativos no agrupados: este caso se da cuando los datos numricos en
estudio se encuentran muy cercas entre s. Por ejemplo: si nos encontramos analizando una
situacin referente al nmero de horas no laborados en 30 empleados durante una quincena y
tenemos respuestas como: 2, 3, 4, 1 y 5. Pues lgicamente los datos se encuentran muy
cercas entre s. La TDF a desarrollar en esta situacin es muy similar a la que se desarrolla
con variables cualitativas, la diferencia radica en que los datos en la columna Xi se ordenan de
menor a mayor.

Ejemplo 1: Distribucin de frecuencia simple:


El Gerente-propietario recoge la informacin respecto a la variable salario diario de sus 50
operarias y la relaciona en la tabla No 1. (Salario diario de 50 operarios en la fbrica de

confecciones la Hilada (datos en miles de pesos))


Analizando las columnas se obtienen, entre otras las siguientes conclusiones:
Slo el 4% de las obreras gana el mximo salario/da de la fbrica, el cual corresponde
a$58.000.00
El salario diario mnimo ($50.000.00) lo gana nicamente una obrera, lo que constituye el 2%
del personal asalariado.
El 62% de las operarias tiene un salario diario entre $53.000.00 y $55.000.00
El 60% de las obreras tiene un salario/da de $54.000.00 o menos.
El 64% tiene un ingreso/da de $54.000.00 o ms.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 18
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

TDF para datos cuantitativos agrupados: en este caso los datos numricos a analizar se
encuentran distantes entre s y es necesario agruparlos en intervalos para facilitar el respectivo
anlisis. Por ejemplo si se quiere hacer un estudio sobre las edades de 50 personas y tenemos
respuestas como: 10, 50, 38, 70, 41, etc; se recomienda realizar una agrupacin de datos.

Cuando se dispone de un gran nmero de datos, es necesario y recomendable distribuirlos en


clases o categoras y determinar el nmero de individuos pertenecientes a cada clase, que es la
frecuencia absoluta asociada a cada categora o intervalo. Una ordenacin tabular de los datos en
clases, reunidos los diferentes intervalos con las frecuencias absolutas correspondientes a cada
una, se conoce con el nombre de TDF de variables cuantitativas para datos agrupados o por
intervalo.

Para elaborar esta TDF, se deben seguir los siguientes pasos:

(a) Se determina el dato mayor (Xmax) y el dato menor (Xmin).


(b) Se determina el rango o recorrido con la expresin:

(c) Se determina el nmero de intervalos (m), con la expresin:


, en donde n corresponde al nmero de datos
Se recomienda que si el resultado obtenido corresponde a un nmero decimal, se pase al entero
siguiente. Por ejemplo: si m = 5,40 se trabajara con m = 6.

(d) Se determina el tamao del intervalo o valor de la Amplitud (A), con la expresin:

Si el valor de A corresponde a un nmero decimal, se procede como en el caso del nmero de


intervalos (m).

(e) Con los valores de m y A, se calcula un nuevo rango (NR), con la expresin:

(f) Se establece la diferencia de rango (que es la cantidad en que ha sido alterado el recorrido, y
que no debe ser nunca superior a la amplitud), con la expresin:

(g) El valor de debe distribuirse adecuadamente, teniendo en cuenta lo siguiente:

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 19
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Si es par, se le suma la mitad de dicho valor al Xmax (y pasara a ser el nuevo valor
mximo) y se le resta la otra mitad al Xmin (y pasara a ser el nuevo valor mnimo).
Si es impar, la reparticin de dicha cantidad se hace de tal manera que brinde una
buena presentacin a la distribucin de frecuencias, pero teniendo en cuenta que la
cantidad que se suma y se reste debe ser igual a . Si es igual 1, se recomienda
sumarle 1 al valor mximo y mantener el valor mnimo.
Si es igual a 0 (cero), no se quita ni se agrega nada a los valores mximo y mnimo y
por lo tanto se trabajara con ellos en la conformacin de los diferentes intervalos.

(h) Una vez establecido el nuevo rango, el nuevo valor mximo y valor mnimo, los valores de m y
de A, se procede a conformar la TDF de la siguiente manera:
intervalo
MC fi hi Fi Hi %
(1) (2) (3) (4) (5) (6) (7)

Se puede apreciar que en este nueva TDF hay unas nuevas columnas: columna (1) que es donde
se describen los diferentes intervalos de clase, y la columna (2) denominada Marca de clase.

En la conformacin de los diferentes intervalos (columna 1) se procede as: el lmite inferior del
primer intervalo es el nuevo valor mnimo y el lmite superior se obtiene al sumarle a dicho lmite
inferior el valor de la amplitud. El lmite inferior del segundo intervalo es el lmite superior del primer
intervalo y nuevamente se le suma el valor de A para obtener el lmite superior del segundo
intervalo y se contina con este proceso hasta que obtengamos como lmite superior el nuevo valor
mximo.

Para el clculo de las marcas de clase (Mc), se puede proceder de varias maneras:

I) Promediando los valores en cada intervalo. Para ello se suman los lmites del intervalo y se
divide entre dos.
II) Como la amplitud del intervalo (A) es constante, basta con obtener la primera marca de clase
por el mtodo anterior y se le va sumando el valor de A en cada uno de los siguientes
intervalos.
III) Se divide el valor de A entre dos y el resultado se le suma al lmite inferior o se le resta al lmite
superior del intervalo.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 20
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Ejemplo 2: Una empresa despulpadora de fruta busca optimizar su produccin de jugo de mango.
Para esto, inici un estudio en el cual midi los pesos (en gramos) de una muestra de 50 mangos
de diferentes tamaos.
a) Construir una tabla de frecuencias para agrupar los
74 103 106 98 95 datos y organizar la informacin
77 64 100 95 113 b) A partir de la tabla anterior, elaborar el histograma
84 117 113 61 106 que describa grficamente la situacin con su
112 88 118 117 96 respectivo polgono de frecuencias.
c) Responder las siguientes preguntas
118 115 73 118 83 1) Cuntos mangos pesan mximo 84 gramos?
101 117 88 108 62 2) Qu porcentaje de los mangos tienen un peso
95 118 71 107 93 mnimo de 94 gramos?
69 93 95 99 76 3) Qu porcentaje de los mangos tienen un peso
mayor a 102 gramos?
115 89 111 62 107 4) Cuntos mangos pesan al menos 76 gramos, pero
97 77 113 111 72 mximo 111 gramos? A qu porcentaje
corresponde dicha cantidad?

(i) Xmax =118 Xmin =61


(j) rango o recorrido:
(k) nmero de intervalos (m), con la expresin:

(l) Se determina el tamao del intervalo o valor de la Amplitud (A), con la expresin:

(m) nuevo rango (NR),


(n) Diferencia de rango
Si es par, se le suma la mitad de dicho valor al Xmax (y pasara a ser el nuevo valor mximo) y
se le resta la otra mitad al Xmin (y pasara a ser el nuevo valor mnimo).
(o) Xmax =118+3=121 Xmin =61-3=58

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 21
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

1) Cuntos mangos pesan mximo 84 gramos? 14


2) Qu porcentaje de los mangos tienen un peso mnimo de 94 gramos? 62%
3) Qu porcentaje de los mangos tienen un peso mayor a 102 gramos? 42%
4) Cuntos mangos pesan al menos 76 gramos, pero mximo 111 gramos? A qu porcentaje
corresponde dicha cantidad? 28- 56%

EJERCICIO PRACTICOS UNIDAD 3

Dada cada una de las siguientes situaciones planteadas sobre caracterizacin de una variable
cualitativa y/o cuantitativa, realizar el respectivo anlisis estadstico realizando su tabla de
distribucin de frecuencia, grficos estadsticos (diagrama de barras vertical y polgono de
frecuencias) y determinacin del dato modal o de los datos modales.

a) La empresa "Tintutas VillaGuajira", dedicada a la fabricacin de tintes para el cabello, realiza


una encuesta sobre el color de tinte usado por un grupo de clientes, los colores favoritos son:

N N N N C R Color de tintes:
R N R N N N N = negro
R N C N N C C = castao
C N N C R N R = Rubio
N C C C C R

(1) Realizar una Tabla de Distribucin de Frecuencias (TDF).


(2) Realizar un diagrama de barras vertical y su respectivo polgono de frecuencias.
(3) Interpretar los datos obtenidos en la TDF
Cuntos clientes de los encuestados no usan como color de tinte Rubio? A qu %
corresponde dicha cantidad?
Qu % de clientes utilizan el color castao o negro como tinte para su cabello? a
cuntos clientes corresponde dicho %?
Qu color de cabello tiene mayor y menor preferencia por parte de los clientes?

b) En un estudio estadstico se pregunta a una serie de matrimonios por el nmero de hijos que
tienen, el resultado es:

2 1 1 2 2 2
3 3 2 3 1 2
1 1 1 1 1 2
3 3 2 4 3 1
2 1 4 1 1 4

(1) Realizar una Tabla de Distribucin de Frecuencias (TDF).

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 22
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

(2) Realizar un diagrama de barras vertical y su respectivo polgono de frecuencias.


(3) Interpretar los datos obtenidos en la TDF:
Qu nmero de matrimonios tiene ms de dos hijos? A qu % corresponde dicha
cantidad?
Cul es el % de matrimonios que tienen mximo dos hijos? A qu cantidad
corresponde dicho porcentaje?
Qu cantidad de matrimonios tienen mnimo 2 hijos y mximo 3?

c) En el barrio Las Delicias del municipio de Villanueva se realiz un estudio relacionado con el
nmero de cigarrillos que fuma un determinado grupo de personas durante un da. En el barrio
se pregunt a 27 personas fumadoras y se obtuvo la siguiente informacin: 5 personas se
fuman 4 cigarrillos, 3 personas se fuman 6 cigarrillos, 4 personas se fuman 5 cigarrillos, 4
personas se fuman 2 cigarrillos, 8 personas se fuman 3 cigarrillos y 3 personas se fuman 8
cigarrillos.

(1) Determine poblacin, muestra variable estadstica y tipo de variable estadstica


(2) Elaborar una TDF para datos no agrupados
(3) Elaborar un diagrama de barras con su respectivo polgono de frecuencias
(4) Responder:
Cuntas personas se fuman por lo menos 4 cigarrillos durante el da? A qu
porcentaje corresponde?
Qu porcentaje de personas se fuman mximo 5 cigarrillos durante el da?
Cuntas personas estn dentro de dicho porcentaje?

d) Se ha lanzado 20 veces un dado y se han obtenido los siguientes datos:

2 3 5 3 6
5 3 6 2 1
1 5 4 2 3
5 4 4 1 1

(1) Elaborar una TDF para datos no agrupados.


(2) Responder:
Qu porcentaje de veces el dado cae con un nmero mnimo de 4?
Cuntas veces el dado presenta un nmero menor que 5?
Cuntas veces el dado presenta o cae un nmero menor que 2 pero mayor o igual
que 4? a qu porcentaje equivale dicha cantidad?

e) En una institucin educativa del municipio de Villanueva La Guajira se realiz un estudio


sobre el factor estatura en sus estudiantes (medidas en cm), para lo cual se tom a 55 de ellos
obteniendo los siguientes resultados:

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 23
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

120 145 110 157 132 140 135 160 170 110 155
132 140 162 118 137 116 125 135 145 120 130
170 105 140 130 125 145 138 122 137 155 158
164 176 130 156 147 138 160 170 160 114 128
133 142 150 160 154 134 146 105 173 104 140
Realizar:
(1) Una TDF para datos agrupados o por intervalo.
(2) Un histograma con su respectivo polgono de frecuencias.
(3) Interpretar f3, h4, F2, H3, M4, M2, %1, %3.
(4) Responder las siguientes preguntas:
Cuntos estudiantes miden menos de 135 cm?
Cul es el porcentaje de estudiantes que miden por lo menos 157 cm?
Qu porcentaje de estudiantes tienen una estatura mxima de 145 cm?
Cuntos estudiantes tienen una estatura comprendida entre los 124 cm y los 168 cm?

f) Una empresa de servicios de aseo de un edificio de oficinas desea analizar la informacin de


cuentas por pagar de 60 facturas (valores dados en miles de pesos):

72 49 107 104 64 48 47 46 60 54
48 47 83 38 48 83 64 66 45 80
36 24 85 88 77 49 86 120 49 70
110 49 39 49 44 49 49 80 36 74
79 49 58 39 116 103 34 39 50 39
80 35 49 58 41 39 35 48 59 36
Realizar:
(I) Una TDF para datos agrupados o por intervalo.
(II) Un histograma con su respectivo polgono de frecuencias.
(III) Interpretar f2, h3, F4, H3, M2, M5, %2, %5.
g) Se realiza un estudio de la cantidad de pasajeros que ingresan en el portal de TransMilenio y
abordan la ruta H73. La medicin se hizo durante todo el da cada vez que parta un bus a
hacer su ruta. Los resultados son los siguientes:

Pasajeros fi a)Realizar una TDF para datos agrupados.


[32 41) 4 b)Realizar un histograma con su respectivo polgono de frecuencias.
[41 50) 12 c)Responder:
[50 59) 21 Cuntos buses de Transmilenio fueron estudiados?
[59 68) 32 Cul fue la mnima cantidad de pasajeros que subieron en el
[68 77) 46 portal durante todo el da?
[77 86) 27 Cul es el porcentajes de buses que transportan mximo 67
[86 95) 10 personas?
[95 104] 8 Qu cantidad de buses transporta mnimo 77 personas?

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 24
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

h) En un curso de lectura rpida se realiz una prueba a un grupo de 56 personas sobre la


cantidad de palabras ledas en 30 segundos, los resultados fueron los siguientes:

71 52 65 82 76 54 59 68 74 73 59 69 50 62
64 58 73 64 78 73 82 54 52 63 60 51 50 62
58 81 73 75 80 64 76 77 59 66 55 80 79 54
76 64 73 50 81 51 64 56 57 66 67 76 70 52

a) Realizar una tabla de frecuencias con ocho intervalos.


b) Trazar un histograma con su respectivo polgono de frecuencias.
c) Si se aprueba con 62 palabras, entonces, Cuntas personas aprobaron y cuantos
reprobaron?
d) Qu porcentaje obtuvo menos de 66 palabras?

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 25
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

UNIDAD No. 4
MEDIDAS DE TENDENCIA CENTRAL
En las unidades anteriores se pudo evidenciar que la Estadstica cumple una funcin descriptiva
mediante el uso de cuadros (tablas de distribucin de frecuencias), grficas, ahora se completa
con la aplicacin e interpretacin de unas medidas de tendencia central (localizacin), que nos
permiten la descripcin de un hecho o un conjunto de observaciones.

Las medidas de tendencia de central (MTC), nos permiten determinar la posicin de un valor
respecto a un conjunto de datos, el cual se considera representativo o tpico, para el conjunto de
observaciones.

Estas medidas aplicadas a las caractersticas de las unidades en una muestra se les denomina
estimadores o estadgrafos. En cambio, aplicadas a las caractersticas de los elementos de una
poblacin se les conoce como parmetros o valores estadsticos de la poblacin.

Si con el resultado obtenido en una encuesta, aplicada en una zona o barrio de la ciudad o de un
municipio, afirmamos que el consumo promedio de leche por familia es dos litros por semana,
estamos representando una gama o variedad de consumos, que van desde familias que no
consumen, hasta un consumo superior a dos litros. Con esta informacin hacemos referencia al
comportamiento del consumo de leche en una zona de la ciudad o del municipio; tambin, el
resultado puede ser comparado con los consumos promedios de otros barrios, o el consumo
promedio por persona, o establecer la relacin que hay entre el consumo y los niveles de ingresos.

Las MTC, llamadas as porque tienden a localizarse en el centro de la informacin, son de gran
importancia en el manejo de las tcnicas estadsticas, sin embargo, su interpretacin no debe
hacerse aisladamente de las medidas de dispersin, ya que la representabilidad de ellas est
asociada con el grado de concentracin de la informacin.

Las principales medidas de tendencia central son:

Media Aritmtica
Mediana
Moda

4.1. Media Aritmtica ( )

Es la medida de posicin ms utilizada, la ms conocida y sencilla de calcular, de gran estabilidad


en el muestreo y sus frmulas admiten tratamientos algebraicos. Su principal desventaja, es el de
ser muy sensible a los cambios que se haga en algunos de sus valores, o cuando los valores
extremos son demasiado grandes o pequeos.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 26
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Matemticamente, la media aritmtica se define como la suma de los valores observados entre el
nmero de observaciones.

Frmulas para el clculo de en datos no agrupados:

Cuando se cuenta con los datos de manera Cuando la variable est agrupada en una
detallada (uno a uno): distribucin de frecuencias:

En donde:
En donde:
es la media aritmtica de la variable X Se debe multiplicar cada valor de por su
son los valores de la variable X respectiva frecuencia absoluta
n es el nmero de observaciones

Ejemplo 3: Cantidad de cigarrillos consumidos por un fumador en una semana

Lunes: 18; Martes: 21; Mircoles: 22; Jueves: 21; Viernes: 20; Sbado: 19; Domingo: 19

Entonces la media aritmtica es.


El fumador consume en promedio 20 cigarrillos diarios.

Cantidad de Cigarrillos Consumidos por un Fumador en una Semana Dada:


cantidad frecuencia
18 1

19 2
20 1
21 2
22 1
7

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 27
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Frmula para el clculo de en datos agrupados o por intervalo:

Se utiliza la frmula empleada para datos no agrupados cuando la variable est agrupado en una
distribucin de frecuencias con la diferencia de es el valor cada marca de clase (MC).

Ejemplo 4: Una empresa despulpadora de fruta busca optimizar su produccin de jugo de mango.
Para esto, inici un estudio en el cual midi los pesos (en gramos) de una muestra de 50 mangos
de diferentes tamaos.

4.2. Mediana (Me)

Es otra MTC utilizada principalmente en estadstica no paramtrica. Esta medida no se base en la


magnitud de los datos, sino en la posicin central que ocupa en el orden de su magnitud,
dividiendo la informacin en dos partes iguales, dejando igual nmero de datos por encima y por
debajo de ella,
Frmulas para el clculo de la Me en datos no agrupados:

La frmula a emplear vara de cuando el nmero de datos es par o impar:

Nmero de datos PAR Nmero de datos IMPAR

( ) ( )
( )

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 28
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Antes de aplicar la frmula en referencia se debe primero ordenar los datos de menor a mayor sin
importar que se repitan. Una vez aplicada la frmula, lo que se obtiene en s es la posicin o
posiciones a buscar en los datos de estudio.

Ejemplo 5: En el ejercicio de los cigarrillos, consumidos por un fumador tenemos lunes


18, martes 21, mircoles 22, jueves 21, viernes 20, sbado 19, y domingo 19. Ordenando
ascendentemente:

18-19-19-20-21-21-22 como n es Impar (7) entonces ( )


por lo tanto:

( )

Ejemplo 6: Consumo mensual de agua, en m3, por la fbrica de confecciones la hilacha. Enero=
10, Febrero= 12, Marzo= 15, Abril= 18 Mayo= 14, Junio= 19 Julio= 17, Agosto= 18,
Septiembre= 18, Octubre= 22,, Noviembre= 15,Diciembre= 13

Ordenando ascendentemente

10-12-13-14-15-15-17-18-18-18-19-20 22 como n es par (12) entonces

( ) ( ) ( ) ( )
Por lo tanto:
Como se puede observar, en este caso la mediana no es un dato perteneciente a la informacin,
es un parmetro que divide la informacin dejando el 50% por encima y el 50%por debajo de ella.

Frmula e emplear para el clculo de la Me en datos agrupados o por intervalo:

En donde:
Me = Mediana
LI = lmite inferior del intervalo donde se cuenta la mediana (intervalo mediano), el cual se
determina observando en que clase se encuentra la posicin .
n = nmero de observaciones.
= frecuencia acumulada anterior al intervalo mediano.
= frecuencia del intervalo mediano.
A = amplitud del intervalo.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 29
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Antes de aplicar la frmula se debe determinar primero quien es el Intervalo Mediano y para esto
se determina el valor de y se busca en la columna de acumulada el primer valor que
sea mayor o igual que l.

Ejemplo 7: Una empresa despulpadora de fruta busca optimizar su produccin de jugo de mango.
Para esto, inici un estudio en el cual midi los pesos (en gramos) de una muestra de 50 mangos
de diferentes tamaos.

Se concluye que el 50% de los mangos pesan menos 99,4 gramos y 50% ms de 99,4 gramos.

4.3. Moda (Mo)

Modo, moda o valor modal, como su nombre lo indica, es el valor ms comn (de mayor frecuencia
dentro de una distribucin). Una distribucin puede tener una moda (se llamara Unimodal), dos
modas (se llamara Bimodal), tres o ms modas (se llamara Multimodal). Y si todos los datos se
repiten de la misma manera, simplemente no hay moda.

Clculo de la Mo en datos no agrupados: aqu simplemente se observa cual variable o


variables tiene(n) la mayor frecuencia absoluta. De ser uno sola, esa sera la moda, de ser dos
habrn dos modas y as sucesivamente. No hay frmula para este caso.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 30
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Ejemplo 8: En el ejercicio de los cigarrillos, consumidos por un fumador tenemos lunes


18, martes 21, mircoles 22, jueves 21, viernes 20, sbado 19, y domingo 19. Ordenando
ascendentemente:

cantidad frecuencia Moda=19


18 1 Moda=21
19 2 Se llamara Bimodal
20 1
21 2
22 1
7

Clculo de la Mo en datos agrupados o por intervalo: en este caso se utiliza la siguiente


expresin:
,
En donde:
Mo = Moda
LI = lmite inferior del intervalo modal
= frecuencia absoluta del intervalo modal
= frecuencia absoluta del intervalo premodal
= frecuencia absoluta del intervalo postmodal
A = amplitud del intervalo.
Ejemplo 9: Una empresa despulpadora de fruta busca optimizar su produccin de jugo de mango.
Para esto, inici un estudio en el cual midi los pesos (en gramos) de una muestra de 50 mangos
de diferentes tamaos.

La moda se determina dentro del intervalo 112-121 ya que es donde se encuentra la mayor
frecuencia.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 31
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

A pesar que el valor 114,5 gramos no es un dato real de la informacin asumimos ese parmetro
como el de mayor ocurrencia.

4.4 Relacin entre la media, mediana y la moda.


Son tres situaciones que se pueden presentar entre estas tres medidas de posicin.
en este caso la distribucin se considera simtrica
se dice que la Distribucin es Asimtrica negativa
se dice que la Distribucin es Asimtrica positiva

Problemas de aplicacin:
1-Una compaa de aviacin que ofrece un vuelo diario a una determinada regin del pas no
cumpli con el horario de llegada en los ltimos 10 das de abril, con los siguientes minutos de
retraso o de anticipacin (nmero negativo):
-3 6 4 10 -4 124 2 -1 4 1
a-Si la compaa contratara un especialista en estadstica para mostrar el cumplimiento Cules
seran las medidas utilizadas?
b- Si el objetivo fuese mostrar un buen servicio (cumplimiento) Qu medida utilizara?
143
a) Media x 14,3 Minutos retardos
10

Mediana 4 3 1 1 2 4 4 6 10 124

6
Me 3 Minutos de retardos
2
Moda M o x J 4 Minutos de retardos

La ms representativa es la moda, la que ms se repite.

b) En este caso se utiliz la mediana, por ser el menor valor de los tres, de esta manera se
demuestra que hay un buen servicio. Para mostrar un mal servicio, se utiliz la media
aritmtica por ser el de mayor valor.

2-un grupo de 400 empleados, que tiene una compaa, se divide en operarios y tcnicos con un
salario promedio de $1.260.960. Los salarios promedio para cada uno de los grupos son de
$835.300 y de $1.320.856 respectivamente.
a- Cuntos operarios y cuantos tcnicos tiene la compaa?
b- si el gerente establece una bonificacin de $30.000 para los operarios y del 8% para los
tcnicos, Cul ser el salario promedio para los 400 empleados de la compaa?

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 32
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

a-Cuntos operarios y cuantos tcnicos tiene la compaa?

857.300400 n2 1.320.856n2
1.260.960
400

504.384.000 857.300400 857.300n2 1.320.856n2

504.384.000 342.920.000 1.320.856n2 857.300n2

161.464.000 463.556n2 n2 161.464.000 348 Operarios


463.556
n1 400 348 52 Tcnicos

3-Durante diez das se observ en un almacn de autos, el nmero de estos vendidos por su
empleado estrella,

Dia 1 2 3 4 5 6 7 8 9 10
Autos 3 4 2 1 3 2 4 6 5 4

Cada auto vale $18.500.000 y al empleado se la paga un sueldo de $270.000 bsico mensual ms
el 0,5% del valor de cada auto vendido. Cul ser el sueldo promedio para el vendedor estrella
en este lapso de 10 das?

=> Nmero de vehculos vendidos en 10 das es de 34

=> Valor total de las ventas: 34(18.500.000) = $629.000.000

=> El 0,5% = 0,005 gana por cada vehculo

629.000.000 (0,005) = $3.145.000 + 270.000 = $3.415.000 sera el sueldo promedio en los 10


das

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 33
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

EJERCICIOS DE PROFUNDIZACION / APLICACIN


MEDIDAS DE TENDENCIA CENTRAL MTC

1) Datos no agrupados:

(a) Los salarios mensuales en miles de pesos de 11 trabajadores de una misma empresa son:

580 600 590 700 850 600 800 900 600 500 680

Determine e interprete cada una de las MTC.

(b) Despus de preguntar por las edades de 40 estudiantes de primaria en un centro


educativo, se obtuvieron los siguientes datos:

Edad No. estudiantes


10 9
8 12
9 9
12 10

Determine e interprete cada una de las MTC.

2) Datos agrupados:

(a) El ausentismo diario en su oficina parece ir en aumento. Al finalizar el ao se hizo un


estudio estadstico relacionando el nmero empleados ausentes durante un nmero das
en especficos y los resultados fueron los siguientes:

# empleados ausentes # de das de ausencia


[20 29) 5
[29 38) 9
[38 47) 12
[47 56) 10
[56 65) 8
[65 74) 12
[74 83) 4
[83 92] 10

Determine e interprete cada una de las MTC.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 34
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

(b) Indagando sobre el salario mensual en un grupo de trabajadores en el municipio de


Urumita, se dedujo la siguiente distribucin de frecuencias:

Salario en pesos # de empleados


[750.000 800.000) 15
[800.000 850.000) 17
[850.000 900.000) 13
[900.000 950.000) 20
[950.000 1.000.000} 20

Determine e interprete cada una de las MTC.

EJERCICIOS DE PROFUNDIZACION / APLICACIN


TDF PARA DATOS AGRUPADOS

1) En un estudio reciente sobre 500 graduados en Administracin de Negocios, el salario inicial


ms alto que se report fue de U$ 27.500 y el ms bajo fue de U$ 19.900. Usted desea
crear la TDF para analizar y comparar estos datos con las ofertas de trabajo que ha recibido.

a) Determine el valor de m y A.
b) Determine los lmites y puntos medios (marcas de clase) de cada clase.
c) Por equivocacin de la persona que levant la informacin, se logr demostrar que el
salario inicial ms bajo era de U$ 18.500 La TDF tendra variaciones? Por qu?

2) Un conjunto de datos contiene 100 observaciones, la ms grande es 315 y la ms pequea es


56.

a) Cuntas clases debera tener la TDF?


b) Cul es la amplitud de los intervalos?
c) Determine los lmites y marcas de clase de cada intervalo.

EJERCICIOS DE PROFUNDIZACION / APLICACIN


MEDIDAS DE TENDENCIA CENTRAL MTC

3) Datos no agrupados:

(c) Los salarios mensuales en miles de pesos de 7 trabajadores de una misma empresa son:

580 600 590 700 850 600 800

Determine e interprete cada una de las MTC.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 35
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

(d) Despus de preguntar por las edades de 40 estudiantes de primaria en un centro


educativo, se obtuvieron los siguientes datos:

Edad No. estudiantes Determine e interprete cada una de las MTC.


10 9
8 12
9 9
12 10

4) Datos agrupados:

(c) El ausentismo diario en su oficina parece ir en aumento. Al finalizar el ao se hizo un


estudio estadstico relacionando el nmero empleados ausentes durante un nmero das
en especficos y los resultados fueron los siguientes:

# empleados # de das de
ausentes ausencia
[20 29) 5
[29 38) 9
[38 47) 12
[47 56) 10
[56 65) 8
[65 74) 12
[74 83) 4
[83 92] 10

Determine e interprete cada una de las MTC.

(d) Indagando sobre el salario mensual en un grupo de 150 trabajadores en el municipio de


Villanueva, se dedujo la siguiente distribucin de frecuencias:

Salario en pesos # de empleados


[450.000 500.000) 20
[500.000 550.000) 12
[550.000 600.000) 8
[600.000 650.000) 15
[650.000 700.000) 14
[700.000 750.000) 6
[750.000 800.000) 15

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 36
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

[800.000 850.000) 10
[850.000 900.000) 13
[900.000 950.000) 17
[950.000 1.000.000} 20

Determine e interprete cada una de las MTC.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 37
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

UNIDAD No. 5
MEDIDAS DE POSICION
Las medidas de posicin o tambin llamadas medidas de promedios, nos permiten determinar la
posicin de un valor respecto a un conjunto de datos, el cual consideramos como representativo o
tpico, para el total de las observaciones.

Muchos estadsticos y textos de matemticas, las relacionan con las Medidas de Tendencia
Central e inclusive argumentan que ellas (medidas de posicin) son parte de las medidas de
tendencia central.

Estas medidas aplicadas a las caractersticas de las unidades en una muestra se les denominan
estimadores o estadgrafos. En cambio, aplicadas a las caractersticas de los elementos de una
poblacin se les conoce como parmetros o valores estadsticos de la poblacin.

Dicho de otra forma: Las medidas de posicin son parmetros posicionales muy tiles en la
interpretacin porcentual de la informacin.

Cuando la distribucin contiene un nmero alto de intervalos o de marcas de clase o diversos


valores en su(s) variable(s) de estudio y se requiere obtener un promedio de una parte de ella, se
puede dividir la distribucin en cuatro, en cinco, diez o en cien partes. En el primer caso se habla
de Cuartiles, en el segundo caso se llama Quintiles, en el tercer caso se denomina
Deciles y en el ltimo caso Centiles o Percentiles.

Cuartiles: son valores posicionales que dividen la informacin en cuatro partes iguales, el
primer cuartil deja el 25% de la informacin por debajo de l y el 75% por encima; el segundo
cuartil, al igual que la mediana, divide la informacin en dos partes iguales; y por ltimo el
tercer cuartil deja el 75% por debajo de s y el 25% por encima. Con lo anterior queda claro que
solo se pueden calcular tres cuartiles.

Grficamente:

Quintiles: son valores posicionales que dividen la informacin en cinco partes iguales,
agrupndolas en porcentajes de 20, 40, 60 y 80 por ciento, en consecuencia podemos calcular
cuatro quintiles.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 38
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Deciles: son valores posicionales que dividen la informacin en diez partes iguales, en
cantidad porcentuales de 10 en 10. Se pueden calcular nueve deciles.

Centiles o percentiles: obviamente los centiles dividen la informacin en 100 partes iguales,
lo cual facilita la interpretacin porcentual de una distribucin de frecuencias. Se puede
determinar el valor de noventa y nueve centiles o percentiles.

En la siguiente tabla, se muestra a manera de resumen informacin significativa y relevante


relacionada con las diferentes medidas de posicin:

M. Pos. # partes # medidas % base Simbologa


Cuartil 4 3 25 Q1, Q2 y Q3
Quintil 5 4 20 QK1, QK2, QK3 y QK4
Decil 10 9 10 D1, D2, . . . , D9
Centil 100 99 1 C1, C2, , C99

FRMULA A EMPLEAR EN DATOS NO AGRUPADOS

( )
En donde:
X Posicin
k nmero del percentil a calcular.
n nmero de datos
r nmero de partes de la medida de posicin

Una vez se haya aplicado la frmula y se obtuvo un valor entero (exacto), el valor de la medida de
posicin es aquel ubicado en la posicin referenciado en el nmero obtenido. Cuando el clculo
obtenido corresponde a un nmero decimal se procede de la siguiente manera:

a) Se toma la parte decimal, colocando cero en su parte entera.


b) Se resta los valores de las posiciones involucradas (si el clculo obtenido fue 7,14, se restan
los valores de las posiciones 7 y 8).
c) El resultado anterior se multiplica por el valor deducido en el tem a.
d) Este nuevo valor se suma al valor de la primera posicin involucrada.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 39
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Ejemplo: con los siguientes datos: 16 -10 - 4- 8 - 12 - 10 8 - 20 -4 -13- 12- 22- 16- 26- 20- se pide
determinar a-primer y tercer cuartil b- cuarto y sexto decil c-el 30 y 90 percentil

Lo primero que se debe hacer es, ordenar los datos de menor a mayor o viceversa:

4 4 8 8 10 10 12 12 13 16 16 20 20 22 26-
a -primer y tercer cuartil
( ) ( ) ( )

( ) ( ) ( )

b- cuarto y sexto decil
( ) ( ) ( )
Observemos que el proceso correspondiente al resultado obtenido es diferente a los dos
anteriores, pues aparece con la posicin de 6,4. Es decir que debe estar ente la sexta y sptima
posicin. 6=10 , 7=12 entonces 12-10=2, este resultado se multiplica por 0,4, as 2*(0,4)=0,8 y
se lo agregamos al valor anterior de 10, siendo D 4=10,8

( ) ( ) ( )
9=13 y 10=16 entonces 16-13=3 3*(0,6)= 1,8D6=14,8

c-el 30 y 90 percentil
( ) ( ) ( )

( ) ( ) ( )

23,6

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 40
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

FRMULA A EMPLEAR EN DATOS AGRUPADOS O POR INTERVALO

En donde:
lmite inferior del intervalo percentil.
k nmero del percentil a calcular.
n nmero de datos
r nmero de partes de la medida de posicin
frecuencia absoluta acumulada anterior al intervalo percentil.
frecuencia absoluta del intervalo percentil.
A amplitud del intervalo.

Sin importar que la situacin planteada obedezca a datos no agrupados o agrupados, los datos
deben estar ordenados de menor a mayor.

Con relacin a los porcentajes base, son importantes al momento de la interpretacin de la medida
de posicin calculada.

EJERCICIOS DE APLICACIN SOBRE MEDIDAS DE POSICION

Datos no agrupados:

(1) Los salarios mensuales en miles de pesos de 11 trabajadores de una misma empresa son:

580 600 590 700 850 600 800 600 590 900 850

Determine e interprete: Q2, QK1, QK4, D2, D5, D7, C10, C20, C76 y C80.

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 41
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

(2) Despus de preguntar por las edades de 40 nios de un mismo barrio en el municipio de San
Juan del Cesar, se obtuvieron los siguientes datos:

Edad No. estudiantes


10 9
8 12
9 9
12 10

Determine e interprete: Q1, QK2, QK3, D3, D6, C25, C45, C50 y C95.

Datos agrupados o por intervalo:

(3) En un almacn se hace un inventario y se pesan todos los paquetes que hay. El responsable
del almacn confecciona la siguiente tabla, donde relaciona intervalos de pesos con el nmero
de paquetes encontrados:

Pesos (en kg) No. Paquetes


[0 10) 32
[10 20) 25
[20 30) 11
[30 40) 7
[40 50] 1

Determine e interprete: Q1, QK2, QK4, D4, D7, C15, C40, C70 y C85.

(4) Un estudio calcula el tiempo que tardan los trabajadores de una empresa en llegar de su casa
a la oficina. Los resultados obtenidos se muestran en la siguiente tabla:

Tiempo (en No. de


minutos) trabajadores
07 24
7 14 16
14 21 10
JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag
ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 42
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

21 28 7
28 35 13
35 42 15

Determine e interprete: Q1, Q3, QK1, QK2, D1, D4, D5, C30, C60, C75 y C94.

UNIDAD No. 6
MEDIDAS DE DISPERSION

Son medidas que se emplean para determinar el grado de variabilidad o de dispersin de los datos
con respecto a un promedio. Por lo general se les mide como promedio de las desviaciones
respecto a algn valor central o medida de posicin.

La elaboracin de tablas, grficas y la aplicacin de las medidas de tendencia central, no son


suficientes en el anlisis de las caractersticas de una poblacin. Se necesita de alguna medida
adecuada que permita mostrar cmo se distribuyen o se dispersan los datos alrededor del
promedio.

Para medir el grado de dispersin de una variable, se utilizan principalmente los siguientes
indicadores o medidas:

Rango o recorrido
Desviacin media
Varianza
Desviacin tpica o estndar
Coeficiente de variabilidad

(1) Rango o Recorrido (R)

Es la medida de dispersin ms sencilla ya que solo considera los dos valores extremos de una
coleccin de datos, sin embargo, su mayor utilizacin est en el campo de la estadstica no
paramtrica.

Sin importar que los datos sean no agrupados o agrupados, la frmula a emplear es la misma:

(2) Desviacin Media (DM)

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 43
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Este indicador mide la distancia absoluta promedio entre cada uno de los datos y el parmetro que
caracteriza la informacin (media aritmtica).

La desviacin media es una medida de dispersin bastante objetiva: cuanto mayor sea su valor
mayor es la dispersin de los datos; sin embargo, no proporciona una relacin matemtica precisa
entre su magnitud y la posicin de un dato dentro de la distribucin. Por otra parte, al tomar los
valores absolutos mide la desviacin de una observacin sin mostrar si est por encima o por
debajo de la media aritmtica.
La frmula a emplear es la siguiente:

Donde:

DM: desviacin media


| xi: diferentes valores de la variable x
|
fi: nmero de veces que se repite la
observacin xi
: media aritmtica de la informacin
n: tamao de la muestra
m: nmero de agrupamientos o intervalos.

Cuando se trata de datos agrupados el valor a utilizar en xi es el valor de la marca de clase (Mc).

(3) Varianza (s2)

Esta medida es muy conocida y usada, pero su importancia radica especialmente en que da origen
a la medida de dispersin ms significativa, denominada desviacin tpica o estndar (s).

La varianza se simboliza indistintamente por: s2; V(x); V(y). Se define como: la media aritmtica de
los cuadrados de las desviaciones respecto a la media aritmtica.

La frmula a emplear es la siguiente:

Donde:

s2: varianza
xi: diferentes valores de la variable x

: media aritmtica de la informacin
fi: nmero de veces que se repite la
observacin xi
n: tamao de la muestra
m: nmero de agrupamientos o intervalos.
JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag
ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 44
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

Cuando se trata de datos agrupados el valor a utilizar en xi es el valor de la marca de clase (Mc).

(4) Desviacin tpica o estndar (s)

La varianza (s2) tiene el inconveniente de expresar la dispersin de una variable en unidades


distintas a la que mide la variable; as, si estudiamos la dispersin de la altura de las personas
respecto a la media de su grupo, el valor mide la desviacin en cm o en mts, en tanto que
la varianza mide la dispersin en cm cuadrados o mts cuadrados. Al extraer la raz cuadrada se
regresa a la unidad de media de las variables, de lo cual resulta la desviacin tpica o estndar (s).

La desviacin estndar o tpica se simboliza por s (minscula en la muestra y mayscula en la


poblacin, tambin se puede simbolizar por la letra griega sigma ). Se define como la raz
cuadrada de la varianza, tomada siempre con signo positivo. Tambin se puede definir como la
raz cuadrtica de las desviaciones respecto a la media. La frmula es la siguiente (tanto como
para datos agrupados como para no agrupados):

(5) Coeficiente de variabilidad (CV)

Esta medida de dispersin se simboliza por CV (en mayscula) o d (en minscula) y se obtiene
dividiendo a la desviacin tpica por su media aritmtica (en este caso se habla de coeficiente de
variabilidad relativo) y si el resultado de la divisin se multiplica por 100 (se habla de coeficiente de
variabilidad porcentual). Dicho de otra forma sera:

Sin importar que la situacin planteada obedezca a datos agrupados o no agrupados, se


recomienda realizar la siguiente tabla para el clculo de las diferentes medidas de dispersin:

Xi fi | | | |

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 45
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

EJERCICIOS DE APLICACIN MEDIDAS DE DISPERSION

(1) Datos no agrupados

a) A continuacin se relacionan las edades de los 11 trabajadores del rea de servicios generales
de la Alcalda Municipal de Valledupar:

25 30 28 21 41 36 30 28 35 25 28

b) En la siguiente tabla se resume, los salarios bsicos que se pagan a los trabajadores de una
determinada empresa:

Salario No. empleados


$ 450.000 4
$ 550.000 3
$ 650.000 10
$ 800.000 2
$ 950.000 6
$ 1.200.000 4
$ 1.600.000 1

(2) Datos agrupados

a) Los 100 empleados de una compaa se clasifican de acuerdo con los impuestos pagados de
acuerdo con los impuestos pagados (retencin en la fuente).

Retencin No. de empleados


(miles de $)
0 100 30
100 200 25
200 300 15
300 400 13
400 500 12
500 600 5

Problema de Aplicacin:
JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag
ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 46
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

(1) Los salarios de 10 trabajadores suman en total $12.000.000 Cul es el valor de la varianza
sabiendo que el ?

II EXAMEN PARCIAL

1) El lavadero de carros CERO MUGRE CERO SUCIO EN SU VEHICULO, desea estudiar su


capacidad laboral teniendo en cuenta el nmero de vehculos lavados por da durante 20 das,
arrojando los siguientes datos:

5 7 8 9 10 10 12 7 8 9
4 10 11 6 7 8 5 9 10 11

(a) Calcular e interpretar la Media aritmtica


(b) Calcular e interpretar Q2, QK2, D7 y C85
(c) Calcular las diferentes medidas de dispersin

2) A una convocatoria para Contadores Pblicos sin experiencia alguna, se presentaron 600
personas. La convocatoria como tal tiene como objetivo la presentacin de una prueba de
conocimientos con 100 preguntas y el comit de evaluacin present la siguiente informacin
con respecto a sus resultados:

# preguntas bien contestadas % personas


[0 20) 10
[20 40) 30
[40 60) 25
[60 80) 15
[80 100] 20

(a) Calcular e interpretar la Media aritmtica


(b) Calcular e interpretar Q3, D6 y C15
(c) Si la prueba se supera con un mnimo de 60 preguntas bien contestadas, Qu cantidad y
porcentaje de personas no aprueban dicho examen?
(d) Calcular las diferentes medidas de dispersin

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 47
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

3) Resolver los siguientes problemas relacionados con la aplicacin de la Meda Aritmtica:

EXAMEN FINAL (30%)

Nombre: _____________________________________________ Fecha: 19/06/2014

(1) Una multinacional tiene 200 accionistas de tres pases diferentes (Colombia, Venezuela y
Brasil). El nmero de acciones promedio de los colombianos es de 170, de los venezolanos es
de 200 y de los brasileros es de 150. Se sabe que la cantidad de accionistas colombianos es
tres veces la cantidad de accionistas venezolanos y stos a su vez tienen 20 accionistas
menos que los brasileros.

a) Determinar el nmero de promedio de acciones de todo el conjunto de datos. Valor 1.5.


b) Si cada accin en promedio tiene un valor de 45 dlares, Cul es el monto total de todas
las acciones? (Nota: tenga en cuenta la cantidad de accionistas por pas, el valor promedio
de acciones y su respectivo valor). Valor 0.5

(2) Se tiene conocimiento que la varianza de un conjunto de salarios bsicos diarios de 80


operadores de la empresa BAVARIA S.A. es de $810.000 con un . Cul es el
valor del salario promedio diario de dicho conjunto de trabajadores?

(3) En el Supermercado LA ECONOMIA se vende en promedio de manera diaria 5 bultos de


arroz durante 40 das y en el Autoservicio CUIDE SU BOLSILLO durante 30 das se vende en
promedio 6 bultos de arroz por da. El autoservicio CUIDE SU BOLSILLO tiene asociado un
CVrel = 0,067 y el Supermercado LA ECONOMIA tiene un CV% = 4,54%.

(a) Determine el CV% para todo el conjunto de datos. Valor 1.6


(b) Sabiendo que el bulto de arroz se vende a un precio de $125.000. Cul es el valor que recibe
cada negocio por sus ventas? Valor 0.4

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 48
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

VALORACION
Punto 1 2.0 Punto 2 1.0 Punto 3 2.0

EXAMEN DE HABILITACION (100%)

Nombre: _____________________________________________ Fecha: 27/06/2014

1) El nmero de horas no laboradas por un grupo de trabajadores en una empresa de calzado


durante el mes de junio de 2014, se distribuye de la siguiente manera:

# horas no laboradas # personas


[1 3) 5
[3 5) 7
[5 7) 8
[7 9) 10
[9 11] 10

a) Determinar e interpretar la media aritmtica. Valor 1.0

b) Determinar e interpretar la mediana. Valor 1.0

c) Determinar e interpretar la siguiente medida de posicin: C70 Valor 1.0

NOTA: Cada interpretacin tiene un valor de 0,3.

2) La tienda LA ECONOMIA vende en promedio 5 libras de queso durante 30 das y la tienda


MAS BARATO NO SE PUEDE vende durante 20 das en promedio 7 libras de queso.
Sabiendo que en LA ECONOMIA existe una varianza de 2,25 y en MAS BARATO NO SE

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 49
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

PUEDE una varianza de 3,24 Cul de las dos tiendas presenta una distribucin de las ventas
mas recomendable? Valor 2.0

EXAMEN FINAL (30%)

Nombre: _____________________________________________ Fecha: 28/11/2014

(1) Una empresa consta de tres secciones: En la seccin 1 hay 15 empleados con un salario
promedio de $800.000; en la seccin 2 hay 8 empleados ms que en la seccin 1 con un
salario promedio de $950.000 y en la seccin 3 hay el doble de empleados que en la seccin 2.
De cunto debe ser el salario promedio de los empleados de la seccin 3, para que todo el
conjunto de trabajadores tengan un salario promedio de $1.000.000? //VALOR 1.5//

(2) En una distribucin de datos el CV% es igual al 2.5%. Qu valor tiene la varianza en dicha
distribucin si el dato promedio es 12? //VALOR 1.5//

(3) En una compaa de seguros, se indaga por el tiempo (en aos) que tienen sus empleados de
estar trabajando en dicha compaa. Se cuenta con la siguiente informacin: 5 empleados
tienen 4 aos; 3 empleados tienen 2 aos; 7 empleados tienen 7 aos; 6 empleados tienen 3
aos; y 1 empleado tiene 9 aos. Determine las diferentes medidas de dispersin y de su
opinin de la media aritmtica y coeficiente de variacin porcentual. //VALOR 2.0//

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 50
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

EXAMEN DE HABILITACION

Nombre: _____________________________________________ Fecha: 09/12/2014

(1) En una distribucin de datos la varianza toma un valor de 1,26 y el coeficiente de variacin
porcentual es del 3,68%. Determine el valor de la media aritmtica asociada a dicha
distribucin. //VALOR 1.5//

(2) Se consult a un grupo de personas sobre el nmero de das no laborados en una quincena,
obteniendo los siguientes datos:

2 3 4 2 3 5 5 2 4

Determine las diferentes medidas de dispersin y de su opinin de la media aritmtica y


coeficiente de variacin porcentual. //VALOR 2.0//

(3) En una fbrica de zapatos hay 45 trabajadores. Se sabe que una quinta parte de los
trabajadores son de sexo femenino y el restante es de sexo masculino. Si el salario mensual en
promedio de los hombres es de $800.000 y el de las mujeres es de $720.000. Cul es el valor
del salario promedio de todo el conjunto de los trabajadores? //VALOR 1.5//

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 51
UNIGUAJIRA EXTENSION VILLANUEVA Ctedra de Estadstica y
Probabilidades
Programa de Administracin de Empresas III Semestre

JOSE ALFREDO MONTERO:josemontero@uniguajira.edu.co Pag


ALEXI MONTERO SANTIAGO:amsantiago@uniguajira.edu.co 52

También podría gustarte