Está en la página 1de 35

REPBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD NACIONAL EXPERIMENTAL DE LOS LLANOS OCCIDENTALES


EZEQUIEL ZAMORA UNELLEZ
PROGRAMA CIENCIAS SOCIALES Y JURDICAS
DICAS
LICENCIATURA EN ADMINISTRACIN

Estadstica 1

Facilitador: Econ. Carlos Daz


CI.- 14.434.676
0424-5891014
5891014
cdunellez@yahoo.es
@yahoo.es

BARINAS, ABRIL 2014

1
UNELLEZ-ADMINISTRACI
ADMINISTRACIN/ESTADSTICA
STICA I/PROF. CARLOS DAZ
Mdulo I: CONCEPTOS GENERALES DEL ANLISIS ESTADSTICO

INTRODUCCIN

El presente material tiene como propsito ofrecer el apoyo terico y prctico necesario
para el estudio de la estadstica, conocer su importancia y campo de accin. En el
mismo se introducen algunas definiciones bsicas que permiten comprender en forma
intuitiva y real de lo que es la estadstica.

1.1.- CONCEPTOS BSICOS

Durante mucho tiempo se consider que el campo del estudio cientfico era exclusivo
de fenmenos que bajo las mismas condiciones producen los mismos resultados, es
decir, de fenmenos determinsticos.

Sin embargo, aquellos fenmenos donde est presente la incertidumbre en cuanto a lo


que va ocurrir, es decir, fenmenos aleatorios, son en la realidad los de mayor
importancia. Su estudio corresponde a la estadstica.

Son ejemplos de fenmenos aleatorios:

i. Lanzamiento de un dado.
ii. Cantidades vendidas en un supermercado en das sucesivos.
iii. La duracin de los equipos elctricos en un lote producido por determinada
empresa.

La ciencia estadstica tiene su origen en las siguientes corrientes histricas:

i. Recopilacin de datos en forma de censo.


ii. Juegos de azar.
iii. Conocimiento inductivo. Paso de lo particular a lo general.

La naturaleza de la estadstica en el mundo de hoy, el que uno debe primero reunir


datos para aprender sobre algo se ha convertido un axioma. Por ejemplo, el primer
paso para aprender sobre temas como:

i. El estado actual de la economa.


ii. El porcentaje de votantes a favor de una propuesta.
iii. El nmero medio de kilmetros que puede recorrer un automvil de nueva
fabricacin con un litro de gasolina.
iv. La eficacia de un nuevo medicamento.
v. La utilidad de un nuevo mtodo de enseanza de lectura para nios de una
determinada escuela.

Consiste en recolectar datos relevantes.

2
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Para Sheldon (2007, p. 3) la estadstica es el arte de aprender a partir de los datos.
sta relacionada con la recopilacin de los datos, su descripcin subsiguiente y su
anlisis, lo que nos lleva a extraer conclusiones

La estadstica puede ser considerada como una ciencia moderna, es el resultado de la


confluencia de dos disciplinas independientes: el clculo de las probabilidades, que
nace como aproximacin matemtica a los juegos de azar, y la estadstica, o ciencia del
Estado, dedicada a llevar registros ordenados (contar, tabular, clasificar, censar, entre
otras) de los datos del Estado. La unin de ambas en el siglo XIX dio lugar a una nueva
ciencia interesada, fundamentalmente, en estudiar cmo obtener conclusiones de la
investigacin emprica mediante el uso de modelos matemticos.

El anlisis de datos o anlisis estadstico puede definirse como una ciencia que recoge,
ordena y analiza los datos de una muestra extrada de una determinada poblacin, para
hacer inferencias acerca de esa poblacin valindose del clculo de probabilidades.

Cuando se habla de estadstica, tradicionalmente se refiere a nmeros presentados de


forma ordenada y sistemticamente. Idea que se extiende cada vez ms debido a la
influencia de nuestro entorno.

Sin embargo, cuando profundizamos un poco podemos entender que la estadstica es


ms que nmeros, es el nico instrumento que permite obtener informacin en toda
aquella investigacin cuyo comportamiento impiden que pueda ser abordada mediante
mtodos determinsticos.

De acuerdo a esto, se pude definir la estadstica como la ciencia de coleccionar,


describir, analizar e interpretar informacin (cualitativa y cuantitativa) relativa a un
fenmeno en el cual est presente la incertidumbre y que permite al investigador, tomar
decisiones. El objetivo fundamental del anlisis estadstico es tomar una decisin de
alta calidad.

Sarabia y Pascual (2005, p. ) definen la estadstica como un conjunto de tcnicas y


mtodos cientficos que permiten al investigador interpretar la informacin numrica,
elegir muestras representativas para realizar inferencias, contrastar hiptesis, estimar y
predecir relaciones causa-efecto y tomar decisiones.

Para el estudio de un fenmeno, necesitamos contar con informacin relacionada con el


mismo. Esta informacin obtenida bien sea experimentalmente o, mediante observacin
est dada por datos. Estos datos son el resultado de medir en un conjunto de
elementos o individuos, una o varias caractersticas a ser analizadas en una
investigacin.

Un individuo o elemento es un ser vivo, elemento o cosa que posee caractersticas que
se desean investigar. A este conjunto de elementos (personas, fbricas, familias, entre
otras.) se les denomina Universo Estadstico. A la coleccin de todas las posibles
mediciones que se pueden hacer de una caracterstica de inters, se le denomina
Poblacin Estadstica.
3
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Ahora bien, el anlisis puede llevarse a cabo en base a toda o, a una parte de la
poblacin. Si se hace uso de toda la informacin, decimos que se ha hecho una
investigacin exhaustiva o total (censo). No siempre es posible realizar un censo, por
razones como: costos, tiempo, poco prctico, entre otras. Es necesario entonces, en
estos casos, llevar a cabo una investigacin parcial. La misma consiste en realizar el
anlisis en base a la informacin correspondiente a una parte de los elementos o
individuos. A esta parte se le denomina muestra, es un subconjunto de la poblacin.

De tal forma en que se selecciona la muestra, depende la precisin de la investigacin.


La muestra debe ser seleccionada de forma tal que sea lo ms representativa posible.

Existen dos tipos de muestreo: el no probabilstico y el probabilstico. El muestreo no


probabilstico se realiza cuando se selecciona una muestra de forma intencional, de
acuerdo a opiniones y criterios personales. Otras de las principales razones es obtener
informacin sin mucho costo. Este tipo de muestreo no involucra ningn elemento
aleatorio en el procedimiento de seleccin de los individuos que conformaran la
muestra.

Al utilizar mtodos no probabilsticas, no todos los miembros de la poblacin tiene la


probabilidad de ser seleccionados, lo que se traduce en la obtencin de una muestra
no representativa de la poblacin, es decir, existe discrecionalidad (preferencia) en el
proceso de seleccin de los individuos o unidades de anlisis.

El muestreo probabilstico es la alternativa ideal, este procedimiento da a cada


elemento de la poblacin una probabilidad de ser seleccionada. Existen varias
condiciones para que una muestra sea probabilstica:

i. Identificar el conjunto total de muestras posibles que puedan seleccionarse de


acuerdo al procedimiento a utilizar.
ii. Conocer la probabilidad que tiene cada muestra de ser seleccionada.
iii. El procedimiento de muestreo a utilizarse debe asignar a cada elemento de la
poblacin una probabilidad distinta de cero 0 de ser seleccionada.
iv. La seleccin debe ser aleatoria.

Para qu utilizamos la muestra? Para analizarla, la idea es conocer la poblacin a


partir de la muestra esto es inferencia. La nica forma de hacer inferencia es que la
muestra sea probabilstica.

La unidad de anlisis es aquella que se est estudiando. Por ejemplo, las personas
que habitan los hogares en la ciudad de Barinas. La unidad de observacin es aquella
por medio del cual se obtiene la informacin, es decir, es la unidad informante. Por
ejemplo, el jefe de familia que representa a las personas que habitan en cada hogar de
la ciudad de barinas.

El parmetro es cualquier medida referida al total de miembros o elementos de la


poblacin de inters. Es un valor fijo (aunque, en realidad, puede variar con el tiempo)

4
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
y, por lo general, no se conoce, por lo cual se intenta estimar a partir de los datos de la
muestra.

El estadstico es una funcin de variables aleatorias que no incluye parmetros


desconocidos, se calcula a partir de los datos de la muestra y, por lo tanto, sirve para
estimar parmetros. En otras palabras, es una medicin referida a los elementos de una
muestra.

Una distribucin muestral de un estimador es una distribucin de probabilidades de


todos los valores posibles que un estadstico puede tomar cuando es calculado con
muestra de igual tamao, extradas al azar de una misma poblacin.

El error muestral, de estimacin o estndar es la diferencia entre un estadstico y su


parmetro correspondiente. Es una medida de la variabilidad de las estimaciones de
muestras repetidas en torno al valor de la poblacin, nos da una nocin clara de hasta
dnde y con qu probabilidad una estimacin basada en una muestra se aleja del valor
que se hubiera obtenido por medio de un censo completo. Siempre se comete un error,
pero la naturaleza de la investigacin nos indicar hasta qu medida podemos
cometerlo (los resultados se someten a error muestral e intervalos de confianza que
varan muestra a muestra). Un estadstico ser ms preciso en cuanto y tanto su error
sea menor. Podramos decir que es la desviacin de la distribucin muestral de un
estadstico y su fiabilidad.

El nivel de confianza es la probabilidad de que la estimacin efectuada se ajusta a la


realidad. Cualquier informacin que queremos recoger est distribuida segn una ley de
probabilidad (por ejemplo Gauss o Student). As, el nivel de confianza es la probabilidad
de que el intervalo construido en torno a un estadstico capte el verdadero valor del
parmetro.

La varianza poblacional es un indicador del grado de homogeneidad de la poblacin


en estudio. cuando una poblacin es ms homognea la varianza es menor y el nmero
de observaciones necesarias para construir un modelo reducido del universo, o de la
poblacin ser menor. Generalmente es un valor desconocido y hay que estimarlo a
partir de daos de estudios previos.

Objetivo y reas de aplicacin de la estadstica

El objetivo primordial de la estadstica es el de generalizar o, inferir a una poblacin los


resultados provenientes de una parte de la misma, es decir, una muestra.

Su campo de aplicacin es muy amplio, se extiende a todas las investigaciones en que


est presente el azar. De esta forma podemos indicar que la estadstica tiene aplicacin
en todas las reas del saber. Algunos ejemplos son:

i. Agricultura. Evaluar la efectividad de un fertilizante.


ii. Tecnologa. Comparar dos tipos de tcnicas.

5
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
iii. Economa. Estimaciones y predicciones de precios. Elaboracin de indicadores
econmicos. Comparacin de ingresos.
iv. Demografa. Determinacin de la estructura de edades de la poblacin. Clculo
de ndices de natalidad, mortalidad.

1.2.-Clasificacin de la estadstica

La estadstica puede clasificarse de acuerdo a su funcin en el tratamiento de los datos


en:

i. Estadstica descriptiva: denominada tambin estadstica deductiva. Es la


encargada de describir, analizar y representar un conjunto de datos, utilizando
mtodos numricos y grficos que resumen y presentan la informacin contenida
en ellos. Puede llevarse a cabo sobre una muestra o sobre todo una poblacin.
ii. Estadstica inferencial. Denominada tambin inferencia estadstica o estadstica
inductiva. Es la que apoyndose en la teora de probabilidades y la teora del
muestreo, se encarga de efectuar estimaciones, decisiones, predicciones u otras
generalizaciones sobre una poblacin.

La estadstica descriptiva e inductiva pueden ser usadas separadas o conjuntamente.


Lo usual es que en una investigacin participen las dos.

1.3.- Tipos de variables

Qu es una variable?

Es una caracterstica de la poblacin que se est analizando en un estudio estadstico.

Variables cualitativas

Variables discretas
Variables aleatorias

Variables cuantitativas

Variables continuas

Variables aleatorias: no se pueden predecir con exactitud su valor en el futuro. Estas


son las que se utilizan en el anlisis estadstico. Dentro de ellas tenemos:

i. Variables cualitativas: se mide de manera no numrica. Ej: estado civil, religin,


sexo, color del cabello, entre otras.
ii. Variables cuantitativas: son aquellas que se expresan numricamente, resultan
de la medicin. Se subdividen en:

6
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Variables discretas: est limitada a ciertos valores, por lo general son
nmeros enteros, con frecuencia son el resultado de la enumeracin o del
conteo. Ej: nmero de hijo, nmero de automviles vendidos en el mes,
nmero de visitantes en un sitio turstico, entre otras.
Variables continuas: es aquella que puede tomar un valor en cualquier rango
dado. Ej: peso, estatura, edad, ingreso familiar, entre otras.

1.4.- Escalas de medida

Como se mencion un individuo es cualquier ente que posee caractersticas las cuales
pueden ser objeto de estudio. A estas caractersticas se les denomina variables y a las
distintas formas en que se pueden presentarse o, a las distintas modalidades o valores
de las variables. Al conjunto de modalidades o valores de una variable se le denomina
Escala de Medida.

Las escalas de medida pueden identificarse de acuerdo a las relaciones que existen
entre los valores y las operaciones aritmticas que puedan realizarse entre las mismas.

i. Escala nominal: son aquellas en que la nica relacin que se defina entre sus
valores es la igualdad (=) o diferencia (). No hay operaciones aritmticas

Consiste en clasificar en categoras a los sujetos u objetos que se desean medir, de


modo que todos los sujetos u objetos clasificados dentro de la misma categora sean
equivalentes respecto a la variable o propiedad que se est midiendo.

En el nivel nominal, las observaciones nicamente se pueden clasificar o contar. No hay


un orden en particular para las distintas clases.

Ejemplo: Estado civil: ( ) soltero ( ) casado ( ) divorciado


Sexo: ( ) masculino ( ) femenino
Religin: ( ) catlica ( ) evanglica ( ) protestante
Raza: ( ) blanca ( ) negros ( ) mestizos

ii. Escala ordinal: son aquellas en que entre sus valores estn definidas las
relaciones igualdad o diferencia y mayor que o menor que. No hay operaciones
aritmticas definidas.

En el nivel ordinal consiste en asignar a los sujetos u objetos medidos un nmero que
permita ordenarlos segn la cantidad de variable que poseen. Adems de estar
presente la relacin de igualdad-desigualdad (= / ) propia de la escala nominal, los
nmeros asignados permiten afirmar si la cantidad de variable que posee un sujeto es
mayor que o menor que ( / ), la cantidad de variable que posee otro sujeto u objeto
cualquiera.

Ejemplo: Satisfaccin laboral con su ingreso (las opciones de respuestas que se


muestran a continuacin corresponde a una escala tipo Likert)

7
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
1.- muy satisfecho ( )
2.- satisfecho ( )
3.- ni insatisfecho ni satisfecho ( )
4.- poco satisfecho ( )
5.- insatisfecho ( )

iii. Escala de intervalo: los valores son nmeros y entre ellos tienen sentido las
relaciones de igualdad, de orden y de las distancias. La resta es la nica
operacin aritmtica definida. Esta escala posee dos propiedades de gran
importancia:

- Existe una unidad de medida cuyo significado se mantiene constante para todos los
valores.

- Posee un cero 0 u origen relativo. El cero no significa ausencia de la caracterstica.

El nivel de intervalo posee las caractersticas del nivel ordinal, pero, adems, la
diferencia entre dos valores es de un tamao constante.

En la medida de intervalo, adems de poder afirmar que un objeto posee ms o menos


cantidad de variable que otro (relacin alcanzada ya en la escala ordinal), tambin es
posible determinar la magnitud de la diferencia existente entre dos objetos medidos, es
decir, la cantidad de variable en la que difieren dos objetos.

Ejemplos: la temperatura: grados centgrados, grados Fahrenheit, grados Celsius

iv. Escala de razn o escala proporcional: los valores de la variable son nmeros y
entre ellos tienen sentido las relaciones de igualdad, orden y estn definidas las
operaciones aritmticas de: suma, diferencia y proporciones (mltiplos). Estas
escalas tiene un cero 0 absoluto, el cual representa la ausencia de
caracterstica.

1.6.- Clasificacin de los datos

Consiste en organizar y describir los datos de manera concisa y significativa. Para


determinar su significancia, los datos se organizan de manera que con un simple
vistazo, se pueda tener una idea de lo que pueda decirnos.

Para Hernndez, Fernndez y Batista 2003, la informacin para cualquier tipo de


investigacin puede ser:

i. Transversal: para un momento dado. Ej: encuestas, cuestionarios, entre otras.


ii. Serie de tiempo: para un periodo dado. Ej: el comportamiento de las ventas de la
empresa entre 1999-2005.

8
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
1.7.- Clasificacin de los cuadros o tablas en estadstica

i. Tabla de frecuencias: es un agrupamiento de los datos en categoras


mutuamente excluyentes dando el nmero de observaciones a cada categora.
(observe los cuadros, la variable es de tipo cualitativa y su escala es nominal)

Observe la estructura del cuadro, existe una enumeracin, un ttulo, una fuente. A
continuacin detalle cmo se realizan los clculos para la representacin porcentual.
Fi= es la frecuencia absoluta.

Cuadro 1
Sexo del personal encuestado
Individuos por sexo Fi (Observaciones) % (Representacin)
Hombres 65 (65/163)*100= 39,88
Mujeres 98 (98/163)*100= 60,12
total 163 100,0
Fuente: Instrumento aplicado a la Empresa XYZ, 2014

A continuacin observe cmo se presentara en un trabajo de investigacin una tabla de


frecuencia.

Cuadro 2
Sexo del personal encuestado
Individuos por sexo Fi %
Hombres 65 39,88
Mujeres 98 60,12
total 163 100,0
Fuente: Instrumento aplicado a la Empresa XYZ, 2014

ii. Datos de asociacin o tabla de contingencia: se utiliza cuando se desea


examinar o comparar dos variables, por lo general son dos variables cualitativas.

Cuadro 3
Sexo y raza del personal encuestado
(Valores absolutos)
Individuos por Raza y Sexo
Sexo Raza
Total
Blancos Negros
Hombres 28* 37 63
Mujeres 50 48 98
Total 78 85 163
Fuente: Instrumento aplicado a la Empresa XYZ, 2014

El anlisis que se muestra a continuacin es engorroso a la hora de describirlo en un


documento o trabajo de investigacin:

9
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
i. Lectura vertical 28*: de los setenta y ocho individuos correspondientes a la raza
blanca, veintiocho son hombres y cincuenta son mujeres.
ii. Lectura horizontal 28*: de los sesenta y tres hombres, veintiocho corresponden a
la raza blanca y treinta y siete a la raza negra.

Como se observa el anlisis es engorroso es por ello que los valores absolutos hay
que transformarlos en valores relativos (cifras en porcentajes).

NOTA: a la casilla donde se encuentra el valor 163 se le conoce con el nombre de Gran
Total. Para transformar los valores absolutos del cuadro 3 en valores relativos hay que
dividir todos los valores con el valor del Gran Total. Observe los procedimientos
matemticos.

Cuadro 4
Sexo y raza del personal encuestado
Individuos por Raza y Sexo
Sexo Raza
Total
Blancos Negros
Hombres (28/163*100=17,2 (37/163)*100= 22,7 (63/163)*100= 38,7
Mujeres (50/163)*100= 30,7 (48/163)*100= 29,4 (98/63)*100= 60,1
Total (78/163)*100= 48,8 (85/163)*100= 52,1 (163/163)*100= 100
Fuente: Instrumento aplicado a la Empresa XYZ, 2014

A continuacin visualice como se presentara en un trabajo de investigacin una


tabla de contingencia.

Cuadro 5
Sexo y raza del personal encuestado
(Cifras en porcentajes)
Individuos por Raza y Sexo
Sexo Raza
Total
Blancos Negros
Hombres 17,2 22,7 38,7
Mujeres 30,7 29,4 60,1
Total 48,8 52,1 100
Fuente: Instrumento aplicado a la Empresa XYZ, 2014

Lea el siguiente anlisis: El 17,2% de las personas encuestadas son hombres


blancos, el 29,4% de las trabajadoras de la empresa son de raza negra. El 48,8% de los
individuos son blancos. El 60,1% de las personas que participaron en la investigacin
corresponde al sexo femenino.

iii. Series cronolgicas: algunas investigaciones utilizan el tiempo para mostrar la


evolucin o el comportamiento de un fenmeno en relacin a l. En el Cuadro 6
se observa la mortalidad por tuberculosis en Caracas para un periodo de tiempo

10
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
que va desde 1952 hasta 1955. La informacin que usted observa en el Cuadro
6 es la que se obtiene de los anuarios estadsticos de una institucin.

Cuadro 6
Mortalidad por tuberculosis- caracas, 1952-1955
Ao Nmero de defunciones
1952 549
1953 325
1954 270
1955 252
Fuente: Informe Anual del Ministerio de Sanidad de Venezuela, 1952-1955

En el Cuadro 7 visualice cmo se realizan los clculos correspondientes para


obtener la tasa de crecimiento interanual.

Cuadro 7
Mortalidad por tuberculosis- caracas, 1952-1955
Ao Nmero de defunciones Tasa de crecimiento interanual
1952 549 -
1953 325 (325/549)= 0,592-1= -0,4080*100= - 40,80
1954 270 (270/325)= 0,8308-1= -0,1692*100= -16,92
1955 252 (252/270)= 0,933-1= -0,066*100= -6,6
Fuente: Informe Anual del Ministerio de Sanidad de Venezuela, 1952-1955

En el Cuadro 8 detalle cmo se presentara en un trabajo de investigacin

Cuadro 8
Mortalidad por tuberculosis- Caracas, 1952-1955
Ao Nmero de defunciones %
1952 549 -
1953 325 - 40,80
1954 270 -16,92
1955 252 -6,6
Fuente: Informe Anual del Ministerio de Sanidad de Venezuela, 1952-1955

Lea el siguiente anlisis: en 1953 las defunciones por tuberculosis disminuyeron


40,8% al compararse con 1952. El indicador tasa de crecimiento interanual evidencia
una tendencia hacia la baja.

11
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Mdulo II: LA TABLA DE DISTRIBUCIN DE FRECUENCIA, UNA TCNICA DE
AGRUPACIN DE DATOS

iv. Una distribucin de frecuencias: ordenar los datos si estos se dividen en clases
y se registrar el nmero de observaciones en cada clase. Este tipo de cuadro se
utiliza cuando las variable es cuantitativa discreta o continua. Se le conoce como
tcnica de Agrupacin de Datos

Como caso estadstico residente de Aeropostal, el director de la divisin de estadstica


le pide recolectar y agrupar los datos sobre el nmero de pasajeros que han decidido
volar con la aerolnea correspondiente a los ltimos 50 das. Los datos son los
siguientes:

68 71 77 83 79
72 74 57 67 69
50 60 70 66 76
70 84 59 75 94
65 72 85 79 71
83 84 74 82 97
77 73 78 93 95
78 81 79 90 83
80 84 91 101 86
93 92 102 80 69

Los pasos para construir una tabla de distribucin de frecuencias para agrupar los datos
son los siguientes:

1.- Hay que organizar la informacin de menor a mayor / mayor a menor (este paso
se puede omitir)

2.- Se calcula el Rango:

2.1- para variables discretas R = valor Mximo valor Mnimo


2.2- para variables continuas R = ( valor Mximo valor Mnimo) 1

3.- Se calcula el nmero de clases:

Para calcular el nmero de clases se utiliza la frmula de stugers:

Nc= 1 + 3,3 log n donde n= nmero de datos o tamao de la muestra

4.- se calcula la amplitud de clase o intervalo de clase para una tabla de frecuencia

R
Amplitud de clases ( Ac ) =
Nc

12
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Nota: el ejercicio se realizar en clase

A la tabla de distribucin de frecuencia le corresponde los siguientes grficos:

i. El histograma
ii. El polgono de frecuencia
iii. La ojiva de Galton

Los grficos anteriormente descritos se realizarn en clases, sin embargo los


estudiantes deben investigar para conocer las caracterstica de los mismos.

13
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
1.8.- GRFICOS

Caractersticas generales

Los grficos dan una idea mucho ms sinttica que los cuadros estadsticos. Unas
veces su finalidad es simplemente tratar de mostrar a otras personas la evolucin de un
determinado fenmeno, pues mientras que la interpretacin de un cuadro estadstico
requiere ciertos conocimientos, cualquiera puede comprender fcilmente que una lnea
ascendente traduce un aumento del fenmeno estudiado y que una lnea ascendente
significa una disminucin.

Escalas del grfico y errores en su empleo

Dejando a un lado contadas excepciones que se sealarn a su debido tiempo, la


mayora de los grficos presentan forma rectangular y se inscribe en la llamadas
coordenadas rectangulares que son aquellas formadas por la intercepcin de dos
lneas en ngulos recto.

De esas dos lneas, la horizontal o abscisa se destinar para diferentes clases de la


escala que se utiliza y, la vertical u ordenada, para anotar la frecuencia o nmero de
veces que se observa el fenmeno en estudio. A propsito de estas escalas es
necesario recordar los siguientes principios:

Las dos (2) escalas deben ser de la misma longitud o lado mayor la horizontal que la
vertical. En general, salvo en ocasiones que se sealarn oportunamente, las dos (2)
escalas deben guardar una proporcin entre 1 a 1 y 1 a 2, es decir, que si la ordenada
mide 10 centmetros, la abscisa debe medir entre 10 y 20. Esta exigencia se hace con
el fin de no distorsionar el fenmeno que se estudia.

Principales grficos

De acuerdo a lo que se ha sealado, pueden por consiguiente distinguirse dos


clases de grficos: aquellos destinados a mostrar las variaciones de determinado
fenmeno y aquellas utilizados con fines analticos. Los primeros aunque muy
demostrativos no siempre son de mayor utilidad para el investigador.

Dada la extraordinaria diversidad de grficos existentes, slo estudiaremos los


ms utilizados:

1. Diagramas de barras y sus diferentes modalidades.


2. Diagrama de sectores.
3. Histograma.
4. Polgono de frecuencias.
5. Diagrama de frecuencias acumuladas.
6. Diagrama de puntos.
7. Diagrama de tallo y hoja.
8. Diagrama de caja y bigote.
14
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Grfico 1
Ilustracin de los errores ms comunes en la elaboracin de grficos
400

300

200

100
500
400
1950 1954 300
a.- incorrecto: escala vertical exagerada 200
100
500

400

1950 1954
300

200
b.- correcto: la proporcin entre las dos (2)
100 escala es adecuada

1950 1954

b.- incorrecto: escala horizontal exagerada


800

800 750

600 700

400

200
1950 1954

1950 1954
e.- correcto: se nota que la escala esta
d.- incorrecto: no se aprecian las fluctuaciones de interrumpida
fenmeno

1. Diagramas de barras y sus diferentes modalidades

Es aquel en el cual el fenmeno que se estudia queda representado por una serie de
rectngulos o barras, las cuales pueden dibujarse horizontal o verticalmente. Las barras
deben ser de la misma anchura y el espacio que las separa no debe ser mayor que el
espesor de las mismas.

15
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Si los datos representados no estn en alguna secuencia que debe conservarse, debe
ordenarse de mayor a menor, con lo cual se mejora la esttica del grfico y se capta
mejor las variaciones que se estudian.

Si se quiere representar por ejemplo, las variaciones mensuales de un fenmeno


durante determinado ao, lo meses deben colocarse ordenadamente de enero a
diciembre.

1.1.- diagrama de barras sencilla: se utiliza para distribuciones de frecuencias en escala


cualitativa y cuantitativa discontinua (o discreta). Pueden utilizarse tambin para series
cronolgicas, cuando son pocos los valores que se quieren representar, especialmente
cuando corresponde a observaciones peridicas (VER CUADRO N 9)

1.2.- diagrama de barras dobles: este diagrama cuya idea puede hacerse extensiva par
barras triples o cudruples, se emplea para representar datos de asociacin, cuyas dos
escalas sean cualitativas (defunciones por sexo y causa, entre otras). Tambin se
emplea cuando se quiere comparar dos distribuciones de frecuencias (VER CUADRO
N 10).

Cuadro 9
Vacunaciones practicadas en la primera
zona epidemiolgica del estado Lara, 2005
Descripcin personas inoculadas
antivarilica 16.202
doble 5.239
triple 15.584
antipolio 22.951
antitfica 873
b.c.g 7.752
total 68.241
Fuente: IVSS-Lara, 2005

Grfico 2
Personas inoculadas en la primera zona epidemiolgica del estado Lara, 2005

antitifica

doble

b.c.g

triple

antivariolica

antipolio

0 5.000 10.000 15.000 20.000 25.000

Fuente: Cuadro 9
16
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Cuadro 10
Defunciones por accidentes, por causas y sexo en el estado Barinas, 2009

Causa del accidente sexo


hombres mujeres total
accidentes del transporte 1145 232 1377
sumersin accidental 346 92 438
cadas 242 101 343
envenenamientos 58 43 101
otros accidentes 653 311 964
total 2444 779 3223

Fuente: Hospital Lus Razetti del estado Barinas

Grfico 3
Defunciones por accidentes, por causas y sexo en el estado Barinas, 2009

1200

1000

800

600 hombres
mujeres
400

200

0
accidentes del sumersin cadas envenenamientos otros accidentes
transporte accidental

Fuente: Cuadro 10

1.3.- Diagrama de barras compuestas: continuando con la informacin del cuadro N 10,
se puede expresar la informacin en proporciones, es decir, en porcentajes.

17
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Grfico 4
Defunciones por accidentes, por causas y sexo en el estado Barinas, 2009

100% otros accidentes

80% envenenamientos

60%
cadas
40%
sumersin accidental
20%
accidentes del
0% transporte
hombres mujeres

Fuente: Cuadro 10

2. Diagrama por sectores

Es uno de los ms frecuentemente empleados, se utiliza con fines comparativos,


cuando se quiere mostrar los diversos componentes de una serie y con tal propsito, a
menudo se emplea en lugar un diagrama de barras sencillas, a pesar de que no tiene
ninguna ventaja sobre l.

En l se pueden representarse cifras absolutas o porcentajes. Como el crculo


tiene 360, la manera ms fcil de elaborarlo es expresar los datos que se estudian en
forma de porcentajes, pues en tal caso, cada 1% corresponde a 3,6 del crculo.
Continuando con la informacin del cuadro N 10, se realiz un diagrama por sectores
para los hombres.

Grfico 5
Defunciones del sexo masculino por accidentes, por causas en el estado Barinas, 2009

27%
accidentes del transporte
sumersin accidental
47%
cadas
2%
envenenamientos
10% otros accidentes

14%

Fuente: Cuadro 10
18
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
3. Histograma

En el histograma el fenmeno que se estudia queda representado por una serie


de rectngulos semejantes a los del diagrama de barras. Sin embargo, las barras del
histograma siempre se colocan verticalmente y deben ir una al lado de las otras, sin que
haya ningn espacio que las separe. A continuacin se realizar el histograma del
problema de la aerolnea.

Grfico 6
Histograma de aeropostal
20

f
r
15
e
c
u
10
e
n
c
5
i
a Desv. tp. = 11,24
Media = 78,3
0 N = 50,00

NP

Pasajeros

4. Polgono de frecuencias

Seala la frecuencia ordinaria absoluta correspondiente a cada intervalo de clase


por medio de rectngulos cuya altura es la frecuencia absoluta del intervalo (n) y la
base (ancho), es el espacio representado en el eje de las abscisas (X) por el
intervalo completo. Tambin se llama histograma y se utiliza para representar
variables continuas. (Ver grfico anterior).

5.- Ojiva de Galton o curva acumulativa

Esta curva seala la frecuencia acumulada correspondiente acada uno de los


intervalos de clase. En su construccin, se coloca en las ordenadas o eje (Y), las Ni
(frecuencias absolutas acumuladas) o Fi (frecuencias relativas acumuladas), y en las
abscisas o eje (X) los puntos medios (variable continua). Corresponde al caso de la
aerolnea.

19
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Grfico 7
Ojiva acumulativa de Galton para el caso de aeropostal
N
P
m 100,00% o
e 50 100,00% r
e
r
o
45 80,00% 90,00% c
e
d
40 86,00% 80,00% n
e t
35 70,00% a
d
30 60,00% j
a e
s 25 56,00% 50,00%
a a
c
20 40,00% c
u u
m 15 30,00%
u m
l 10 6,00% 20,00% 20,00% u
a l
d
o
5 10,00% a
s
0 0,00% d
o
50 a 59 60 a 69 70 a 79 80 a 89 90 a 99 100 a 110

6. Diagrama de dispersin

El diagrama de dispersin es aquel que nos va permitir observar la relacin


existente entre dos variables de una manera grfica, as como que tan dispersos se
encuentran los datos.

Grfico 8
Variables: peso al nacer y estado de gestacin
2,0

1,8

1,6

1,4

1,2
Peso al nacer (Kg)

1,0

,8

,6
24 26 28 30 32 34 36 38

Estado de gestacin (semanas)

7. Diagrama de caja (Box and Wisker)

Utiliza la estructura de los datos en trminos de cuartiles, es decir, es posible


dividir los datos en cuatro partes iguales. Tambin se le conoce como las bisagras de
Tukey.
20
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Grfico 9
Diagrama de caja y bigote

* Casos Extremos: valores alejados ms de 3 longitudes


de la caja del percentil 75

0 Casos atpicos: valores alejados ms de 1,5 longitudes


de caja del percentil 75

Valor ms grande que no llega a ser atpico

Percentil 75 (3era bisagra)


La caja
contiene el
50% de los Mediana
casos
centrales
Percentil 25 (1era bisagra)

Valor ms pequeo que no llega a ser atpico

0 Casos atpicos: valores alejados ms de 1,5 longitudes


de caja del percentil 25

* Casos Extremos: valores alejados ms de 3 longitudes


de la caja del percentil 25

8. Diagrama de tallo y hoja (Steam and Leaf)

Es una alternativa sencilla de organizar y presentar datos sin perder precisin.


Cada dato se divide en dos partes: un tallo y una hoja separados por una recta vertical.
Puede adaptarse a cualquier conjunto de datos.

La parte ms importante de un valor con respecto a toda la serie es utilizada


como el tallo (generalmente la primera cifra). Esta representacin grfica intenta
potenciar la visualizacin de la informacin.

Como el histograma, el diagrama de tallo y hoja nos permite una visualizacin del
nmero de observaciones para cada clase, pero adems tiene la ventaja adicional de
proporcionar ms detalles, no slo vemos el nmero de valores sino su magnitud
tambin. A continuacin se presentar el diagrama de tallo y hoja, diagrama de caja,
medidas de tendencia central y de dispersin. El programa utilizado para procesar la

21
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
informacin es: El SPSS (Statistical Product and Service Solutions). Los datos
utilizados corresponden a los de Aeropostal y los cuadros sern discutidos en clase.

Resumen del procesamiento de los casos


Casos
Vlidos Perdidos Total
N Porcentaje N Porcentaje N Porcentaje
NP 50 100,0% 0 ,0% 50 100,0%

Descriptivos
Estadstico
Variable
Media 78,30
NP
Intervalo de confianza para la media al 95% Lmite inferior 75,11
Lmite superior 81,49
Mediana 78,50
Varianza 126,378
Desv. tp. 11,24
Mnimo 50
Mximo 102
Rango 52
Amplitud intercuartil 13,50
Asimetra -,060
Curtosis ,003

Grfico 10
Diagrama de tallo y hoja y diagrama de caja y bigote
Ejercicio de aeropostal

NP Stem-and-Leaf Plot

Frequency Stem & Leaf


110
1,00 Extremes (=<50)
2,00 5 . 79 100

1,00 6 . 0
6,00 6 . 567899 90

9,00 7 . 001122344
80
9,00 7 . 567788999
10,00 8 . 0012333444 70
2,00 8 . 56
6,00 9 . 001234 60

2,00 9 . 57
2,00 10 . 12 50 3

40
Stem width: 10 N= 50

NP
Each leaf: 1 case(s)

22
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Mdulo III: MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN PARA DATOS
AGRUPADOS Y NO AGRUPADOS

Objetivo: Analizar las medidas de tendencia central y de dispersin para datos


agrupados y no agrupados en el proceso de toma de decisiones.

2.1.- Medidas de tendencia central para datos no agrupados

Existen tres mtodos para identificar el centro de un conjunto de datos: la media, la


mediana y la moda. Su clculo e interpretacin depender de la definicin de centro.
En cada caso, se ubican en el punto alrededor del cual se aglomeran los datos.

i. La media aritmtica: la medida de la tendencia central que normalmente es


considerada como el promedio

X 1 + X 2 + ... + Xn Xi Parmetro: una caracterstica de


Media poblacional = = i =1
una poblacin
N N

n
Estadstico: una caracterstica
X 1 + X 2 + ... + Xn Xi de una muestra
Media muestral x= = i =1
n n

ii. La mediana: es el valor que divide una distribucin de datos en dos partes
iguales, es decir, el 50% de la observaciones est por encima de ella y el otro
50% se encuentra por debajo de ella

Si el conjunto de datos tiene un nmero impar de observaciones, la posicin de la


mediana es:
n +1
Posicin de la mediana ( Md ) = =
2
Ejemplo. Ingresos por venta 45, 52, 56, 67, 67 n= 5

Posicin de la mediana es (5+1)/2= 3 nota: recuerde organizar la informacin de


menor a mayor si se observa que esta desorganizada

El valor 3 indica la posicin de la mediana, es decir, el tercer valor 56

Si el conjunto de datos tiene un nmero par de observaciones, la posicin de la


mediana es:

Ejemplo. Ingresos por venta 35, 45, 52, 56, 67, 67 n=6
23
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Posicin de la mediana es (6+1)/2=3.5

Los valores de las posiciones tercera y cuarta se promedian para producir una
mediana de 52 + 56= 54. Esto significa que en la mitad de los meses las ventas
estuvieron por encima de Bs. 54, y en la mitad de los meses los ingresos excedieron
dicha suma.

iii. La moda:la observacin modal es la observacin que ms se repite o que ocurre


con mayor frecuencia. En el ejemplo anterior 35, 45, 52, 56, 67, 67, la moda es
67.

Calcule las medidas de tendencia central para la siguiente informacin. La emisin


de la revista fortune de 17 de febrero de 1997 report que en 1996 las utilidades en
millones de US$ de varias de las 500 mejores compaas que aparecen en la revista
incluan:

Empresa Millones de dlares


Exxon 7.510
Phipilp morris 6.246
Intel 5.157
General Electric 7.280
IBM 5.429
General Motors 4.289

2.2.- Otras medidas o estadsticos

i. La media ponderada: toma en cuenta la importancia relativa de las


observaciones.

Media ponderada ( xw ) =
XW =
w
Donde, ( xw ) = media ponderada
X = es la observacin individual
W= es el peso o ponderacin asignada a cada observacin

Se asume que se obtuvo un puntaje de 17, 15 y 19 en los exmenes parciales y 14


en el examen final. Si es profesor de estadstica amenaza que el examen final valdr el
doble de los otros exmenes para determinar la nota final, entonces el puntaje que se
24
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
obtenga en el examen final debe drsele el doble de peso. Es decir, debe contarse
doble al calcular la nota.

Nota (X) Peso(W) XW


17 1 17
15 1 15
19 1 19
14 2 28
Total 5 79

( x w ) = 79/5 = 15,8

ii. La media geomtrica. Proporciona una medida precisa de un cambio porcentual


promedio de una serie de nmeros. Se utiliza para mostrar los cambios
porcentuales en una serie de nmeros positivos, tiene amplia aplicacin para los
negocios y la economa, debido a que con frecuencia se est interesado en
conocer el cambio porcentual en las ventas, el Producto interno Bruto o en
cualquier serie econmica.

MG = n X 1 * X 2 * X 3 * ... * X N

El director ejecutivo de Empresas Polar desea determinar la tasa de crecimiento


promedio en los ingresos con base en las cifras dadas en la tabla, si la tasa de
crecimiento promedio es menor que el promedio industrial 10%, se asumir una nueva
campaa publicitaria.

Ao Ingresos millones de Bs. Porcentaje del ao anterior


2001 50.000 ---
2002 55.000 55/50=1.10
2003 66.000 66/65=2.20
2004 60.000 60/66=0.91
2005 78.000 78/60=1.3

MG = 4 (1.10) * (1.2) * (0.91) * (1.3) =1.1179

Restando 1 para convertirlo a un incremento anual promedio da 0.1179, o un


incremento promedio de 11,79% para el periodo de cinco aos.

Por otro lado la media aritmtica simple:

25
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
1.1 + 1.2 + 0.91 + 1.3 4.51
x= = = 1.1275
4 4
O un cambio porcentual de 12, 75%. Se divide por 4 ya que se presentaron cuatro
cambios durante el periodo de cinco aos.

2.3.- Medidas de dispersin para datos no agrupados

Como se ha venido reseando para describir un conjunto de nmero hemos visto que
es de utilidad ubicar el centro del conjunto de datos. Pero identificar una medida de
tendencia central es suficiente. Una descripcin ms completa del conjunto de datos
puede obtenerse si se mide qu tan dispersos estn los datos alrededor de dicho punto
central. Esto es precisamente lo que hacen las medidas de dispersin. Indican cunto
se desvan las observaciones alrededor de su media.

1.- El Rango: es la medida de dispersin ms simple (y menos til), tambin se le


reconoce como recorrido. Se calcula como la diferencia entre el valor ms alto y el
valor ms bajo. Ventaja: es de fcil clculo. Desventaja: considera slo dos
observaciones donde quizs existen cientos de observaciones en un conjunto de datos.

2.- La Varianza: es el promedio de las desviaciones respecto a su media elevadas


al cuadrado.

( X 1 ) 2 + ( X 2 ) 2 + ... + ( X n ) 2 (X )2
Varianza poblacional 2 = = i

N N

3.- Desviacin estndar: es la raz cuadrada de la varianza. Es una medida importante


de la dispersin.

= 2
La varianza y desviacin estndar para una muestra

Como se recordar rara vez se pueden estimar los parmetros poblacionales ( y


). En la mayora de los casos ms bien se estimarn tomando una muestra y
calculando los estadsticos correspondientes.

( X 1 x ) 2 + ( X 2 x ) 2 + ... + ( X n x ) 2 (X x) 2
Varianza de una muestra s2 = = i

n 1 n 1
s= s 2

Desviacin estndar de la muestra

26
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Retomemos el ejemplo
Empresa Millones de dlares
Exxon 7.510
Phipilp morris 6.246
Intel 5.157
General Electric 7.280
IBM 5.429
General Motors 4.289

2.4.- Medidas de tendencia central para datos agrupados

Al trabajar con datos agrupados en una distribucin de frecuencias, no se conoce


cules son las observaciones individuales. Los procedimientos anteriormente descritos
simplemente no aplican. Deben encontrase mtodos alternativos. Sin embargo el
anlisis es el mismo para cada una de las medidas de dispersin.

1.- La Media:

(xg ) =
( f * cc)
Media para datos agrupados
( f )
Donde, f= es la frecuencia o nmero de observaciones en cada clase
cc= centro de clase o punto medio de la clase
n= es el tamao de la muestra y es igual a las frecuencias sumadas en todas las
clases

2.- La Mediana: primero se debe de hallar la clase de la mediana de la


distribucin de frecuencias. La clase mediana es la clase cuya frecuencia acumulada
es mayor que o igual a n/2

( n / 2) f
Mediana para datos agrupados Md = Lmd + * (C )
f md

Donde, Lmd= es el lmite inferior de la clase de la mediana


f= es la frecuencia acumulada de la clase que antecede a la clase de la
mediana
fmd= es la frecuencia absoluta de la clase de la mediana
C= es el intervalo de clase de la clase de la mediana
27
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
3.- La Moda:
Da
Moda para datos agrupados Mo = Lmo + * (C )
Db + Da

Donde, Lmd= es el lmite inferior a la clase modal


Da= es la diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase que la antecede
Db= es la diferencia entre la frecuencia absoluta de la clase modal y la
frecuencia absoluta de la clase que le sigue
C= es el intervalo de clase de la clase modal

2.5.- Medidas de dispersin para datos agrupados

) n * xg
2
Varianza de la muestra
s 2
=
( f * cc 2

De datos agrupados n 1

Desviacin estndar muestral s = s2


Para datos agrupados

se utilizar la tabla de distribucin de frecuencia del caso de Aeropostal

28
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
UNELLEZ BARINAS
LICENCIATURA EN ADMINISTRACIN
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS Y NO
AGRUPADOS
PROFESOR: CARLOS DAZ
GUA DE EJERCICIOS

PROBLEMA: se cuenta con la siguiente informacin referida a una muestra de 30


trabajadores de una empresa con un total de 5000 empleados. Entre las variables se
encuentra la Satisfaccin con el trabajo. Cuyos valores son: 1.- Muy satisfecho, 2.-
Satisfecho, 3.- Moderadamente satisfecho, 4.- Un poco insatisfecho y 5.- Muy
insatisfecho. El objetivo se centra en describir la satisfaccin de los empleados con su
trabajo.
Gnero Ingreso Aos de
Satisfaccin
Trabajador 1: Masculino y Semanal Escolaridad
con su Trabajo
2: Femenino (Miles de Bs.) Concluidos
1 1 78 2 20
2 2 25 1 14
3 1 40 2 15
4 1 20 1 14
5 2 25 1 12
6 1 35 5 14
7 2 15 2 14
8 2 18 2 13
9 1 60 2 18
10 1 38 2 16
11 2 31 1 12
12 1 76 3 14
13 2 33 2 4
14 2 15 3 16
15 1 27 2 12
16 1 64 1 16
17 2 32 1 16
18 1 26 2 11
19 1 33 1 13
20 1 30 1 12
21 2 35 2 10
22 2 24 4 16
23 1 33 1 13
24 1 34 1 16
25 1 25 3 15
26 2 36 3 16
27 1 42 1 16
28 1 24 1 12
29 2 23 1 14
30 2 31 5 12

o Especifique el tipo de variable y la escala de medicin


o Elabore una tabla de frecuencia para el Gnero y Satisfaccin con su trabajo
o Elabore una tabla de asociacin o contingencia para el Gnero y Satisfaccin
con su trabajo
o Elabore una tabla de distribucin de frecuencia para la variable ingreso
o A qu conclusiones llega sobre la satisfaccin laboral de los trabajadores
29
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
1.- Como gerente de ventas de Acme, Inc., usted desea calcular las medidas de
tendencia central para los niveles de utilidad de su firma, durante los ltimos doce
meses, ya que las siguientes utilidades mensuales estn dadas en miles de dlares:

US$12.3 US$14.3 US$25.7


21.6 21.6 -12.8
22.3 18.0 23.1
-3.4 17.9 22.3

2.- Una empresa grande de equipos deportivos est probando el efecto de dos planes
publicitarios sobre las ventas de los ltimos cuatro meses. Dadas las ventas que se ven
aqu. Cul programa de publicidad parece producir el crecimiento promedio ms alto
en ventas mensuales?

Mes Plan 1 Plan 2


Enero US$ 1,657 US$ 4,735
Febrero 1,998 5,012
Marzo 2,267 5,479
Abril 3,432 5,589

3.- Se utilizan dos procesos para producir discos de computador. Han surgidos
problemas respecto a las variaciones de los tamaos de tales discos. Con base a los
datos que se muestran aqu observados, de ocho tamaos de discos en pulgadas para
cada proceso, explique cul proceso aconsejara usted si su objetivo es minimizar la
desviacin en el tamao alrededor de la media.

Proceso 1 Proceso 2
3.41 3.81
3.74 3.26
3.22 3.26
3.89 3.07
3.65 3.35
3.06 3.79
3.65 3.17
3.33 3.51

4.- explique con sus propias palabras qu miden la varianza y la desviacin estndar.
Por qu su clculo es algo diferente para la poblacin y la muestra?

5.- un analista de inversiones sugiere que usted invierta en Boomer Securities en lugar
de Reliable Stocks. Dadas las tasas anuales de rendimiento que se muestran a
continuacin para una muestra de cada inversin. Qu le dice al analista si usted
desea minimizar su exposicin al riesgo?

30
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
Boomer Reliable
Cifras en porcentajes
15.5 4.5
21.7 5.5
3.6 6.2
27.2 7.2
-7.8 3.5
-5.0 4.1
2.2 4.2
12.2

6.- personas que cuidan. Los estadsticos del programa de Meals on Wheels (comida
sobre ruedas), el cual lleva comidas calientes a enfermos confinados en casa, desean
evaluar sus servicios. El nmero de comidas diarias que suministran aparece en la
siguiente tabla de distribucin de frecuencias:

Nmero de comidas por da Nmero de das (fi)


05 3
6 11 6
12 17 5
18 23 8
24 29 2
30 35 3
27
Calcule las medidas de tendencia central y de dispersin? Analice los resultados.

7.- Las edades de cincuenta de los directivos ejecutivos de las mejores corporaciones
de la nacin reportadas en la edicin de la revista Forbes de la edicin del 24 de mayo
de 1997 aparecen en la siguiente tabla:

Edades frecuencias
50 - 54 8
55 - 59 13
60 - 64 15
65 - 69 10
70 - 74 3
75 - 80 1

a.- calcule e interprete la media, la mediana y la moda.


b.- calcule e interprete la varianza, la desviacin estndar y el coeficiente de
variacin.

8.- Describa cules son las ventajas y desventajas de la media aritmtica, mediana y
moda
9.- Describa cules son las ventajas y desventajas de la varianza, desviacin estndar
y el coeficiente de variacin.
31
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
MODULO IV: REGRESIN Y CORRELACIN LINEAL SIMPLE

Objetivo: Utilizar la correlacin y regresin lineal simple para establecer relaciones


lineales y efectuar proyecciones entre variables cuantitativas.

Contenido a desarrollar por parte del estudiante:

i. Qu es el modelo de regresin lineal simple


ii. Qu es una variable dependiente
iii. Qu es una variable independiente
iv. Qu es el diagrama de dispersin
v. Qu es el intercepto en un modelo de regresin lineal simple
vi. Qu es la pendiente en u modelo de regresin lineal simple
vii. Qu es el coeficiente de correlacin de Pearson
viii. Qu es el coeficiente de Determinacin
ix. Qu es el error estndar de la medicin

FORMULAS:

1.- Modelo de regresin lineal simple

= bo + b1 x

2.- Suma de los cuadrados de Y

SCy = y 2
( y) 2

3.- Suma de los cuadrados de X

SCx = x 2
( x) 2

4.- Suma de los cuadrados de X y Y

SCxy = x * y
( x) * ( y )
n

5.- Pendiente de la recta b1

SCxy
b1 =
SCx

6.- Intercepto de la recta bo


32
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
bo = y b1 x , y es el promedio de las y, x es el promedio de las x

7.- Error estndar de la estimacin (se)

(a) Suma de cuadrados medio del error

( SCxy ) 2
SCE = SCy
SCx
(b) Cuadrado medio del error

SCE
CME =
n2

(c) Se= CME , es el error estndar de la estimacin

8.- Coeficiente de correlacin de Pearson (r)

SCxy
r=
( SCx) * ( SCy )

9.- Coeficiente de determinacin R

R= (r)

10.- Intervalo de confianza para Bo

I.C. para Bo = bo t * ( Sbo )

11.- Intervalo de confianza para B1

I.C. para B1 = b1 t * ( Sb1 )

GUA DE EJERCICIOS:

1.- El centro de ubicacin laboral en state university desea determinar si los promedios
puntuales en notas de los estudiantes (GPAs) puede explicar el nmero de ofertas
laborales que ellos reciben despus de graduarse.
Los siguientes datos corresponden a los 1 recin graduados:

Estudiante 1 2 3 4 5 6 7 8 9 10
GPA 3.25 2.35 1.02 0.36 3.69 2.65 2.15 2.15 3.88 3.37
ofertas 3 3 1 0 5 4 2 2 6 2

33
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
a.- haga un diagrama de dispersin
b.- calcule e interprete el modelo de regresin. qu le dice el modelo sobre la relacin
entre GPA y las ofertas de trabajo?
c.- Si steve tiene un GPA de 3.22 cuntas ofertas de trabajo pronostica usted que l
recibir?
d.- realice las pruebas de hiptesis sobre los parmetros
e.- Calcule los intervalos de confianza para bo y b1

2.- un economista del departamento de recursos humanos de florida state est


preparando un estudio sobre el comportamiento del consumidor. l recolect los datos
que aparecen en miles de dlares para determinar si existe una relacin entre el
ingreso del consumidor y los niveles de consumo. Determine cul es la variable
dependiente.

Consumidor 1 2 3 4 5 6 7 8 9 10 11 12
Ingreso 24.3 12.5 31.2 28.0 35.1 10.5 23.2 10.0 8.5 15.9 14.7 15
Consumo 16.2 8.5 15 17 24.2 11.2 15. 7.1 3.5 11.5 10.7 9.2

a.- haga un diagrama de dispersin para los datos.


b.- calcule e interprete el modelo de regresin. Qu le dice el modelo de regresin
sobre la relacin entre el consumo y el ingreso? Qu proporcin de cada dlar
adicional que se gana se invierte en consumo?
c.- qu consumo pronosticara el modelo para alguien que gana $ 27.500?
d.- realice las pruebas de hiptesis sobre los parmetros
e.- Calcule los intervalos de confianza para bo y b1

3.- Un banco en Atlanta se especializa en crditos para vivienda intenta analizar el


mercado de finca raz, midiendo el poder explicativo que las tasa de inters tiene sobre
el nmero de casa vendidas en el rea. Se compilaron los datos para un perodo de 10
meses, as:

Mes 1 2 3 4 5 6 7 8 9 10
Inters 12.3 10.5 15.6 9.5 10.5 9.3 8.7 14.2 15.2 12
Casas 196 285 125 225 248 303 265 102 105 114

a.- haga un diagrama de dispersin.


b.- calcule e interprete el modelo de regresin. qu le dice el modelo de regresin
sobre la relacin entre la tasa de inters y las ventas de vivienda?
c.- si la tasa de inters es del 9,5%, cuntas casas se venderan con el modelo?
d.- realice las pruebas de hiptesis sobre los parmetros
e.- Calcule los intervalos de confianza para bo y b1

4.- Overland group produce partes para camin que se utilizan en los semiremolques. El
jefe de contabilidad desea desarrollar un modelo de regresin que pueda utilizarse para
predecir los costos. l selecciona unidades de produccin fabricadas como una variable
34
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ
de prediccin y recolecta los datos que se observan aqu. Los costos estn en miles de
dlares y las unidades en cientos.

Unidades 12.3 8.3 6.5 4.8 14.6 14.6 14.6 6.5


Costo 6.2 5.3 4.1 4.4 5.2 4.8 5.9 4.2

a.- haga un diagrama de dispersin.


b.- calcule e interprete el modelo de regresin. qu le dice al contador sobre la
relacin entre produccin y costos?
c.- segn el modelo, cuntos costara producir 750 unidades?
d.- realice las pruebas de hiptesis sobre los parmetros
e.- Calcule los intervalos de confianza para bo y b1

REFERENCIAS BIBLIOGRFICAS

LIND, D. & MASON, R. (2003). Estadstica para la administracin y economa.


McGrawHill. Mxico.
NAVA, L. (2000). Estadstica. Universidad de los Andes. Mrida Venezuela.
PARDO, A. & RUIZ, M. (2002). SPSS11. Gua para el anlisis de datos. McGrawHill.
Madrid Espaa.
Sarabia, J. & Pascual, M. (2005). Curso bsico de estadstica para economa y
administracin de empresas. Textos universitarios. Espaa.
SHELDON, R. (2007). Introduccin a la estadstica. Editorial revert. Espaa.
TAMAYO Y TAMAYO, (2004). El proceso de la investigacin cientfica. 4ta Edicin.
LIMUSA. Mxico.
WEBSTER, A. (2001). Estadstica aplicada a los negocios y a la economa. 3era
Edicin. McGrawHill. Colombia.

35
UNELLEZ-ADMINISTRACIN/ESTADSTICA I/PROF. CARLOS DAZ

También podría gustarte