Está en la página 1de 57

ESTADISTICA Y PROBABILIDADES

APLICADA A LA ADMINISTRACION
Y ECONOMIA
(Apuntes de Clase)

MSc. Ing. José Zavala Fernández

Arequipa, 2017
Estadística y Probabilidades

INDICE

CAPITULO I ESTADISTICA GENERALIDADES.......................................................................................1


1.1 ¿Qué es la Estadística? ......................................................................................................1
1.2 ¿Qué se entiende por Estadística? ....................................................................................1
1.3 ¿Por qué hay que estudiar Estadística? .............................................................................2
1.4 Tipos de Estadística ...........................................................................................................2
1.4.1 Estadística Descriptiva ...............................................................................................2
1.4.2 Estadística Inferencial ................................................................................................2
1.5 Conceptos generales. ........................................................................................................2
1.6 Fuentes de Datos Estadísticos ...........................................................................................4
1.7 Niveles de Medición ..........................................................................................................4
1.1. Datos de Nivel Nominal .....................................................................................................4
1.2. Datos de Nivel Ordinal .......................................................................................................5
1.3. Datos de Nivel de Intervalo ...............................................................................................5
1.4. Datos de Nivel de Razón ....................................................................................................5
1.8 Ejercicios del capítulo ........................................................................................................7
CAPÍTULO II DESCRIPCION DE LOS DATOS ........................................................................................8
2.1 Distribución de frecuencias y representaciones gráficas ...................................................8
2.1.1 Elaboración de una distribución de frecuencias ........................................................8
2.2 Resumen de datos cuantitativos .......................................................................................9
2.2.1 Distribución de frecuencias de variables discretas ....................................................9
2.2.2 Distribución de frecuencias de variables continuas .................................................10
2.2.3 Principales Tipos de Graficas ...................................................................................11
2.2.4 Otras Graficas Estadísticas .......................................................................................15
2.2.5 Ejercicios Desarrollados ...........................................................................................19
CAPITULO III DESCRIPCION DE LOS DATOS ......................................................................................27
3.1 Introducción ....................................................................................................................27
3.2 Las medidas de ubicación ................................................................................................27
3.3 Datos simples y datos agrupados ....................................................................................28
3.4 Medidas de tendencia central .........................................................................................28
3.4.1 Media.......................................................................................................................28
3.4.2 Mediana...................................................................................................................28
Estadística y Probabilidades

3.4.3 Moda .......................................................................................................................29


3.4.4 Cuartiles ...................................................................................................................29
3.4.5 Deciles .....................................................................................................................30
3.4.6 Percentiles ...............................................................................................................30
3.5 Medidas de Dispersión ....................................................................................................30
3.5.1 Desviación media .....................................................................................................30
3.5.2 Varianza ...................................................................................................................31
3.5.3 Desviación típica o Desviación estándar ..................................................................31
3.5.4 Coeficiente de variación ..........................................................................................32
3.5.5 Ejercicios Desarrollados ...........................................................................................32
3.5.6 Ejercicios Propuestos ...............................................................................................33
3.5.7 Suplemento: Estadística Descriptiva con Excel ......................................................36
CAPITULO IV UN PANORAMA DE CONCEPTOS PROBABILISTICOS .. ¡Error! Marcador no definido.
4.1 Definiciones Básicas ........................................................... ¡Error! Marcador no definido.
4.2 Enfoques de la probabilidad ............................................... ¡Error! Marcador no definido.
4.2.1 Probabilidad Clásica: ................................................... ¡Error! Marcador no definido.
4.2.2 Probabilidad Subjetiva: ............................................... ¡Error! Marcador no definido.
4.3 Algunas Reglas de Probabilidad .......................................... ¡Error! Marcador no definido.
4.3.1 Reglas de la Adición .................................................... ¡Error! Marcador no definido.
4.3.2 Reglas de la Multiplicación ......................................... ¡Error! Marcador no definido.
4.3.3 Postulados de la Probabilidad..................................... ¡Error! Marcador no definido.
4.3.4 Leyes de la Probabilidad ............................................. ¡Error! Marcador no definido.
4.3.5 Diagrama de Árbol ...................................................... ¡Error! Marcador no definido.
4.3.6 Teorema de Bayes ...................................................... ¡Error! Marcador no definido.
4.3.7 Principios de conteo ................................................... ¡Error! Marcador no definido.
4.3.8 Ejercicios ..................................................................... ¡Error! Marcador no definido.
4.4 Variables aleatorias ............................................................ ¡Error! Marcador no definido.
4.5 Distribuciones probabilísticas ............................................. ¡Error! Marcador no definido.
4.6 Distribución probabilística binomial ................................... ¡Error! Marcador no definido.
4.7 Distribución hipergeométrica ............................................. ¡Error! Marcador no definido.
4.7.1 Distribución de Poisson .............................................. ¡Error! Marcador no definido.
4.7.2 Distribución probabilística normal ............................. ¡Error! Marcador no definido.
4.7.3 Aproximación normal a la binomial ............................ ¡Error! Marcador no definido.
4.7.4 Ejercicios ..................................................................... ¡Error! Marcador no definido.
Estadística y Probabilidades

CAPITULO V: Métodos y distribuciones de muestreo ......................... ¡Error! Marcador no definido.


5.1 ¿Por qué obtener muestras de la población? ..................... ¡Error! Marcador no definido.
5.1.1 Muestra aleatoria ....................................................... ¡Error! Marcador no definido.
5.1.2 Métodos de muestreo aleatorio ................................. ¡Error! Marcador no definido.
5.1.3 Distribución de muestreo de medias muestrales ....... ¡Error! Marcador no definido.
5.1.4 Teorema del límite central.......................................... ¡Error! Marcador no definido.
5.2 Selección del tamaño de muestra ...................................... ¡Error! Marcador no definido.
5.3 Ejercicios Resueltos ............................................................ ¡Error! Marcador no definido.
CAPITULO VI: Pruebas de hipótesis, muestras grandes ...................... ¡Error! Marcador no definido.
6.1 ¿Qué es una hipótesis? ....................................................... ¡Error! Marcador no definido.
6.2 Prueba de hipótesis ............................................................ ¡Error! Marcador no definido.
6.2.1 Prueba para la media poblacional .............................. ¡Error! Marcador no definido.
6.2.2 Prueba de hipótesis: dos medias poblacionales ......... ¡Error! Marcador no definido.
6.2.3 Pruebas respecto a relaciones proporcionales ........... ¡Error! Marcador no definido.
6.3 Ejercicios Resueltos (Lind, Marchal, & Wathen, 2012) ....... ¡Error! Marcador no definido.
6.4 Ejercicios Propuestos .......................................................... ¡Error! Marcador no definido.
Bibliografía ......................................................................................................................................38
Anexos.............................................................................................................................................39
CAPITULO I ESTADISTICA GENERALIDADES

1.1 ¿Qué es la Estadística?

Casi diariamente utilizamos los conceptos estadísticos en todas las actividades de nuestro hacer
diario, es por eso que el conocimiento estadístico está en nuestras decisiones y es necesario no solo
para ser un buen y eficiente manejador de la economía, sino también para una toma de decisiones
efectiva en varias áreas de los negocios.

ESTADÍSTICA Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de
propiciar una toma de decisiones más eficaz. (Lind, Marchal, & Wathen, 2012).

Virtualmente cada área de la investigación científica seria puede beneficiarse del análisis
estadístico. Para quien formula las políticas económicas y para quien asesora al presidente y a otros
funcionarios públicos sobre procedimientos económicos apropiados, la estadística ha demostrado
ser una herramienta valiosa. Las decisiones sobre las tasas tributarias, los programas sociales, el
gasto de defensa y muchos otros asuntos pueden hacerse de manera inteligente tan sólo con la
ayuda del análisis estadístico. Los hombres y mujeres de negocios, en su eterna búsqueda de la
rentabilidad, consideran que la estadística es esencial en el proceso de toma de decisiones. Los
esfuerzos en control de calidad, minimización de costos, combinación de productos e inventarios,
y una gran cantidad de otros asuntos empresariales, pueden manejarse efectivamente a través del
uso de procedimientos estadísticos comprobados. Para quienes están en el área de la investigación
de mercados, la estadística es de gran ayuda en el momento de determinar qué tan probable es
que un producto nuevo sea exitoso. La estadística también es muy útil para evaluar las
oportunidades de inversión por parte de asesores financieros. Los contadores, los jefes de personal,
y los fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del análisis
estadístico. Incluso un investigador en el campo de la medicina, interesado en la efectividad de un
nuevo medicamento, considera la estadística una aliada imprescindible. (Webster, 2000)

1.2 ¿Qué se entiende por Estadística?

La Estadística se ocupa de la recolección, agrupación, presentación, análisis e interpretación de


datos. A menudo se llaman estadísticas a las listas de estos datos, sin embargo la estadística va más
allá de estas afirmaciones.

La Estadística no son sólo los resultados de encuestas, ni el cálculo de unos porcentajes, la


Estadística es un método científico que pretende sacar conclusiones a partir de unas observaciones
realizadas bajo procedimientos adecuados.

El propósito general de la Estadística por lo tanto es la de describir y encontrar soluciones para lo


cual se recolecta, procesa, organizar y presenta datos para entender y analizar los mismos para
una toma de decisiones mas efectiva.
Estadística y Probabilidades

1.3 ¿Por qué hay que estudiar Estadística?

Entre las muchas razones que


hay para estudiar estadística
destaca principalmente el que
en todos lados se encuentra
información numérica y los
métodos estadísticos ayudan
a entender por qué se toman
ciertas decisiones, ademas
aportan una mejor
comprensión sobre la manera
en la que estas decisiones nos
afectan.

1.4 Tipos de Estadística

En el estudio de la Estadística se divide en dos categorías: Estadística Descriptiva y Estadística


Inferencial.

1.4.1 Estadística Descriptiva

Comprende un conjunto de métodos para organizar, resumir y presentar los datos de manera
informativa.

1.4.2 Estadística Inferencial

Comprende un conjunto de métodos utilizados para saber algo acerca de una población, basándose
en una muestra.

1.5 Conceptos generales.

Algunas definiciones:

Población: conjunto finito o


infinito de elementos,
denominados individuos,
sobre los cuales se realizan
observaciones. Ejemplos:
todos los habitantes de cierto
lugar, todos los ejemplares de
una determinada especie de
animales, todos los
trabajadores de una fábrica o de una empresa, etc.

2
Estadística y Probabilidades

Muestra: subconjunto finito de una población. El número de individuos que forman la muestra se
denomina tamaño muestral.

Variable: cada una de las características que pueden observarse en un individuo de la muestra.
Ejemplos: en una muestra de una población de alumnos de una Universidad podemos medir: la
altura, la edad, el peso, el sexo, número de hermanos…; en una muestra de una población de
expedientes o cuentas de ahorro podemos medir: nro de expedientes, saldos, número de
operaciones, cuantía de hojas de expedientes, etc.

Tipos de Variables

Existen dos tipos básicos de datos:

Los obtenidos a partir de una población cualitativa y los obtenidos de una población cuantitativa.

Variable Cualitativa o de Atributos: Cuando la característica o variable en estudio es no numérica,

Ejemplos: estado civil, sexo, afiliación política, tipo de automóvil, lugar de nacimiento, Área de
Trabajo, color de los ojos, etc.

Variable Cuantitativa: si la variable estudiada se puede expresar numéricamente, , y la población


se conoce como población cuantitativa.

EJEMPLOS: sexo, afiliación religiosa, tipo de automóvil que se posee, lugar de nacimiento, color de
los ojos
Las variables cuantitativas pueden ser discretas o continuas. Las variables discretas pueden asumir
solo ciertos valores, y generalmente existen brechas entre ellos. Las variables continuas pueden
asumir cualquier valor dentro de un intervalo específico.

Ejemplo: saldo en una cuenta de ahorros, minutos que faltan terminar un partido, duración de un
examen, número de niños en una familia, etc.

Las variables cuantitativas se pueden clasificar como discretas o continuas.

• Variables discretas: sólo pueden adquirir ciertos valores y casi siempre hay “brechas” entre
esos valores. Regularmente se consideran como un conteo.

Ejemplo: número de veces que asisto a la universidad, el número de habitaciones en una casa
(1,2,3,..., etc.).

• Variables continuas: pueden tomar cualquier valor dentro de un intervalo específico.

Ejemplo: el tiempo que toma vijar de Arequipa a Lima, tiempo que demora un bus en llagar a la
Universidad, etc.

3
Estadística y Probabilidades

DATOS

Cualitativos o de atributos Cuantitativos o numéricos


(tipo de auto que posee)

discretos continuos
(número de hijos) (tiempo para resolver el examen)
Ilustración 1 Tipos de Datos

1.6 Fuentes de Datos Estadísticos

No siempre se encuentran datos publicados sobre cada tema de interés. Se puede solicitar infor-
mación a personas en un centro comercial, en sus hogares, por teléfono o por correo. Las
respuestas que se reciben normalmente son contabilizadas a mano o por una computadora y son
preparados luego de esto para su análisis estadístico.

1.7 Niveles de Medición

Los datos pueden clasificarse de acuerdo a los niveles de medición. Generalmente, el nivel de
medición de un dato marca los cálculos que pueden realizarse para resumir y presentar la
información, y las pruebas estadísticas que pueden desarrollarse.

Existen cuatro niveles de medición: nominal, ordinal, de intervalo y de razón. El nivel más bajo, o
más primitivo es el nominal. El mas alto, o el que proporciona la mayor cantidad de información
acerca de la observación, es la medicion de nivel de razón o cociente.

Dentro de los niveles de medición es importante destacar los siguientes términos:

Mutuamente Excluyente: Cuando una persona, objeto o medición se ha de incluir en sólo una cate-
goría.

Exhaustivo: Cada individuo, objeto o medición debe aparecer en una categoría.

1.1. Datos de Nivel Nominal

En el nivel Nominal de la medición, las observaciones solamente pueden clasificarse o contarse. No


existe algún orden especifico para las marcas.

Los datos de nivel nominal cuentan con las siguientes propiedades:

• Las categorías de datos son mutuamente excluyentes.


• Las categorías de datos no cuentan con un orden lógico.

Aunque los atributos no son susceptibles de ser medidos numéricamente, sus modalidades pueden
relacionarse con lo que se denominan escalas nominales y ordinales. Las observaciones de las
distintas modalidades decimos que están en una escala nominal cuando los números que le
asignamos sólo se emplean para diferenciar las distintas categorías. Si al ejemplo de los colores del

4
Estadística y Probabilidades

semáforo le asignamos los dígitos 1, 2 y 3, sólo cabe la interpretación de que el 1<> 2 <> 3 sin que
se pueda afirmar que uno es superior a otro y sin que se puedan ordenar. La escala nominal es la
forma de medición más débil y se utiliza sólo para clasificar las distintas modalidades de un atribulo.
No permiten ninguna relación de orden ni operaciones aritméticas de suma, resta, multiplicación y
división.

1.2. Datos de Nivel Ordinal

El nivel Ordinal describe las variables a lo largo de un continuo sobre el que se pueden ordenar los
valores. En este caso las variables no sólo se asignan a grupos sino que además pueden establecerse
relaciones de mayor que, menor que o igual que, entre los elementos.

Los datos de nivel ordinal cuentan con las siguientes propiedades:

• Las categorías de datos son mutuamente excluyentes y exhaustivas.


• Dichas categorías se clasifican u ordenan de acuerdo con las características
particulares que poseen.

La medición de las características cualitativas o atributos también admite en ciertos casos lo que se
conoce como escalas ordinales. Se podrá emplear la escala ordinal cuando las distintas modalidades
admiten una determinada graduación u ordenación. En estudios de mercado y de opinión se
emplean con mucha frecuencia las escalas ordinales. La imagen de un determinado político podrá
calificarse de: muy mala, mala, regular, buena y muy buena. Si se le asignan los dígitos 1, 2, 3, 4 y 5
no quiere decir que la imagen buena sea el doble que la mala, sino que está en un orden superior.
Este tipo de mediciones con escalas ordinales es superior al nominal ya que además de clasificar las
distintas modalidades permiten ordenarlas, pero tampoco admite, como en las nominales, las
operaciones aritméticas de suma, resta, multiplicación y división.

1.3. Datos de Nivel de Intervalo

El nivel de Intervalo incluye todas las caracteristicas del nivel Ordinal, pero, además, la diferencia
entre los valores es un tamaño constante.

Los datos de nivel de intervalo cuentan con las siguientes propiedades:

• Las categorías de datos son mutuamente excluyentes y exhaustivas.


• Dichas categorías se clasifican de acuerdo con las caracteristicas particulares que
poseen
• Las diferencias iguales en la característica son representadas por iguales diferencias
en los números asignados a las categorías.

1.4. Datos de Nivel de Razón

5
Estadística y Probabilidades

El nivel de la Razón de la medicion es el nivel mas alto de la misma. Dicho nivel cuenta con todas
las características del nivel de intervalo, incluyendo el hecho de que el punto 0 es importante y la
razón entre dos numeros también es importante.

Los datos de nivel de intervalo cuentan con las siguientes propiedades:

• Las categorías de datos son mutuamente excluyentes y exhaustivas.


• Dichas categorías se clasifican de acuerdo con las caracteristicas particulares que
poseen
• Las diferencias iguales en la característica son representadas por iguales diferencias
en los números asignados a las categorías.
• el punto (o valor) 0 representa una ausencia de la característica.

Por lo tanto, cuando los datos son susceptibles de tomar valores numéricos a los que se les pueda
aplicar lo que se conocen como escalas de intervalos y de razón o proporción. Las primeras son
aquellas que permiten una unidad de medida con lo que podemos cuantificar numéricamente la
distancia existente entre dos observaciones cualesquiera. El orden de esta escala es superior a las
nominales y ordinales ya que además de clasificar y ordenar las mediciones permite diferenciar con
exactitud unas situaciones de otras. En el mundo económico empresarial tenemos multitud de
características en las que pueden aplicarse escalas de intervalos: salarios de una empresa, cualquier
tipo de presupuesto, gastos, ventas, etc. Las escalas de proporción o razón, además de las
cualidades de las de intervalo, se caracterizan por incorporar un punto de origen no arbitrario (un
cero verdadero) como puede ocurrir, con los pesos y las edades de las personas, litros de gasolina
en un depósito, etc. En conclusión podemos decir que las escalas de intervalo admiten unidades de
medida y un origen (cero) arbitrarios y las de razón además de la unidad de medida tienen asignado
un punto de origen no arbitrario ya que es un verdadero cero o cero absoluto. En estas escalas sí
se permiten las operaciones aritméticas de la suma, resta, multiplicación y división.

6
Estadística y Probabilidades

1.8 Ejercicios del capítulo

1. La Gerente de una institución gubernamental, debe informar a su superior sobre el número de


días promedio que los empleados se ausentan del trabajo. Sin embargo, la institución tiene
más de dos mil trabajadores, y la Jefe de Recursos Humanos no tiene tiempo de revisar los
registros de asistencia de cada empleado. Como asistente usted debe decidir cómo puede
obtener la información necesaria. ¿Qué consejo podría darle?

2. Describa en sus propias palabras cómo la importancia de la la estadística para solucionar


problemas en varias disciplinas y/o ocupaciones.

3. Según la Especialidad que Ud. está siguiendo, mencione ejemplos específicos donde pueda
enumerar y analizar detalladamente los tipos de problemas que pueden surgir y las decisiones
que tendrá que tomar cuando el análisis estadístico pruebe ser de utilidad.

4. ¿Por qué es poco probable escaparse de la necesidad de tener un conocimiento básico en


estadística?

5. Defina en sus propios términos la diferencia entre una población y una muestra; entre un
parámetro y un estadístico.

6. ¿Cuál es la diferencia entre una variable cuantitativa y una variable cualitativa? Dé ejemplos.

7. Diferencie entre una variable continua y una variable discreta. Dé ejemplos de cada una.

7
Estadística y Probabilidades

CAPÍTULO II DESCRIPCION DE LOS DATOS

2.1 Distribución de frecuencias y representaciones gráficas

2.1.1 Elaboración de una distribución de frecuencias

Una distribución de frecuencias es una agrupación de datos en categorías que muestran el número
de observaciones en cada categoría mutuamente excluyente.

Los pasos para elaborar una distribución de frecuencias son:

• Determinar el tamaño del intervalo de clase.


• Clasificar los datos reales en las clases.
• Contar el número de entradas en cada clase.

La frecuencia de clase es el número de observaciones en cada clase.

Dependiendo de los tipos de variables se puedes construir la tabla de frecuencias para variables
discretas y continuas.

Tabla de frecuencias para una variable discreta.

Tabla de frecuencias para una variable continua.

Número de veces
Valores de la que aparecen
variable (Frecuencia
Absoluta)
x1 f1
x2 f2
... ...
xn fn

N: Número total
de datos

Frecuencia absoluta. Es el número de veces que aparece cualquier valor de la variable. Se


representa por fi ó ni.

Frecuencia absoluta acumulada. Es la suma de la frecuencia absoluta de un valor de la variable con


todos los anteriores. Se representa por Fi ó Ni.

Frecuencia relativa. Es el cociente entre la frecuencia absoluta y el número total de datos (N). Se
representa por fri ó hi. Al multiplicarla por 100 obtenemos el valor en porcentaje.

8
Estadística y Probabilidades

Frecuencia relativa acumulada. Es la suma de la frecuencia relativa de un valor de la variable con


todos los anteriores. También se puede definir como el cociente entre la frecuencia absoluta
acumulada y el número total de datos. Se representa por Fri ó Hi.

2.2 Resumen de datos cuantitativos

2.2.1 Distribución de frecuencias de variables discretas

Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la variable el
número de elementos (frecuencia) que la componen.

Ejemplo.- Los siguientes datos muestran el número de veces que 30 alumnos se han matriculados
en el curso Estadística, en el último semestre académico.

2 1 1 1 1 1 3 1 1 1
1 1 1 2 1 1 1 2 2 2
1 1 1 1 2 1 1 1 1 1
Solución

X fi fr fr% Fa Fri
1 23 0.77 76.67 23.00 0.77
2 6 0.20 20.00 29.00 0.97
3 1 0.03 3.33 30.00 1.00
30 100.00

Solución en Excel

Utilizar la Función Frecuencia (Datos, grupos) en la primera celda de la tabla

9
Estadística y Probabilidades

Luego de marcar el bloque consignado para las frecuencia presionar simultáneamente las teclas
<Ctrol>+<Shift>+<Entrer>

2.2.2 Distribución de frecuencias de variables continuas

Es un resumen de un conjunto de datos que consiste en presentar para cada categoría el número
de elementos (frecuencia) que la componen.

Los tres pasos necesarios para definir en una distribución de frecuencias con datos cuantitativos
son los siguientes:

Determinar la cantidad de clases

Determinar el ancho de cada clase

Determinar los límites de cada clase

Procedimiento

a) Determinar el Máximo y Mínimo de los Datos

b) Determinar el Rango (R)

c) Determinar el Numero de Clases (k)

Se recomienda usar entre 5 y 20 clases

c.1.) Por la regla de Sturges la propuso (Herbert Sturges(1926), la fórmula trata de que el
histograma resultante se aproxime a la distribución normal)

La idea es emplear suficientes clases para mostrar la variación de los datos, pero no tantas que
varias contendrían unos cuantos elementos.

Para determinar el número de clases se usa la regla de Sturges.

Regla de Sturges: k = 1 + 3,322 log n

c.2.) Regla 2K >=n

d) Determinar amplitud o ancho de cada clase. Se usa el mismo ancho para todas las clases.

Se calcula de la siguiente manera:

i= R/K

La amplitud se redondea al número inmediato superior de acuerdo con la cantidad de decimales y


al número de decimales que tiene los datos

d) Límites de cada clase

Los límites de clase se escogen de tal manera que cada valor de dato pertenezca a una clase y sólo

10
Estadística y Probabilidades

a una. El límite inferior de clase es el valor mínimo posible de los datos que se asigna a la clase. El
límite superior de clase es el valor máximo posible de los datos que se asigna a la clase.

El punto medio de clase se encuentra a la mitad entre los límites inferiores de dos clases conse-
cutivas. La marca de clase es el punto medio de los límites de cada intervalo.

2.2.3 Principales Tipos de Graficas

La aplicación de las gráficas en estadística se le atribuye WILLIAM PLAYFARI a finales de siglo XIII.
Un gráfico es la representación de fenómenos estadísticos por medio de figuras geométricas, el
grafico es un auxiliar del cuadro estadístico es decir no lo sustituye sino lo complementa.

Ventajas y desventajas

• Permite apreciar más rápidamente la información los datos y abarca todo su conjunto
• No pude presentar tantos grupos de datos como una tabla
• El los gráficos no se pueden apreciar los valores exactos

Partes de un grafico

a. Título.
b. El gráfico propiamente dicho.
c. Las notas explicativas.

2.2.3.1 Representaciones Graficas

Gráfico de Barras o Histograma:

Un histograma muestra el número de frecuencias en


cada Clase, en forma de rectángulos.

11
Estadística y Probabilidades

Este grafico se utiliza para representar variables de tipo


cualitativo o discreto

Un gráfico de barras es aquella representación gráfica


bidimensional en que los objetos gráficos elementales
son un conjunto de rectángulos dispuestos paralelamente
de manera que la extensión de los mismos es proporcional a la magnitud que se quiere representar.

• Gráfico de Barras Dobles o múltiples

Podríamos estar interesados en comparar una o más series estadísticas con otra. Existen dos formas
de realizar una comparación: mediante una forma de barras compuestas o proporcionales.

• Grafica de Barras Compuestas o de Proporción

Se caracterizan por utilizar una sola figura geométrica datos cuyo conjunto
forman un todo. Se dibuja el diagrama de barras de una de las series
estadísticas y luego se continúa las barras dibujadas con otras de distinto
sombreado.

La diferencia con los gráficos de barras simples, dobles o múltiples está en


que todos los datos están representados en una sola barra la cual está
dividida en porcentajes.

Polígono de frecuencia:
Un polígono de frecuencias consiste en segmentos de recta
que unen los puntos determinados por las intersecciones
de los puntos medios de clase y las frecuencias de clase.

Ejemplo Desarrollado

En una comunidad de la selva se realizó una encuesta para determinar la edad de las personas que
la conforman. Se tomó una muestra aleatoria de 55 personas, que dio a conocer las siguientes
edades:

5 70 23 51 16 14 8 2 35 24 72

19 8 25 42 18 23 50 32 62 4 10

3 6 8 19 7 21 7 39 20 14 6

3 19 25 46 83 12 19 25 33 32 2

12
Estadística y Probabilidades

29 14 27 17 9 11 5 2 13 73 53

Calcular

a) El número apropiado de clases y de intervalos


b) Organice los datos en una distribución de frecuencias
c) Realice un histograma e interprete
d) Realice un polígono de frecuencias e interprete
e) Realice un polígono de frecuencias acumuladas e interprete
f) Calcule la media, mediana y moda para los datos

SOLUCIÓN

Rango I = ( V alto - V bajo) I = (83-2 ) = 81

Numero de clases: se aplica la regla 2k

2k ≥ n n=55 2k ≥ 55

k =6

Intervalo de Clase

i = ( V alto - V bajo) / nro . de clases

i = (83-2)/6 = 81/6 = 13.5 ≈ 15

Se toma un intervalo de 15,pues uno de 13.5 ó 14 sería poco conveniente y causaría algunas
dificultades para la interpretación.

intervalos Frecuencia % Frec. % xi


0-15 23 acumulado
41.82% Acum
23 acumulado
41.82% 7,5
15-30 17 72.73% 40 72.73% 22,5
30-45 6 83.64% 46 83.64% 37,5
45-60 4 90.91% 50 90.91% 52,5
60-75 4 98.18% 54 98.18% 67,5
75-90 1 100.00% 55 100.00% 82,5

Histograma

13
Estadística y Probabilidades

Histograma
25

Frecuencia 20

15
Frecuencia
10

0
0-15

y mayor...
15-30

30-45

45-60

60-75

75-90
edades

De aquí se puede observar que las dos primeras clases tienen frecuencias muy altas, y las demás,
frecuencias muy pequeñas. Las clases 0-15 y 15-30 tienen más del 70% del total de observaciones.

Polígono de frecuencias

poligono de frecuencias
25

20
edades

15

10

0
0-15

15-30

30-45

45-60

60-75

75-90

frecuencia

Esta gráfica es sesgada a la derecha, porque se observa una especie de cola en el lado derecho ; y
hay dos valores extraordinariamente grandes en el lado izquierdo.

a) Polígono de Frecuencias acumuladas

14
Estadística y Probabilidades

POLÍGONO DE FRECUENCIAS
ACUMULADAS "MENOR QUE"

55
FRECUENCIA 50
45
40
35
30
25 Series1
20
15
10
5
0
0 15 30 45 60 75 90

EDADES

Interpretacio nde Resultados:

De aquí se puede deducir lo siguiente:

a. Más del 50% del total, tiene menos de 30 años.


b. 20 de cada 55 personas tienen menos de 15 años.
c. 45 encuestados tienen una edad menor a 45 años.

2.2.4 Otras Graficas Estadísticas

Polígono de frecuencias acumuladas “Menor Que”


Un polígono de frecuencias acumuladas “Menor Que"
muestra el número de observaciones por abajo de un
valor determinado.

Ilustración 2 Polígono de frecuencias acumuladas


Gráficas de Datos Lineal o de líneas “Menor Que"

Los periódicos y las revistas utilizan


muchas gráficas, entre ellas la gráfica
lineal que es muy útil para mostrar la
tendencia de ventas o el ingreso en un
periodo determinado.

15
Estadística y Probabilidades

Gráficas circulares son útiles para mostrar


los porcentajes del total que corresponden
a diversos componentes.

Consideraciones de la Gráficos y cuadros estadísticos

En el arreglo de filas y columnas de datos o series estadísticas, por lo general tiene dos entradas en
ellas pueden representarse características cualitativas y cuantitativas.

La finalidad es ofrecer información resumida de fácil lectura, comparación e interpretación.

Consideraciones en el Cuadro estadístico

• Numeración de los cuadros y Gráficos


• Título: el titulo debe indicar claramente cuál es el contenido del cuadro y/o gráfico. Por lo
tanto debe responder las siguientes preguntas: Qué, Cuándo, Cómo, Donde.
• Ser conciso: el titulo debe ser breve pero sin dejar de explicar el mismo

• Contenido es el conjunto de celdas y columnas donde están los datos numéricos y/o
cuerpo principal en los gráficos.
• Notas al pie del cuadro o gráfica: Contiene normalmente la fuente de los datos
representados y cualquier nota que pueda aclarar el cuadro o gráfico.

16
Estadística y Probabilidades

Pictogramas o Pictografos

Es la representación de
las series estadísticas
mediante símbolos que
por su forma sugieren la
naturaleza de datos.

Gráfico de Sectores o Pastel

Sus usos más frecuentes es con fines comparativos


cuando se quiere mostrar las diversas componentes de
una serie de valores de la variable comparada con el total.

Histograma de Frecuencias Relativas o de


Frecuencias Acumuladas

Se usa para representar gráficamente las


distribuciones de frecuencias absolutas o
relativas, También las Frecuencias
acumuladas datos cuantitativos continuos
agrupados por clases. Estos gráficos
reciben el nombre de histograma de
frecuencias absolutas o relativas sean estas
acumuladas o no.

POLIGONO DE FRECUENCIAS ACUMULADAS. OJIVAS

Una ojiva es la representación gráfica de una distribución de frecuencias absolutas acumuladas.

• Ojiva menor que: es la gráfica de distribución de frecuencias menor que o las frecuencias
relativas acumuladas.
• Ojiva mayor o igual que: es la representación gráfica de una distribución de frecuencias
absolutas mayor o igual que

17
Estadística y Probabilidades

18
Estadística y Probabilidades

2.2.5 Ejercicios Desarrollados

1. Una compañía tiene como función principal el de dar servicio por vía telefónica por concepto de
seguros de vida. A continuación se indica el número de citas que se realizo en las últimas 40 horas.

6 4 6 9 3 8 2 8
7 6 9 8 9 7 10 10
8 8 4 8 5 5 7 7
10 10 9 7 9 8 4 7
8 9 10 9 9 8 5 7

Rango: Lsuperior- Linferior 10-2 = 8

Clases: 1+3.3 log40 = 6,287 = 6

Intervalo: rango/clase = 8/6 1.33 = 1.5

b) Trace un histograma de frecuencias relativas para el conjunto de datos

Histograma

45 120.00%
40
100.00%
35
Frecuencia

30 80.00%
25
60.00%
20
15 40.00%
10
20.00%
5
0 0.00%
3 4.5 6 7.5 9 11.5
Clase

c) ¿La distribución de x, es simétrica o sesgada? Explique

Distribucion de x

12
Marca de clase

10
8
6
4
2
0
3 4.5 6 7.5 9 11.5
clase

Es sesgada a la izquierda, no es simétrica porque al dividirlo en la mitad el lado izquierdo y derecho


no forman imágenes idénticas

c) Construya la tabla de distribución de frecuencias para el conjunto de datos.

19
Estadística y Probabilidades

Clase Frecuencia Frelativa f % x f.X


3 2 0.05 acumulado
2 5.00%
acumulado 1 0
4.5 3 0.075 5 12.50% 3 6
6 6 0.15 11 27.50% 5 30
7.5 7 0.175 18 45.00% 7 70
9 17 0.425 35 87.50% 9 153
11.5 5 0.125 40 100.00% 11 55
40 100.00% 314

d) determine la media, mediana y moda para estas mediciones ( con Excel)

media 7.325

mediana 8

moda 8

(verifique los resultados)

2. Los datos que a continuación se presentan corresponden a las horas extras laboradas por un
grupo de trabajadores de la empresa ANIPSA, con esos datos estadísticos:

29 30 33 38 39 40 42 45 47 48
50 50 51 52 53 57 58 61 64 65
68 69 70 72 73 73 75 75 76 77
78 79 80 81 82 84 86 87 89 90
91 92 93 96 99 102 103 104 106 107
107 110 112 114 116 117 119 123 125 128

a) construya un grafico de tallo y hoja


b) trace un histograma de frecuencias relativas para el conjunto de datos
c) ¿cual es el mas pequeñote los datos y cual es el mayor?
d) Determine la media mediana y moda para estas mediciones
e) Construya un polígono de frecuencias acumuladas

20
Estadística y Probabilidades

a)

2 9
3 0 3 8 9
4 0 2 5 7 8
5 0 0 1 2 3 7 8
6 1 4 5 8 9
7 0 2 3 3 5 5 6 7 8 9
8 0 1 2 4 6 7 9
9 0 1 2 3 6 9
10 2 3 4 6 7 7
11 0 2 4 6 7 9
12 3 5 8

b)

Horas extras laboradas por un grupo de trabajadores de


la empresa ANIPSA

14
12
10
8
6
4 fi
2
0

c)

RANGO: (R) = XM – Xm
DATOS: XM = 128 ; Xm = 29
R = 128 – 29 = 99
NUMERO DE CLASES

2 K  N
NC= K N = 60
K = 6 2  6  64

R 99
IC = → IC =  I C = 16.5 → I C  17
INTERVALO DE LAS CLASES NC 6

21
Estadística y Probabilidades

Tabla

CLASES fi fa fr fr % far far % PM fXi


28—45 7 7 0.117 11.7 0.117 11.7 36,5 255,5
45—62 11 18 0.183 18.3 0.300 30.0 53,5 588,5
62—79 13 31 0.216 21.6 0.516 51.6 70,5 916,5
79—96 12 43 0.200 20.0 0.716 71.6 87,5 1050
96—113 10 53 0.167 16.7 0.883 88.3 105 1045
113—130 7 60 0.117 11.7 1.000 100.0 122 850,5
TOTALES 60 1.000 100.00 4706

MEDIA ARITMÉTICA:

X =
 f Xi
→X =
4706
X = 78.4
N 60

MEDIANA:

 N 
 I C 2 − faa  N 60
Md = Li +  → = = 30;..Li = 62;.. faa = 18;.. fm = 13;...I C = 17
 fm  2 2
 

 ( 17 )30 − 18 
Md = 62 +    Md = 77.6
 13 

 12 
Mo = 62 +  17 
 12 + 11 
MODA: Mo = 70.7

Grafica de frecuencia acumulativa

Ojiva correspondienta a las hora extras laboradas por


un grupo de trabajodores de la empresa anipsa
70

60 60
53
50
43
40
Frecuencias

30 31

20
18
10
7
0 0
28 45 62 79 96 113 130
Limites Superiores

22
Estadística y Probabilidades

3.- La siguiente tabla muestra el precio de venta de los inmuebles vendidos en áreas residenciales
de la ciudad de Lima, en el último trimestre del año anterior.

precio de venta (miles nro de casas vendidas


50-100
$) 20
100-150 30
150-200 75
200-250 75
250-300 25
300-350 25

a) Construya un polígono de frecuencias acumuladas “Menor que”

Polígono de frecuencias acumuladas


absolutas "Menor que"

250
frecuencia acumulada

200
absoluta

150
Serie1
100

50

0
75 125 175 225 275 325
Precio de venta (miles$)

Polígono de frecuencias acumuladas


relativas "Menor que"

100%
frecuencias acumuladas

80%
relativas

60%
Serie1
40%

20%

0%
75 125 175 225 275 325
Precio de venta (miles $)

b) ¿Cuántas casas se vendieron durante el último trimestre?

Según se aprecia en la gráfica de frecuencias acumuladas la suma de casas vendidas en el último


trimestre fue de 250.

c) ¿Alrededor del 75% de las casas se vendieron por menos de que cantidad?

23
Estadística y Probabilidades

Según el polígono de frecuencias acumuladas absolutas, alrededor del 75% de las casas se
vendieron por un precio menor a $250 000.

d) ¿Ciento setenta y cinco de las casas se vendieron por menos de que cantidad?

Según el polígono de frecuencias acumuladas relativas, ciento setenta y cinco de las casas se
vendieron por menos de $250 000.

e) ¿Qué porcentaje de casas se vendieron por encima de los $275 000?

Según el polígono de frecuencias acumuladas relativas, el porcentaje restante de casas en la


acumulación de la gráfica que sobrepasa los $275 000 es del 10%.

f) El 50% de casas se vendieron a un precio aproximado de:

Según el polígono de frecuencias acumuladas relativas, el 50% de casas se vendieron por un precio
aproximado de $175 000.

4.- Del Ejercicio Anterior

Calcular Media Mediana Para los datos

Para datos no agrupados

MEDIA 23.9090909

MEDIANA 19

MODA 19

Para datos agrupados

intervalos Frecuencia % Frec. Acum % xi F xi


0-15 23 41.82% 23 41.82%
acumulado 7,5 172.5
15-30 17 72.73% 40 72.73% 22,5 382.5
30-45 6 83.64% 46 83.64% 37,5 225.0
45-60 4 90.91% 50 90.91% 52,5 210.0
60-75 4 98.18% 54 98.18% 67,5 270.0
75-90 1 100.00% 55 100.00% 82,5 82.5
∑ 55 1342.5

MEDIA:

X= ∑ fxi / ∑ xi

X= 1342.5/ 55 = 24.41

MEDIANA:

24
Estadística y Probabilidades

X= Li + (i) (n/2 –fa) /f

X= 15 + (15) (27,5-23) / 17

X=18.97

MODA :

X= Li + (i) (fa/ fa +fb)

X= 0 + 15(6/6)

X= 15

Como la distribución es sesgada a la derecha, la media es mayor que la mediana y la moda, ya que
está afectada por valores extremos (70, 83,etc.)

Ejercicios propuestos

1.- Realizar un grafica de Pastel para los siguientes datos. que corresponden al número de personas
emplean un tipo de combustible

Categorias f
Electricidad 68,110
Gas 3,061,537
Kerosene 391,349
Carbon 131,861
Leña 1,974,758
Otro tipo de combustible 230,988
No cocinan 195,078
Total 6,053,681

2.- A continuación se presenta la tabla de distribución e frecuencias de las edades de 50 integrantes


de un programa de servicio social del gobierno:

li ls ls-1 f
1 39 49 48 4
2 49 59 58 8
3 59 69 68 14
4 69 79 78 12
5 79 89 88 8
6 89 99 98 4

a) Trace un histograma de frecuencias relativas para el conjunto de datos. Comente


b) Encuentre la fr, FA, fra para los datos, haga tres interpretaciones
c) Trace un Grafico circular de los datos e interprete

25
Estadística y Probabilidades

3.- Obtenga un gráfico Estadístico de los Datos, muestre e interprete su resultado

4.- Complete la siguiente tabla de datos:

Li – ls Xi fi fr i Fa Fra
10 - 14 0.125
14 - 18 0.375
18 -22 27 0.675
22 - 26 0.875
26 - 30 1.000

26
Estadística y Probabilidades

CAPITULO III DESCRIPCION DE LOS DATOS

3.1 Introducción

En este capítulo se presentan dos formas numéricas de describir datos cuantitativos:

Las medidas de ubicación y,

Las medidas de dispersión.

3.2 Las medidas de ubicación

También llamada promedios. El propósito consiste en señalar el centro de un conjunto de valores.


La medida de ubicación muestra el valor central de los datos. Los promedios aparecen a diario en
televisión, en el periódico y otras publicaciones. He aquí algunos ejemplos:

• Promedio de gasto familia es de 35 soles por día


• El sueldo promedio de un profesor es de 2500 nuevos soles mensuales.
• El hogar el promedio tiene más televisores que personas. Hay 2.73 televisores y 2.55
personas en el hogar típico.
• El precio promedio de un boleto de teatro Lima es de 7.50 dólares, según la Asociación
Nacional de Propietarios de Teatros.

Si sólo toma en cuenta las medidas de ubicación de un conjunto de datos o si compara varios
conjuntos de datos utilizando valores centrales, llegará a una conclusión incorrecta.

Además de las medidas de ubicación, debe tomar en consideración la dispersión denominada con
frecuencia variación o propagación de los datos. Por ejemplo, suponga que el ingreso anual
promedio de los ejecutivos de compañías relacionadas con internet es de $80 000, igual que el
ingreso promedio de ejecutivos de compañías farmacéuticas. Si sólo atiende a los ingresos
promedio, podría concluir, equivocadamente, que las dos distribuciones de salarios son idénticas o
casi idénticas. Un vistazo a los rangos salariales indica que esta conclusión no es correcta. Los
salarios de los ejecutivos de las empresas de internet oscilan entre $70 000 y $90 000; en cambio,
los salarios de los ejecutivos de marketing de la industria farmacéutica van de $40 000 a $120 000.
Por consiguiente, aunque los salarios promedios son los mismos en las dos industrias, hay más
propagación o dispersión en los que perciben los ejecutivos de la industria farmacéutica. Para
describir la dispersión considere el rango, la desviación media, la varianza y la desviación estándar.

En principio se explican las medidas de ubicación. No existe una única medida de dispersión; de
hecho, existen varias. Consideraremos cinco: la media aritmética, la media ponderada, la mediana,
la moda y la media geométrica. La media aritmética es la medida de ubicación que más se utiliza y
que se publica con mayor frecuencia, por lo cual se le considerará como parámetro para una
población y como estadístico para las muestras.

27
Estadística y Probabilidades

3.3 Datos simples y datos agrupados

Se denomina datos simples (datos no agrupados) a los valores que no están agrupados en tablas
de distribuciones de frecuencia, mientras que son datos agrupados aquellos que si lo están.

Si se tienen datos simples no se construye la distribución de frecuencias para calcular la media, la


mediana o cualquier estadístico, se prefiere el cálculo con los datos simples.

3.4 Medidas de tendencia central

Las medidas de localización o de tendencia central se refieren al valor central que representa a los

datos de una determinada variable.

3.4.1 Media
La media aritmética (media o promedio) de un conjunto de valores de una variable es la suma de
dichos valores dividida entre el número de valores.

La fórmula para la media poblacional es

La fórmula para la media muestral de datos no agrupados es

La fórmula para la media muestral de datos agrupados es

Donde xi: dato (datos no agrupados) o marca de clase xi (datos


agrupados)
fi : frecuencia de cada clase
N: tamaño de la población
n : tamaño de la muestra

3.4.2 Mediana
Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a
mayor.

a) Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.

b) Si la serie tiene un número par de puntuaciones la mediana es la media entre las


dos puntuaciones centrales.

Mediana para datos agrupados

es la semisuma de las frecuencias absolutas.

Li-1 es el límite inferior de la clase donde se encuentra .

28
Estadística y Probabilidades

Fi-1 es la frecuencia acumulada anterior a la clase mediana.

ai es la amplitud de la clase.

3.4.3 Moda
La moda, Mo, es el valor que tiene mayor frecuencia absoluta.

1º Todos los intervalos tienen la misma amplitud.

Li-1 es el límite inferior de la clase modal.

fi es la frecuencia absoluta de la clase modal.

fi--1 es la frecuencia absoluta inmediatamente inferior a la en clase modal.

fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.

ai es la amplitud de la clase.

También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:

2º Los intervalos tienen amplitudes distintas.

En primer lugar tenemos que hallar las alturas.

La clase modal es la que tiene mayor altura.

La fórmula de la moda aproximada cuando existen distintas amplitudes es:

3.4.4 Cuartiles
Los cuartiles son los tres valores de la variable dividen a un conjunto de datos ordenados en cuatro
partes iguales.

Cálculo de los cuartiles

29
Estadística y Probabilidades

1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa cada cuartil mediante la expresión .

Cálculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra, en la tabla de las frecuencias acumuladas.

3.4.5 Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.

Cálculo de deciles

Ordenamos los datos de menor a mayor.

Buscamos la puntuación, en la serie, o la clase, en la tabla de las frecuencias acumuladas, donde se


encuentra , .

3.4.6 Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en100 partes iguales.

Cálculo de percentiles

Ordenamos los datos de menor a mayor.

Buscamos la puntuación, en la serie, o la clase, en la tabla de las frecuencias acumuladas, donde se


encuentra ,.

3.5 Medidas de Dispersión

3.5.1 Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a
la media.

30
Estadística y Probabilidades

Desviación media para datos agrupados

3.5.2 Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una
distribución estadística.

Varianza para datos agrupados

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son
equivalentes a las anteriores.

Varianza para datos agrupados

3.5.3 Desviación típica o Desviación estándar


La desviación típica es la raíz cuadrada de la varianza.

Desviación típica para datos agrupados

Para simplificar el cálculo vamos o utilizar las siguientes expresiones que son equivalentes a las
anteriores.

31
Estadística y Probabilidades

Desviación típica para datos agrupados

3.5.4 Coeficiente de variación


El coeficiente de variación es la relación entre la desviación típica de una muestra y su media.

Coeficiente de variación en tanto por ciento

3.5.5 Ejercicios Desarrollados

Ejemplo 1

Del ejemplo anterior.- En una comunidad de la selva se realizó una encuesta para determinar la
edad de las personas que la conforman. Se tomó una muestra aleatoria de 55 personas, que dio a
conocer las siguientes edades:

5 70 23 51 16 14 8 2 35 24 72
19 8 25 42 18 23 50 32 62 4 10
3 6 8 19 7 21 7 39 20 14 6
3 19 25 46 83 12 19 25 33 32 2
29 14 27 17 9 11 5 2 13 73 53
Calcular

Calcule la media, mediana y moda para los datos

SOLUCIÓN

% %
intervalos Frecuencia acumulado Frec. Acum acumulado xi
0-15 23 41.82% 23 41.82% 7,5
15-30 17 72.73% 40 72.73% 22,5
30-45 6 83.64% 46 83.64% 37,5
45-60 4 90.91% 50 90.91% 52,5
60-75 4 98.18% 54 98.18% 67,5
75-90 1 100.00% 55 100.00% 82,5

De aquí se puede observar que las dos primeras clases tienen frecuencias muy altas, y las demás,
frecuencias muy pequeñas. Las clases 0-15 y 15-30 tienen más del 70% del total de observaciones.
Calculo de la media. Mediana y Moda

Si se considera como datos no agrupados, tenemos:

32
Estadística y Probabilidades

MEDIA 23.91
MEDIANA 19.00
MODA 19.00

Calculo de la Media Mediana y Moda para datos agrupados:

% F xi
intervalos Frecuencia % Frec. Acum acumulado xi
0-15 23 41.82% 23 41.82% 7,5 172.5
15-30 17 72.73% 40 72.73% 22,5 382.5
30-45 6 83.64% 46 83.64% 37,5 225.0
45-60 4 90.91% 50 90.91% 52,5 210.0
60-75 4 98.18% 54 98.18% 67,5 270.0
75-90 1 100.00% 55 100.00% 82,5 82.5
∑ 55 1342.5

Media

X= ∑ fxi / ∑ xi
X= 1342.5/ 55 = 24.41

Mediana:

X= Li + (i) (n/2 –fa) /f


X= 15 + (15) (27,5-23) / 17
X=18.97

Moda :

X= Li + (i) (fa/ fa +fb)


X= 0 + 15(6/6)
X= 15

Como la distribución es sesgada a la derecha, la media es mayor que la mediana y la moda, ya que
está afectada por valores extremos (70, 83,etc.)

3.5.6 Ejercicios Propuestos


1. En una comunidad de la selva se realizó una encuesta para determinar la edad de las
personas que la conforman. Se tomó una muestra aleatoria de 50 personas, que dio a
conocer las siguientes edades.

5 70 23 51 16 14 8 2 35 24
19 8 25 42 18 23 50 32 62 4
3 6 8 19 7 21 7 39 20 14
3 19 25 46 83 12 19 25 33 32
29 14 27 17 9 11 5 2 13 73
Calcular:

33
Estadística y Probabilidades

a) El número apropiado de clases y de intervalos


b) Organice los datos en una distribución de frecuencias
c) Realice un histograma e interprete
d) Realice un polígono de frecuencias e interprete
e) Realice un polígono de frecuencias acumuladas e interprete
f) El número de pobladores de la comunidad que tiene una edad menor a 10 años
g) El número de pobladores de la comunidad que tiene una edad entre a 25 a 35 años
h) El número de pobladores de la comunidad que tiene una edad mayor a 65 años
i) El porcentaje de pobladores que tienen una edad entre 20 y 30 años
j) El porcentaje de pobladores que tienen una edad menor a 8 años

2.- Se presenta un Histograma de frecuencias del peso de 150 personas que usaron las canastillas
para subir a esquiar cierto día. Construya la tabla de distribución de frecuencias con los datos
(considere que los datos del eje X son los puntos medios de cada clase)

a) Elabore una tabla de Distribución de Frecuencias a partir del Grafico


b) ¿Qué puede observar en este histograma acerca de los datos que no era aparente en la
distribución de frecuencias?
3.- A continuación se dan los datos correspondientes al tiempo de espera (en minutos) hasta que
son atendidos 40 personas que visitan una determinada entidad pública:

13 15 20 21 24 17 9 10 11 12
18 16 14 13 11 10 13 15 20 19
20 21 22 18 16 11 14 8 24 6
18 19 20 17 15 16 13 12 15 14
15 18 21 17 19 12 9 9 11 15

Agrupar los datos en intervalos.


a. Con los datos agrupados en intervalos: determinar la distribución de frecuencias
absolutas, relativas, acumuladas absolutas y acumuladas relativas.
b. Hacer el histograma de frecuencias absolutas y el polígono de frecuencias acumuladas
relativas.
c. Hallar las medidas de posición; media mediana y moda e interprete los resultados

4.- Con la siguiente tabla de distribución de frecuencias

34
Estadística y Probabilidades

Intervalo Frecuencia
1 1-6 3
2 6 - 11 8
3 11 - 16 8
4 16-21 12
5 21-26 9
6 26-31 3

a. Calcule la media aritmética, la mediana y la moda


b. Calcule la Varianza y Desviación Estándar
c. Elabore un Polígono de frecuencias de frecuencias
d. Calcule el D1, D6 , P30, P80
e. Elabore un diagrama de caja para los datos

35
Estadística y Probabilidades

3.5.7 Suplemento: Estadística Descriptiva con Excel

Pasos :

1. Abrir la Hoja de Cálculo. Escribir los datos a partir de la en la Columna A y fila 1

2. La hoja de cálculo proporciona un análisis estadístico básico, asi:

Ir al menu FICHA DATOS →ANÁLISIS DE DATOS→ ESTADÍSTICA DESCRIPTIVA. (Verificar)

Si no existe este complemento, activarlo siguiendo los siguientes pasos

Seleccionar Barra de herramientas de acceso rápido/ complementos/ Ir

Lego activar la casilla, herramientas para análisis

Luego, Ir al menu DATOS →ANÁLISIS DE


DATOS→ ESTADÍSTICA DESCRIPTIVA.

36
Estadística y Probabilidades

El cuadro de diálogo pregunta por el rango de entrada (esto es, dónde están los datos que hay que
analizar) que es A?:A? los datos se deben encontrar en columna, (la columna A en Excel) y el de
salida (donde se han de escribir los resultados) que podemos hacer D1. Además no hay que olvidar
marcar la opción RESUMEN DE ESTADÍSTICAS. Dar al botón Aceptar.

En Excel también existen Formulas para obtener directamente el parámetro o estadistico, asi
tenemos algunas funciones:

=PROMEDIO(A1:A32000)

=MEDIANA(A1:A32000)

=MODA(A1:A32000)

=DESVESTP(A1:A32000)

=VARP(A1:A32000)

=CURTOSIS(A1:A32000)

=COEFICIENTE.ASIMETRIA(A1:A3200)

=MAX -MIN

=MÍN(A1:A32000)

=MAX(A1:A32000)

=SUMA(A1:A32000)

=CONTAR(A1:A32000)

37
Estadística y Probabilidades

Bibliografía

Berenson, M., & Levine, D. (2004). Estadística Básica en la Administración. Mexico D.F.. Prentice
hall hispanoamericana S.A.

Cordova, M. (2003). Estadística Descriptiva e Inferencial – Aplicaciones. Lima Peru. Editorial


Moshera,

D.R. Anderson, D.J. Sweeney, T.A. Williams.(2008). Estadística para Administración y Economía.
México. 10ma Edición.

Lind, D., Marchal, W., & Wathen, S. (2012). Estadistica Aplicada a la Edministracion y Economia.
México, D.F.: McGRAW-HILL/INTERAMERICANA EDITORES, S.A.

Webster, A. (2000). Estadistica Aplicada a los Negocios y la Economia. Colombia: McGraw-Hill


Interamerica S.A.

38
Estadística y Probabilidades

Anexos

A.1 Área Bajo la Curva normal

39
Estadística y Probabilidades

A.2 Distribución t de Student

40
Estadística y Probabilidades

41
Estadística y Probabilidades

A.3 Valores críticos de ji cuadrada

Esta tabla contiene los valores X2 de correspondientes a un área específica de la cola derecha y un
número específico de grados de libertad.

42
Estadística y Probabilidades

A.4 Valores críticos de la distribución F en un nivel de significancia de 5%

43
Estadística y Probabilidades

A.6 Valores críticos de la distribución F en un nivel de significancia de 1%

44
Estadística y Probabilidades

A.7 Distribución de Poisson

45
Estadística y Probabilidades

A.8 Tabla de números aleatorios

46
Estadística y Probabilidades

A.9 Distribución de probabilidad binomial

47
Estadística y Probabilidades

48
Estadística y Probabilidades

49
Estadística y Probabilidades

50
Estadística y Probabilidades

51
Estadística y Probabilidades

A.10 Distribución t de Student

52
Estadística y Probabilidades

53

También podría gustarte