Está en la página 1de 56

Unidad 1.

Organización de datos
1.1 Estadística
Es la ciencia de los datos, implica la colección, clasificación, síntesis, organización, análisis e
interpretación de los datos.

Estadística descriptiva
Es la rama de la Estadística que se dedica al análisis, descripción y representación de un
conjunto de datos. Obteniéndose conclusiones sobre las características de dicho conjunto.

Estadística inferencial
Es la rama de la Estadística que desarrolla los procesos de estimación, análisis y pruebas de
hipótesis de un conjunto de datos extraídos de una muestra, con el propósito de llegar a
tener conclusiones acerca de una población.
1.2 Conceptos básicos

Población (N)
Es un conjunto de elementos, (personas, objetos, etc.), que tienen una o más características
observables que se pueden medir en ellos.

Elemento
(unidad
elemental)

Población Todos los trabajadores del área de marketing de la inmobiliaria Nexo

Muestra Algunos

Elemento Un

Población Todos

Muestra Un subconjunto

Elemento Un
Ejemplo
Para conocer la opinión que tienen los estudiantes de ingeniería sobre el servicio que ofrece el
Centro de Información, se puede considerar como población a todos los estudiantes de
ingeniería de la UPC matriculados en el semestre anterior.

Muestra (n)
Se denomina muestra a una parte de la población.

Ejemplo
Para conocer la opinión que tienen los estudiantes de ingeniería, sobre el servicio que ofrece el
Centro de Información, se puede considerar como muestra a un subconjunto de estudiantes de
ingeniería de la UPC matriculados en el semestre 2018-2.

Elemento o unidad elemental


Es cada una de las entidades acerca de las cuales se reúnen los datos.

Ejemplo
Para conocer la opinión que tienen los estudiantes de ingeniería acerca del servicio que ofrece
el Centro de Información, se puede considerar como elemento a un estudiante de ingeniería de
la UPC matriculado en el presente semestre académico.

Ejercicios

1. Se realizó un estudio para determinar la cantidad promedio diario de residuos de


construcción y demolición en la ciudad de Lima durante los meses de enero, febrero y marzo.
Determine la población, muestra y elemento.
2. El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad en el
departamento de Lima y las consecuencias que éste podría generar en el Cercado de Lima.
Por esta razón, Defensa Civil ha decidido realizar un diagnóstico de la situación de las
viviendas en este distrito encuestando a 1200 viviendas seleccionadas al azar. Parte de la
encuesta se presenta a continuación:

Encuesta de vivienda
1. Tiempo de antigüedad de la vivienda
• Menos de 10 años
• Entre 10 y 20 años
• Más de 20 años

2. Material de construcción de la vivienda:


• Cemento
• Adobe
• Quincha
• Prefabricado

3. Número de habitaciones: ____________

4. Área de terreno: __________ m2

5. La vivienda se encuentra en:


• Buen estado de conservación
• Regular estado de conservación
• Mal estado de conservación

Complete la siguiente Ficha técnica:

Fecha: Del 02 al 15 de marzo del 2020

Población: __________________________________________________________________

Muestra: ___________________________________________________________________

Unidad elemental: ___________________________________________________________

Con 95% de confianza y 3% de margen de error.


1.3 Variables
Variable es una característica de interés de los elementos.

Clasificación de variables
Variable cualitativa
Es la característica cuyos valores se expresan en escala nominal u ordinal. Por ejemplo,
carreras universitarias, materiales de construcción y tipos de resistencias.
Variable cuantitativa
Es la característica cuyos valores se expresan en escala de intervalo o de razón. Se dividen
en discretas y continuas

Variable cuantitativa discreta


Es aquella variable cuyo resultado sólo puede tomar un número finito o infinito numerable
de valores. Estos valores surgen de un proceso de conteo.
Por ejemplo, número de artículos defectuosos producidos diariamente o número de
columnas de concreto necesarias en la construcción de un puente.
Variable cuantitativa continua
Es aquella variable cuyo resultado puede tomar infinitos valores entre dos valores
cualesquiera. Estos valores surgen de un proceso de medición.
Por ejemplo, temperatura de ignición de un gas, resistencia del concreto a la compresión o
tiempo de corte de un torno corriente.
Ejemplo

¿Cuál es tu programa de TV preferido?


X= programa de TV preferido
Tipo de variable: variable cualitativa

¿Cuál es tu carrera profesional?


Y= ……………………………………………………………………………………………………………………………………………
Tipo de variable: …………………………………………………………………………………………………………………….

a. Ing. Civil
b. Ing. Electrónica categorías de la variable
c. Ing. mecatrónica

¿Cuál es su grado de instrucción?


Y= ………………………………………………………………………………………………………………………………………….…
Tipo de variable: …………………………………………………………………………………………………………………….

a. Primaria
d. Secundaria categorías de la variable
b. Superior
c. Post grado

¿Cuál es su ingreso mensual?


X= Ingreso mensual (soles)
Tipo de variable: …………………………………………………………………………………………………………………….

Z= número de hermanos
Tipo de variable: …………………………………………………………………………………………………………………….

X= Año de nacimiento
Tipo de variable: …………………………………………………………………………………………………………………….

X= Temperatura (°C)
Tipo de variable: …………………………………………………………………………………………………………………….
Escalas de medición de las variables
La escala de medición permite determinar la cantidad de información que contienen los datos
e indica el resumen de estos y el análisis estadístico más apropiado.
Las escalas de medida de una variable cualitativa son las siguientes:
Nominal
Una variable está medida en escala nominal cuando los datos son etiquetas o nombres que
se emplean para definir un atributo del elemento. Por ejemplo: el género de las personas,
el estado civil, el número del celular, etc.
Ordinal
Una variable está medida en escala ordinal cuando pueden ordenarse de acuerdo con algún
criterio. Se pueden ordenar en forma ascendente o descendente. También, pueden
registrarse por medio de un código numérico. Por ejemplo: el orden de mérito de los
alumnos en el curso de Estadística, el grado de instrucción de los clientes de un banco, nivel
socioeconómico de los alumnos de la universidad.

Las escalas de medida de una variable cualitativa son las siguientes:


Intervalo
Una variable está medida en escala de intervalo, si los datos tienen propiedades de datos
ordinales y el intervalo entre observaciones, se expresa en términos de una unidad fija de
medida. Los datos de intervalo siempre son numéricos. En esta escala, el cero es relativo, es
decir, no indica la ausencia de la característica medida. Por ejemplo: las temperaturas en
grados Celsius o en grados Fahrenheit.
Razón
Una variable está medida en escala de razón si los datos tienen todas las propiedades de los
datos de intervalo y el cociente de los dos valores es significativo. En esta escala, el cero
indica la ausencia de característica de la medida. Por ejemplo: el sueldo de los empleados
de una empresa, el peso de los alumnos de la UPC.

Ejemplo

1. Complete lo solicitado:

¿Cuál es tu programa de TV preferido?


X= programa de TV preferido
Tipo de variable: variable cualitativa
Escala: ……………………………………………………………………………………………………………………………………

Y= Carrera profesional
Escala: …………………………………………………………………………………………………………………………………..
X= Ingreso mensual (soles)
Escala: …………………………………………………………………………………………………………………………………..

Z= número de hermanos
Escala: …………………………………………………………………………………………………………………………………..

2. La Corporación Aceros Perú es una empresa que se dedica a la


industria del acero. Actualmente, la empresa está fabricando
hierro esponja, palanquillas de acero, barras helicoidales,
alambrón y barras de construcción y tiene una capacidad de
680,000 toneladas al año. Uno de los mercados a los que más
se orientan los productos es el mercado de la construcción de
Lima.

Al departamento de control de calidad se le ha encargado realizar


un estudio sobre las varillas devueltas a la fábrica. Al seleccionar una muestra aleatoria de 80
barras de aceros de la sección de devoluciones del almacén, se midieron algunas características
de acuerdo con la siguiente ficha técnica:

N° de barra: ___________

1.- Tipo de barra de acero:


• Corrugado ASTM
• Corrugado Grado60
• Corrugado NBR7480
• Corrugado 4.7 mm
2.- El destino de uso de la barra de acero
• Columnas
• Vigas
• Cimentación
• Concreto armado
3.- Resistencia a la tracción: ________________ Kg/cm2

4.- Número de protuberancias: ________________

5.- Categoría del límite a afluencia


• Alta
• Regular
• Baja

6.- Tipo de defecto


• Escamas • Marcas mecánicas • Corrosión
• Pliegues • Fisuras
• Grietas • Porosidad

A partir de la información, complete lo solicitado:

Población

Muestra

Identifique las
características e
indique el tipo y la
escala de medida

Ejercicios

1. Corporación Domar S.A.C. es una empresa peruana ubicada


en la ciudad de Lima con más de ocho años de experiencia en
el sector Industrial. La empresa ejecuta proyectos de
instalación de sistemas mecánicos y electrónicos, además
brinda un servicio industrial de mantenimiento especializado
de maquinarias y laboratorios en todas las especialidades de
ingeniería. El gerente del área de servicios quiere convertir a la corporación en una de las
empresas con mayor representatividad, a nivel nacional, en el rubro industrial, por lo que
desea evaluar los servicios brindados durante el último trimestre. En consecuencia,
selecciona al azar a 22 registros de los servicios realizados durante el último trimestre.
Algunas de las variables del estudio se presentan a continuación:

• Precio neto por el servicio (en miles de soles)


• Rubro de la empresa cliente (Construcción, Industria Manufacturera, Salud, Educación)
• Número de ingenieros necesarios para realizar el servicio
• Tipo de servicio (Mantenimiento preventivo, mantenimiento correctivo, instalación de
laboratorios, instalación de máquinas industriales)
• Número de días de ejecución del servicio (Duración del servicio, en días)

Se solicita identificar la población y clasificar las variables.


Población:

Variable Tipo de variable Escala de medición

Precio neto por el servicio

Rubro de la empresa cliente

Número de ingenieros necesarios para


realizar el servicio

Tipo de servicio

Número de días de ejecución del servicio

2. El gobierno está preocupado por la ocurrencia de un sismo de alta intensidad en el


departamento de Lima y por las consecuencias que esto podría generar, especialmente en
algunos distritos como el Cercado de Lima. Por esta razón Defensa Civil realizó un diagnóstico
de la situación de las viviendas en el mencionado distrito a través de una muestra de 1200
viviendas seleccionadas al azar. Se registraron las siguientes variables:

• Años de construcción.
• Tipo de vivienda (1 = Cemento, 2 = Adobe, 3 = Quincha, 4: Material prefabricado)
• Número de habitaciones por vivienda.
• Área del terreno en donde se construyó la vivienda.
a. De acuerdo con el enunciado anterior identifique la población y la muestra.
b. Identifique el tipo y escala de medición de las variables mencionadas.

3. ComputerSoft es una compañía dedicada a brindar servicios informáticos a empresas que


desean tener una presencia firme y contundente en la red. Esta compañía se dedica al
tendido de redes LAN, instalación de equipos, servidores y toda una gama de productos
tecnológicos que puedan resultar imprescindibles para una empresa. Como parte de un
estudio realizado por ComputerSoft se analizó la información correspondiente a una muestra
de 30 empresas en la ciudad de Lima a las que se les brindó los servicios informáticos.

Identifique el tipo y escala de medición de las variables consideradas en dicho estudio.

Variable Tipo de variable Escala de medida


Lenguajes de programación (Cobol,
Java, etc)
Cantidad de servidores por empresa
Costo de las licencias de software (en
dólares)
Año de instalación del software

4. La empresa de investigación de mercados AlphaDatum S.A. realizó un estudio para evaluar


el efecto de la caída de la bolsa de valores de Lima (BVL) en las administradoras de fondos
de pensiones (AFP). En este estudio se tomó una muestra de 300 afiliados entre 25 y 35 años
en Lima seleccionados al azar. Se registraron las siguientes variables:

• AFP a la que pertenece el afiliado (1 = Futuro Sólido, 2 = Siempre Contigo, 3 = Forever)


• Monto del fondo del afiliado (en soles)
• Edad del afiliado (en años)
• Tipo de fondo según riesgo (1 = Bajo riesgo, 2 = Riesgo moderado, 3 = Alto riesgo)

a. De acuerdo con el enunciado anterior identifique la población y la muestra.


b. Identifique el tipo y escala de medición de las variables mencionadas.

5. Indique el tipo y la escala de medición de las características observadas en una muestra de


secciones de tuberías de agua.

Variable Tipo de variable Escala de medición

Diámetro de la tubería (pulgadas)

Material de la tubería

Año de instalación

Ubicación (subterránea, aérea)

Longitud de la tubería (pies)

Estabilidad del suelo circundante (inestable,


moderadamente estable o estable)

Corrosividad del suelo circundante (corrosivo


o no corrosivo)

1.4 Dato y observación


Dato: es la respuesta que se tiene, por variable, de cada unidad elemental. Los datos pueden
ser cuantitativos o numéricos y cualitativos o no numéricos.
Observación: es el conjunto de datos por unidad elemental.

Ejemplo
La siguiente base de datos contiene información de una muestra de 10 usuarios de internet de
un determinado distrito de la ciudad capital.

Principales problemas Nº de PC's Tiempo de navegación


Usuario Marca de PC
con internet con internet diaria (min)
1 HP S 1 194.00
2 Dell L 1 274.45
3 IBM S 3 104.89
4 HP V 3 125.53
5 Dell V 3 123.97
6 HP C 4 134.66
7 Otra marca B 2 256.33
8 HP O 2 195.32
9 HP B 2 121.90
10 Lenovo V 2 378.27

Principales problemas con internet


B = Baja velocidad en la señal
L = Lentitud para subir información
S = Saturación de la red
V = Lentitud para ver videos y escuchar música en línea
C = Calidad y durabilidad del modem
O = Otros

Unidad elemental: ………………………………………………………………………………………………………….………………………...

• ¿Cuántos datos tenemos por unidad elemental? …………………………….


• ¿Cuántas observaciones tengo? ………………………………………………..…….
• ¿Cuántas características estoy evaluando? ……………………………………..
• ¿Cuántos datos tengo en total? …………………………………………….………..
Un dato cuantitativo discreto: …………………………………………………………………………………………………
Una observación: ……………………………………………………………………………………………………………………..
………………………………………………………………………………………………………………………………………………….

1.5 Parámetro y estadístico


Un parámetro resume una característica de la población. Para obtener su valor se hace
necesario contar con toda la información que brindan los elementos de una población.
Un estadístico resume una característica de la muestra, para obtener su valor se utiliza la
información muestral. El valor obtenido de un estimador se conoce como estimación. Al
estimador se le llama estadígrafo o estadístico.
Algunos parámetros y estadísticos:
Nombre de la medida de
Parámetro Estadístico
resumen
N n

Promedio ∑x i ∑x i

µ= i =1
x= i =1

N n

Moda Mo mo
A a
Proporción p=
N
pˆ =
n

Ejemplo

N= 30 alumnos del curso de estadística de la sección XYZ


X= Edad (años)
Promedio = 19.7 años

¿El valor que se ha calculado corresponde a un parámetro o estadístico?


• Respuesta: …………………………………………….
• Valor del parámetro: …………………….
• Notación: ………………….

1.6 Organización de datos cualitativos


La organización se presenta a través de una tabla y de gráficos. Los elementos de la tabla de
frecuencias se describen a continuación:

Frecuencia absoluta (fi)


La frecuencia absoluta (fi) de una categoría, está dada por el número de repeticiones en las
observaciones que presenta esta categoría.
Frecuencia relativa (hi)
La frecuencia relativa (hi) de una categoría está dada por la proporción del número total de
observaciones que caen en esa categoría
Frecuencia relativa acumulada (Hi)
La frecuencia relativa acumulada de una categoría está dada por la proporción del número
total de observaciones que caen hasta esa categoría.
Elementos de toda tabla de frecuencia

Título: El título debe seguir la siguiente estructura “Distribución de (elementos) según


(variable en estudio)”
Fuente: Se refiere de donde se extrajeron los datos para posteriormente ser organizados

Ejemplo

La siguiente información muestra la distribución de una muestra de viviendas de un


determinado distrito de Lima según material con el cual fue construido.

Distribución de viviendas según material de construcción


Distribución <muestra> según <variable>
Material de construcción fi hi = fi/n pi = hi *100%
Cemento 48 0,160
Adobe 100 0,333
Quincha 108 0,360
Material prefabricado 44 0.147
Total 300 1,000
Fuente: Municipalidad distrital

• Unidad elemental: ……………………………………………………………………………………………………….


• Variable: ……………………………………………………………………………………………………………….……..
• Tipo: ……………………………………………………………………………………………………………………….…….
• Escala: …………………………………………………………………………………………………………………….…….
Interprete según el enunciado el valor de las siguientes frecuencias:

f3 = ……....

p3 = …………

Gráfico de una variable cualitativa


Para representar gráficamente la variable cualitativa se utiliza el gráfico de barras o el gráfico
de sectores circulares.
Si trabajamos con variables cualitativas nominales, las categorías pueden ser colocadas en
cualquier orden.
En el caso la variable cualitativa sea de escala ordinal las categorías deberán ser colocadas
en orden.
Para el gráfico de barras usar frecuencias absolutas o porcentuales.
Para el caso del gráfico circular sólo es posible usar las frecuencias porcentuales.
El título del gráfico es el mismo que se ha colocado a la tabla de frecuencias.
En el gráfico también se debe colocar la fuente y las etiquetas.

Ejemplo

Se tiene información para una muestra de instituciones peruanas sobre los dominios de
segundo nivel registrados bajo la categoría .pe.

Título: …………………………………………………………………….…………………………………………………..

Dominio fi Hi = fi/n pi = hi *100%


com.pe 285 0.570 57.0%
org.pe 106 0.212 21.2%
edu.pe 64 0.128 12.8%
gob.pe 26 0.052 5.2%
net.pe 3 0.006 0.6%
Otros 16 0.032 3.2%
Total 500

Interprete el valor de las siguientes frecuencias:

f2 = ……....

p2 = ……....

Ejemplo

1. La empresa “PC Review – Perú” está interesada en conocer cuál es el programa de Microsoft
Office que más utilizan los empleados de las empresas de la ciudad de Lima. Por tal motivo
se seleccionó una muestra de 500 empleados y se les pidió que indicaran el programa que
más usaba diariamente. La información se presenta a continuación:

Distribución de empleados según tipo de programa de Microsoft que usan diariamente

Tipo de programa de
Número de empleados (fi) hi = fi/n pi% = hi *100%
Microsoft
Access 50
MS Excel 101
MS Power Point 90
MS Word 113
Outlook 101
Otros 45
Total 500
Fuente: PC-Review-Perú

Complete los elementos de los siguientes gráficos:

Fuente: Municipalidad distrital

120 Categoría
Access
Ms Excel
Ms Power Point
100
Ms Word
Otros
Outlook
80

60

40

20

0
Access Ms Excel Ms Power Point Ms Word Otros Outlook

Fuente: Fuente:

2. La siguiente información muestra la distribución de una muestra de viviendas de un


determinado distrito de Lima según material con el cual fue construido.

Distribución de viviendas según tipo de material de construcción


Material de construcción fi hi
Cemento 48 0,160
Adobe 100 0,333
Quincha 108 0,360
Material prefabricado
Total 300 1,000

Interprete el valor de las siguientes frecuencias:

f2
h2(%)

El gráfico circular se presenta a continuación:

Comente

Fuente: Municipalidad distrital

Elabore el gráfico de barras para el ejercicio anterior y comente.

Gráfico de Pareto
El gráfico de Pareto es un gráfico de barras ordenado por frecuencia, en orden descendente.
También se dice, ordenado por orden de prioridad.
Permite mostrar gráficamente el principio de Pareto: “el 80% de los problemas se pueden
solucionar, si se eliminan el 20% de las causas que los originan” (pocos vitales, muchos
triviales). Por ejemplo, en control de calidad, se puede mostrar que la mayoría de los
defectos surgen de un número pequeño de causas.
Este diagrama es un caso particular de gráfico de barras y es utilizado básicamente para:
• Conocer cuál es el factor o los factores más importantes en un problema.
• Decidir el objetivo de mejora y los elementos que se deben mejorar.

Pasos para realizar el gráfico de Pareto:

• Recolectar datos y clasificarlos por categorías.


• Ordenar las categorías de mayor a menor, según la frecuencia fi, indicando el número de
veces que se ha producido.
• La categoría “Otros” debe ser colocada en la última posición, no importando cuán grande sea
esta categoría.
• Dibuje dos ejes verticales y uno horizontal. En el eje vertical derecho marque con una escala
de 0% a 100%; en el eje vertical izquierdo, marque una escala de 0 hasta el número total de
observaciones o de 0% a 100%; en el eje Horizontal, marque los espacios donde estarán
dibujadas las barras para cada una de las categorías, incluida la categoría “otros”.
• Calcular los porcentajes individuales y acumulados de cada categoría.
• Elabore el diagrama de barras y dibuje la línea de frecuencias acumuladas (curva de Pareto)
en función de los datos obtenidos anteriormente.
• Coloque título principal, título al eje X, título al eje Y primario y secundario, etiquetas y
fuente.

Ejercicios

1. La siguiente tabla muestra información sobre los defectos observados con mayor frecuencia
en los puentes vecinales construidos en estructura de madera de cierta localidad del interior
del país:
Distribución de puentes vecinales según defectos observados
Defectos observados fi
Pandeos y rajaduras 40
Pudrimiento de las piezas de madera 30
Efectos del desgaste mecánico 20
Otros 5
Deformaciones 15
Ataques de insectos y crustáceos 10
Acción de fuego 5
Fuente: Municipalidad distrital

Elabore el diagrama de Pareto para identificar qué defectos deben priorizarse en este tipo de
puentes.
2. REX S.A. es una empresa con más de 30 años en el mercado y está
dedicada a la fabricación de hornos para la elaboración de
ladrillos que requieren altas temperaturas de secado. Estos
aparatos pueden causar daños bastantes considerables a los
operarios cuando el horno no está funcionando correctamente.
Durante el último mes, el Departamento de Control de Calidad
seleccionó una muestra de 57 hornos para ser revisados.
Entre los principales problemas observados en la revisión se indicaron los siguientes:

Principal problema Número de hornos


Condensación precoz 5
Retracciones del mortero 12
Cocción de ladrillos 15
Otros 8
Caliches 9
Exfoliaciones 8

El Departamento de Control de Calidad tiene por norma priorizar los problemas que resuelvan
alrededor del 80% del total casos. Sin embargo, si estos problemas son más de tres, dicho
departamento ordenará realizar una revisión total del proceso de producción.

3. El jefe de control de calidad de la empresa “Mundo” está interesado en conocer cuáles son
las principales causas que están afectando la producción. Al seleccionar una muestra de 450
artículos fallados obtuvo los siguientes resultados:
Causas que afectan la producción Cantidad
Inestabilidad máquina 56
Cambios ambientales 191
Rotura máquina 35
Cansancio operador 11
Desgaste del equipo 3
Desviación del material 5
Fluctuación energía 9
Error de medición 10
Partida fría 8
Rotura de operador 122
Total 450

Complete el diagrama de Pareto agrupando en la categoría “Otros” a las categorías cuyos


porcentajes sean menores al 10%. Identifique las principales causas que resuelvan el 80% de los
problemas de producción.

Distribución de ………………………….…………. según ……………………………………………………………….


Causas fi hi Fi Hi
Cambios ambientales 191 0.424 191 42.4%
Rotura de operador 122 0.271 313 69.6%
Inestabilidad máquina 56 0.124 369 82.0%
Rotura máquina
Cansancio operador
Otros
Total 450 1
100.0%
450 89.8% 92.2% 100.0%

Porcentaje acumulado de artículos


400 82.0%

350 69.6% 80.0%


Número de artículos

300
60.0%
250
42.4%
200 191
40.0%
150 122
100 20.0%
56
50 35 35
11
0 0.0%
Cambios Rotura de Inestabilidad Rotura máquina Cansancio Otros
ambientales operador máquina operador

Principal causa

Fuente: ………………………………………………………………………..………

4. Metronics S. A. es una fábrica especializada en la producción


de piezas electrónicas para ensamblaje de computadoras. En
los últimos meses, el jefe de producción ha registrado
pérdidas en la producción, por ello, ha solicitado información
estadística. Una muestra aleatoria de 30 piezas defectuosas
fabricadas, a diario por el área de producción, arrojó la
siguiente información respecto al tipo de problema
observado en la pieza defectuosa.

Basado en su experiencia, el inspector de calidad determina que corrigendo a lo más el 77% de


los problemas se reducen las pérdidas en la producción. Si se llega a identificar que los
problemas a corregir son tres, entonces pasará por un nuevo proceso de evaluación de calidad
de los productos ¿La empresa será sometida nuevamente a un proceso de evaluación de
calidad?

Distribución de …………………………………………………………………………………………………………………..
Problema observado Número de piezas fabricadas
Recalentamiento 3
Corrosión 6
Rajadura 8
Deformación 9
No cumple estándar 4
Tabulaciones cruzadas
También llamadas tablas de contingencia o tablas de doble entrada. Se usan para resumir de
manera simultánea los datos de dos variables.

Ejercicio
1. Un estudio realizado por A&C Consultores sobre los tipos de riesgos asociados a las
excavaciones de zanjas y tipo de terreno, arrojó los siguientes resultados en base a una
muestra de 500 obras de construcción:

Distribución de las obras de construcción según tipo de terreno y riesgo más importante
Tipo de riesgo más importante
Tipo de
Caída de
terreno Atrapamiento Derrumbe Inundaciones Otros Total
personal
Roca blanda 27 66 51 9 25 178
Roca dura 15 53 38 3 9 118
Tierra
9 31 17 1 10 68
arcillosa
Tierra fuerte 17 55 36 10 18 136
Total 68 205 142 23 62 500
Fuente: Consultores A&C

Complete los espacios en blanco.

• El número de obras de construcción cuyo tipo de terreno son de roca dura y presentan riesgo
de derrumbe es: …………………………………………………………………………………………………………….……
• Del total de obras que presentan riesgo de atrapamiento, el ……………………..…….% son de
tierra fuerte.
• ¿Cuál es el porcentaje de obras de construcción con riesgo de inundación y roca dura? …..….

2. Uno de los requisitos que toda represa debe tener es poder conservar las condiciones de
funcionalidad y de seguridad que permita su utilización a lo largo de su vida útil, sufriendo
las menores incidencias posibles y dando cumplimiento a la legislación de seguridad y
mantenimiento vigentes. La Confiep sospecha que existe un alto porcentaje de represas de
tipo terraplén en mal y muy mal estado de conservación. De comprobarse que este
porcentaje supera el 10%, la represa será declarada en emergencia. La información de la
tabla fue obtenida al término de la inspección de las represas.

Estado de conservación
Tipo de represa
Bueno Regular Malo Muy Malo Total
Cimiento 16 17 12 12 57
Excavación 5 8 5 11 29
Terraplén 7 9 13 5 34
Total 28 34 30 28 120
Fuente: Andino S.A.
a. Identifique las variables en estudio e indique su tipo y escala de medida
b. Identifique la unidad elemental

c. Coloque título a la tabla

d. Interprete el valor de la celda sombreada con respecto al total de fila, columna y gran total.

Gráfico de barras agrupadas


Un gráfico de barras agrupadas muestra todas las series en una sola barra por cada categoría.
El alto de cada barra es proporcional a la frecuencia de cada categoría.
Gráfico de barras apiladas

Un gráfico de barras apiladas muestra todas las series apiladas en una sola barra para cada
categoría. El alto de cada barra es proporcional a la frecuencia de cada categoría.

Gráfico de barras apiladas al 100%

Un gráfico de barras apiladas 100% muestra todas las series apiladas en una sola barra para
cada categoría. El alto de cada barra es el mismo para cada categoría.

Ejercicio
A continuación, se muestra la información de una tabla de contingencia y un gráfico incompleto
para las variables lugar de destino y nacionalidad.

Distribución de pasajeros según su lugar de destino y nacionalidad


Nacionalidad
Lugar de destino Total
Peruana Extranjero
Arequipa 8 8 16
Cuzco 15 20 35
Miami 20 10 30
México D.F 22 10 32
Piura 2 7 9
Río de Janeiro 23 5 28
Total 90 60 150
Fuente: Wayra S.A

Complete los elementos faltantes del siguiente gráfico.

100%
90% 17.9%
33.3% 31.3%
80%
50.0%
70%
60% 77.8%
50% Extranjero
40%
Peruana
30%
20%
10%
0%
Arequipa Cuzco Miami México D.F Piura Río de
Janeiro

Interprete

Elabore el gráfico porcentual para la siguiente tabla cruzada e interprete.


Distribución de pasajeros según su lugar de destino y nacionalidad

18%
16%
14%
12%
10%
Peruano
8%
Extranjero
6%
4%
2%
0%
Arequipa Cuzco Miami México D.F Piura Río de
Janeiro

Interprete

Complete todos los elementos del siguiente gráfico.

100%
90% 25.6%
80% Río de Janeiro
70% 2.2%
24.4% Piura
60%
50% México D.F
40% Miami
22.2%
30%
Cuzco
20% 16.7%
10% Arequipa
8.9% 13.3%
0%
Peruana Extranjero

Interprete
Ejercicios propuestos

1. La empresa “PC Review Perú” realizó un estudio a una muestra a 500 directores de
empresas de la ciudad de Lima. Los resultados obtenidos a la pregunta ¿cuál de los
programas de Office usaba con mayor frecuencia? se resumen a continuación:

Programa de Microsoft de uso más Cantidad de directores de


frecuente empresas
Access 30
MS Excel 80
MS Power Point 75
MS Word 250
Outlook 55
Otros 10
Total 500

Construya el diagrama de barras y sector circular para la información anterior.

2. La siguiente tabla muestra la distribución de clientes de la empresa de telefonía según sus


principales quejas.

Distribución de clientes según principales quejas

Principales Quejas Frecuencia hi Fi Hi


Cambios sin consentimiento 246
Tarifas y servicios 106
Forzamiento al cambio 29
Marketing 74
Llamadas internacionales 14.5
Maltratos 12.5
Servicio de operadora 18

Construya el diagrama de Pareto para la variable en estudio. Considere un acumulado de


menos de 8% para la categoría Otros. ¿Cuáles son las quejas que deberán priorizarse?

3. En la siguiente tabla se muestran los resultados obtenidos en un estudio realizado en la


ciudad de Ica por un grupo de profesionales de la UPC de la facultad de Ingeniería sobre las
fallas estructurales en las edificaciones debido al último sismo que tuvo como epicentro la
ciudad de Nazca.

Fallas estructurales Porcentaje


Columnas cortas 10%
Configuración del edificio 45%
Problemas geotécnicos 30%
Otros 10%
Piso blando 5%

Construya un diagrama de Pareto para identificar las fallas estructurales que tienen mayor
incidencia en las edificaciones en la ciudad de Ica debido al último sismo mencionado.

4. A una muestra de 95 hombres y 155 mujeres se formuló la siguiente pregunta: ¿Por qué
usa el servicio de taxi mediante una aplicación? Los resultados obtenidos se muestran en
los siguientes gráficos:
Gráfico 2 Gráfico 3
1.0 100%
0.9
0.32 0.36 80%
0.8
59% 65%
0.7 D
60% Masculino
0.6 A
0.15 Reunión Femenino
0.5 Estudio 40%
0.4 Trabajo
20% C E
0.3 33%
0.56
B
0.2 0%
0.1 Trabajo Estudio Reunión
0.0
Masculino Femenino

a. Indique la unidad elemental


b. Identifique las variables e indique sus escalas de medida
c. Indique el título del gráfico 2 y el título del gráfico 3
d. Complete los elementos faltantes de los gráficos 2 y 3.
e. Del total de encuestados que usan la aplicación de taxi por trabajo, ¿cuántos son mujeres?
f. Del total de hombres, ¿cuántos prefieren usar el servicio de taxi por reuniones?
5. Corporación Industrial Aceros Metálica S.A. se
dedica a la fabricación de hierro esponja,
palanquillas de acero, barras helicoidales,
alambrón de construcción y aceros calibrados. El
jefe de Control de Calidad desea realizar un control
a las barras de construcción, para ello toma una
muestra aleatoria de 80 barras y analiza el límite
de fluencia y el uso de las barras de construcción. La variable límite de fluencia se ha
categorizado tal como se muestra en la tabla:

Del análisis de las variables se ha obtenido el siguiente gráfico:

100%
90%
% de barras de construcción

80% 36% 40%


40%
70% Regular
60%
Baja
50% 28% 24%
30% Alta
40%
30% Al límite
16% 20%
20% 20%
10% 20% 16%
10%
0%
Cimentación Columnas Vigas

Utilización de las barras


Fuente: Aceros Metálica S.A.

a. Coloque el título apropiado al gráfico.


b. Interprete el valor 36%
c. Del total de barras de construcción fabricadas utilizadas en cimentación, el 36% de ellas
tienen un límite de fluencia regular.
d. Si se seleccionaron 30 barras de construcción que fueron utilizadas en columnas, ¿En cuántas
de ellas su límite de fluencia fue clasificada como regular?

1.7 Organización de datos cuantitativos discretos


La variable cuantitativa discreta, además de presentar las frecuencias absolutas y relativas,
presenta dos frecuencias acumuladas. La frecuencia acumulada absoluta representada por Fi y
la frecuencia acumulada relativa representada por Hi.

Tabla de distribución de frecuencias

Frecuencia acumulada (Fi)


Representa el número de observaciones que caen hasta esa categoría.
Título
Variable fi hi Fi Hi
0 f1 h1 F1 H1
1 f2 h2 F2 H2
2 f3 h3 F3 H3
. . . . .
k fk hk n 1
Total n 1
Fuente: ………………………………..………………………………….…..

Gráfico de bastones o líneas


Es un gráfico para variable cuantitativa discreta donde se representan los valores de la
variable y sus respectivas frecuencias absolutas, relativas o porcentuales.

Ejemplo

Distribución de empleados según número de capacitaciones

En base al siguiente gráfico identifique:


a. La unidad elemental: ……………………………………………………………………………………….….…….…………
b. La variable en estudio: …………………………………………………………………………….……………….…..……..
c. Interprete el gráfico: ……………………………………………………………………………………………………….……
……………………………………………………………………………………………………………………………………………….…

Ejercicios
1. El jefe de Recursos Humanos desea información de la cantidad de faltas que han tenido los
trabajadores en el mes anterior. Por tal razón, seleccionó al azar a 30 trabajadores y registró
el número de faltas.

0 0 0 0 1 1 1 1 1 1 1 1 2 2 2
2 2 2 2 2 2 2 3 3 3 3 3 3 4 4

a. Con la información anterior, complete:

• La variable en estudio es …………………………………………………………………………………………………


• La unidad elemental es …………………………………………………………………………………………………..

Título: ……………………………………………………………………………………………………………………………

Número de faltas fi hi Fi Hi
0 4 4
1 8 12
2 10 22
3 28
4 30
Total
Fuente: ………………………………………….………..

b. Complete la tabla y llene los espacios en blanco:

• El porcentaje de trabajadores que asisten es: ____________________________________


• El número de trabajadores que tienen a lo más dos faltas es: _______________________
• Los trabajadores con problemas son aquellos con 3 o más faltas, ¿qué porcentaje de
trabajadores tienen problemas? ______________________________________________
• Interprete la primera frecuencia absoluta: ______________________________________
_________________________________________________________________________
• Interprete la tercera frecuencia relativa: ________________________________________
_________________________________________________________________________
• Interprete la cuarta frecuencia acumulada absoluta: ______________________________
_________________________________________________________________________

c. Presente el gráfico adecuado para la variable en estudio. Interprete.


Interpretación

2. La siguiente información muestra el número de ladrillos defectuosos fabricados


diariamente en una de las plantas de la empresa Rex S.A. Se tomó una muestra aleatoria
de 50 días mostrándose los resultados a continuación:

Distribución de días según número de ladrillos defectuosos


N° ladrillos defectuosos fi hi Fi Hi
0 12
1 0.32
2 0.10
3 9
4 8 0.16
Total 50 1.00
Fuente: Ladrillera Rex

Si se encuentra al menos un ladrillo defectuoso, en más de 40 días, el Gerente de Rex S.A deberá
revisar su sistema de fabricación. ¿Se deberá revisar el sistema?

1.8 Organización de datos cuantitativos continuos


Pasos para elaborar la tabla de distribución de frecuencias
• Obtener el rango (R) o recorrido: R = dato máximo – dato mínimo
• Calcular el número de intervalos k = 1+ 3.322 log10 n . (redondeado al entero más próximo).
• Calcular la amplitud del intervalo w = R/k. (redondeado por exceso y con el mismo número
de cifras decimales que tienen los datos).
• Obtenga las frecuencias absolutas y relativas con sus respectivas frecuencias acumuladas.
• Obtenga la marca de clase a través de la siguiente fórmula: Lím Inf i + Lím Sup i
xi/ =
2

Ejercicios
1. Se ha llevado a cabo un estudio para evaluar el tiempo, en horas, que utiliza cada trabajador
de una planta hidroeléctrica para verificar el normal funcionamiento de la tubería de
presión y las válvulas de control. Para ello se eligieron al azar 30 de ellos.

0.08 0.15 0.19 0.71 0.75 0.82 0.84 0.92 0.96 1.16 1.17 1.19 1.23 1.4 1.47
1.59 1.61 2.01 2.16 2.38 2.42 3.07 3.22 3.53 3.76 3.94 4.5 4.59 4.75 5.41

Elemento: ………………………………………………………………………………………………………………………….
X = …………………………………………………………………………………………………………………………..….………
Tipo y escala: ……………………………………………………………………………………………………………………..

 Calcule el rango (R) o recorrido


R = ………………
 Determine el número de intervalos (k)
k = …………………………………………………….
 Determine el tamaño del intervalo de clase (w)
w = ………………..  w= …………………..

Título: ………………………………………………………………………………………………………..………………..

i Intervalo x’i fi hi Fi Hi
1 –
2 –
3 –
4 –
5 –
6 –

Fuente: ………………………………………………………………………..…

Interprete los valores de las siguientes frecuencias:

f2

h2 (%)

F4

H4 (%)

2. Use la regla de Sturges para construir la tabla de distribución de frecuencias del monto de
venta diario, en cientos de soles, de la empresa Beta Systems S.A.

52.0 94.7 95.1 97.5 102.5 104.1 106.0 125.2 125.6 146.0
146.8 158.6 158.7 162.6 166.2 166.2 166.2 166.2 168.2 169.7
196.0 204.9 204.9 204.9 204.9 208.3 215.2 217.5 218.1 218.1
218.1 218.1 220.9 226.2 235.0 239.7 242.2 259.6 261.6 277.2
286.5 287.0 297.8 313.9 315.0 316.2 338.6 359.9 363.1 398.3

Variable en estudio

Elemento

Cálculos

Título: ………………………………………………………………………………………………………………………………
Lim Inf Lim Sup x´i fi hi Fi Hi
Fuente: ……………………………………………………………………………

Interprete los valores de las siguientes frecuencias:

f2

h3 (%)

F4

H2 (%)

Gráficos de una variable cuantitativa continua

Son gráficas que representan las observaciones obtenidas de la variable cuantitativa continua.

HISTOGRAMA

Es una gráfica de barras cuyos valores del


eje X son los intervalos de clase. Además,
la altura de las barras está determinada
por las frecuencias relativas de los
intervalos de clase. Según el interés del
estudio se pueden considerar también,
las frecuencias absolutas.
POLÍGONO

Es una gráfica donde los valores del eje X


son las marcas de clase. Para cerrar el
polígono se debe aplicar el siguiente
artificio: Restar a la primera marca de
clase el valor de la amplitud y sumar a la
última marca de clase el valor de la
amplitud. Según el interés del estudio se
pueden considerar también, las
frecuencias absolutas.

OJIVA

Es una gráfica donde los valores del eje X


son los límites superiores. Es una gráfica
creciente a la que debe aplicarse el
siguiente artificio: El primer valor del eje
X es el dato más pequeño del conjunto
de datos o valor mínimo o valor del
primer límite inferior. Según el interés
del estudio se pueden considerar
también, las frecuencias absolutas.

Ejercicios propuestos

1. Investigadores del Massachussets Institute of Technology (MIT) estudiaron las propiedades


espectroscópicas de asteroides de la franja principal, con un diámetro menor a los 100
kilómetros. Los asteroides se observaron con el telescopio Hiltner del observatorio de MIT;
se registró el número de exposiciones de imagen espectral independiente para cada
observación. Aquí se presentan los datos de 40 observaciones de asteroides obtenidas de
Science).

Número de exposiciones de imagen espectral independientes para 40 observaciones


de asteroides
3 4 3 3 1 4 1 3 2 3
1 1 4 2 3 3 2 6 1 1
3 3 2 2 2 2 1 3 2 1
6 3 1 2 2 3 2 2 4 2

Construir un gráfico de bastones para el número de exposiciones de imagen espectral.


2. En la producción de las piezas electrónicas, el tiempo de fabricación es muy importante, de
tal manera que el jefe de producción debería calibrar su maquinaria si verifica que hay por
lo menos 30% de piezas electrónicas cuyo tiempo de fabricación es más de 10,55 minutos.
¿Deberá el jefe de producción calibrar su maquinaria? Se cuenta con la siguiente
información del tiempo de fabricación en una muestra de 30 piezas electrónicas.

Distribución de piezas electrónicas según tiempo de fabricación

Tiempo de fabricación X´i fi hi Fi Hi


4,71 0,100
7,63 2
8
5 0,167
11,28 7

30
Fuente: Metronics S.A.

3. Corporación Domar S.A.C. es una empresa peruana ubicada


en la ciudad de Lima con más de ocho años de experiencia
en el sector Industrial. La empresa ejecuta proyectos de
instalación de sistemas mecánicos y electrónicos, además
brinda un servicio industrial de mantenimiento
especializado de maquinarias y laboratorios en todas las
especialidades de ingeniería. Debido a las expectativas de las utilidades del último
trimestre, la meta del gerente del área de servicios es que por lo menos el 40% de servicios
tengan precios netos por el servicio mayores a s/ 33 900.00. De llegar a cumplir la meta, el
gerente será reconocido con una bonificación por parte del directorio. ¿Cuál será la decisión
del directorio? Los registros del último trimestre se presentan a continuación:

N° de Número de Precio neto del servicio


Tipo de servicio
servicio ingenieros (en miles de soles)
1 5 23.3 Mantenimiento preventivo
2 4 27.5 Instalación de laboratorios
3 7 23 Mantenimiento preventivo
4 3 28.1 Mantenimiento correctivo
5 4 34.5 Instalación de laboratorios
6 7 38.4 Instalación de máquinas industriales
7 5 28.1 Mantenimiento correctivo
8 5 30.7 Instalación de laboratorios
9 3 31.9 Mantenimiento correctivo
10 3 30.7 Mantenimiento preventivo
11 3 26.5 Mantenimiento preventivo
12 4 36.9 Instalación de máquinas industriales
13 6 30.7 Instalación de laboratorios
14 3 29 Instalación de máquinas industriales
15 3 38.1 Mantenimiento correctivo
16 5 31.2 Instalación de laboratorios
17 4 35.8 Instalación de laboratorios
18 7 34 Instalación de máquinas industriales
19 5 35 Mantenimiento correctivo
20 3 28 Mantenimiento correctivo
21 6 31.2 Instalación de máquinas industriales
22 5 28.2 Mantenimiento preventivo

1.9 Métodos numéricos para describir datos cuantitativos


1.9.1 Definiciones
Parámetro
Es una medida de resumen que caracteriza a la población. Para obtener su valor se hace
necesario contar con toda la información que brinda los elementos de una población. Por
ejemplo, el promedio poblacional (µ), varianza poblacional (σ2).
Estadístico
Es una medida de resumen que caracteriza a la muestra. Para obtener su valor se utiliza la
información muestral. A los valores obtenidos de un estimador se conoce como estimación.
Por ejemplo: el promedio muestral (𝑥𝑥̅ ), varianza muestral (s2).
Los parámetros y estadísticos de mayor uso son:

Nombre Parámetro Estadístico


N n

Promedio ∑X i ∑X i
μ= i =1
X= i =1
N n
N

Varianza ∑ (X i − μ) 2
2
∑𝑛𝑛𝑖𝑖=1�𝑋𝑋𝑖𝑖 − 𝑋𝑋�
2

σ2 = i =1 𝑠𝑠 =
n-1
N

Desviación estándar σ s

Nº de éxitos Nº de éxitos
Proporción p= p̂ =
N n

1.9.2 Medidas de tendencia central

Son aquellas que localizan el “centro” de una distribución, indicando el valor alrededor del
cual tienden a concentrarse ó distribuirse las demás observaciones. Lo que se persigue es
conseguir un valor que sea representativo del conjunto de datos que se está analizando.

Media aritmética (promedio)


La media llamada también promedio, se define como el cociente de la suma de los valores
observados de la variable en estudio y el número de observaciones.
Características de la media
• Es un estadístico o parámetro muy conocido y de fácil comprensión.
• Se puede calcular para variables de escala intervalo o razón.
• La mayor desventaja es que se ve afectado por valores extremos, es decir si hay valores muy
pequeños o grandes, la media no los representaría adecuadamente.

∑x i
Para datos simples (no agrupados) se calcula por x= i =1

n
k

∑fx i i
Para datos discretos (agrupados) se calcula por x= i =1

n
k

∑fx i i
/

Para datos continuos (agrupados) se calcula por x= i =1

Ejemplo

Los siguientes datos son medidas de la resistencia al rompimiento (en onzas) de una muestra
de hilos de lino:

15,2 15,8 16,2 18,5 19,4 20,6 21,2 21,9 25,4 27,3 28,3 29,5 32,5 33,7 36,9
n

∑x i
(15,2 + 15,8 + 16,2 + ... + 32,5 + 33,7 + 36,9)
x= i =1
= x= = 24,16
n 15
Interpretación: La resistencia promedio al rompimiento de los hilos es de 24,16 onzas.

Ejercicio

1. Calcule e interprete la media para el número de hijos obtenida a partir de una muestra de 35
familias.

Número de hijos fi
0 13
1 6
2 8
3 6
4 2

2. Calcule el tiempo promedio de verificación, en horas, para una muestra de trabajadores e


interprete.

Intervalos fi x’i
0.02 - 0.81 6
0.81 - 1.60 13
1.60 - 2.39 4
2.39 - 3.18 3
3.18 - 3.97 2
3.97 - 4.76 2
Mediana
Es el valor que ocupa el lugar central de un conjunto de datos ordenados. Por tanto, es el valor
que divide en dos partes a dicho conjunto de datos.

Características de la mediana
• Se puede calcular para variables medidas en escala intervalo o razón.
• La mediana no se ve afectada por valores “extremos” (mínimo y máximo).
• Fórmula para datos no agrupados:

Si denotamos las observaciones ordenadas por x1, x2, x3, ... , xn , la mediana pude representarse
por:

me = x n +1 Si n es impar
2

x n +x n Es el promedio de los datos que se


+1
me = 2 2
Si n es par encuentran en la posición: [n/2] y [(n/2)+1]
2
Ejemplo

Los datos corresponden a una muestra de baterías cuyas lecturas de voltaje (en voltios) son:

9.84 9.96 9.98 9.99 10.00 10.00 10.05 10.12 10.26 25.00

Calcule e interprete el valor de la mediana.

x n +x n
+1 x 5 +x 6
Me = 2 2
= = 10
2 2

Interpretación: El 50% de las baterías tienen una lectura máxima de 10 voltios

Ejercicio
Los siguientes datos corresponden a la distribución del número de piezas defectuosas
producidas en una muestra de 150 días. Calcule e interprete el valor de la mediana.

Número de piezas de defectuosas Número de días Fi


0 50
1 60
2 25
3 10
4 5
Moda
La moda de un conjunto de datos es aquel valor que se repite con mayor frecuencia.

Características de la moda
• La moda se puede calcular para cualquier escala de medición.
• El valor de la moda no se ve afectada por valores extremos.
• La moda no siempre es un valor único.
• Un conjunto de datos puede tener dos modas (bimodal) o más de dos modas (multimodal o
polimodal).
• Se puede dar el caso de que el conjunto de datos no tenga moda.

Ejemplo
Los siguientes datos corresponden a una muestra de baterías cuyas lecturas de voltaje se
presentan a continuación:

9,84 9,98 9,98 9,99 10,00 10,00 10,05 10,12 10,26 25,00

Moda = 10

Interpretación: La lectura de voltaje más frecuente es de 10 voltios.

Ejercicio

Renacer S.A fabrica Hornos de Microondas, encargo al jefe de control de calidad que informe
cual es el problema más frecuente encontrado en los hornos microondas. Se tomó una muestra
del área de reparaciones y estos fueron los resultados:

Problemas Número de hornos


De capacidad de descongelación 6
Velocidad de calentamiento 14
Cable de alimentación 3
Fuga de la microondas 8
Frecuencia de la microondas (MHz) 9
Potencia de microondas (W) 10

Con la información presentada, ¿qué problema se presenta con mayor frecuencia?


1.9.3 Medidas de posición o Cuantiles

Se define así a un número real que divide a un conjunto de datos en dos partes con porcentajes
especificados debajo y sobre este valor. Para su cálculo, los datos deben estar previamente
ordenados.

Cuartil (Q)
Divide al conjunto de datos en 4 partes porcentualmente iguales. Se denotan Q1, Q2 y Q3 que
son los correspondientes percentiles P25 , P50 y P75 .

Decil (D)
Divide al conjunto de datos en 10 partes porcentualmente iguales, hay nueve deciles D1, D2,
…, D9 que son los correspondientes percentiles P10 , P20 , .., y P90 .

Percentil (P)
Divide un conjunto de datos en 100 partes porcentualmente iguales. Dado un percentil Pk,
este divide el conjunto de datos en dos partes, la inferior que contiene el K% de datos y la
superior que contiene el (100-k)% de datos.

K% (100-K)%

P
K

Para datos no agrupados:

Primero debe ordenarse los datos en orden creciente o decreciente. Luego, para hallar el
percentil Pk se sugiere los siguientes pasos:

• Calcular el valor de la posición que ocupa el percentil Pk en la lista k (n + 1)


i= = E, d
de datos ordenados que está determinada por la siguiente 100
expresión:

• Luego,
Pk = X ( E ) + 0, d * ( X ( E +1) − X ( E ) )
Donde: E : parte entera y d : parte decimal

Ejercicio

1. Suponga que los promedios ponderados de una muestra de 12 ingenieros civiles egresados
se muestran a continuación:

14.5 15.5 15.5 16.2 16.2 16.5 16.5 17.0 17.1 17.3 17.5 17.6

a. Calcule e interprete el valor del D4

b. Si se desea contratar a un egresado que pertenezca al quinto superior, ¿Qué percentil debe
calcular y cuál es la nota mínima que debería de tener?

2. Una muestra de 30 trabajadores de una plataforma petrolera marina formó parte de un


ejercicio de escape del área. Para ello se registraron los siguientes tiempos, en minutos,
empleados en la evacuación.

31.5 32.5 32.5 33.4 33.9 34.0 35.6 35.6 35.9 35.9
36.3 36.4 36.9 37.0 37.3 37.3 37.4 37.5 38.0 38.9
39.2 39.3 39.4 39.7 40.2 40.3 41.5 42.4 42.8 44.5

a. ¿Cuál es el tiempo mínimo registrado por el 18% de trabajadores que emplearon más tiempo
en la evacuación de la plataforma?
b. ¿Cuál es tiempo máximo empleado por el 28% de trabajadores que emplearon menos tiempo
en la evacuación de la plataforma?

3. Investigadores del Massachussets Institute of Technology (MIT) realizaron, 9 de abril de


1993, un estudio sobre asteroides. Al observar 40 de estos asteroides con el telescopio
Hiltner del observatorio de MIT; se registró el número de exposiciones de imagen espectral.

Número de exposiciones de imagen espectral


1 1 1 1 1 1 1 1 1 2
2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3
3 3 3 3 4 4 4 4 6 6
Elabore la Tabla de frecuencia

Título: ………………………………………………………………………………………………………………………..
Número de exposiciones fi hi Fi Hi
1
2
3
4
6
Total

a. El mínimo número de exposiciones obtenidos en el 15% de los asteroides con mayores


exposiciones es: ________________que corresponde al percentil ___________________

b. Se desea categorizar a los asteroides según su número de exposiciones en categorías baja,


media y alta ¿Cuáles serán los límites de este si la categoría media contiene al 50% central
de la cantidad de asteroides?
1.9.4 Medidas de variación o dispersión

Son aquellas que cuantifican que tan dispersos o concentrados se encuentran los datos respecto
de una medida de tendencia central. Los datos que están relativamente cercanos entre sí,
tienen bajas medidas de variabilidad, mientras que los que están más alejados entre sí tienen
medidas de variación más grandes.

Varianza
Es una medida del grado de dispersión o variación de los valores de una variable con
respecto a su media aritmética.
Las unidades en las que queda expresada la varianza son unidades al cuadrado. Esta medida
no tiene interpretación.
La varianza de una muestra se denota por s2, mientras que la de una población se denota
por σ 2

Varianza poblacional
N

∑ (x − µ)
2
i
σ2 = i =1

N
Varianza muestral para datos simples

∑ (x − x)
2
i
s2 = i =1

n −1

Varianza muestral para datos agrupados discretos y continuos

k 2 k 2

2
∑ f (x − x)
i i
2
∑ f (x i i
/
− x)
s = i =1
s = i =1

n −1 n −1

Desviación estándar
La desviación estándar es la raíz cuadrada positiva de la varianza
Se denota por s cuando es calculada de una muestra y por σ cuando es poblacional.
Nota: Para calcular la varianza y desviación estándar usaremos su
calculadora científica.
Video: https://www.youtube.com/watch?v=Ds4vXpZ5jOw

Ejemplo

Calcule la varianza y la desviación estándar para la cantidad de plomo en una muestra de agua
potable en miligramos por litro.

35 73 30 15 36 60 47 19 15 38 10 35 31 21 22 20

• Varianza: ______
• Desviación estándar: _______
Ejercicio

1. Calcule la varianza y desviación estándar del número de accidentes automovilísticos en una


muestra de 100 días:

Nro de accidentes
0 1 2 3 4
automovilísticos
fi 10 15 30 35 10

2. Calcule la varianza y desviación estándar de los tiempos de exposición, en minutos, de un


metal a una sustancia química. Los resultados de una muestra de 66 reacciones son las
siguientes:
Intervalos fi xli
[15.2 – 17.2[ 12
[17.2 – 19.2[ 13
[19.2 – 21.2[ 20
[21.2 – 23.2[ 16
[23.2 – 25.2] 5
Total 66

Calcule la varianza y desviación estándar.


Coeficiente de variación
Es una medida de dispersión relativa libre de unidades por lo que es útil para comparar la
variabilidad de dos o más grupos de datos expresados en distintas unidades de medida o
cuando los promedios de los conjuntos de datos a comparar son diferentes.
El coeficiente de variación proporciona una estimación de la magnitud de las desviaciones
con respecto a la magnitud de la media.
s
CV= ×100%
x
Ejemplo

A continuación, se presentan los tiempos de transmisión de un archivo, en segundos, evaluados


en empresas que adoptaron la Tecnología WAN y la Tecnología LAN bajo condiciones similares.

Tecnología LAN Frecuencia


108 111 3
111 114 35
114 117 66
117 120 57
120 123 29
123 126 16

Tecnología
138 126 125 124 119 119 137 110 119 155 123 124 126 126 129
WAN

Determine para qué tipo de Tecnología utilizada los tiempos de transmisión de datos son más
homogéneos. Justifique numéricamente su respuesta.

Tecnología WAN Tecnología LAN

s=
s = 10,45
x = 126,67 x=
cv = 8,25%
cv =
Interpretación: La tecnología que presenta los tiempos de transmisión de datos más
homogéneos es …………………………………………………………………………………………………………………
Ejercicio

1. La empresa Electro, dedicada a la venta de artefactos electrónicos para el hogar, opera 200
tiendas en diferentes lugares del país. Los últimos informes indican que las ventas
mensuales han descendido a tal punto que se han tenido que cerrar algunas tiendas. El
gerente, con el fin de enfrentar el problema, ha determinado que es necesario un estudio
estadístico de las ventas semanales (en miles de soles) de un producto electrónico en tres
de sus principales tiendas: Aptao, Azufral y Brento. Las muestras tomadas al azar de cada
tienda arrojaron los siguientes resultados:

Número de Número de
Ventas Aptao Ventas Brento
semanas semanas
100 – 200 5 20 2
200 – 300 14 40 8
300 – 400 21 60 25
400 – 500 7 80 20
500 – 600 3 100 8
Total 50 Total 63

Ventas Azufral 120 200 100 50 45 120 100 100 90 75 100 210 100 50 120

a. Calcule la media y la varianza de las ventas en Azufral, Aptao y en Brento.

b. Determine en cuál de las tiendas las ventas realizadas son más homogéneas. Justifique
numéricamente su respuesta.

2. En el medio local hay dos plantas (Planta 1 y Planta 2) que se dedican a la fabricación de
barras de acero para la construcción. Las empresas proveedoras de barras de acero para la
construcción, que abastecen al mercado constructor, desean averiguar acerca de la
resistencia media a la tracción y la desviación estándar, para ello, se tomaron muestras
aleatorias en ambas plantas y la información registrada acerca de la resistencia a la tracción
(en Kg/cm2) se muestra en las siguientes tablas:

Resistencia a la tracción (Planta 1) fi


69.220 – 70.436 14
70.436 – 71.652 5
71.652 – 72.868 6
72.868 – 74.084 8
74.084 – 75.300 7
75.300 – 76.516 17
76.516 – 77.732 5
Total 62

Estadísticas descriptivas: Resistencia a la tracción: Planta 2

Variable n Media Desv.Est. Varianza Mínimo Máximo


Tracción 62 64.52 2.983 8.899 61.220 69.856

Realice el análisis adecuado para la dispersión y responda ¿qué planta es más heterogénea en
las resistencias a la tracción? Sustente su respuesta estadísticamente.

3. Las represas constituyen una de las principales causas directas e indirectas de


contaminación ambiental. Una de estas causas es la filtración de sustancias contaminantes
originando el debilitamiento de la densidad de la superficie en la cual está construida la
represa. Los resultados que Andino S.A. obtuvo sobre las densidades de los terrenos en
represas calificadas con impacto ambiental regular y en represas con impacto ambiental
fuerte se presentan a continuación:

Densidad del terreno en represas con impacto ambiental regular


15,2 20,7 16,6 22,7 35,6
17,1 25,2 26,6 10.4 23,6
Para que una represa siga funcionando, la Confiep establece el cumplimiento de dos
condiciones:

• Condición 1: La densidad promedio del terreno con impacto ambiental (regular o fuerte)
donde se ubica la represa debe ser por lo menos 17,5 gr/cm3 para que ésta no se derrumbe.
• Condición 2: La densidad del terreno donde se ubica la represa con impacto ambiental
(regular o fuerte) debe tener una variabilidad relativa de a lo más 34%.
Verifique las condiciones de tal manera que pueda presentar un informe que ayude a identificar
qué tipo de represa (con impacto ambiental fuerte o regular) está habilitada para su normal
funcionamiento.

4. En una reciente entrevista, el presidente de la Confederación Nacional de Instituciones


Empresariales Privadas (Confiep), sostuvo que, en el país, y a largo plazo, la mejor forma de
prevenir los desastres naturales es la construcción de represas y reservorios.
Debido a la previsión de falta de agua, la Confiep ha encargado realizar un nuevo estudio
de prefactibilidad a cargo de profesionales de ingeniería civil, en zonas cercanas a los ríos
de la costa norte del país, Tumbes, Piura, y Lambayeque, para decidir la construcción de
una represa.
La información recogida se presenta a continuación:
Zonas Tipo de estructura ríos caudal del río (m3/segundo)
1 cimientos Tumbes 13.3
2 cimientos Tumbes 20.9
3 cimientos Tumbes 35.7
4 cimientos Tumbes 41.9
5 cimientos Tumbes 42.2
6 cimientos Tumbes 48
7 cimientos Tumbes 49.7
8 cimientos Tumbes 52.4
9 cimientos Tumbes 52.4
10 cimientos Tumbes 56.3
11 cimientos Tumbes 62.5
12 cimientos Piura 38.1
13 cimientos Piura 40.3
14 cimientos Piura 49.8
15 excavaciones Piura 56.2
16 excavaciones Piura 57.2
17 excavaciones Piura 61.3
18 excavaciones Piura 61.3
19 excavaciones Piura 71.1
20 excavaciones Piura 77.5
21 excavaciones Lambayeque 34.4
22 excavaciones Lambayeque 42.8
23 excavaciones Lambayeque 42.8
24 terraplenes Lambayeque 44.5
25 terraplenes Lambayeque 48.1
26 terraplenes Lambayeque 49.4
27 terraplenes Lambayeque 54.3
28 terraplenes Lambayeque 56.1
29 terraplenes Lambayeque 61.4
30 terraplenes Lambayeque 65.7

a. Según los especialistas un punto muy importante a considerar al momento de diseñar la


ubicación de las represas es evaluar el caudal (m3/segundo) en cada uno de los ríos (Tumbes,
Piura y Lambayeque), porque si el caudal es muy bajo la represa no almacenaría la cantidad
de agua esperada para su posterior distribución. Por ello, el gerente de la empresa decidirá
construir la represa en aquella zona, que concentre los caudales del río en los valores más
altos. Según los resultados, ¿Cuál sería la recomendación de ustedes al gerente de la
empresa?

b. Ingenieros especialistas indicaron, que se debe realizar la construcción de la represa en


aquella zona que presente menor variabilidad posible en el caudal del río. Según la
información analizada, ¿en cuál de los ríos es más propicia la construcción de la represa?
1.9.5 Coeficiente de asimetría de Pearson (Forma de la distribución de un
conjunto de datos)
Mide si los datos aparecen ubicados simétricamente o no respecto de la media.

Cálculo del coeficiente de asimetría de Pearson


El coeficiente de asimetría para datos simples o agrupados se calcula con la siguiente fórmula:

 x − Mediana 
As = 3 
 s 

Si el coeficiente de simetría As es:

asimétrica positiva simétrica asimétrica negativa

Ejercicio

Complete los siguientes textos:

• Si un grupo de datos tiene un coeficiente de asimetría negativo, esto significa que hay una
concentración de datos en los valores ………………………………………………………………..………………………………

• Si un grupo de datos tiene un coeficiente de asimetría positivo, esto significa que hay una
concentración de datos en los valores ……………………………………………………………………..…………………………
• En un país como el Perú, los sueldos de las personas seguramente tienen un coeficiente de asimetría
……………………………………………….………..…….., porque ………………………………..…………………………………………

• En un examen de Estadística, los tiempos que toman los alumnos en resolverlo seguramente tienen
un coeficiente de asimetría …………………………………….., porque ……………………………………………………………

Ejercicio

1. COMASA S.A. es una empresa que produce artículos pesados de acero y dispone de un
equipo especializado de operarios que se capacitan constantemente. El último año se ha
observado un aumento en el número de accidentes, incrementándose así el costo de
atención inmediata. Con el propósito de implementar estrategias de prevención de
accidentes, se analizarán los costos de la planta de producción de Lima Sur. A continuación,
se presenta la información, en miles de soles:

8 9 10 11 11 12 12 13 13 13 13 14
14 15 15 16 17 17 18 18 19 19 20 21
22 23 24 25 25 26 27 28 28 29 30

a. ¿Qué forma presenta la distribución de esta variable? Presente la gráfica.

b. Analizando la forma de la distribución, ¿es preocupante para la empresa? Sustente su


respuesta.
2. COVISA, empresa de construcción civil, compra actualmente los ladrillos al proveedor FAX
S.A. Para continuar con el proveedor o cambiarlo, ha decidido realizar un análisis de la
resistencia transversal de los ladrillos, en Mn/m2. A continuación se presentan los resultados
de una muestra de 40 ladrillos fabricados por el proveedor:

3 4 4 4 5 5 6 6 6 7
8 8 8 8 8 9 9 9 10 11
11 11 11 11 11 12 12 12 12 13
13 13 14 15 15 17 17 18 19 20

¿Qué forma presenta la distribución de esta variable? Presente la gráfica.

3. Zinder y Crisis (1990), presentaron un algoritmo híbrido para resolver un problema de


programación matemática polinomial cero-uno. El algoritmo incorpora una combinación de
conceptos pseudo booleanos y procedimientos de enumeración implícitos probados y
comprobados. Se resolvieron 52 problemas al azar utilizando el algoritmo híbrido; los
tiempos de resolución (tiempos de CPU en segundos) se listan en la siguiente tabla.

0.045 0.036 0.045 0.049 0.064 0.07 0.079 0.088 0.091 0.118 0.13 0.136
0.136 0.136 0.145 0.179 0.182 0.182 0.194 0.209 0.209 0.227 0.242 0.258
0.258 0.258 0.291 0.327 0.333 0.336 0.361 0.379 0.394 0.412 0.445 0.506
0.554 0.567 0.579 0.6 0.67 0.912 1.055 1.07 1.267 1.639 1.894 3.046
3.888 3.985 4.170 8.788

a. ¿Cuál es el tiempo máximo de resolución de un problema para ser considerado dentro


del 10% de los más rápidos?
b. ¿Cuál es el tiempo mínimo de resolución de un problema para ser considerado dentro
del 20% de los menos rápidos
c. Se desea categorizar a los problemas según sus tiempos de resolución en categorías
normal, media y alta ¿Cuáles serán los límites de cada una de ellas si la categoría media
contiene al 50% central de la cantidad de problemas?

4. Los ingresos mensuales de una muestra de pequeños comerciantes se tabularon en una


distribución de frecuencias simétrica de 5 intervalos de igual amplitud resultando que el
ingreso mínimo es de 125 dólares y la marca de clase del cuarto intervalo es de 300 dólares.
Si el 8% de los ingresos son menores que 175 dólares y el 70% de los ingresos son menores
a 275 dólares.

a. Determine las frecuencias relativas de cada intervalo.


b. ¿Qué porcentaje de ingresos son superiores a $ 285?

5. A continuación, se presenta la Distribución del número de camiones enviados a cada obra desde Lurín

distribución del número de camiones 16 15

que atendió la planta de Lurín en cada 14

12 11
obra con el objetivo de “Evaluar

Número de obras
10 9
indicadores en las atenciones que 8 7
realiza la planta de Lurín”. 6
6

Calcule las medidas de tendencia 4


4
3

central e interprete los resultados. 2

0
1 2 3 4 5 6 7
Número de camiones
Fuente: Tricon S.A.

6. Cuando se diseña un puente los ingenieros deben determinar la tensión que el concreto
puede soportar. En lugar de probar cada pulgada cúbica de concreto para determinar su
capacidad de resistencia, los ingenieros toman una muestra, la prueban y llegan a la
conclusión sobre qué tanta tensión, en promedio, puede resistir este tipo de concreto. A
continuación, se presenta la tensión (en kg/cm2) obtenidos de una muestra de 30 bloques
de concreto que se utilizarán para construir un puente.

1.2 2.1 2.2 2.2 2.5 2.5 2.6 2.6 2.7 2.8
3.0 3.0 3.2 3.2 3.2 3.4 3.4 3.5 3.5 3.6
3.6 3.6 3.6 3.7 3.8 3.9 3.9 4.0 4.0 4.0

Calcule las medidas de tendencia central e interprete los resultados.

También podría gustarte