Está en la página 1de 51

Módulo II

OBTENCION DE DATOS
Recolección de los Datos
• Si el estudio es descriptivo se aplican los instrumentos de
medición de acuerdo a lo programado.
• Si el estudio es experimental se realizan las mediciones
correspondientes de las variables de acuerdo al diseño
seleccionado.
¿ Qué son los datos ?
Los datos pueden definirse como información numérica
o no, necesaria para ayudarnos a tomar una decisión con
más base en un situación dada.

¿Para qué necesitamos datos?


Proporcionan la introducción imprescindible para un
estudio de investigación
Medir un desempeño en un servicio o proceso e una
producción en curso
Ayudar en la formulación de alternativas
Satisfacer nuestra curiosidad
Organización de Datos en Tablas y Gráficas
Datos Categóricos Univariables
• Tabla de Resumen
• Diagrama de Barras
• Diagrama de Pastel
• Diagrama de Pareto
• Pictogramas

Datos Categóricos Bivariados


• Tabla de Contingencia
• Diagrama de Barras lado a lado
Datos Categóricos Univariables
TABLA RESUMEN: es aquella en la cual Diagrama de Pastel : es la representación
se presentan las diferentes categorías que gráfica de una tabla resumen en forma de
toma la variable con su respectiva frecuencia círculo, donde este es dividido en sectores
y porcentaje. de acuerdo al porcentaje de cada valor de la
variable.
Diagrama de Barras: es la representación
gráfica de una tabla de resumen, donde los
valores que toma la variable de interés se
representa en el eje horizontal y la Pictogramas: se construyen
frecuencia de ocurrencia o porcentual en el representando de manera pictórica cada
eje vertical. modalidad de la variable.

Diagrama de Pareto: es un tipo especial de


diagrama de barras verticales, donde las respuestas
categorizadas se grafican en orden descendente de
frecuencias y se combinan con un polígono
acumulado.
Gráficos para variables
cualitativas
• Diagramas de barras
– Alturas proporcionales a las
frecuencias (abs. o rel.)
– Se pueden aplicar también a
variables discretas

• Diagramas de sectores (tartas,


polares)
– El área de cada sector es
proporcional a su frecuencia (abs.
o rel.)
Gráficos para variables cualitativas
• Pictogramas
– Fáciles de
entender.
– Cada modalidad
debe ser
proporcional a la
frecuencia.

De los dos
pictogramas,
¿cuál dirías que es
incorrecto?
El gerente de operaciones de una CARTON ROTO ( R )
planta empacadora de cereales CARTON ABULTADO ( G )
indicó que según su experiencia,
casi siempre hay nueve razones CARTON AGRIETADO ( C )
(tabla1) que dan como resultado CARTON SUCIO ( D )
la producción de cajas de cartón
no conformes al final del proceso AGUJEROS ( H )
de empaque.
PESO INADECUADO ( I )
De la producción de la semana
pasada se tomó una muestra de 50 ERROR DE IMPRESIÓN ( P )
cajas de cereales no conformes. ETIQUETA ILEGIBLE ( U )
Los datos obtenidos se muestran
TAPA SUPERIOR SIN SELLO ( S )
en la tabla 2
Tabla 1: Razones de no conformidad

UGUSHDDRIUSUSUGCSUDRSUDUS S
DPRSISUDGSSUSDGSCUDDSSSU
Tabla 2: datos obtenidos
1. Que tipos de datos son
2. Organizar los datos de las no conformidades en una
tabla resumen
3. Calcular el porcentaje de ocurrencia de cada categoría
4. Elaborar el diagrama de barra para la frecuencia de
ocurrencia
5. Elaborar el diagrama de barras para el porcentaje de
cada categoría
6. Elaborar el diagrama de pastel
7. Interpretar los resultados obtenidos
RAZONES DE LA NO CONFORMIDAD FRECUENCIA %

CARTON ROTO ( R ) 3 6
CARTON ABULTADO ( G ) 4 8
CARTON AGRIETADO ( C ) 2 4
CARTON SUCIO ( D ) 9 18
AGUJEROS ( H ) 1 2
PESO INADECUADO ( I ) 2 4
ERROR DE IMPRESIÓN ( P ) 1 2
ETIQUETA ILEGIBLE ( U ) 12 24
TAPA SUPERIOR SIN SELLO ( S ) 16 32
TOTAL 50 100
DIAGRAMA DE BARRAS

R A ZON E S D E LA N O C ON FOR MI D A D

30

25

20

15 Se r i e 1

10

0
R G C D H I P U S

R A ZO N E S D E LA N O C O N F O R M I D A D
RAZONES DE LA NO
CONFORMIDAD FRECUENCIA %
S 16 32
U 12 24
D 9 18
G 4 8
R 3 6
C 2 4
I 2 4
H 1 2
P 1 2
TOTAL 50 100
DIAGRAMA DE BARRAS

RAZONES DE LA NO CONFORMIDAD

18

16

14

12
FRECUENCIA

10

Serie1
8

0
S U D G R C I H P
RAZONES DE LA NO CONFORMIDAD
DIAGRAMA DE PASTEL
RAZONES DE LA NO CONFORMIDAD

S
U
D
G
R
C
I
H
P
INTERPRETACION
La no conformidad que ocurre con mayor frecuencia es que
se deja la tapa superior sin sello.
Le siguen etiqueta ilegible y cartón sucio.
La empresa debe adoptar las medidas para disminuir estas
no conformidades.
Un analista de redes registró las causas principales que
propiciaron fallas en los sistemas durante los últimos seis meses:

RAZON DE LA FALLA FRECUENCIA

Servidor sin memoria disponible A 32

Software del servidor B 29

Falla eléctrica C 3

Hardware del servidor D 2

Conexión física E 1

Ancho de banda inadecuado F 1


FR E C UE NC IA

35

30

25

20

FR E C UE NC IA

15

10

A B C D E F

Se r v i d o r s i n So f t wa r e d e l Fa l l a e l é c t r i c a Ha r d wa r e d e l C o n e x i ó n f ís i c a An c h o d e b a n d a
me mo r i a s e r vi dor s e r vi dor i na de c ua do
dis poni ble
Datos Categóricos Bivariables

Tabla de Contingencia: se utiliza para


estudiar las respuestas simultáneas de dos
variables categóricas.

Diagramas de Barras Lado a Lado: es la


presentación visual de los datos categóricos cuando se
buscan patrones o relaciones, lo cual implica la
construcción de un diagrama de barras lado a lado.
Ejemplo
Cadena de
Supermercados X

Ventas Venta Ventas


Estaciones 2007 s 2008 2009
Invierno 10000 12000 13000
Primavera 8000 5000 3000
Verano 5600 4800 3560
Otoño 7500 4850 4000
Comparacion de las ventas por estacion

14000

Ventas Anuales 12000

10000

8000
Serie1
Serie2
Serie3
6000

4000

2000

2003 2004 2005 2003 2004 2005 2003 2004 2005 2003 2004 2005
0

invierno primavera verano otoño

Estaciones
Suponga que en cuatro regiones, la Compañía Nacional de
Cuidado de la Salud, muestrea las actitudes de los empleados de
sus hospitales respecto a la evaluación del desempeño en el
trabajo. Los trabajadores eligen entre el método actual (dos
evaluaciones al año) y un nuevo método propuesto (evaluaciones
trimestrales). La tabla siguiente ilustra la respuesta a esta
pregunta que dio la muestra encuestada.

Centr
Regiones: Noreste Sureste al Total
Número de Método
empleados Actual 68 75 57 279
que Método
prefieren: Propuesto 32 45 33 141
Total de empleados
muestrados en cada
región 100 120 90 420
Organización de Datos en Tablas y Gráficas
Datos Numéricos Univariables

Tablas Gráficos Correspondientes


• Arreglo Ordenado
• Diagrama de Tallo y Hoja
• Distribución de Frecuencias Absolutas • Histograma y Polígono de fa
• Distribución de Frecuencias Relativas • Histograma y Polígono de fr
• Distribución de Frecuencias Porcentuales • Histograma y Polígono de f%
• Distribución de Frecuencia Absoluta • Ojiva de fa
Acumulada
• Distribución de Frecuencia Relativa Acumulada • Ojiva de fra
• Distribución de Frecuencia Porcentual • Ojiva de f%
Acumulada
Arreglo Ordenado:
• Es el ordenamiento de los datos recopilados en
forma ascendente o descendente.
• Es poco útil cuando el número de observaciones
es grande.

Diagrama de Tallo y Hoja


• Es útil para entender la distribución y agrupación de los
valores dentro del intervalo de observaciones en el
conjunto.
• Separa los datos en dígitos guía , o tallos, y dígitos que
le siguen, u hojas.
FRECUENCIA: es el número de veces que se
repite un dato específico xi en un conjunto de
datos o en un intervalo de clase determinado.

Tipos de Frecuencias
•Frecuencia Absoluta
•Frecuencia Absoluta Acumulada
•Frecuencia Relativa
•Frecuencia Relativa Acumulada
•Frecuencia Porcentual
•Frecuencia Porcentual Acumulada
Distribución de Frecuencias:
Es una tabla resumen en la cual los datos se colocan en
agrupamiento o categorías establecidas en forma conveniente de
clases ordenadas numéricamente.
La distribución de frecuencia es la representación
estructurada, en forma de tabla, de toda la información que
se ha recogido sobre la variable que se estudia. Agrupa los
datos en clases o categorías que muestran el número de
datos por categoría.
Se pueden elaborar distribuciones de frecuencia absoluta,
frecuencia absoluta acumulada, frecuencia relativa,
frecuencia relativa acumulada, frecuencia porcentual y
frecuencia porcentual acumulada.
Pasos para la Construcción de una Distribución de Frecuencias
• Selección del número de clases
• Determinación del ancho del intervalo
• Establecer los límites de clase
• Establecer los límites reales de clase
• Ubicar cada una de las observaciones en el intervalo correspondiente
• Realizar el conteo para encontrar la frecuencia absoluta de cada
intervalo
• Calcular la frecuencia absoluta acumulada
• Calcular la frecuencia relativa de cada intervalo
• Calcular la frecuencia relativa acumulada de cada intervalo
Claves para tener una distribución de frecuencia de
datos agrupados eficiente y eficaz
•Escogencia de un método que considere las cifras significativas de
los datos
•Selección de un número de clases que refleje una adecuada
distribución
•Evitar ambigüedad, ya que dos o más clases no deben considerar el
mismo dato, es por eso que los límites de los intervalos entre una
clase y otra no deben coincidir
•Procurar que la amplitud de los intervalos de clases sean tomados de
igual longitud, ya que facilita su interpretación y análisis posterior
•Siempre se eligen clases de modo que todos los datos se puedan
observar
Distribución de Frecuencias
El numero de clases depende del número de observaciones

De acuerdo a expertos en estadística se considera que la cantidad de


intervalos debe estar entre 5 y 15 o entre 5 y 20

También se puede aplicar la regla de Sturges para obtener un aproximado


al número de clases
K= 1 + 3.3 log n n es el tamaño de la muestra

El número de intervalos en los que se agrupa la información es una decisión que


debe tomar el analista:
•Si el número de clases es muy grande es imposible visualizar una distribución pues
muchas clases quedarán vacías. puede que menos representativa e informativa sea
la tabla.
•Si es un número muy bajo cerca de dos, también es imposible determinar la
distribución
Distribución de Frecuencias
El ancho del intervalo se determina por la expresión:
AI = Rango / Número de clases

Rango: Valor Mayor – Valor Menor

En base al ancho del intervalo se establecen los límites de


clase y los límites reales de clase.
Debe ser redondeado siempre hacia arriba y a la misma
cantidad de decimales que tienen los datos.
Frecuencia Absoluta
Es el número absoluto de veces que se encuentra un dato
en un conjunto de datos o intervalo de clase.
Se encuentra por inspección y conteo de los datos.

Frecuencia Absoluta Acumulada


Es la suma acumulada de la frecuencia absoluta.
Se encuentra sumando a la frecuencia absoluta actual la
frecuencia acumulada anterior.
Frecuencia relativa
Es una forma de expresar relativamente el número de
veces que se repite un dato o el número de datos que se
encuentran en un intervalo de clase.

Frecuencia Relativa Acumulada


Es la suma acumulada de la frecuencia relativa.
INTERVALOS o CLASES MARCAS DE CLASES FRECUENCIA

INFERIOR SUPERIOR ( Xi ) fi

La clase es un intervalo dentro del cual se encuentra un subconjunto del conjunto de


datos. Sus valores extremos se llaman límites de clase.
Distribución de Frecuencia Acumulada:
Se calcula sumando a la frecuencia de un intervalo
cualquiera la frecuencia anterior hasta llegar a la última
clase.
Distribución de Frecuencia Relativa:
Se calcula dividiendo la frecuencia absoluta de cada clase por
el número total de observaciones.

Distribución de Frecuencia Relativa Acumulada:


Se calcula sumando a la frecuencia relativa de un intervalo
cualquiera la frecuencia relativa anterior hasta llegar a la
última clase.
MARCA DE
INTERVALOS CLASE FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA

REL.
ABSOLUTA ACUMULADA RELATIVA ACUM

INFERIOR SUPERIOR ( Xi ) f fa fr fra

La marca de clase es el punto medio de cada intervalo. Se calcula por el


promedio de los límites de clase o de los límites reales de clase.
Complete la tabla en términos generales

MARCA DE
INTERVALOS CLASE FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA

ABSOLUTA ACUMULADA RELATIVA REL. ACUM

INFERIOR SUPERIOR ( Xi ) f fa fr fra


Distribución de Frecuencia Porcentual:
Se calcula dividiendo la frecuencia absoluta de cada clase
por el número total de observaciones y se multiplica cada
una por 100.

Distribución de Frecuencia Porcentual Acumulada:


Se calcula sumando a la frecuencia porcentual de un
intervalo cualquiera la frecuencia porcentual anterior
hasta llegar a la última clase.
MARCA DE
INTERVALOS CLASE FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA

ABSOLUTA RELATIVA PORCENTUAL PORC. ACUM

INFERIOR SUPERIOR ( Xi ) f fr f% f%acum


Organizar los datos tiene como propósito:
•Ver rápidamente algunas de las características de los datos
recolectados.
•Ver rápidamente el alcance, patrones evidentes, alrededor
de qué valores tienden a agruparse los datos, que valores
aparecen con mayor frecuencia, y otros.
Gráficos para 400
419
375

variables numéricas
300

Son diferentes en función de que las 255

variables sean discretas o continuas. 200


215

Valen con frecuencias absolutas o relativas. 127

100

54

– Diagramas barras para variables 24 23 17

discretas 0 1 2 3 4 5 6 7 Ocho o más

Número de hijos
– Se deja una separación entre barras para
indicar los valores que no son posibles 250

– Histogramas para variables 200

continuas 150

– El área que hay bajo el histograma entre 100

dos puntos cualesquiera indica la cantidad 50

(porcentaje o frecuencia) de individuos en


el intervalo.
20 40 60 80

Edad del encuestado


Histograma :
Es la representación gráfica de una distribución de frecuencia, por medio de
barras continuas. De acuerdo al tipo de distribución de frecuencias éstos
pueden denominarse:
• Histograma de frecuencia absoluta
• Histograma de frecuencia relativa
• Histograma de frecuencia porcentual

Construcción:
• En el eje horizontal se ubican los límites reales de clase. La escala debe
graduarse de tal manera que todas las barras sean de igual tamaño.
• En el eje vertical se ubican las frecuencias correspondientes a cada
intervalo, dependiendo que tipo de histograma se quiere construir.
Polígonos de Frecuencia:
• Es un gráfico que se construye sobre el histograma.
• De acuerdo al tipo de distribución de frecuencia, éstos
pueden denominarse:
. Polígonos de frecuencia absoluta
. Polígonos de frecuencia relativa
. Polígonos de frecuencia porcentual

Construcción:
• Se elabora a través de la unión de los puntos medios de
los intervalos del histograma correspondiente.
...

HISTOGRAMA Y POLIGONO
25
20
15
Serie1
10
5
0

mmm

LÍMITES REALES DE CLASE (Variable)


Frecuencia

0
5
10
15
20
25
30
35
40
45
50

19

39

59

79

99

119

139
Clase

159

179
Histograma

199

219

239

y mayor...
Frecuencia
Ejemplo 1:
En un programa para la detección de hipertensión en una muestra
de 30 hombres en edades entre 30 y 40 años, la distribución de la
presión diastólica (mínima) en mm Hg fue la siguiente:
70 85 85 75 65 90 110 95 90 70
60 75 80 120 85 95 90 70 100 65
80 90 95 90 95 110 100 85 80 75
La variable en estudio es :
Presión diastólica (medida en mm de Hg)
Es una variable numérica continua.
Ordenamos los datos en forma creciente:
60 65 65 70 70 70 75 75 75 80
80 80 85 85 85 85 90 90 90 90
90 95 95 95 95 10 10 11 11 12
0 0 0 0 0
La amplitud total R = 120 – 60 = 60
Número de clases: K =1 +3.3 log30 = 5.78 Aprox. 6 clases

Extensión del intervalo : A = R/ K = 60/6 = 10


En este caso , entonces, la tabla de frecuencias tendrá
aproximadamente 6 clases de amplitud 10 unidades en
cada clase.
Frecuencia Frecuencia Frecuencia
Variable Frecuencia absoluta norm.
normalizada absoluta

x f fr F Fr
60 - 70 3 0.1 3 0.1
70 - 80 6 0.2 9 0.3
80 - 90 7 0.23 16 0.53
90 - 100 9 0.3 25 0.83
100 - 110 2 0.07 27 0.90
110 - 120 2 0.07 29 0.97
120 - 130 1 0.03 30 1.00
total 30 1.0
Histograma de la distribución de presión diastólica en
mm de Hg según las frecuencias absolutas:
10

f 8

60 70 80 90 100 110 120 130 mm de Hg


Histogramas, Polígonos y Ojivas
Ejemplo 2: Las longitudes de 20 varillas de acero que se utilizan
en la fabricación de clavos y tornillos, medidas en cms, se presentan en el
siguiente cuadro :
8 17 23 26 30
11 18 25 29 35
13 21 25 30 36
15 21 25 30 42

Rango = 42 – 8 = 34
1 +3.3 log 20 = 5.29 = 6 intervalos de clases
Rango / Número de clases = 34 / 7 = 4.86

Intervalo de Clase Marca de Frec. Frec. F. Acum. FADP F.Acum.Asc. FAAP


clase Absoluta Relativa Desc. o más o menos

7.5 - 12.5 10 2 10% 20 100% 2 10%


12.5 - 17.5 15 3 15% 18 90% 5 25%
17.5 - 22.5 20 3 15% 15 75% 8 40%
22.5 - 27.5 25 5 25% 12 60% 13 65%
27.5 - 32.5 30 4 20% 7 35% 17 85%
32.5 - 37.5 35 2 10% 3 15% 19 95%
37.5 - 42.5 40 1 5% 1 5% 20 100%
Continuación…

La Tabla anterior y los gráficos se pueden utilizar


para responder algunas preguntas interesantes, como:

1. Aproximadamente 10% de las varillas tienen


¿Qué longitud o menos?
2. ¿Cuál es la proporción de varillas que tienen 30 cms
ó menos ? ¿ 39 ó más?
3. ¿Qué proporción de varillas tienen una longitud entre
22.5 y 37.5 cms?
Producto Precio Cantidad vendida Ingreso total
Producto A $10 100 $1000
Producto B $15 75 $1125
Producto C $20 50 $1000
Total $3125

04/20/2024
51

También podría gustarte