Está en la página 1de 48

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE INGENIERIA INDUSTRIAL Y DE


SISTEMAS
UNIDAD DE POSGRADO

MAESTRIA: INGENIERIA DE SISTEMAS

CURSO: PROBABILIDAD Y ESTADISTICA


CAPITULO II
RECOLECCION Y PRESENTACION DE DATOS
Mg. GERMAN ELIAS POMACHAGUA PEREZ

Material de Clases © German Pomachagua Perez 8-Jun.-19


RECOLECCION DE DATOS
• La recolección de datos es la fase en el cuál el
investigador se pone en contacto con los elementos
sometidos a estudio, con el fin de obtener datos o
respuestas de las variables consideradas y a partir de
aquí se prepara la información estadística.
• Antes de recolectar datos es importante determinar el
objetivo de estudio, precisar las variables, las fuentes de
datos, con la finalidad de definir que datos hay que
recolectar

Material de Clases © German Pomachagua Perez 8-Jun.-19


TIPOS DE FUENTES
a) Fuentes Secundarias:
 Datos ya recolectados para cumplir otros objetivos
 Contiene información, sintetizada y organizada
 Es la primera fuente que se debe analizar.
Ejemplo:
Datos publicados (en papel o en forma electrónica) en revistas especializadas,
tesis, censos y en las hojas de registro anteriores
Principales organismos que disponen de publicaciones son:
Portal del Estado Peruano www.peru.gob.pe/
Instituto Nacional del Estadística e Informática www.inei.gob.pe
Banco Central de Reserva del Perú www.bcrp.gob.pe/
Ministerio de Salud del Perú www.minsa.gob.pe
Organización Mundial de la Salud www.who.int/es/
Ministerio de Educación www.minedu.org.pe
Ipsos Apoyo. Opinión y Mercado www.ipsos-apoyo.com.pe/

Material de Clases © German Pomachagua Perez 8-Jun.-19


TIPOS DE FUENTES

• FUENTES PRIMARIAS:
– Datos que hay que recolectar para el trabajo
– Personas que por su conocimiento proporciona
información especifica para el investigador
– Las técnica mas empleadas de recolección de datos son
La observación:
La experimentación
La entrevista.
La encuesta (Cuestionario)

Material de Clases © German Pomachagua Perez 8-Jun.-19


(a) La observación

Es el registro visual de lo


ocurre, es una situacional real,
clasificando y consignando los
acontecimientos pertinentes de
acuerdo con algún esquema
previsto y según el problema que
se estudia.
 Cuando se mide el desempeño,
la persona observada no debe
saber que es sujeta de
observación

Material de Clases © German Pomachagua Perez 8-Jun.-19


(b) La experimentación
Se registra un dato bajo condiciones provocadas
simulando el proceso lo más real posible.

Ejemplo:
Un mercado prueba para introducir un tipo jabón
de antiséptico con fragancia .

Material de Clases © German Pomachagua Perez 8-Jun.-19


(c) La entrevista
 Permite recolectar datos
o partir de un dialogo.
 Puede se estructurada o
no estructurada

Ejemplo:
Entrevista al Director de una
Clínica sobre la aplicación de
norma de calidad ISO 9000

Material de Clases © German Pomachagua Perez 8-Jun.-19


(a) La encuesta
Diseño de cuestionario para la
encuesta

1. Cuestionario de preguntas abiertas o


cerradas
2. Al diseñarla se debe:
• Decidir forma de aplicarlo: correo,
teléfono, personal, web
• Plantear preguntas
• Realizar una prueba piloto y hacer
revisiones finales
Ejemplo:
Encuesta para conocer el grado de
satisfacción de los asegurados a una
clínica.

Material de Clases © German Pomachagua Perez 8-Jun.-19


RECOMENDACIONES EN LA ELABORACIÓN DE CUESTIONARIOS

• Es una tarea difícil y que requiere tiempo


• Construir el instrumento de modo que refleje calidad
• Hacer el cuestionario lo más breve posible, de modo
que se requiera el mínimo de tiempo para llenarlo.
• Todos los reactivos (preguntas) deberán estar en
función del problema de investigación.
• Debe partirse de las hipótesis y específicamente de los
indicadores que expresan a las variables. Estos
indicadores deben traducirse en las preguntas del
cuestionario.
Material de Clases © German Pomachagua Perez 8-Jun.-19
• El lenguaje utilizado en la redacción debe ser
entendible por los encuestados

• Debe evitarse la ambigüedad


Ejemplo: En un estudio de sobre tabaquismo

¿Frecuentemente fuma? SI …. NO ……

• No formular preguntas dirigidas. Evitar adjetivos


Ejemplo: ¿Cree usted que precio de las tarifas
postales son altas?
SI …….. NO ………

Material de Clases © German Pomachagua Perez 8-Jun.-19


• Neutralidad de las preguntas. El investigador debe
intentar adoptar una postura neutral con respecto al
problema objeto de estudio.

Ejemplo 1: “La defensa del país exige contar


con un presupuesto adecuado. ¿Está usted de
acuerdo con que se destinen fondos del
presupuesto nacional a la actualización del
Armamento de las Fuerzas Armadas?
Forma tendenciosa grotesca

Material de Clases © German Pomachagua Perez 8-Jun.-19


• Ejemplo 2: ¿Considera usted que la empresa X
ofrece un buen servicio postventa?
Si ____
No ____
No sabe/ no contesta_____________

Forma más sutil de sesgar la pregunta

Material de Clases © German Pomachagua Perez 8-Jun.-19


Ejemplo 3:
• ¿Cómo encuentra usted el servicio post-venta de la empresa X?
Bueno _________
Regular ________
Malo ___________
No sabe/ no contesta __________
• ¿Aprueba o desaprueba la labor que viene desarrollando Martín
Vizcarra como Presidente de la República? (%)
Aprueba 1

Desaprueba 2
• ¿Esta a favor o en contra de otorgar indulto a Alberto Fujimori? (%)

A favor 1

En Contra 2

Forma objetiva
Material de Clases © German Pomachagua Perez 8-Jun.-19
Tipos de preguntas
I. Según su formulación en el cuestionario:
1) Preguntas cerradas
Las posibles respuestas se presentan como alternativas.
Facilita la codificación y operatividad de los datos.
Ejemplo : ¿Posee Ud. un seguro médico?
Si 1 No 2 Cerradas Dicotómicas (Si /No)

Ejemplo: Categoría docente


Principal ( ) 1
Cerradas múltiple
Asociado ( ) 2
Auxiliar ( ) 3
Ejemplo: ¿Cómo se entero de nuestra de nuestra institución?
Internet ( ) 1
Periódico ( ) 2
Cerradas de elección
Radio ( ) 3
multiple
Tv ( ) 4
Amigos ( ) 5
Material de Clases © German Pomachagua Perez 8-Jun.-19
2) Preguntas abiertas

 Los encuestados tienen libertad para emitir su


opinión.
 Se utilizan cuando no se tiene precisión sobre las
posibles respuestas.
 Dificulta la recolección de datos (incomoda al
encuestado).
 Es necesario codificar las respuestas para ser
procesadas
Ejemplo:
¿Qué opinión tiene sobre la política de salud del
actual Gobierno ?
………………………………………………………………………

Material de Clases © German Pomachagua Perez 8-Jun.-19


3) Preguntas Literales

Sonpreguntas
Son preguntas abiertas
abiertas cuyasserespuestas
cuyas respuestas se palabra
expresan con una expresan con
o cantidad
Ejemplo:
una palabra o cantidad
cantidad
 ¿Cuál es su edad? ……………………………
Ejemplo:
 ¿Cuántos hijos tiene? …………………………..
 ¿Cuál
 ¿Cuáles es su edad?
edad?
su ocupación ……………………………
actual? …………………….……………………………
 Preguntas
4) ¿Cuántoscon
hijos tiene? de grados
respuestas …………………………..
de intensidad
 ¿Cuál es su ocupación actual? …………………….
Sus respuestas indican un grado de intensidad en sus respuestas
Ejemplo : ¿Esta usted de acuerdo con la política económica del actual gobierno?

1. Totalmente en desacuerdo ( )
2. En desacuerdo ( )
3. Ni en acuerdo ni desacuerdo ( ) Escala de Likert
4. De acuerdo ( )
5. Totalmente de acuerdo ( )
VALIDEZ Y CONFIABILIDAD DE UN CUESTIONARIO
Toda medición o instrumento de recolección de datos debe reunir dos requisitos
básicos: VALIDEZ Y CONFIABILIDAD de un instrumento.

1) VALIDEZ: Se refiere al grado en que un instrumento mide la variable que


pretende medir. Por ejemplo, un instrumento válido para medir inteligencia
debe medir la inteligencia y no la memoria.
(Hernández Sampieri, Fernández Collado, & Baptista Lucio, 1998).
Pero cuando se trata de variables como motivaciones, actitudes, sentimientos,
emociones, etc., la validez de un instrumento que pretenda medirlas se torna
más compleja, y por lo tanto, cabe preguntarse si ¿realmente el instrumento
estará midiendo lo que pretende medir?

2) CONFIABILIDAD: Un test es fiable cuando al aplicarlo dos a mas veces al


mismo individuo en circunstancias similares obtenemos resultados análogos
(precisión) Ej: El lunes me peso en la balanza y resulta 90 Kg; luego el martes
resulta 70Kg luego la balanza no es fiable
VALIDEZ: Según Arias (2006): “La validez…significa que las preguntas o ítems deben
tener una correspondencia directa con los objetivos de la investigación. Es decir, las
interrogantes consultarán sólo aquello que se pretende conocer o medir" (p.79).

Es recomendable determinar la validez mediante la técnica del juicio de experto,


por ello, se solicitó la colaboración de tres profesionales en las áreas de
metodología, lenguaje y contenido quienes efectuaron valoraciones cualitativas,
estableciendo que los instrumentos cumplen con su propósito.

CONFIABILIDAD: Aún cuando el instrumento haya sido revisado por los expertos,
todavía no se ha demostrado su eficacia en condiciones reales, por ello, antes de
iniciar el trabajo de campo, es conveniente verificar su confiabilidad. Definen
Palella y Martins (2003), la confiabilidad como “la ausencia de error aleatorio en
un instrumento de recolección de datos. Representa la influencia del azar en la
medida, es decir, es el grado en que las mediciones están libres de la desviación
producida por errores causales”. (p.150).
Además, según los autores, “un instrumento es confiable cuando, aplicado al
mismo sujeto en diferentes circunstancias, los resultados o puntajes obtenidos son
aproximadamente los mismos
VALIDEZ Y CONFIABILIDAD DE LOS INSTRUMENTOS DE RECOLECCIÓN DE DATOS
PRESENTACION DE DATOS
Nota: Manual para la presentación de cuadros estadísticos D.L. 604
https://www.inei.gob.pe/media/MenuRecursivo/metodologias/libro.pdf
https://www.inei.gob.pe/media/MenuRecursivo/publicaciones_digitales/Est/Lib0933/Libro.pdf
Tipos de Presentación de datos

Tablas de Contingencia: Es un arreglo ordenado de filas


y columnas de variables cualitativas
Tabla 01: LIMA: POBLACION DE ALUMNOS QUE FUMA SEGÚN
SEXO, 2014
Ta bla de conti nge ncia SEX O * FUMAR

Recuento
FUMAR
FUMA NO FUMA Total
SE XO HOMB RE 55 25 80
MUJER 16 4 20
Total 71 29 100

Fuente:
Apoyo 2014

Material de Clases © German Pomachagua Perez 8-Jun.-19


En SPSS ir a Analizar / Estadísticos Descriptivos/ Tablas de Contingencia …

Luego clic en Casillas

Después Continuar / Aceptar

Ta bla de continge ncia SEXO * FUMAR

Recuento
FUMAR
FUMA NO FUMA Total
SEXO HOMBRE 55 25 80
MUJER 16 4 20
Total 71 29 100
Tipos de Presentación de datos
2. Tabla de Frecuencia: Es una tabla que divide a un conjunto de datos
en un numero adecuado de intervalos o categorías.
Elementos de una Tabla de Frecuencia:
• Frecuencia Absoluta (fi): Es el número de veces que se repite cada
valor de una variable.
Donde: m = número de intervalos o categorías
n = número total de observaciones
m
Además
 fi  n
i 1
y 0  fi  n

• Frecuencia Relativa (hi): Se expresa en términos de porcentajes.


Donde fi
hi 
n m

Además h
i 1
i 1 y 0  h1  1
• Frecuencia Absoluta Acumulada (Fi): Es la acumulación
sucesivamente de las frecuencias absolutas, donde:
F1 = f 1
F2 = f1 + f2 = F1 + f2
… = …………………………………

Fm = f1 + f2 + ………+ fm = Fm-1 + fm = n

• Frecuencia Relativa Acumulada (Hi): Resulta de sumar


sucesivamente las frecuencias relativas, donde:
H1 = h1
H2 = h1 + h2 = H1 + h2
…= ……………………………………………
Hm = h1 + h2 + ………+ hm = Hm-1 + hm = 1

Material de Clases © German Pomachagua Perez 8-Jun.-19


Tabla de frecuencia con intervalos: Se sigue el
procedimiento siguiente:
1) Determinar el rango R= Xmax - Xmin
2) Determinar el número m de intervalos. Se
recomienda generalmente entre (5  m  15).
m = 1 + 3.3 x log (n) (Redondear al entero más
cercano).
3) Se determina el tamaño del intervalo de clase.
En lo preferible se debe encontrar un número entero
R
C tal que Cm  R
m
(Redondear por exceso, a la cantidad de
decimales que tienen los datos).
En caso de no cumplir, cambiar m o C
Material de Clases © German Pomachagua Perez 8-Jun.-19
4º) Calcular el rango ampliado R´= Cm
(5º) Hallar la diferencia a= R´- R

(6º) Distribuir la diferencia


 -(Límite inferior del primer intervalo)
 +(Límite superior del último intervalo)

(7º) Construcción de los intervalos [ >, < ]

(8º) Hallar la marca de clase que es el promedio del


intervalo
( Li  Ls )
Mi 
2

(9º) Se elabora la tabla: titulo, cuerpo y fuente

. Material de Clases © German Pomachagua Perez 8-Jun.-19


Histograma de Frecuencias: Constituido por un conjunto
sucesivo de rectángulos

Polígono de Frecuencias: Se construye tomando en cuenta la


marca de clase
• Ejemplo 1: La siguiente tabla muestra las edades de los 21
trabajadores que laboran en Siderúrgica Aceros Arequipa:

Construir a partir de estos datos


• Una tabla de frecuencia
• Un histograma
• Un polígono de frecuencia

Material de Clases © German Pomachagua Perez 8-Jun.-19


Solución
1. El rango R =72 – 39 =33
2. Determinar el intervalo
m =1 + 3.3log(21)
m =1 + 3.3x1.322 = 1 + 4.36 = 5.36
m=5
3. Hallar la amplitud
C =R/m=33/5= 6.6 (la cantidad de decimales que tienen los
datos).C=7
4. Luego el rango ampliado R´=C*m= 7x5=35
5. La diferencia a=R´-R =35-33=2
6. Distribuyendo la diferencia

Min Max +a
V. Corregido 39 72+2=74

Material de Clases © German Pomachagua Perez 8-Jun.-19


Interpretar

1) f1, F2, h3, H4


2) ¿Calcular el número y porcentaje de trabajadores entre 47 años y 68 años?

3) ¿Calcular el porcentaje de trabajadores que tienen por lo menos 55 años?

Material de Clases © German Pomachagua Perez 8-Jun.-19


• Histograma de Frecuencias: Constituido por un conjunto sucesivo
de rectángulos.
• .
Histograma de Frecuencias fi

8 7
7 6
6

Frecuencia
5
4 3 3
3 2
2
1
0
[39 - 46] <46 - 53] <53 - 60] <60 - 67] <67 - 74]

Polígono de Frecuencias: Se construye tomando en cuenta la marca


de clase Poligono de Frecuencias fi
8
7
6
Frecuencia

5
4
3
2
1
0
35.5 42.5 49.5 56.5 63.5 70.5 77.5

Material de Clases © German Pomachagua Perez 8-Jun.-19


Reporte del SPSS

Material de Clases © German Pomachagua Perez 8-Jun.-19


En SPSS después de poner los datos
Ir a Transformar / Recodificar en distintas variables ..

Luego clic en
Valores antiguos y nuevos

Y así hasta completar


todos los intervalos
Luego clic en
Continuar/ Cambiar Aceptar

Luego hallar la tabla de frecuencia de la


variable EDADRECO
En Minitab Polígono de Frecuencia
Gráfica de dispersión de FRECUENCIA vs. MARCA
7
7

6
6

FRECUENCIA
4

3 3
3

2
2

0 0
0
35.5 42.5 49.5 56.5 63.5 70.5 77.5
MARCA
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores y
datos continuos (Varios valores se agrupan en una clase)

ELABORACION DE HISTOGRAMAS
EN MINITAB
a) Luego de elegir
Graficas/Histograma
aparece la ventana
Histograma.

b) Elegir Simple y dar


Aceptar; luego ingresar en
la ventana Variables de
grafica el nombre de la
columna (variable) que se
desea analizar. La ventana
resultante es:

08/06/2019 . 41
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

c) Dar click en
Etiquetas) y luego
seleccionar Etiqueta
de datos / Usar
etiquetas de valor y a
fin de que se muestre
la altura de la barra
(frecuencia).
d) Aceptar La grafica
resultante es:

08/06/2019 42
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

e) Este gráfico no es
el que se desea
obtener. Vea que
C=7 y m=5, como
lo habíamos
planteado.
f) Dar click en una
barra cualquiera y
se obtiene la
ventana Edit
Barras:
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

g) A continuación, se elige
la opción
Seccionamiento y se
abre el cuadro de datos
Punto medio y Punto de
corte , tal como se
muestra a continuación:
Variables Cuantitativas (Discretas y Continuas)

h) Nótese que en Tipo


de intervalo, se ha
elegido la opción
Punto de corte. En
Definición de
intervalo se ha
elegido Posiciones
de punto medio de
corte
Xmín:Xmáx/C

i) A continuación se da
click en Aceptar y se
obtiene la ventana
Histograma:
Variables Cuantitativas (Discretas y Continuas)
Distribuciones de frecuencias para datos discretos con muchos valores
y datos continuos (Varios valores se agrupan en una clase)

j) El grafico obtenido es
denominado: Histograma de
Frecuencias Absolutas.
Note que ahora m=5 y los
valores de los límites superior é
inferior de cada clase, se
muestran en el eje horizontal
del gráfico.

k) Esto nos facilita elaborar la


correspondiente Tabla de
Distribución de Frecuencias
GRAFICO DE TALLOS Y HOJAS

EDAD Stem-and-Leaf Plot


3*10+9 tallo=3, hoja= 9, anchura =10
Frequency Stem & Leaf

1,00 3. 9
3,00 4. 029
8,00 5. 14678889
5,00 6. 34689
4,00 7. 0012

Stem width: 10
Each leaf: 1 case(s)

Material de Clases © German Pomachagua Perez 8-Jun.-19


GRAFICO DE CAJAS Y BIGOTES
(BOX PLOT)

25

24 46

23 52

22 41
71
47
62

21 43
93
65
28
94

20

19
EDAD

18

17
N= 80 20

HOMBRE MUJER

SEXO

Material de Clases © German Pomachagua Perez 8-Jun.-19

También podría gustarte