Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INGENIERÍA DE SISTEMAS
2019
ASIGNATURA
“ESTADÍSTICA GENERAL”
PROFESOR RESPONSABLE
Lic. Mg. MARCO ARMANDO GÁLVEZ
DÍAZ
DEFINICIÓN DE ESTADÍSTICA
Estadística es la ciencia que estudia los
métodos y técnicas para el planeamiento,
recolección, organización, procesamiento,
presentación y análisis de datos con el fin
de extraer conclusiones y tomar
decisiones.
3
CLASIFICACIÓN
• ESTADÍSTICA DESCRIPTIVA: Describe, analiza, y
representa un grupo de datos utilizando
métodos numéricos y gráficos que resumen y
presentan información contenidos en ellos.
4
IMPORTANCIA
• Es usada por un creciente número de disciplinas:
Agricultura, Industria, Ingeniería, Ciencias Sociales,
Gobierno, Ciencias Biológicas y Medicina.
• Los métodos y técnicas estadísticas son independientes de
la materia a la cual se aplica.
• Existe un rápido desarrollo de nuevos procedimientos
estadísticos.
• El planeamiento y la evaluación de la investigación
contribuyen a los avances tecnológicos en todas las áreas del
desarrollo humano.
• El control estadístico de la calidad en la industria hace
confiables los productos elaborados.
• Proporciona información para los estudios de impacto
ambiental y ayuda en la evaluación de exigencias
gubernamentales para que la industria farmacéutica,
demuestre que un producto es benéfico y seguro.
5
OBJETIVOS DE LA ESTADÍSTICA:
• Los objetivos estadísticos se relacionan con los
niveles de investigación, los mismos que
referenciamos: Exploratorio – Descriptivo –
Relacional – Explicativo – Predictivo.
• Al Nivel Descriptivo, tenemos los objetivos:
Determinar, Estimar y Describir.
• Al Nivel Relacional, tenemos los objetivos:
Asociar, Correlacionar y Concordar.
• Al Nivel Explicativo, tenemos los objetivos:
Evidenciar, Demostrar y Probar.
• Al Nivel Predictivo, tenemos los objetivos:
Predecir, Pronosticar y Preveer.
CONCEPTOS BÁSICOS
• POBLACIÓN: Conjunto de elementos (objetos, individuos,
animales, organizaciones, datos, etc.) finito o infinito que
poseen una característica o combinación de características
comunes.
Generalización de
resultados
Muestra:
11
PASOS DEL METODO CIENTIFICO
1.- Concebir la idea a investigar.
Revisión de la Literatura.
Detección de la Literatura.
Obtención de la Literatura.
Consulta de la Literatura.
Extracción y Recopilación de la Información de Interés.
13
8.- Recolección de los Datos:
Elaborar el instrumento de medición y aplicarlo.
Calcular la validez y confiabilidad del instrumento de medición.
Codificar los datos.
Crear un archivo que contenga los datos.
14
Relación Estadística y el Método Científico:
15
Concluyendo, la Estadística sirve de fundamento al
investigador en el diseño y análisis de sus
experimentos. Bien aplicada, conduce a la
realización de diseños más eficientes con el
consiguiente ahorro de tiempo y recursos, a la vez
que se gana en información. Al contrario,
experimentos mal diseñados conducen
frecuentemente a errores que pueden arruinar todo
un proyecto de investigación.
16
Ejemplos de Utilización de Hipótesis
Estadísticas:
1.- Se está estudiando un nuevo fármaco para utilizarlo en el tratamiento del
cáncer de piel. Se espera que sea eficaz en la mayoría de pacientes sobre
los que se aplica, la compañía que produce el fármaco quiere obtener
alguna prueba estadística que apoye tal información.
Aquí nos interesa que la proporción ρ pacientes para los cuales el
fármaco sea efectivo sea mayor que el 50% ρ > 0.5.
17
Ejemplos de Diseños de Investigación y Pruebas
Estadísticas:
1.- Diseño con pre prueba - post prueba y grupo
de control:
RG1 01 X 02
RG2 03 ---- 04
18
2.- La medida de la asociación o relación de
características (variables) de pacientes se
contrasta con los índices de correlación.
19
ETAPAS DE LA INVESTIGACIÓN
ESTADÍSTICA
20
IMPORTANCIA DE LA HIPÓTESIS
21
VARIABLES ESTADÍSTICAS
Una variable estadística es una característica
(cualitativa o cuantitativa) que se mide u
observa en la unidad estadística de la población.
Se representa por una letra mayúscula del
alfabeto castellano.
Si una variable se denota por X, sus valores
observados en n unidades estadísticas se denota
por x1, x2,..., xn, conforme al orden que se han
obtenido.
22
Este conjunto de n observaciones constituye
una muestra de tamaño n obtenida de una
población de tamaño N.
• Elementos.
• Unidades de muestreo. (Unidad Estadística)
• Alcance.
• Tiempo.
23
CLASES DE VARIABLES
• A) P0R SU NATURALEZA
VARIABLES CUALITATIVAS: Es la característica cuyos valores se
expresan en modalidades o categorías. Ejemplo: sexo, nivel
de instrucción, estado civil, historia familiar, tipo sanguíneo,
nivel socioeconómico.
Ejemplo:
24
VARIABLE CUANTITATIVA: Es la característica cuyos valores
son números. Ejemplo: Peso, Talla, Presión Arterial,
sueldo de empleados, Número de hijos de una familia,
ventas anuales etc. Se clasifican en discretas y continuas.
25
B) POR SU RELACIÓN CAUSAL
VARIABLE INDEPENDIENTE
Es aquella característica o propiedad que se
supone ser la causa o explicación del
fenómeno estudiado. En investigación
experimental se llama así, a la variable que el
investigador manipula. Generalmente se
simboliza con la letra mayúscula X, y no
depende de ninguna variable dentro de un
contexto determinado, indica: causa,
antecedente, estímulo, determinante
26
VARIABLE DEPENDIENTE
Es la propiedad o característica que se trata de cambiar
mediante la manipulación de la variable independiente.
Generalmente se simboliza con la letra mayúscula Y, y son
aquellas que dependen o son explicadas por otra u otras
variables dentro de un contexto determinado, indica:
Efecto, consecuente, respuesta, resultado.
VARIABLE INTERVINIENTE
Es aquella característica o propiedad que de una manera
u otra afectan el resultado que se espera, produciendo
efectos indirectos en la relación entre variables
independientes y dependientes. Simbólicamente se la la
denota con la letra mayúscula Z, son aquellas que van a
especificar las condiciones o requisitos para que las
variables X e Y tomen sus correspondientes
27
EJEMPLOS:
28
C.- SEGÚN EL NIVEL DE ABSTRACCIÓN
VARIABLES TEÓRICAS
VARIABLES INTERMEDIAS
30
ESCALA
31
ESCALA NOMINAL
ESCALA ORDINAL
32
ESCALA DE INTERVALO
ESCALA DE RAZÓN
33
ESCALAS DE MEDICIÓN DE LAS VARIABLES
VARIABLES CUALITATIVAS VARIABLES CUANTITATIVAS
CATEGÓRICAS NUMÉRICAS
NOMINAL ORDINAL INTERVALO RAZÓN
Ningún Atributo Un Atributo Dos Atributos Tres Atributos
Orden Orden, Distancia Orden, Distancia,
Origen
Posee categorías a las Posee categorías ordenadas Tiene intervalos iguales y Tienen intervalos
que se asigna un pero no permite cuantificar medibles, pero no tiene un constantes en
nombre sin que exista la distancia entre una origen real. Puede asumir valores, además de
ningún orden implícito categoría y otra. valores negativos. un origen real. El
entre ellas. cero significa la
ausencia de la
variable.
Género Estado Civil Instrucción Intensidad Temperatura Hora del Peso Hijos
día
Masculino Soltero Primaria Leve - 10°C 00 horas 10.0 kg 1
Femenino Casado Secundaria Moderado 0° C 10 horas 10.2 kg 2
Conviviente Superior Severo 20° C 20 horas 20.0 kg 3
Dicotómicas, tienen sólo dos categorías. Discretas, provienen de contar, sólo pueden ser
Ejemplo: representadas por números enteros.
Vivo – Fallecido Continuas, se pueden representar con números enteros o
Sano – Enfermo fraccionarios, entre dos valores existe un número
Politómicas: Tienen más de dos categorías. intermedio.
34
OPERACIONALIZACIÓN DE VARIABLES
35
a) Directa Unidimensional, Ejemplo:
VARIABLES DEF. TIPO/NATURALE ESCALA INDICADOR
OPERACIONAL ZA
Tipo/Naturaleza: Cualitativa
Valores Finales: Desnutrición de Grado I, II y III.
Indicadores: Peso, Talla y Edad.
Escala de medición: Peso, Talla y Edad (Razón); Desnutrición
(Ordinal).
• Instrumentos y procedimientos de medición: El Peso, mediantes
una balance regulada en gramos con medición hecha en ayunas; la
Talla, mediante un tallímetro regulado en milímetros; y la Edad,
mediante la determinación de la fecha de nacimiento dada por el
DNI o partida de nacimiento.
• Definición Operacional de Desnutrición Infantil: “Se expresa en
grados I, II y III, de acuerdo a la comparación de los indicadores
peso, talla y edad, con las tablas antropométricas de la OMS. Para
la medición de los indicadores se usará una balanza regulada en
gramos, un tallímetro regulado en milímetros y la fecha de
nacimiento obtenida mediante DNI o partida de nacimiento”
37
SUMATORIA
Es una estructura matemática que
es utilizada en el cálculo de
importantes medidas estadísticas
descriptivas y procesos
inferenciales, por lo que se hace
necesario su tratamiento.
38
RECOLECCIÓN DE DATOS
En un tratamiento estadístico, es muy importante determinar el método
de recolección de datos y el tipo de instrumento que se utilizará, en base
a los objetivos y las variables del estudio.
FUENTES PRIMARIAS:
Son las que obtienen información a través del contacto directo con la
Unidad de Análisis en estudio.
• Observación.
• Encuesta.
• Entrevista.
• Cuestionario.
FUENTES SECUNDARIAS:
C1 n1 f1 P1
C2 n2 f2 P2
. . . .
. . . .
. . . .
CK nK fk Pk
n
i 1
i n
ni
Frecuencias Relativas fi se obtienen en cada categoría por fi
n
La suma de todas las frecuencias relativas es igual a 1.
i 1
fk 1
P
i 1
i 100
41
EJEMPLO
CUADRO N° 1: Tipo de Empresa por Constitución Legal. Distrito Tarapoto 2005
43
Gráfico N° 1: Tipo Empresa por Constitución
Legal. Distrito Tarapoto - 2005
100
80
60
40
20
0
Soc. Civil RL Soc. Civil Ord. Persona Natural
Emp. Ind. RL Soc. CL
Tipo de Empresa
Emp. Ind. RL
8.2%
Soc. Civil Ord.
1.0%
Soc. CL
2.0%
Persona Natural
83.7%
46
RESUMEN DE DISTRIBUCIÓN DE FRECUENCIA DE UNA VARIABLE DISCRETA
x1 n1 N1 f1 F1 P1
x2 n2 N2 f2 F2 P2
x3 n3 N3 f3 F3 P3
. . . . . .
. . . . . .
. . . . . .
xK nK NK = n fK FK = 1.00 PK
47
EJEMPLO
Número de nacimientos diarios en el Centro
Materno Perinatal de Tarapoto. Enero-
Febrero 2004.
6, 6, 2, 6, 5, 9, 8, 4, 4, 3, 4, 1, 5, 5, 7, 4, 3, 4, 2,
6, 4, 3, 6, 7, 4, 7, 7, 7, 7, 4, 4, 4, 5, 6, 5, 4, 5, 3,
7, 6, 5, 5, 2, 4, 8, 8, 2, 6, 9, 4, 7, 4, 5, 6, 8, 6, 2,
3, 5, 4.
48
CUADRO N° 2. DPTO. SAN MARTÍN: NÚMERO DE NACIMIENTOS DIARIOS
EN EL CENTRO MATERNO PERINATAL-TARAPOTO. ENERO-FEBRERO 2004.
50
GRÁFICOS
Los gráficos más importantes son el Gráfico de
Bastones y el Gráfico Acumulativo.
51
GRÁFICO N° 3. DPTO. SAN MARTÍN: NÚMERO DE NACIMIENTOS DIARIOS
EN EL CENTRO MATERNO PERINATAL-TARAPOTO. ENERO-FEBRERO 2004.
53
GRÁFICO N° 4. DPTO. SAN MARTÍN: NÚMERO DE NACIMIENTOS DIARIOS
EN EL CENTRO MATERNO PERINATAL-TARAPOTO. ENERO-FEBRERO 2004.
Días
55
RESUMEN DE DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS
Frecuencias Frecuencias
Intervalos Marca de Frecuencias Frecuencias
Absolutas Relativas
o Clases clase Absolutas Relativas
Acumuladas Acumuladas
Ii xi ni fi
Ni Fi
I1 x1 n1 N1 f1 F1
I2 x2 n2 N2 f2 F2
I3 x3 n3 N3 f3 F3
. . . . . .
. . . . . .
. . . . . .
IK xk nK NK = n fK FK =1.00
TOTAL n 1.00
56
PASOS PARA ELABORAR UN
CUADRO DE DISTRIBUCIÓN DE
FRECUENCIAS POR INTERVALOS
57
1.- Determinar el Rango R X max X min
58
3.- Determinar la Amplitud del intervalo, dividiendo el Rango entre
R
el número de intervalos: A
K
4.- Determinar los extremos de los Intervalos de la Siguiente manera:
I1 X min , X min A)
I 2 X min A, X min 2 A)
I 3 X min 2 A, X min 3 A)
……………………………………
I i Li , Ls
Li Ls
Xi
2
7.- Construir el cuadro completo.
60
EJEMPLO
EDAD DE 154 MADRES GESTANTES EN EL C.M. PERINATAL-
TARAPOTO. ENERO 2004.
31, 38, 19, 23, 27, 22, 19, 15, 23, 30, 38, 33, 30, 22, 18, 28,
21, 25, 43, 17, 33, 16, 18, 21, 17, 17, 20, 31, 17, 17, 26, 33,
32, 33, 39, 20, 22, 22, 32, 28, 32, 20, 17, 30, 19, 23, 23, 40,
16, 27, 27, 28, 22, 21, 30, 18, 20, 26, 19, 20, 28, 31, 37, 18,
33, 20, 27, 34, 18, 27, 18, 33, 22, 25, 22, 30, 35, 21, 33, 18,
31, 17, 15, 18, 28, 20, 22, 30, 21, 18, 15, 18, 22, 18, 31, 16,
16, 35, 29, 18, 20, 19, 29, 28, 18, 30, 18, 40, 15, 19, 33, 20,
24, 23, 33, 18, 21, 19, 19, 29, 17, 20, 23, 38, 40, 20, 16, 30,
22, 16, 29, 20, 19, 31, 20, 33, 33, 23, 22, 34, 24, 16, 18, 20,
23, 19, 28, 31, 32, 26, 32, 16, 24.
61
Con esta masa bruta de datos, se inicia el proceso del tratamiento
estadístico de frecuencias respecto a las 154 edades de madres
gestantes, las cuales fueron atendidas en el parto en el Centro Materno
Perinatal-Tarapoto. Enero 2004, siguiendo los pasos teóricos propuestos:
62
Indicamos que cuando la amplitud en su cálculo
registra decimales, es necesario redondear al
entero inmediato superior, además, en la
mayoría de cuadros de distribución de
frecuencias se utiliza la misma Amplitud para
todo los intervalos, pero, también se pueden
utilizar intervalos de diferentes Amplitudes, por
ejemplo, al estudiar los grupos Etáreos de una
población.
Fuente: DIRES/SM
64
En el tratamiento y resumen de datos de una variable
cuantitativa discreta, por ejemplo, número de nacimientos
diarios en el C.M. Perinatal-Tarapoto. Enero-Febrero 2004,
no se pierde la información original, ya que, todos sus
valores están representados en las clases o modalidades con
sus respectivas frecuencias; pero, en una variable
cuantitativa continua al elaborarse los intervalos de clase, se
pierde la información original y las frecuencias se refieren a
la Marca de Clase como dato representativo en ese
intervalo. Por ejemplo, en el quinto intervalo existe 25
madres gestantes con una edad de 30.75 años, que serán
usados en cálculos de cualquier indicador estadístico. Esta
pérdida de información es compensada, al realizar la
sistematización de la masa bruta de datos, ya que, las 154
edades de madres gestantes presentadas al inicio no dicen
nada relevante, pero luego del sencillo tratamiento de
elaborar las distribuciones de frecuencias, pueden ser
descritas y analizadas, por ejemplo:
65
• El grupo adolescente entre 15 y 18 años
representa el 23.4% y con la más alta frecuencia
de 25 gestantes.
66
GRÁFICAS
Los gráficos más importantes son el Histograma de
Frecuencias Absolutas, Polígono de Frecuencias Absolutas,
Histograma de Frecuencias Relativas, Polígono de
Frecuencias Relativas, Polígono de Frecuencias Relativas
Acumuladas, etc.
67
GRAFICO N° 5. HISTOGRAMA DE FRECUENCIA ABSOLUTAS: EDAD DE MADRES
GESTANTES ATENDIDAS EN PARTO EN EL C.M. PERINATAL-TARAPOTO. ENERO 2004.
Fuente: DIRES/SM.
68