Explora Libros electrónicos
Categorías
Explora Audiolibros
Categorías
Explora Revistas
Categorías
Explora Documentos
Categorías
ESTADÍSTICA
DISEÑO DE EXPERIMENTOS
CONTRASTE
ESTIMACIÓN
DE HIPÓTESIS
T-STUDENT U-MANN
WHITNEY
MEDIDAS DE
POSICIÓN CENTRAL ANOVA
K-W
Y DE DISPERSIÓN
FISHER
TABLAS DE
CONTINGENCIA
PEARSON
¿Porqué la estadística es importante?
¿Ventas
¿Qué variedad de mensuales?
suelo elegiré?, Pruebas de control y
¿porqué razón? calidad del agua
¿Mejor resistencia?
Estudios
¿tasa de interés?
interlaboratorios
¿Fenómenos
ambientales?
La estadística
herramienta
fundamental
en la toma
de decisiones
Población
Definiciones:
Muestra
* Se denomina muestra a una parte de la población seleccionada de acuerdo con
un plan o regla, con el fin de obtener información acerca de la población de la
cual proviene.
*Es un subconjunto de la población y para que la muestra sea representativa debe ser
aleatoria o no sesgada. Una muestra es aleatoria cuando cada elemento de la población
tiene la misma posibilidad de ser seleccionado en la muestra.
La demostraremos por: n= tamaño de la muestra ó número total de observaciones en la
muestra.
EJEMPLO: * Encuesta a 900 personas de Lima aptos para el sufragio.
n = 900
* Altura (mts) de 45 alumnos de la UDH
n = 45.
ESTADÍSTICA DESCRIPTIVA
La Estadística Descriptiva, se encarga de recopilar la información
de una muestra aleatoria, esta información tiene que ser ordenada
para una buena presentación; Esta ordenación se basa en las
llamadas Tablas de Frecuencias y también en los Gráficos
Estadísticos.
RECOPILACIÓN DE DATOS
Es el momento en el cual el investigador se pone en contacto con los
objetos o elementos sometidos a estudio, con el propósito de obtener
datos o respuestas de las variables consideradas; a partir de estos
datos o respuestas se calculan los Estadígrafos o indicadores
estadísticos.
FUENTES DE DATOS
La fuente de datos, es el lugar, la institución, las personas o elementos donde están o que
poseen los datos que se necesitan para cada uno de las variables o aspectos de la investigación
o estudio.
En general, se puede disponer de cinco tipos de fuentes de datos:
Las Oficinas de Estadística.- Como instituciones responsables de recopilar, procesar y
publicar las estadísticas sociales o nacionales.
Archivos o Registros Administrativos.- Como el Registro Civil, Electoral, Escalafón o
Personal, Padrón de Contribuyentes, etc.. Estos registros no tienen fines Estadísticos, su
función es de tipo legal y administrativo, sin embargo pueden utilizarse como fuentes de datos
estadísticos.
Documentos.- Boletines, e informes estadísticos que son las publicaciones o estudios que
preparan los organismos especializados.
Encuestas y Censos.- Son fuentes directas y especiales, que se construyen en un momento
determinado, recopilando datos de una parte o de la totalidad de una población.
Los Elementos o Sujetos.- Son aquellos que están sometidos a un estudio, pueden ser
personas, instituciones, animales u objetos.
TÉCNICAS DE RECOPILACIÓN O
RECOLECCIÓN DE DATOS
Es el conjunto de métodos y procedimientos que se llevan a cabo para recolectar los datos.
Las más frecuentes técnicas utilizadas son:
La Observación.- Es la acción de mirar de mirar en forma sistemática y profunda, con el interés de descubrir la
importancia de aquello que se observa.
La Técnica Documental.- Es aquella que busca datos a través de documentos, fuentes escritas o gráficas de todo tipo.
Ejm.: Libros, Informes, Autobiografías, fotografías, planos, videos, etc.
La Entrevista.- Es la interrelación o diálogo entre personas, donde una de ellas se llama Entrevistador o Encuestador
quien solicita a otra persona llamada Entrevistado o Encuestado le proporcione algunos datos o información.
El Cuestionario.- Es un instrumento constituido por un conjunto de preguntas sistemáticamente elaboradas, que se
formulan al Entrevistado o Encuestado, con el propósito de obtener los datos de las variables consideradas en el
estudio. El Cuestionario se desarrolla en el Formulario o Cédula, en donde las preguntas están debidamente
organizadas.
La Encuesta.- Es la técnica por la cual se obtiene la información tal como se necesita, preparada exprofesamente y
con objetivo estadístico. Permite observar y registrar características en las unidades de análisis de una determinada
población o muestra, delimitada en el tiempo y en el espacio. El Entrevistado da respuesta a las preguntas en el
formulario o Cédula
Definiciones:
Variable
Es una característica definida en la
población y que puede tomar dos o
más valores o modalidades.
Cualitativa Cuantitativa
Es la característica Es la característica
cuyos valores se
cuyos valores se
expresan en escala
nominal u ordinal. expresan en escala de
Ej.. intervalos o de razón.
Sexo Se dividen en:
Cursos del primer ciclo
–Discretas
Tipos de envase
–Continua
Clasificación de las variables cuantitativas
Discreta Continua
Cuando toma sólo Es aquella variable que
ciertos valores en el puede tomar cualquier
intervalo considerado y valor en el intervalo
no admite valores considerado.
intermedios entre dos Ej.:Temperatura de
valores consecutivos. ignición de un gas,
Ej.: Número de artículos tiempo de corte de un
defectuosos torno corriente.
EJEMPLOS:
La cantidad N de hijos que tiene una familia puede tomar los
valores 0, 1, 2, 3, . . . , pero no puede tomar valores como 2.5 o
3.842; ésta es una variable ………..
La estatura H de una persona que puede ser 62 pulgadas (in),
63.8 in o 65.8341 in, dependiendo de la exactitud con que se
mida, es una variable …………….
El arco iris, color C es una variable que puede tomar los
“valores” rojo, anaranjado, amarillo, verde, azul, índigo o
violeta. Estas variables se pueden reemplazar por números; por
ejemplo, se puede denotar rojo con 1, anaranjado con 2,
etcétera.
ESCALAS DE MEDICIÓN DE LAS VARIABLES
Razón
Intervalo Origen
B N N B R N N B B N
B N N R B N B R B N
Preferencias de bebidas
10
9
8
7
Personas
6
5 Series1
4
3
2
1
0
Negro Blanco Rojo
Gráfica de sectores circulares
Gráfica de barras
La bebida que mas prefiere la muestra es de color negro 9 de 20 o 45%. Sólo un 15% de la muestra (3 de 20) prefieren de color
rojo. El color negro que tiene mayor frecuencia es la moda de la distribución.
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE
CUANTITAVA DISCRETA
Categorías de Frecuencias Frecuencias Frecuencias
la Variable X Absolutas fi Relativas hi Porcentajes Pi
Valor Simple(fi) Simple(hi )
X1 f1 h1=f1/n P1
X2 f2 h2=f2/n P2
… … … …
XK Fk hk=fk/n Pk
Total N 1.00 100.00
GRÁFICO DE BASTON, para expresar este tipo de datos. No confundir con las barras separas de las variables cuantitativa.
EJEMPLO: Ante la pregunta del número de hijos por familia (variable x ) una muestra de 20 hogares, marcó las siguientes respuestas:
OJO;
Variable cuantitativa discreta.
Nivel de escala de razón
Ejemplo 2 (Ordinal)
Al realizar el estudio del grado de instrucción en una muestra de 120
pacientes que sufren de tuberculosis pulmonar que fueron atendidos durante
el mes de enero de 2017 en el hospital Hermilio Valdizan Medrano, se
obtuvieron los siguientes resultados: Analfabetos 38, primaria 63, secundaria
16, superior 3.
2 1 2 4 1 3 2 3 2 0
3 2 1 3 2 3 3 1 2 4
Describa la variable de la encuestas y obtenga la distribución de frecuencias de los datos. Luego,
grafique la distribución. Finalmente desarrolle un breve comentario.
SOLUCIÓN
Cuadro: Distribución de frecuencias, del número de hijos por familias
Nº de hijos Frecuencia Frecuencia Porcentajes
Xi Absoluta (fi) Relativa (hi) (PI)
0 1 0.05 5
1 4 0.20 20
2 7 0.35 35
3 6 0.30 30
4 2 0.10 10
Total 20 1.00 100
I1 ///… f1 h1 P1
I2 ///… f2 h2 P2
… …. … ….
IK ///… fk hk Pk
TOTAL N 1.00 100
R= Xmax - Xmin
En el ejemplo, el rango quedaría de la siguiente manera:
k = √n , 23 <=n>=400
n>= 10,
K = 5.95430355
3. Amplitud
Dividiendo A=R/K, Sometida a la condición kA>=R
I1=[Xmin, Xmin + A[
I2=[Xmin+A, Xmin + 2A[
I3=[Xmin+2a, Xmin + 3A[
….
Ik=[Xmin+(k-1)A, Xmin + KA]
EJEMPLO:
Los salarios quincenales, el dólares, recopilados en una muestra de 45 empleados
son:
63 82 36 49 56 64 59 35 78
43 51 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
50 64 76 44 73 56 62 63 60
SOLUCION:
18
18 16
16 14
14 12
Empleados
12 10
Empleados
10 8
8 6
6 4
4 2
2 0
22 30 38 46 54 62 70 78 86
0
22 30 38 46 54 62 70 78 86 Salarios
Salarios
CURVA DE FRECUENCIAS
La curva de frecuencia, también llamada modelo de la población, y desribe las
características de la distribución de la población como simetría, asimetría, tipos
como: normal, bimodal, uniforme, etc.
18
16
14
12
Empleados
10
0
22 30 38 46 54 62 70 78 86
Salarios
CURVA DE FRECUENCIAS
Las curvas son de 3 tipos:
Normal o mesocúrtica (figura (a))
Platicúrtica(figura (b))
Leptocúrtica(figura (c))
Distribuciones Asimétricas
Las curvas asimétricas pueden ser de dos tipos:
Asimétricas positivas (o de cola al lado derecho)(a)
Asimétricas negativa (o de cola al lado izquierdo)(b)
MEDIDAS DE ASIMETRIA
𝑿 − 𝑴𝒐
𝑨𝑺 =
𝒔
Siendo Xi los distintos valores que puede tomar las variables (i=1,2,3…k)
Siendo fi el número de veces que se repite cada valor.
Siendo hi el porcentaje que la repetición de cada valor supone sobre el total
Siendo n el números de observaciones realizadas
Ejemplo:
Si presentamos la información estructurada obtendríamos la
siguiente tabla de frecuencias.
Si los valores que toma la variable son diversos y cada uno de ellos se repite varias veces,
entonces conviene agruparlos por intervalos, ya que de otra manera obtendríamos una tabla
de frecuencia muy extensa que aportaría poco valor a efectos de síntesis.
CASO 1: ANALIZAR.
A continuación se muestran los siguientes datos, que son puntajes obtenidos por 50
estudiantes en un examen:
n=?
K=?
R=?
A=?
En el cuadro: Generar los intervalos y el intervalo de clase.
Tabla de distribución de frecuencias.
Interpretación de datos:
La Variables es: Sueldo diario de Trabajadores.
CAPITULO 2
MEDIDAS DE POSICIÓN
MEDIDAS DE POSICIÓN CENTRAL
MEDIA: Es el valor medio ponderado de la serie de datos. Se puede calcular
diversos tipos de media, siendo las mas utilizadas:
Medía Aritmética
REPASO
ANÁLISIS DE DATOS UNIVARIANTES
REPASO: Medidas de localización o posición
Moda
Mediana
Media
Cuantiles
Medidas de dispersión
Varianza y desviación típica
Coeficiente de variación
Rango y rango intercuartílico
Medidas de localización o posición
LA MODA: (Cuando los datos no están agrupados en
intervalos)
Es el valor que aparece con una frecuencia mayor.
Puede haber más de una moda: bimodal-trimodal-plurimodal
7 7 7 5 3 5 11 7
11 2 11 7 4 8 8 7
10 2 5
ni 1
Mo LIi
ni 1 ni 1
i
72
¿Podemos calcularla para DATOS CUALITATIVOS?
Medidas de localización o posición
EJERCICIO: LA MODA Intervalo Frecuencia absoluta
[0,5) 6
[5,10) 14
[10,15) 20
[15,20) 10
7 7 7 5 3 5 11 7
11 2 11 7 4 8 8 7
10 2 5
N
Ni 1
Me LIi 1 2 i
ni
¿Podemos calcularla para DATOS CUALITATIVOS?
75
Medidas de localización o posición
(Cuando los datos no están agrupados en intervalos)
7 7 7 5 3 5 11 7
11 2 11 7 4 8 8 7
10 2 5
x i
x 1x 2 ... x N
X i 1
N N
76
Medidas de localización o posición
(Cuando los datos están agrupados en intervalos)
LA MEDIA ARITMÉTICA:
Clases ni M.C. (xi) ni xi
El valor de la media con
[0,5) 13 2,5 32,5
los datos agrupados en [5,10) 11 7,5 82,5
intervalos utiliza la [10,15) 6 12,5 75
marca de clase. [15,20) 2 17,5 35
[20,25) 1 22,5 22,5
[25,30) 3 27,5 82,5
330 Suma
9,17 Media
x n i i
X i 1
,siendo "K" el nº de intervalos
N
78
Medidas de localización o posición
LOS CUANTILES: (Cuando los datos no están agrupados en intervalos)
Nos divide en conjunto de datos en k partes.
Si por EJEMPLO tenemos diez datos (N=10), y queremos hacer cuatro partes
(k=4), necesitamos tres marcas (c1, c2 y c3)
EJEMPLO: EDADES 15 17 16 16 15 17 15 18 14 16 15
Medidas de localización o posición
CÁLCULO DE CUARTILES
47 52 52 57 63 64 69 71
72 72 78 81 81 86 91
1. Ordenamos los datos de menor a mayor.
81
Medidas de localización o posición
47 47
52 52
52 52
57 57
63 63
c1 = 60
Q=k(n+1)/4 64 64
69 69
Q=kn/4 c2 = 71 71 71 71
72 72
72 72
78 78
c3 = 79,5
81 81
81 81
86 86
91 91
82
Respuesta f F
0 10 5 5
10 20 9 14
20 30 25 39
30 40 32 71
40 50 21 92
50 60 8 100