Está en la página 1de 84

Estadística I

MCs. Ing. Johnny Jacha Rojas


CIP 146207
Capitulo I
FUNDAMENTOS
Estadística
Definición:
Es una ciencia que nos ofrece un conjunto de
métodos y técnicas para: Recolectar, Clasificar,
Procesar, Analizar e Interpretar y Presentar un
conjunto de datos con la finalidad de conocer de una
manera más detallada un aspecto de la Realidad o
Problema y colaborar en la toma decisiones para la
solución o mejora de dicho problema.
1. 1.

2. Estadística Descriptiva; es la que se 2. Estadística Inferencial; es la parte de la


Estadística que se encarga de inferir sobre el
encarga de recopilar, ordenar, clasificar
comportamiento de una población a partir de una
y presenta una información, llamada muestra, bajo un margen de error o incertidumbre
muestra aleatoria. que es cuantificado por la teoría de probabilidades.
ESQUEMA DEL CURSO

ESTADÍSTICA

DISEÑO DE EXPERIMENTOS

ESTADÍSTICA DESCRIPTIVA INFERENCIA ESTADÍSTICA

CONTRASTE
ESTIMACIÓN
DE HIPÓTESIS

TIPOS DE TABLAS Y POR MÉTODOS MÉTODOS NO


PUNTUAL
VARIABLES GRÁFICAS INTERVALOS PARAMÉTRICOS PARAMÉTRICOS

T-STUDENT U-MANN
WHITNEY
MEDIDAS DE
POSICIÓN CENTRAL ANOVA
K-W
Y DE DISPERSIÓN
FISHER
TABLAS DE
CONTINGENCIA
PEARSON
¿Porqué la estadística es importante?
¿Ventas
¿Qué variedad de mensuales?
suelo elegiré?, Pruebas de control y
¿porqué razón? calidad del agua
¿Mejor resistencia?

Estudios
¿tasa de interés?
interlaboratorios
¿Fenómenos
ambientales?
La estadística
herramienta
fundamental
en la toma
de decisiones
Población
Definiciones:

1) Es un conjunto de elementos, (personas, objetos o


cosas...), que tienen una o más características
observables que se pueden medir en ellos.
2) Es un conjunto de observaciones que tienen una
característica en común la cual se desea estudiar, la
población representa la totalidad de elementos de un
determinado estudio y puede ser finita o infinita.
Ejemplos:
*Habitantes de Lima (aptos para el sufragio). Población
Infinita
*Alumnos de la UDH (altura en mts.). Población Finita
POBLACIÓN
 El elemento de una población puede ser una entidad simple(una
persona) o una entidad compleja (una familia), y se denomina unidad
investigada. Es importante resaltar el hecho de que a pesar de
encontrarse una población constituida por un grupo de elementos, a
la estadística no le interesa el elemento en sí, sino sus
características.
 Ejemplos de lo que podría denominarse elementos de una población
y características de la misma
SEGÚN, Ciro Martínez BenCardino
 Existe una diferencia entre los términos estadística y estadísticas; la
primera se requiere a la técnica de recolección, procesamiento y
análisis del dato; la segunda, corresponde al ordenamiento sistemático
de la información en forma de cuadros y gráficas.
 La estadística cumple dos funciones:
a) La de análisis descriptivo en forma cuantitativa de las características
observadas en el fenómeno,
b) La inferencia estadística o inducción, lográndose generalizaciones para
un grupo mayor denominado población, partiendo de un grupo menor o
muestra. Se da una serie de términos estadísticos que deben conocerse
para un buen desarrollo del curso de estadística, entre otros:
población, muestra, variables y atributos
 
    
         
           
  
          
 

 

Muestra
* Se denomina muestra a una parte de la población seleccionada de acuerdo con
un plan o regla, con el fin de obtener información acerca de la población de la
cual proviene.
*Es un subconjunto de la población y para que la muestra sea representativa debe ser
aleatoria o no sesgada. Una muestra es aleatoria cuando cada elemento de la población
tiene la misma posibilidad de ser seleccionado en la muestra.
La demostraremos por: n= tamaño de la muestra ó número total de observaciones en la
muestra.
EJEMPLO: * Encuesta a 900 personas de Lima aptos para el sufragio.
n = 900
* Altura (mts) de 45 alumnos de la UDH
n = 45.
ESTADÍSTICA DESCRIPTIVA
La Estadística Descriptiva, se encarga de recopilar la información
de una muestra aleatoria, esta información tiene que ser ordenada
para una buena presentación; Esta ordenación se basa en las
llamadas Tablas de Frecuencias y también en los Gráficos
Estadísticos.
RECOPILACIÓN DE DATOS
Es el momento en el cual el investigador se pone en contacto con los
objetos o elementos sometidos a estudio, con el propósito de obtener
datos o respuestas de las variables consideradas; a partir de estos
datos o respuestas se calculan los Estadígrafos o indicadores
estadísticos.
FUENTES DE DATOS
La fuente de datos, es el lugar, la institución, las personas o elementos donde están o que
poseen los datos que se necesitan para cada uno de las variables o aspectos de la investigación
o estudio.
 En general, se puede disponer de cinco tipos de fuentes de datos:
Las Oficinas de Estadística.- Como instituciones responsables de recopilar, procesar y
publicar las estadísticas sociales o nacionales.
Archivos o Registros Administrativos.- Como el Registro Civil, Electoral, Escalafón o
Personal, Padrón de Contribuyentes, etc.. Estos registros no tienen fines Estadísticos, su
función es de tipo legal y administrativo, sin embargo pueden utilizarse como fuentes de datos
estadísticos.
Documentos.- Boletines, e informes estadísticos que son las publicaciones o estudios que
preparan los organismos especializados.
Encuestas y Censos.- Son fuentes directas y especiales, que se construyen en un momento
determinado, recopilando datos de una parte o de la totalidad de una población.
Los Elementos o Sujetos.- Son aquellos que están sometidos a un estudio, pueden ser
personas, instituciones, animales u objetos.
TÉCNICAS DE RECOPILACIÓN O
RECOLECCIÓN DE DATOS
Es el conjunto de métodos y procedimientos que se llevan a cabo para recolectar los datos.
Las más frecuentes técnicas utilizadas son:
 La Observación.- Es la acción de mirar de mirar en forma sistemática y profunda, con el interés de descubrir la
importancia de aquello que se observa.
 La Técnica Documental.- Es aquella que busca datos a través de documentos, fuentes escritas o gráficas de todo tipo.
Ejm.: Libros, Informes, Autobiografías, fotografías, planos, videos, etc.
 La Entrevista.- Es la interrelación o diálogo entre personas, donde una de ellas se llama Entrevistador o Encuestador
quien solicita a otra persona llamada Entrevistado o Encuestado le proporcione algunos datos o información.
 El Cuestionario.- Es un instrumento constituido por un conjunto de preguntas sistemáticamente elaboradas, que se
formulan al Entrevistado o Encuestado, con el propósito de obtener los datos de las variables consideradas en el
estudio. El Cuestionario se desarrolla en el Formulario o Cédula, en donde las preguntas están debidamente
organizadas.
 La Encuesta.- Es la técnica por la cual se obtiene la información tal como se necesita, preparada exprofesamente y
con objetivo estadístico. Permite observar y registrar características en las unidades de análisis de una determinada
población o muestra, delimitada en el tiempo y en el espacio. El Entrevistado da respuesta a las preguntas en el
formulario o Cédula
Definiciones:
Variable
Es una característica definida en la
población y que puede tomar dos o
más valores o modalidades.

DATO: Es la recopilación o anotación de cada


característica de las observaciones de una muestra.
Ejemplo:
Altura (mts) de n=5 alumnos de la UDH: 1.65, 1.59, 1.68, 1.63, 1.69.
Clasificación de variables

Cualitativa Cuantitativa
Es la característica Es la característica
cuyos valores se
cuyos valores se
expresan en escala
nominal u ordinal. expresan en escala de
Ej.. intervalos o de razón.
Sexo Se dividen en:
Cursos del primer ciclo
–Discretas
Tipos de envase
–Continua
Clasificación de las variables cuantitativas

Discreta Continua
Cuando toma sólo Es aquella variable que
ciertos valores en el puede tomar cualquier
intervalo considerado y valor en el intervalo
no admite valores considerado.
intermedios entre dos Ej.:Temperatura de
valores consecutivos. ignición de un gas,
Ej.: Número de artículos tiempo de corte de un
defectuosos torno corriente.
EJEMPLOS:
 La cantidad N de hijos que tiene una familia puede tomar los
valores 0, 1, 2, 3, . . . , pero no puede tomar valores como 2.5 o
3.842; ésta es una variable ………..
 La estatura H de una persona que puede ser 62 pulgadas (in),
63.8 in o 65.8341 in, dependiendo de la exactitud con que se
mida, es una variable …………….
 El arco iris, color C es una variable que puede tomar los
“valores” rojo, anaranjado, amarillo, verde, azul, índigo o
violeta. Estas variables se pueden reemplazar por números; por
ejemplo, se puede denotar rojo con 1, anaranjado con 2,
etcétera.
ESCALAS DE MEDICIÓN DE LAS VARIABLES

 Se diferencian por sus atributos.

Razón

Intervalo Origen

Ordinal Distancia Distancia

Orden Orden Orden


Nominal
Escala de medición
Escala de medición
ORGANIZACIÓN DE DATOS
DISTRIBUCIÓN DE FRECUENCIAS

 Es la condensación, simplificación, ordenación, del conjunto de observaciones que forman


la muestra; la característica principal es no perder ningún dato de la muestra.
 También se puede decir que la Distribución de Frecuencia es la representación
estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable
que se estudia.
TODO CUADRO ESTADISTICO DEBE CONTENER BÁSICAMENTE:
 Un título adecuado para evitar confusiones y para expresar brevemente su
contenido.
 El cuerpo o agrupación de datos.
 La fuente de los datos, si no son datos propios.
 El cuadro numérico de una sola variable estadística se denomina distribución de
frecuencias.
Construcción de tablas de frecuencias

Las tablas de frecuencias son herramientas de Estadística, siendo estas un


resumen en forma de arreglo tabular de los datos útiles más que una simple
enumeración dada por medio de una recolección de datos. Este arreglo
tabular se forma por columnas en donde son colocados los datos estadísticos
que representan los distintos valores recogidos en la muestra y las frecuencias
(las veces) en que ocurren.

“Secuencia de análisis de un estudio de datos estadísticos”

Es importante las tablas de frecuencias ya que permite la determinación del número de


intervalos (clases) que la conforman. Este número depende de la cantidad y de la naturaleza
de los datos a resumir asi como del fín que se busca con el resumen.
LA ORGANIZACIÓN DE LOS DATOS
 Categorías o Clases.- Son los datos que están agrupados por sus características
comunes.
 Frecuencia de Clases.- Es el número o cantidad de datos que componen una Categoría
o Clase. Las Frecuencias se clasifican en :
 Frecuencia Absoluta (Simple).- Representa a la cantidad de datos de cada Clase.
 Frecuencia Absoluta Acumulada.- Representa a la suma en forma acumulativa de
Clase en Clase de sus respectivas Frecuencias Absolutas.
 Frecuencia Relativa (Simple) .- Es el % que representa a la cantidad de datos de una
Clase con respecto al total de datos.
 Frecuencia Relativa Acumulada.- Representa a la suma en forma acumulativa de
Clase en Clase de sus respectivas Frecuencias Relativas.
EJEMPLO
 Medimos la altura de los niños de una clase y obtenemos los siguientes resultados (cm):

Alumno Estatura Alumno Estatura Alumno Estatura

Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21


Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29
Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26
Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22
Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28
Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27
Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26
Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23
Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22
Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21

Si presentamos esta información estructurada obtendríamos la


siguiente Tabla de Frecuencias:
EJEMPLO TABLA DE FRECUENCIAS
Variable Frecuencias Absolutas Frecuencias Relativas
(Valor) Simple Acumulada Simple Acumulada
X fi Fi hi Hi
1,20 1 1 3,3% 3,3%
1,21 4 5 13,3% 16,6%
1,22 4 9 13,3% 30,0%
1,23 2 11 6,6% 36,6%
1,24 1 12 3,3% 40,0%
1,25 2 14 6,6% 46,6%
1,26 3 17 10,0% 56,6%
1,27 3 20 10,0% 66,6%
1,28 4 24 13,3% 80,0%
1,29 3 27 10,0% 90,0%
1,30 3 30 10,0% 100,0%
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE
CUALITATIVA
 Si la variable X es cualitativa, observada en una muestra de n unidades estadística
de una población que origina k cualidades diferentes C1, C2, ...Ck, la tabulación o
agrupación de estos n datos, es la distribución de frecuencias:

Categorías de Frecuencias Frecuencias Frecuencias


la Variable X Absolutas fi Relativas hi Porcentajes Pi
Valor Simple(fi) Simple(hi )
C1 f1 h1=f1/n P1
C2 f2 h2=f2/n P2
… … … …
CK Fk hk=fk/n Pk
Total n 1.00 100.00
La frecuencia absoluta fi es el número de datos que resulta del conteo de la categoría respectiva Ci, donde i=1,2,…k. La suma
de todas las frecuencias absolutas es igual a n, el total de datos observados.
La frecuencia relativa h1 se define en cada categoría Ci por hi=fi/n
Las frecuencias relativas suma a uno
Las frecuencias porcentaje Pi se define en cada categoría Ci por Pi=hix100%
El total de las frecuencias porcentajes es igual cien.
Grafica de la distribución cualitativa
 Gráfica de barras, los datos son representados para una barra
rectangular vertical (u horizontal), cuya altura (o largo) es
proporcional a su frecuencia. Las barras se dibujan dejando un
espacio entre ellas.
 Si la escala es nominal las cualidades pueden ser colocadas en
cualquier orden. Pero, si el nivel de escala es ordinal las cualidades
deben ir ordenadas.
 Gráfica circular, se representan por un por un sector circular cuyo
Angulo en el centro es igual a hix360°. Si la gráfica por sectores
circulares es tridimensional ésta es denominada gráfica de Pastel.
Ejemplo 1 (Nominal)
 En encuesta de opinión acerca de las preferencias de bebidas gaseosas por su
color: Negro (N), blanco (B), Rojo (R), 20 consumidores dieron las siguientes
respuestas.

B N N B R N N B B N
B N N R B N B R B N

 Describa la variable estadística y obtenga la distribución de frecuencias.


Luego presente los datos agrupados en las gráficas de barras y circular.
Finalmente desarrolle un breve comentario de los resultados de sondeo.
SOLUCIÓN:
SOLUCIÓN
Cuadro de distribución de personas por su color preferido de una Marca de bebida gaseosa.

Frecuencia Absoluta Frecuencia Relativa Frecuencias


Valores de x
fi hi Porcentajes.
Negro (N) 9 0.45 45
Blanco (B) 8 0.40 40
Rojo (R) 3 0.15 15
Total 20 1.00 100

Preferencias de bebidas

10
9
8
7
Personas

6
5 Series1
4
3
2
1
0
Negro Blanco Rojo
Gráfica de sectores circulares
Gráfica de barras
La bebida que mas prefiere la muestra es de color negro 9 de 20 o 45%. Sólo un 15% de la muestra (3 de 20) prefieren de color
rojo. El color negro que tiene mayor frecuencia es la moda de la distribución.
DISTRIBUCIÓN DE FRECUENCIAS DE VARIABLE
CUANTITAVA DISCRETA
Categorías de Frecuencias Frecuencias Frecuencias
la Variable X Absolutas fi Relativas hi Porcentajes Pi
Valor Simple(fi) Simple(hi )
X1 f1 h1=f1/n P1
X2 f2 h2=f2/n P2
… … … …
XK Fk hk=fk/n Pk
Total N 1.00 100.00

 GRÁFICO DE BASTON, para expresar este tipo de datos. No confundir con las barras separas de las variables cuantitativa.
EJEMPLO: Ante la pregunta del número de hijos por familia (variable x ) una muestra de 20 hogares, marcó las siguientes respuestas:
OJO;
Variable cuantitativa discreta.
Nivel de escala de razón
Ejemplo 2 (Ordinal)
 Al realizar el estudio del grado de instrucción en una muestra de 120
pacientes que sufren de tuberculosis pulmonar que fueron atendidos durante
el mes de enero de 2017 en el hospital Hermilio Valdizan Medrano, se
obtuvieron los siguientes resultados: Analfabetos 38, primaria 63, secundaria
16, superior 3.

Frecuencia Absoluta Frecuencia Relativa Frecuencias


Valores de x
fi hi Porcentajes. hi%
Analfabetos
Primaria
Secundaria
Superior
Total 120 1.00 100
EJEMPLO 03:
 Ante la pregunta del número de hijos por familia (variable x ) una muestra de
20 hogares, marcó las siguientes respuestas:

2 1 2 4 1 3 2 3 2 0
3 2 1 3 2 3 3 1 2 4
Describa la variable de la encuestas y obtenga la distribución de frecuencias de los datos. Luego,
grafique la distribución. Finalmente desarrolle un breve comentario.
SOLUCIÓN
Cuadro: Distribución de frecuencias, del número de hijos por familias
Nº de hijos Frecuencia Frecuencia Porcentajes
Xi Absoluta (fi) Relativa (hi) (PI)

0 1 0.05 5
1 4 0.20 20
2 7 0.35 35
3 6 0.30 30
4 2 0.10 10
Total 20 1.00 100

La distribución de datos es asimétrica y presenta una concentración en el valor 2 de la


variable. La mayoría de familias de la muestra (35%) tiene 2 hijos. Solo un 5% no tiene
hijos.
TABLAS DE DISTRIBUCIÓN DE FRECUENCIAS
PARA VARIABLE CUANTITATIVA CONTINUA
PASOS PARA LA CONSTRUCCIÓN DE LA TABLA.
* Calcular el número de intervalos.
* Calcular la marca de clase.
* Obtener las frecuencias absolutas y relativas.
* Obtener las frecuencias acumuladas.
Para determinar el número de intervalos de una distribución de frecuencias es necesario seguir cuatro pasos.
* Ordenación.
* Determinar el campo de variación (recorrido) de la variable.
* Seleccionar la amplitud de los intervalos.
* Fijar el límite inferior y superior de cada intervalo.
* Se definirán estos nuevos conceptos a través del desarrollo del siguiente ejemplo.
DISTRIBUCIÓN DE FRECUENCIAS POR
INTERVALOS
FRECUENCIAS
Intervalo Conteo
Ii Absolutas(fi) Relativas(hi ) Porcentajes Pi

I1 ///… f1 h1 P1
I2 ///… f2 h2 P2
… …. … ….
IK ///… fk hk Pk
TOTAL N 1.00 100

La distribución de frecuencias por intervalos o clases se aplica cuando


la variable estadística cuantitativa es continua o cuando el número de
valores distintos de una variable discreta es my grande.
1. Obtención de Rango de datos:
Se puede calcular de la siguiente manera:

Rango =Dato mayor - el dato menor

R= Xmax - Xmin
En el ejemplo, el rango quedaría de la siguiente manera:

Rango= 1.87 – 1.52 = 0.35


2. Número de Intervalos o clases.
 El número de clases se puede determinar con la raíz cuadrada de el número de datos, siempre y
cuando esté último sea menor que 200, Por lo tanto lo determinaremos de esa manera.

k = √n , 23 <=n>=400

n>= 10,

K = 5.95430355
3. Amplitud
 Dividiendo A=R/K, Sometida a la condición kA>=R
 I1=[Xmin, Xmin + A[
 I2=[Xmin+A, Xmin + 2A[
 I3=[Xmin+2a, Xmin + 3A[
 ….
 Ik=[Xmin+(k-1)A, Xmin + KA]
EJEMPLO:
Los salarios quincenales, el dólares, recopilados en una muestra de 45 empleados
son:

63 82 36 49 56 64 59 35 78
43 51 70 57 62 43 68 62 26
64 72 52 51 62 60 71 61 55
59 60 67 57 67 61 67 51 81
50 64 76 44 73 56 62 63 60

Describa la variable y desarrolle la distribución de frecuencias de los datos.

SOLUCION:

La variable X = “Salarios quincenales de empleados”, Es


una variable cuantitativa continua cuyos valores están en
escala de razón
SOLUCION:
 1. Rango:56
 2. Intervalos: 6.4556 = 7
 3. Amplitud:8
FRECUENCIAS
Intervalo Conteo de
De salarios empleados Absolutas(fi) Relativas(hi ) Porcentajes Pi%
Ii
[26,34[ / 1 0.022 2.2
[34,42[ // 2 0.044 4.4
[42,50[ //// 4 0.089 8.9
[50.58[ ///// ///// 10 0.222 22.2
[58,66[ ///// ///// ///// / 16 0.356 35.6
[66,74[ ///// /// 8 0.178 17.8
[74,82] //// 4 0.089 8.9
TOTAL 45 1.000 100.0
MARCA DE CLASE
 También llamado marca de intervalo Ii=[Li,Ui[ en el número mi, que se define
como el punto medio del intervalo. Esto es;
mi=Li + Ui FRECUENCIAS
Intervalo Conteo de
INTERVALOS2
De salarios empleados Absolutas(fi) Relativas(hi ) Porcentajes Pi%
Ii
[26,34[ / 30 1 0.022 2.2
[34,42[ // 38 2 0.044 4.4
[42,50[ //// 46 4 0.089 8.9
[50.58[ ///// ///// 54 10 0.222 22.2
[58,66[ ///// ///// ///// / 62 16 0.356 35.6
[66,74[ ///// /// 70 8 0.178 17.8
[74,82] //// 78 4 0.089 8.9
TOTAL 45 1.000 100.0
GRAFICA DE LA DISTRIBUCIÓN DE
FRECUENCIAS.
 HISTOGRAMAS POLIGONO DE FRECUENCIAS

18
18 16
16 14
14 12

Empleados
12 10
Empleados

10 8
8 6
6 4
4 2
2 0
22 30 38 46 54 62 70 78 86
0
22 30 38 46 54 62 70 78 86 Salarios
Salarios
CURVA DE FRECUENCIAS
La curva de frecuencia, también llamada modelo de la población, y desribe las
características de la distribución de la población como simetría, asimetría, tipos
como: normal, bimodal, uniforme, etc.

18

16

14

12
Empleados

10

0
22 30 38 46 54 62 70 78 86
Salarios
CURVA DE FRECUENCIAS
 Las curvas son de 3 tipos:
 Normal o mesocúrtica (figura (a))
 Platicúrtica(figura (b))
 Leptocúrtica(figura (c))
Distribuciones Asimétricas
Las curvas asimétricas pueden ser de dos tipos:
 Asimétricas positivas (o de cola al lado derecho)(a)
 Asimétricas negativa (o de cola al lado izquierdo)(b)
MEDIDAS DE ASIMETRIA
𝑿 − 𝑴𝒐
𝑨𝑺 =
𝒔

ASIMETRIA POSITIVA ASIMETRIA NEGATIVA


Distribución multimodal
 Una curva de frecuencias es bimodal si tiene dos frecuencias máximas figura
(a). Es trimodal si tiene tres frecuencias máximas, como la figura(b), etc.
DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS
 Es la representación estructurada, en forma de tabla, de toda la información que se ha recogido
sobre la variable que se estudia.

VARIABLE FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA


Valor Simple(fi) Acumulada (Fi) Simple(hi ) Acumulada (Hi )
X1 f1 f1 h1=f1/n h1
X2 f2 f1 + f2 h2=f2/n h1+h2
… … … … …
XK-1 Fk-1 f1 + f2 +..+ Fk-1 hk-1=fk-1/n h1+h2+..+hk-1
XK fk ∑F1=n hk=fk/n 1

Siendo Xi los distintos valores que puede tomar las variables (i=1,2,3…k)
Siendo fi el número de veces que se repite cada valor.
Siendo hi el porcentaje que la repetición de cada valor supone sobre el total
Siendo n el números de observaciones realizadas
Ejemplo:
Si presentamos la información estructurada obtendríamos la
siguiente tabla de frecuencias.

VARIABLE FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA

valor Simple Acumulada Simple Acumulada


1.20 1 1 3.3% 3.3%
1.21 4 5 13.3% 16.7%
1.22 4 9 13.3% 30.0%
1.23 2 11 6.7% 36.7%
1.24 1 12 3.3% 40.0%
1.25 2 14 6.7% 46.7%
1.26 3 17 10.0% 56.7%
1.27 3 20 10.0% 66.7%
1.28 4 24 13.3% 80.0%
1.29 3 27 10.0% 90.0%
1.30 3 30 10.0% 100.0%

Si los valores que toma la variable son diversos y cada uno de ellos se repite varias veces,
entonces conviene agruparlos por intervalos, ya que de otra manera obtendríamos una tabla
de frecuencia muy extensa que aportaría poco valor a efectos de síntesis.
CASO 1: ANALIZAR.
A continuación se muestran los siguientes datos, que son puntajes obtenidos por 50
estudiantes en un examen:

n=?
K=?
R=?
A=?
En el cuadro: Generar los intervalos y el intervalo de clase.
Tabla de distribución de frecuencias.
Interpretación de datos:
 La Variables es: Sueldo diario de Trabajadores.
CAPITULO 2
MEDIDAS DE POSICIÓN
MEDIDAS DE POSICIÓN CENTRAL
MEDIA: Es el valor medio ponderado de la serie de datos. Se puede calcular
diversos tipos de media, siendo las mas utilizadas:

Medía Aritmética
REPASO
ANÁLISIS DE DATOS UNIVARIANTES
REPASO: Medidas de localización o posición
 Moda
 Mediana
 Media
 Cuantiles

Medidas de dispersión
 Varianza y desviación típica
 Coeficiente de variación
 Rango y rango intercuartílico
Medidas de localización o posición
LA MODA: (Cuando los datos no están agrupados en
intervalos)
Es el valor que aparece con una frecuencia mayor.
Puede haber más de una moda: bimodal-trimodal-plurimodal

7 7 7 5 3 5 11 7
11 2 11 7 4 8 8 7
10 2 5

¿Qué valor toma la moda?


Medidas de localización o posición

Clases ni Marca de clase


LA MODA: (Cuando los [0,5) 11
datos están agrupados [5,10) 13
en intervalos) [10,15) 6
[15,20) 2
[20,25) 1
[25,30) 3

Podemos encontrar: La CLASE MODAL


¿En la representación gráfica?
Pero, ¿y si queremos calcular “exactamente” el valor de la MODA?

ni 1
Mo  LIi 
ni 1  ni 1
i

72
¿Podemos calcularla para DATOS CUALITATIVOS?
Medidas de localización o posición
EJERCICIO: LA MODA Intervalo Frecuencia absoluta

[0,5) 6

[5,10) 14

[10,15) 20

[15,20) 10

Calcular el valor “exacto” de la


moda.
73
Medidas de localización o posición

LA MEDIANA: (Cuando los datos no están agrupados en intervalos)


Es la observación que ocupa el “lugar” central

7 7 7 5 3 5 11 7
11 2 11 7 4 8 8 7
10 2 5

¿Qué valor toma la mediana?


1. Ordenamos los datos de menor a mayor.
2. Tenemos en cuenta también los que se repiten.
3. La mediana, es el “CENTRO FÍSICO”
74 ¿Cómo cambia el cálculo si N es par o impar?
Medidas de localización o posición

LA MEDIANA: (Cuando los datos están agrupados en intervalos)

Clases ni Marca de clase


[0,5) 13 2,5
Podemos encontrar: [5,10) 11 7,5
[10,15) 6 12,5
El INTERVALO MEDIANO
[15,20) 2 17,5
[20,25) 1 22,5
[25,30) 3 27,5

Pero, ¿y si queremos calcular exactamente el valor de la MEDIANA?

N
 Ni 1
Me  LIi 1  2 i
ni
¿Podemos calcularla para DATOS CUALITATIVOS?
75
Medidas de localización o posición
(Cuando los datos no están agrupados en intervalos)

LA MEDIA ARITMÉTICA: Es el PROMEDIO de los valores de la muestra

7 7 7 5 3 5 11 7
11 2 11 7 4 8 8 7
10 2 5

¿Qué valor toma la media?


1. Sumamos los datos.
2. Los dividimos por el número total de datos (N).
N

x i
x 1x 2  ...  x N
X  i 1

N N
76
Medidas de localización o posición
(Cuando los datos están agrupados en intervalos)

LA MEDIA ARITMÉTICA:
Clases ni M.C. (xi) ni xi
El valor de la media con
[0,5) 13 2,5 32,5
los datos agrupados en [5,10) 11 7,5 82,5
intervalos utiliza la [10,15) 6 12,5 75
marca de clase. [15,20) 2 17,5 35
[20,25) 1 22,5 22,5
[25,30) 3 27,5 82,5
330 Suma
9,17 Media

¿Podemos calcularla para DATOS CUALITATIVOS?


77
Medidas de localización o posición
(Cuando los datos están agrupados en intervalos)

La MEDIA ARITMÉTICA para datos agrupados en intervalos es entonces:

x n i i
X i 1
,siendo "K" el nº de intervalos
N

78
Medidas de localización o posición
LOS CUANTILES: (Cuando los datos no están agrupados en intervalos)
Nos divide en conjunto de datos en k partes.
Si por EJEMPLO tenemos diez datos (N=10), y queremos hacer cuatro partes
(k=4), necesitamos tres marcas (c1, c2 y c3)

Cuando k=4, se llaman CUARTILES; cuando k=10, DECILES; y


cuando k=100, CENTILES.
MEDIDAS DE POSICIÓN: CUARTILES
 SON 3 VALORES DE LA VARIABLE QUE DIVIDES A UN CONJUNTO DE DATOS
ORDENADOS EN 4 PARTES IGUALES.
 LOS CUARTILES REPRESENTAN LOS VALORES 25%, 50% Y 75% DE LOS DATOS, Q2
COINCIDE CON Me

EJEMPLO: EDADES 15 17 16 16 15 17 15 18 14 16 15
Medidas de localización o posición

CÁLCULO DE CUARTILES

Tenemos el siguiente conjunto de datos:

47 52 52 57 63 64 69 71
72 72 78 81 81 86 91
1. Ordenamos los datos de menor a mayor.

2. Calculamos c2 , que ocupa la posición correspondiente a la “mitad”,


¿con qué parámetro visto ya coincide este segundo cuartil?

3. Ahora calculamos, la “mitad” de la primera parte: c1 .

4. Y la “mitad” de la segunda parte: c3

81
Medidas de localización o posición

47 47
52 52
52 52
57 57
63 63
c1 = 60
Q=k(n+1)/4 64 64
69 69
Q=kn/4 c2 = 71 71 71 71
72 72
72 72
78 78
c3 = 79,5
81 81
81 81
86 86
91 91
82
Respuesta f F
0 10 5 5
10 20 9 14
20 30 25 39
30 40 32 71
40 50 21 92
50 60 8 100

También podría gustarte