Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA DESCRIPTIVA
1.1. CONCEPTO DE ESTADISTICA.
La estadística es una rama de la matemática aplicada que se ocupa de recolectar datos
organizarlos, representarlos y analizarlos; a partir de estos análisis extrae conclusiones
que sirven de base para tomar decisiones; la Estadística está ligada con los métodos
científicos en la toma, organización, presentación y análisis de datos, tanto para la
deducción de conclusiones, como para tomar decisiones razonables de acuerdo con los
análisis y cuando existen situaciones de incertidumbre. Algunas otras definiciones:
Ciencia dedicada al estudio sistemático de los datos. Transforma datos en información
Contribuye a la generación de conocimiento.
Es una ciencia que tiene por objeto la recolección, presentación, análisis e interpretación
de datos.
Rol de la estadística: Proporcionar métodos para evaluar y juzgar la teoría y la realidad
Usos: Ciencias naturales; ciencias económicas; ciencias políticas y sociales; medicas, etc.
Abusos:
Encuestas de opinión
Índices económicos
Pronósticos
1.2. DIVISION DE LA ESTADISTICA: La estadística se divide en dos grandes ramas:
a) Estadística Descriptiva: Describe, analiza y representa un grupo de datos utilizando
métodos numéricos y gráficos que resumen y representan la información contenida en
ellos
b) Estadística Inferencial: Apoyándose en el cálculo de probabilidades y a partir de
datos muéstrales, efectúa estimaciones, decisiones, predicciones, u otras
generalizaciones, sobre un conjunto mayor de datos.
1.3. IMPORTANCIA DE LA ESTADISTICA
La Estadística es importante , desde el punto de vista cultural en la formación general del
ciudadano, quien precisa tener cierta cultura estadística para leer e interpretar cuadros y
gráficos que con frecuencia aparecen en los medios informativos, por su utilidad en las
diferentes disciplinas como herramienta básica para la investigación en el estudio de
fenómenos complejos en los que hay que comenzar por definir el objeto de estudio y las
variables relevantes, tomar datos de los mismos, interpretarlos y analizarlos; por su aporte
en el desarrollo personal fomentando un razonamiento critico basado en la valoración de
la evidencia objetiva, es decir hemos de ser capaces de usar los datos cuantitativamente
para controlar nuestros juicios e interpretar el de los demás, es importante para adquirir
un sentido crítico de los métodos y razonamientos que permitan resolver problemas de
decisión y efectuar predicciones, porque ayuda a comprender otros temas del currículo,
tanto de la educación obligatoria como universitaria, donde con frecuencia aparecen
gráficos, resúmenes, términos o conceptos estadísticos, además de ser un buen vehículo
para alcanzar las capacidades de comunicación , tratamiento de información, resolución
de problemas, uso de ordenadores y trabajo corporativo y en grupo a los que se da
bastante importancia en los nuevos currículos.
La estadística es importante, desde una perspectiva económica y financiera por ser ella
una herramienta válida para quien formula las políticas económicas, de salud, para
quienes asesoran al presidente por ejemplo en la toma de decisiones de declarar una
cuarentena para controlar la pandemia del Covid-19 y a otros funcionarios públicos como
alcalde o gobernadores, por su ayuda inteligente en la toma de decisiones sobre tasas
tributarias, programas sociales y otros asuntos que se manejan en el área gubernamental
y empresarial, así como en el mundo de los negocios, en cuestiones de rentabilidad.
Expresa también que para los que trabajan en el área de investigación de mercados, la
estadística es de gran ayuda para determinar la reacción de los consumidores frente a
los actuales productos de una empresa y en el lanzamiento de los nuevos, como también
para evaluar las oportunidades de inversión por parte de los asesores financieros.
Desde una perspectiva industrial , la estadística es importante ya que juega un papel
importante en el proceso de transformación necesario para la sobrevivencia de la
industria nacional en concierto con la industria mundial, orientando los procesos y
productos a los consumidores, con calidad superior, rapidez, bajo precio y utilizando
nuevos recursos para cualquier otro competidor. Para lograrlo existe una necesidad crítica
de los métodos y pensamientos estadísticos para tomar decisiones no solo a nivel
operacional, sino también en los niveles de alta dirección.
En la actualidad la Estadística es considerada como una de las ciencias metodológicas
fundamentales y base del método científico experimental es por eso que como
especialista en la materia considero que la estadística es muy importante por ser una
ciencia de carácter instrumental para otras disciplinas tales como la medicina, ingeniería
comercial, contabilidad , administración , educación , etc. y que contribuye a tomar
decisiones inteligentes y significativas en condiciones de incertidumbre o duda de
acuerdo a la naturaleza del problema a resolver
1.4. LA ESTADISTICA EN EL DESARROLLO DE LA INVESTIGACION
La investigación científica consiste en la búsqueda de la verdad, de una verdad que ya
existe pero que tenemos que descubrir.
El proceso de investigación científica comienza con un problema que constituye el punto
de partida. Del análisis lógico del problema surge una hipótesis, que viene a ser una
respuesta preliminar al problema, Para comprobar la hipótesis se recolectan pruebas ,
hechos, datos , observaciones etc. , los mismos que clasificados, analizados o
interpretados permitan la demostración de la hipótesis, llegándose a la generalización, es
decir a establecer los principios o leyes.
El proceso utilizado es la investigación científica, el principio o ley que se ha obtenido es
la ciencia. La estadística está relacionada directamente con el método científico por lo
siguiente:
En el proceso de observación y los hechos a observar, además la estadística ayuda a que
las observaciones sean exactas.
En el proceso de formulación de hipótesis, la estadística permite descubrir algunas
relaciones que conducen a la formulación de la hipótesis.
En el proceso de verificación de hipótesis, la estadística permite a través de sus técnicas,
la presentación adecuada de los resultados y el uso correspondiente de las pruebas de
significación en el análisis inferencial.
1.4.1. Etapas del Método Estadístico: De acuerdo con el orden de aplicaciones de la
estadística, el método estadístico se lleva a cabo en cuatro etapas.
a) Etapa de Planificación: Esta etapa define ciertamente la naturaleza y objetivos de la
investigación, así como los detalles concernientes a la recolección, clasificación y análisis
de la información en base a lo cual se describen las características de una determinada
población o se confirma o niega una determinada hipótesis de trabajo.
b) Etapa de Recolección: Esta etapa consiste en determinar los métodos de recolección
adecuados para preparar los instrumentos de recolección, probar el método y los
instrumentos de recolección seleccionados y realizar la recolección de los datos.
c) Organización y presentación de los datos: En esta etapa se debe tratar de
asegurar la validez y confiabilidad de los datos recopilados. Luego se debe clasificar y
tabular los datos y finalmente presentarlos en cuadros estadísticos y gráficos.
d) Análisis e Interpretación de Resultados: En esta etapa se calculan indicadores y
medidas de resumen que describen el conjunto de datos.
1.5. VARIABLES.
Una variable es una característica de la población que se va a investigar y puede tomar
diferentes valores, una variable al ser medida en diferentes Individuos es susceptible de
adoptar diferentes valores. Ejemplo: el peso, la talla .Las variables se clasifican en
cuantitativas y cualitativas.
a) Variables Cuantitativas.- Aquellas que se pueden medir o cuantificar, existen dos
tipos de variables cuantitativas: Discretos y Continuos.
a.1) Variables Cuantitativas Discretas: Esta representado por todos los números
enteros; ejemplo: número de alumnos en el aula de clases, número de defunciones por
día, número de obreros en una empresa, etc.
a.2) Variables Cuantitativas Continuas: está representado por todos los números
reales, ejemplo: talla, peso, densidad, volumen, área, longitud, resistencia, temperatura.
b) Variables Cualitativas.- Se refieren a las cualidades de las cosas, es un atributo. Ej.:
sexo, color de ojos, estado civil, lugar de procedencia, ocupación, etc.
Las variables cualitativas pueden ser nominales u ordinales.
b.1) Variable Cualitativas Nominal: Es aquella que establece la distinción de los
elementos en las categorías sin implicar orden entre ellas. Ejemplo sexo. Masculino,
femenino. Etc.
b.2) Variable Cualitativa Ordinal: Es aquella que agrupa a los objetos, individuos en
categorías ordenadas para establecer relaciones comparativas. Ejemplo: Nivel de
pobreza: pobre, muy pobre. Extremadamente pobre.
1.6. TERMINOS DE ESTADISTICA.
Considerando que existe un conjunto de términos que se usan frecuentemente en
estadística, conviene precisar el significado de algunos de ellos.
a) Población (N): Es el conjunto de todos los individuos, objetos u observaciones que
poseen alguna característica observable común . Ejemplo La población de estudiantes de
la Universidad Jorge Basadre Grohmann de Tacna.
Una población puede clasificarse como finita o infinita.
a.1) Población Finita: Es aquella que tiene un número limitado de elementos. Ejemplo:
Las edades de todos los estudiantes de la Universidad Nacional Jorge Basadre
Grohmann de Tacna.(UNJBG)
a.2) Población Infinita: Es aquella que tiene un número ilimitado de elementos. Ejemplo:
El número de unidades elaboradas en un proceso de producción continúo.
b) Muestra(n): Es una parte o un subconjunto representativo de la población y al proceso
de obtener la muestra de le llama muestro. La selección y el estudio d ela muestra tiene
por objeto la extracción de conclu8siones que serán válidas para la población de la cual
se obtuvo dicha muestra. Ejemplo. Estudio de una muestra aleatoria d 150 alumnos de la
UNJBG, según su nivel socio económico.
c) Unidad Estadística: También se le conoce como unidad de observación o unidad de
análisis. Es el elemento u objeto indivisible de la población que será analizado y sobre los
cuales se obtendrán los datos. Ejemplo: Si se quiere estudiar el rendimiento académico
de los alumnos de la UNJBG, la unidad estadística serán los alumnos.
d) Datos: También se le conoce como observaciones. Son los valores recopilados como
resultado de las observaciones de una variable, es decir es el registro numérico de una
característica o variable. Ejemplo calificación de 18 al evaluar el rendimiento académico.
e) Parámetro: Es un valor obtenido para describir en forma resumida las características
pertinentes o más importantes de una población. Ejemplo. El sueldo promedio de todos
los trabajadores de la Empresa Electro sur S.A de Tacna.
f) Estadígrafo: También se le conoce como estadístico (a): Es una medida descriptiva de
una muestra. El estadígrafo sirve como estimación del parámetro. Ejemplo. El sueldo
promedio del 25% de los trabajadores de la Empresa Electro sur S.A de Tacna
g) Indicadores: Son elementos característicos que describen una situación permitiendo
su análisis. Son referentes empíricos que permiten una medición, descripción,
ordenamiento de los datos característicos en forma valida y confiable. Los indicadores no
determinan la realidad, la realidad la determina el valor del indicador. La validez y
confiabilidad del indicador depende de la validez de los datos utilizados y de la lógica de
su relación o construcción. Son indicadores los llamados índice, tasas, estadígrafos,
medidas de resume etc.
1.7 RECOLECCION DE DATOS
La recolección o recopilación de datos es el momento en el cual el investigador se pone
en contacto con los sujetos, objetos o elementos sometidos a estudio con el propósito de
obtener los datos o respuestas de las variables consideradas; a partir de estos datos se
prepara la información estadística y se calcula las medidas de resumen e indicadores
para el análisis estadístico. Para recoger la información se toma en cuenta las siguientes
modalidades; las fuentes de información, los sistemas de recolección y las técnicas de
recolección.
f1 +f2+........+ fm =Σ fi = n
Xm fm
Total n 100%
FUENTE………………………………………
5 2 2 4 4 7
3 2 5 2 4 4
3 1 2 4 4 2
5 3 3 2 2 3
4 3 3 2 1 4
3 2 3 3 3
Construir un cuadro de distribución de frecuencias
Solución: lo primero que hay que observar para construir un cuadro es el tipo de variable
en este caso la variable número de hermanos es una variable cuantitativa discreta.
TABLA N° 2
Muestra de estudiantes de la FAIA-UNJBG. Observados según la cantidad de hermanos
que tienen. Datos obtenidos por entrevista directa en mayo del 2007.
Xi =Nº de fi Fi hi Hi % = hi x 100
hermanos
1 2 2 2/35 2/35 5.71%
2 10 1 10/35 12/35 28.57%
2
3 11 2 11/35 23/35 31.421%
3
4 8 3 8/35 31/35 22.85%
1
5 3 3 3/35 34/35 8.57%
4
7 1 3 1/35 35/35 = 2.85%
5 1
total n = 35 1 100%
Fuente: Datos obtenidos por entrevista directa en el salón de clases del cuarto año
B. Distribución de Frecuencias en Intervalos de Clase: Se utiliza generalmente
cuando la variable es cuantitativa continua
Pasos a seguir en la construcción de un cuadro de frecuencias.
1). Recolección de datos (Distinguir si la variable es discreta o continua)
2). Ordenar los datos: en forma ascendente o descendente, y obtener el número total de
muestra
3). Obtener el valor más pequeño o límite inferior (Y min) y el valor más grande o límite
superior (Ymax). Si es variable continua se procede con el siguiente paso:
a). Calcular el rango (R) que se obtiene restando el valor máximo y el valor minimo, cuya
fórmula es:
R= Ymax – Ymin
b). Determinar el número de intervalos (K), se emplea la fórmula de Sturges:
K= 1 + 3.32 log(n) ,
Dónde: n es el número de observaciones de la muestra o número de datos
c). calcular la amplitud interválica : C , cuya fórmula es:
C= R
K
d) Se determina los límites de Clase, de manera que cada observación se clasifique sin
ambigüedades en una sola clase
TABLA N° 3
Muestra del cuadro de distribución para variable continúa
Título:……………………………………………………………….
│Yi-1 Yi│ Yi fi F hi Hi % = hi x 100 % = Hi x 100
i
………….
Total n 100%
FUENTE…………………………………………
Dónde:
Frecuencias absolutas simples (fi).- Esta representado por la cantidad de
veces que se repite cada valor de la variable, es el número de datos
contenidos en cada uno de los intervalos.
Frecuencias absolutas acumuladas (Fi).- Es la suma de las frecuencias
simples en forma acumulativa.
Frecuencias relativas simples (hi).- Se obtiene dividiendo cada una de las
frecuencias absolutas por el número total de datos así: hi = fi
n
Frecuencias relativas acumuladas (Hi).- Se consiguen sumando sucesivamente
las frecuencias relativas simples de tal manera que la primera frecuencia
relativa acumulada es igual a la primera frecuencia relativa simple, la segunda
acumulada es igual a la suma de la primera y segunda simple. Hi = Fi
n
H1 = h1
H2 = h1 + h2.
.
.
Hm = h1 + h2…………+hm = 1.
Frecuencias porcentuales (% = hi x 100).- En forma de porcentaje representa
la frecuencia en un intervalo.
Frecuencias porcentuales acumuladas (% = Hi x 100).- es la suma de las
frecuencias porcentuales y representa un porcentaje acumulado del total.
Marca de clase (Yi).- es el punto medio entre los límites reales de clase así:
Yi = Yi-1 + Yi
2
Ejemplo 2. Construcción de un cuadro estadístico de Variable cuantitativa continúa
Se tienen los siguientes datos sobre las edades de los trabajadores de la SPCC. Y que
laboran en la refinería de Ilo observadas el mes de noviembre del 2004, y son las
siguientes:
20 34 60 68 32 30 34 30 47 41
42 43 46 44 53 48 55 41 57 45
23 45 38 34 29 38 55 67 46 33
Construir un cuadro de distribución de frecuencias e intérprete la marca de clase 4
Solución: la edad es una variable cuantitativa continua por que se mide en el tiempo y
este es una magnitud continua: el procedimiento a seguir es:
a). Calcular el rango (R), cuya fórmula es: R= Ymax – Ymin ; donde : Ymax = 68 y Ymin=48
R = 68 – 20 , donde R = 48
b). Determinar el número de intervalos (K), con la fórmula de Sturges: K= 1 + 3.32 log(n)
K = 1+ 3.32 log 30 = 5.9 , donde K = 6
c). Calcular la amplitud intervalica (C), cuya fórmula es: C= R /K = 48/6 = 8
TABLA N° 4
Título: Muestra de trabajadores de la SPCC. Observados según su edad, tomados
en noviembre del 2004 en la ciudad de Ilo.
[Yi-1 Yi ] Yi fi Fi hi Hi % = hx100
Interpretación
Interprete usted la marca de clase 4 (Y4)
Y4 = 48: Es el promedio de edad en el intervalo cuarto
fi = 7: Existen siete trabajadores que laboran en la refinería de Ilo de la SPCC. Que tienen
edades entre 44 y menores que 52 años.
Fi = 23: Existen 23 trabajadores que laboran en la refinería de Ilo de la SPCC. Que tienen
edades entre 20 y menores que 52 años.
hi = 7/30 y se expresa en porcentaje como 23.3% : Existen 23.3% de trabajadores que
laboran en la refinería de Ilo de la SPCC. Que tienen edades entre 44 y 52 años.
1.8.2.2. Distribución de Frecuencias para Variables Cualitativas. Este tipo de
distribución se utiliza para clasificar los datos de una variable cualitativa nominal u ordinal,
también toma el nombre de distribución de frecuencias por atributos
TABLA N° 5
TITULO : …………………………………………………..
Xi fi Fi hi Hi % = hi x 100 % = Hi x 100
X1 f1 F1 h1
X2 f2 F2 h2
. . .
. . .
. . .
Xm fm
Total n 100%
FUENTE………………………………………
TABLA N°6
Título: Distribución de docentes de la Universidad Nacional Jorge Basadre Grohmann de
Tacna, según su estado civil, en diciembre del 2013:
Estado Civil Nº de Docentes Frecuencia relativa Frecuencia relativa
porcentual.
Xi fi
hi%
Soltero 7 0.23 23
Casado 18 0.60 60
Viudo. 2 0.07 7
Divorciado 3 10
0.10
Total 30 1.00 100
FUENTE: Oficina de Recursos Humanos de la UNJBG
Interprete f2 y h2 :
Interpretando: f2 Hay 18 docentes que son casados
h2 % El 60% de los docentes son casados
1.9. REPRESENTACION TABULAR Y GRÁFICA. Una vez que se ha recolectado y
clasificado la información, resulta imprescindible representarlo de manera adecuada de tal
forma que le permita hacer un análisis útil. Existen dos tipos de presentación: Los
cuadros estadísticos y los gráficos.
1.9.1. Cuadros Estadísticos: Es un arreglo tabular de filas y columnas en donde se
representan los datos de una muestra bajo un ordenamiento convencional
predeterminado con el objeto de facilitar su lectura, análisis e interpretación.
Partes de un Cuadro Estadístico: Las partes de un cuadro estadístico son: título o
encabezado, cuerpo del cuadro y fuente.
Título: Año 2010 2011
Tipo
Quejas 18059 18782
Petitorios 5481 8038
Cuerpo
Consultas 25357 24873
TOTAL 48897 51693
Fuente: Defensoría del Pueblo (de donde se obtuvieron los datos)
1.9.2. Representación Gráfica: Un gráfico es la representación de un fenómeno
estadístico por medio de figuras geométricas (puntos, líneas, rectángulos,
paralelepípedos, etc.) cuyas dimensiones son proporcionales a la magnitud de los datos
representados. Su objetivo principal es la representación de los datos en forma gráfica,
que permite a simple vista darse cuenta del conjunto de elementos presentados y de
evidenciar sus variaciones y características. El grafico es un auxiliar del cuadro
estadístico, no lo sustituye, sino lo complementa.
Entre los gráficos más usuales tenemos: Grafico de bastones, histograma de frecuencias,
polígono de frecuencias, gráficos de barras, gráficos de sectores circulares y gráficos
lineal.
1.9.2.1. Gráficos para Variables Cualitativas. Los gráficos más usuales para
representar variables de tipo nominal son los siguientes:
a) Diagramas de barras:
Siguiendo la figura 1 representamos en el eje de ordenadas las modalidades y en
abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el
gráfico, se intenta comparar varias poblaciones entre sí, existen otras modalidades, como
las mostradas en la figura 2. Cuando los tamaños de las dos poblaciones son diferentes,
es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar
engañosas.
Figura1: Diagrama de barras para una
variable cualitativa.
Penicilina 20 72º
Ampicilina 15 54º
Ciprofloxalina 25
90º
Amoxilina 40 144º
45%
40%
35%
30%
25%
20% %
15%
10%
5%
0%
Variable
Figura N° 6
Ejemplo: Estudiantes de la FAIA-UNJBG. Observados según la cantidad de hermanos
que tienen. Datos obtenidos por entrevista directa en mayo del 2007
fi
11
10
3
2
1
Figura 7 Nº de hermanos
d) Histograma de Frecuencias: Estos gráficos se utilizan para describir datos cuando
una variables cuantitativa continua. Su construcción se hace levantando sobre el eje de la
variable rectángulos contiguos (pegados), que tengan como base la amplitud del intervalo
de clase y una altura proporcional a su frecuencia absoluta o relativa porcentual.
Ejemplo
Se tiene los siguientes datos sobre las edades de los trabajadores se la SPCC y que
labran en la refinería de Ilo observadas el mes de noviembre del 2013 y que son los
siguientes.
20 43 38 32 48 30 41 67 42 45
68 53 38 41 45 33 23 60 44 29
34 47 55 34 46 34 30 35 57 46
a) construir un cuadro de distribución de frecuencias.
b) construir un histograma de frecuencias y un polígono de frecuencias relativos
acumulados
Solución
Calculo del rango Ymax = 68 ; Ymin = 20 luego :R = Ymax – Ymin = 68 – 20 = 48
Hallamos el número de intervalos con la fórmula de Sturges : K = 1 + 3.32 log (n)
K = 1 + 3.32 log 30, de donde: K = 5.9 = 6
Calculamos la amplitud intervalica. : C = R/K de donde C = 48/6 , entonces C = 8.
TABLA N° 8
Trabajadores se la SPCC que labran en la refinería de Ilo observadas según su edad el
mes de noviembre del 2013 .
[Xi-1 – Xi] Xi ni Ni hi Hi hi x 100 Hi x
100
20 - 28 24 2 2 0.0666 0.0666 6.66 6.66
28 - 36 32 8 10 0.2666 0.3333 26.66 33.33
36 - 44 40 6 16 0.2000 0.5333 20.00 53.33
44 - 52 48 7 23 0.2333 0.7666 23.33 76.66
52 - 60 56 4 27 0.1333 0.9000 13.33 90.00
60 - 68 64 3 30 0.1000 1 10.00 100
Total 30 1 100
Fuente: Datos obtenidos en la Oficina de personal de la refinería de Ilo
Figura N° 8
Trabajadores se la SPCC que labran en la refinería de Ilo observadas según su edad el
mes de noviembre del 2013
8
7
6
5
4
3
2
20 28 36 44 52 60 68
FUENTE: Datos obtenidos en la Oficina de personal de la refinería de Ilo
Figura N° 8
9
8
7
6
5
fi
4
3
2
1
0
24 32 40 48 56 64
Yi-1
Figura 9
PROBLEMAS PROPUESTOS Nº 1
1-Detallar tres situaciones en las que se tenga que hacer uso de la estadística relacionada
con la carrera que está estudiando.
2.-Dar cinco ejemplos de población.
3.-Dar cinco ejemplos de muestra.
4.-En los siguientes casos ¿Cuál probablemente exija solo el uso de la Estadística
descriptiva y cual de la Estadística Inferencial?
a) Un profesor emplea diferentes métodos en cada uno de sus dos cursos a su cargo. Al
final del desarrollo del curso compara las calificaciones obtenidas por sus alumnos con el
fin de establecer cual método es más eficiente.
b) En una empresa se registra diariamente la hora de ingreso de los trabajadores
mediante el tarjeteo electrónico para a final de mes hacer los descuentos respectivos de
ley por las tardanzas.
c) Un economista registra el crecimiento de la población en una región determinada.
d) Un psicólogo estudia los efectos de las nuevas técnicas de automatización sobre el
rendimiento de la población.
e) Una universidad”X” examina las distribución de las calificaciones de su examen de
admisión para establecer el porcentaje de postulantes que obtuvieron el puntaje mínimo
de ingreso.
5. Analice si las siguientes variables son cuantitativas (discreta o continuas) y cualitativas
(Nominales u ordinales).
a) Ahorro en dólares
b) Número de hijos.
c) Tasa de criminalidad.
d) Colegios profesionales de Tacna.
e) Nivel económico de la población.
f) Método de enseñanza.
g) Número de ingresos al penal.
h) Edad en años.
i) Talla en cm.
6. dar tres ejemplos de variable cualitativa referida a su campo de estudios.
7. Dar cuatro ejemplos de variable cuantitativa discreta, referida a su campo de
estudios.
8. Dar cuatro ejemplos de variable cuantitativa continua, referida a su campo de
estudios.
9.-De tres ejemplos sobre el uso de fuentes primarias y secundarias en estudios
relacionados a su carrera profesional.
10. La siguiente distribución muestra el peso en gr de 30 paquetes de un determinado
producto.
Peso en gr [10 15 ) [15 20) [ 20 25 ) [ 25 30 ) [ 30 35 ]
hi K/2 0.17 2K K 0.13
La mediana
La moda
Formas de Cálculo:
n
xi Suma. . de .todas .las . .observaciones
x̄=∑ =
i=1 n Nro . total . de . . datos
Donde el signo Σ=Es sigma, letra del alfabeto griego que significa sumatoria.
n n
xi f i yi f i
M ( X )= x̄=∑ M (Y )= ȳ =∑
i=1 n i=1 n
Edades Yi fi Yi fi
18 20 19 12 19x12=228
20 22 21 10 21x10=210
22 24 23 15 23x15=345
24 26 25 19 25x19=475
Total n=56 ΣYi fi =1258
n
y i f i 1258
ȳ=∑ = =22 . 46
i=1 n 56
La edad promedio de las 56 personas es de 22 .46 años.
Nota: El cálculo de la media aritmética también se puede hacer haciendo uso de la
calculadora; esto se estudiará en clase.
Propiedades de la Media Aritmética.-
1.-La suma de las desviaciones (diferencias) entre los valores de la variable x y su media
quedará aumentada o dividida por esta constante esto es: M(C X ) = C M(X) = C x̄
La media aritmética tiene la desventaja que queda afectada fuertemente por la presencia
de valores extremos.
El promedio aritmético es de extraordinaria utilidad tanto en el análisis de una distribución
como en la comparación de las distribuciones, es fácil de comprender y se puede
interpretar.
1.10.2. La Mediana.- La mediana de un conjunto finito de valores es el valor que divide al
conjunto en dos partes iguales tales que el número de mayores o iguales que ella es igual
al número de valores iguales a ella o menores que ella.
La notación que vamos a emplear para la mediana es : Med (x), en el cálculo de la
mediana podremos considerar los tres casos siguientes:
Caso 1.- La variable de estudio es discreta y n (número de observaciones es impar). En
este caso, la mediana será el valor de la variable que ocupa la posición media (rango de
n+1
orden 2 ).
Ejemplo: Supongamos que los casos atendidos en el servicio de emergencia en los
últimos 7 meses fueron:
52, 41,37 ,82, 24, 63, 68.
Ordenamos estos valores en forma ascendente:
24, 37,41, 52, 63, 68, 82.
n+1 7 +1
=4 to
El valor de la variable que ocupa el rango 2 es 2
Luego la mediana de las observaciones es Med (x) = 52.
Caso 2.- La Mediana de estudio La variable de estudio es discreta y n (número de
observaciones es par). En este caso, no existe en la ordenación un valor de la variable
que ocupe la posición central esto es, la mediana es indeterminada, pues cualquier valor
n n
+1
comprendido entre los valores que ocupen la posición 2 y 2 , puede ser
considerado como el centro de la ordenación.
El problema es resuelto por una convención que consiste en tomar como mediana de la
ordenación la media aritmética de estos valores.
Med ( x )=
x +x
n
2
n
2
+1
2
Ejemplo: Considere las siguientes observaciones muestrales: 24, 37, 41, 63, 68, 82, en
este ejemplo no es necesario ordenar ya que están ordenados las observaciones en
n n
+1
forma ascendente. Los valores que ocupan las posiciones 2 y 2 son:
n 6 n 6
= =3 ero +1= +1=4 to
2 2 y 2 2 .
La mediana en este caso es el valor entre 41 y 63, el cual es.
41+63
Me(x )= =52
2
Caso 3.- La variable es continua, es este caso el problema consiste en determinar un
punto dentro del intervalo en que está comprendida la mediana.
Procedimiento:
n
1er paso.- Calcular la posición de orden 2 , como la variable es continua no se debe
preocupar si n es par o impar.
2do paso.- Por las frecuencias acumuladas se identifica la clase que contiene a la
n
mediana, esto es la clase para el cual se cumple que: Fk-1 ≤ 2 ≤ Fk
Con lo cual la mediana estará en la clase que tiene como frecuencia acumulada Fk.
n
( −F k −1 )
Intervalos de clase fi
[ 0 1) 3
[1 2) 10
[2 3) 17
[3 4) 8
[4 5) 5
Total 43
Solución
1er paso.- El intervalo de la clase de mayor frecuencia absoluta (17) es el tercero [2 - 3)
2do paso.- Aplicando la fórmula de Czber tenemos:
7
Mo(Y )=2+ . 1=2 . 44
7+9
Dónde: D1 = 17 - 10 = 7
D2 = 17 - 8 = 9
Ck = 1
Yk-1 = 2
La moda no es una medida de tendencia central muy usual, pero se emplea cuando el
interés se centra en conocer el valor que se presenta más frecuentemente. Por ejemplo
en los negocios sirve determinar cuál es el producto de mayor demanda similarmente
para programar la producción de un medicamento; el fabricante estará interesado En cuál
es la dosis más comúnmente recetada por los médicos.
1.11. MEDIDAS DE DISPERSIÓN O CONCENTRACIÓN.-
Las medidas de dispersión son los que cuantifican el grado de concentración o de
dispersión (diseminación) de los valores de una variable en torno de un promedio o valor
central. Las medidas de dispersión se necesitan para dos propósitos básicos:
a) Para que la confiabilidad de los promedios
b) para que sirva como base para el control de la variación misma.
1.11.1. Varianza.- Sean x1, x2, x3, ... xk valores de la variable X, con frecuencias
absolutas f1, f2, f3, ... fk, respectivamente la varianza muestral de x es dado por:
k
∑ ( x 1−x )2 f i
i=1
Var ( X )=S 2 =
n−1 Varianza práctica muestral
Propiedades de la Varianza y Desviación Estándar .-
Var(X) = S² ≥ 0; la varianza de una variable X es siempre positiva y es igual a cero
cuando la variable X toma el valor constante C esto es Var(C) =0.
Var(x ± C) = Var(x)
Var(C x) = C² Var(x) , donde C = constante
Var(C x ± b) = C² Var(x) , donde C y b son constantes
Observación.- Una fórmula alternativa para la varianza muestral es:
k
∑ ( x 1−x )2 f i
i=1
S 2= =M ( x 2 )−( M ( x ))2
n−1
Que mide la dispersión de la muestra pero tiende a sobrestimar la dispersión de la
población. Si no se indica otra cosa es la fórmula que utilizaremos para el cálculo de la
varianza.
1.11.2. Desviación Estándar.- La desviación estándar o típica de los valores de la
variable x se define como la raíz cuadrada positiva de la varianza, y se denota por:
k
S= √ Var ( X )=+
√ ∑ ( x1 −x )2 f i
i=1
n−1
El valor numérico de S cuantifica el grado de dispersión de los valores de una variable con
respecto a su media.
Ejemplo: Calcular la varianza y la desviación estándar de la siguiente distribución
muestral.
xi 5 7 8 9 11
fi 2 3 5 4 2
2
2 ∑
( x )2 f i ∑ ( x )f i 1083 129
2
S=
n
= ( n ) =
16
−
16 ( )
=2 .68359375
S2
1
n 1 x f nX
2
i i
2
X=
∑ x i f i =129 =8. 1
n 16 ;
1 1 1
S 2= ( ∑ x 2i f i −n X 2 )= (1083−1049 . 76)= (33 .24 )=2. 22
n−1 15 15 Entonces: S
= 1.49
Nota: Cuando se tiene distribuciones de frecuencias en intervalos de clase se trabaja con
puntos medios o marcas de clase de cada intervalo para efectuar el cálculo de la
varianza.
1.11.3. Medida Relativa de Dispersión.- Es útil para la comparación en términos
relativos del grado de concentración en torno a la medida es el “coeficiente de variación”
S
CV ( X )= x 100
que se denota por: 100 .
Generalmente el C.V(X) se expresa en porcentaje.
En la práctica se acostumbra considerar que C.V(X)., superior a 50% indica alto grado de
dispersión y consecuentemente pequeña representatividad de la media aritmética. En
cuanto para valores inferiores a 50%, la media será tanto más representativa, cuanto
menor sea el C.V.(X)
1.12. MEDIDAS DE ASIMETRIA Y APUNTAMIENTO.
1.12.1. Medidas de Asimetría: Son medidas que miden el grado de deformación
horizontal de una distribución de frecuencias. Se dice que una distribución de frecuencias
es simétrica si los intervalos equidistantes del intervalo central tienen iguales frecuencias.
También se dice que una distribución es simétrica si su curva de frecuencias es simétrica
con respecto al centro de los datos. Si la distribución es simétrica entonces la media, la
mediana y la moda coinciden. En contraposición si estos tres promedios no coinciden la
distribución es asimétrica.
Conviene definir unos estadísticos que ayuden a interpretar la asimetría, a los que
llamaremos índices de asimetría, y que denotaremos mediante: As. Vamos a definir a
continuación algunos de los índices de asimetría más usuales
El Coeficiente de asimetría de Pearson:
Se expresa como:
Si una distribución es simétrica, es claro que deben haber tantas observaciones entre la
que deja por debajo de sí las tres cuartas partes de la distribución y la mediana, como
entre la mediana y la que deja por debajo de sí un quarto de todas las observaciones. De
negativa, se tendrá si :
Donde (g1) representa el coeficiente de asimetría de Fisher, (Xi) cada uno de los valores,
( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta
ecuación se interpretan:
(g1 = 0): Se acepta que la distribución es Simétrica, es decir, existe
aproximadamente la misma cantidad de valores a los dos lados de la media. Este
valor es difícil de conseguir por lo que se tiende a tomar los valores que son
cercanos ya sean positivos o negativos (± 0.5).
(g1 > 0): La curva es asimétricamente positiva por lo que los valores se tienden a
reunir más en la parte izquierda que en la derecha de la media.
(g1 < 0): La curva es asimétricamente negativa por lo que los valores se tienden
a reunir más en la parte derecha de la media.
Desde luego entre mayor sea el número (Positivo o Negativo), mayor será la distancia
que separa la aglomeración de los valores con respecto a la media.
Si al calcular el coeficiente de Asimetría As obtenemos:
As = 0 → La distribución es simétrica .Ver fig (b)
As > 0 → La distribución es asimétrica positiva (sesgada a la derecha). Ver fig(a).
As > 0 → La distribución es asimétrica negativa (sesgada a la izquierda).Ver fig(c).
NOTA:
Si As → 0, entonces se dice que la distribución es aproximadamente simétrica o
ligeramente sesgada. Sera tanto más sesgada cuanto más As, se aleje de cero.
Intervalos ni
7 -- 9 4
9 -- 11 18
11 -- 12 14
12 -- 13 27
13 -- 14 42
14 -- 15 31
15 -- 17 20
17 -- 19 1
Determinar la variabilidad de la edad mediante los estadísticos varianza, desviación típica,
coeficiente de variación y rango intercuartílico. Estudie la simetría de la variable.
Solución:
En primer lugar realizamos los cálculos necesarios a partir de la tabla de frecuencias:
Intervalos ni xi Ni xi ni xi² ni
7 -- 9 4 8 4 32 256
9 -- 11 18 10 22 180 1.800
11 -- 12 14 11,5 36 161 1.851,5
12 -- 13 27 12,5 63 337,5 4.218,75
13 -- 14 42 13,5 105 567 7.654,5
14 -- 15 31 14,5 136 449,5 6.517,75
15 -- 17 20 16 156 320 5.120
17 -- 19 1 18 157 18 324
157 2.065 27.742,25
Este resultado nos indica que existe una ligera asimetría a la izquierda (negativa).
1.12.2. Medidas de Apuntamiento o Kurtosis.
Estas medidas determina el grado de deformación vertical o la concentración que
presentan los valores en la región central de la distribución. Por medio del Coeficiente de
Kurtosis, podemos identificar si existe una gran concentración de valores (Leptocúrtica),
una concentración normal (Mesocúrtica) ó una baja concentración (Platicúrtica).
Donde (g2) representa el coeficiente de Kurtosis, (Xi) cada uno de los valores, ( ) la
media de la muestra y (ni o fi ) la frecuencia absoluta simple de cada valor. Los
resultados de esta fórmula se interpretan:
(g2 = 0) la distribución es Mesocúrtica: Al igual que en la asimetría es bastante
difícil encontrar un coeficiente de Kurtosis de cero (0), por lo que se suelen aceptar
los valores cercanos (± 0.5 aprox.).
(g2 > 0) la distribución es Leptocúrtica
(g2 < 0) la distribución es Platicúrtica
Cuando la distribución de los datos cuenta con un coeficiente de asimetría (g1 = ±0.5) y
un coeficiente de Curtosis de (g2 = ±0.5), se le denomina Curva Normal. Este criterio es
de suma importancia ya que para la mayoría de los procedimientos de la estadística de
inferencia se requiere que los datos se distribuyan normalmente. La principal ventaja de la
distribución normal radica en el supuesto que el 95% de los valores se encuentra dentro
de una distancia de dos desviaciones estándar de la media aritmética; es decir, si
tomamos la media y le sumamos dos veces la desviación y después le restamos a la
media dos desviaciones, el 95% de los casos se encontraría dentro del rango que
compongan estos valores.