Está en la página 1de 51

UNIVERSIDAD NACIONAL

“SANTIAGO ANTUNEZ DE MAYOLO”


ESCUELA DE POST GRADO

APUNTES DE ESTADISTICA

Lic. ANGEL MENDOZA LOPEZ

Y
 y *n
i i

Huaraz, 2005

Dr. Angel D. Mendoza López


Apuntes de ESTADISTICA Angel D. Mendoza López

ESTADISTICA
Breve reseña histórica

El desarrollo histórico de la estadística atraviesa por tres etapas:

a. Etapa inicial.- Se extiende desde la antigüedad hasta mediados del siglo XVIII.

Se caracteriza porque la estadística está asociada a los censos poblacionales y registros


de bienes y servicios de un estado o pueblo. Estadística deriva del vocablo estado”.

La cultura Egipcia contó con recopilaciones regulares de datos de su administración


estatal e incluso divinizó a Saphkit, diosa de los libros y de las cuentas. Los romanos
llevaron registros numéricos con fines tributarios. En el Imperio Incaico llevaron
registros de su población y otras cuentas mediante los Quipus.

b. Etapa de la sistematización.- Se caracteriza por la aparición de escuelas que


sistematizan la estadística. Destacándose tres:

La escuela Alemana.- Creó la primera cátedra de estadística considerando esta


disciplina como la descripción de los fenómenos concernientes al Estado o
Administración.

La escuela Inglesa.- Cuantificaron las leyes que rigen los fenómenos sociales; como
consecuencia, "aritmetizaron” la estadística.

La escuela Francesa.- Introduce la teoría de las probabilidades como fundamento


matemático de la estadística.

c. Etapa actual.- Comprendida entre principios del siglo XIX hasta nuestros días. En
esta etapa la matemática se plasma como la columna vertebral de la estadística y se
caracteriza por el gran desarrollo alcanzado como ciencia y como una metodología de
la investigación científica aplicada a todas las ramas del saber humano: Medicina,
biología, química, educación, industria, comercio, etc.

¿Por qué el estudiante necesita de la estadística?

La mayoría de quienes ejercen sus profesiones, unos más otros menos, suelen dar por
sentado el conocimiento de métodos estadísticos como parte esencial de su labor. El
2
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

principiante tal vez reaccione en un comienzo ante la estadística tomándola como un


espantajo cuyos misterios se ciernen ante él amenazantes y acaso se preguntará: ¿para
qué servirá al fin y al cabo? Y ello es cierto sobre todo para quien siente que los números
siempre le han dado dificultades. Los estudiantes que entran a un primer curso sobre
métodos estadísticos en psicología o educación, y probablemente en todas las ciencias
sociales relacionadas con ellas, van desde los que piensan que las matemáticas son en
general fáciles y de su gusto a los del otro extremo que dicen tener dificultad para sumar
2 y 2. Todos ellos, de una u otra manera, tienen que adquirir lo que puedan de una
materia para la cual están tan desigualmente preparados.

Probablemente no hay otra materia que muestre tan claramente que hay diversas clases
de inteligencia. Nada menos que Charles Darwin, de inteligencia tan vigorosa, tenía
dificultades con la estadística, algo que según se dice admitía francamente. Su primo Sir
Francis Galton, casi tan ilustre como él, y que tanto ha hecho por introducir la estadística
en psicología, tenía que apelar a otros en busca de ayuda para sus problemas
matemáticos.

Hay maneras distintas de entender las mismas cosas. Un estudiante captará las nuevas
ideas de la estadística del mismo modo como las entiende un matemático; otro apreciará
las reglas lógicas del pensar y los conceptos aducidos como instrumentos de la reflexión;
y algún otro llegará a dominar las operaciones prácticas y a efectuar los cálculos con una
mínima comprensión de lo que significan.

Aprender sin llegar a penetrar en la íntima naturaleza de las cosas y sin apreciarla, es
aprender sin verdadera disposición y entusiasmo y no es nada satisfactorio.

Para ser más explícito, hay cuatro razones simples e innegables por los cuales los
estudiantes que tomen un curso de estadística como requisito deben alcanzar cierto
dominio de esta materia.

1. Apreciar las reglas y métodos para tratar información estadística.

2. Evaluar y cuantificar la importancia de los resultados estadísticos que veamos publicados.

3. Conocer los aspectos del pensamiento estadístico como un componente esencial de una
educación humanística.

3
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

4. Entender mejor el mundo real de nuestro entorno.

¿Por qué es importante la estadística en la investigación?

Dicho brevemente, las ventajas del pensar y de las operaciones estadísticas en la


investigación son las siguientes:

1. Permiten el tipo de descripción más exacto. Cuando todo está dicho y echo, el objetivo de
la ciencia es la descripción de fenómenos, descripción que ha de ser tan completa y
tan precisa que sea útil para quien pueda entenderla al leer los símbolos en términos
de los cuales se describen esos fenómenos. La matemática y la estadística hacen parte
de nuestro lenguaje descriptivo, son una elaboración de nuestros símbolos verbales,
especialmente adaptados al tipo de descripción eficaz que exige el científico.

2. Nos obligan a ser claros y exactos en nuestros procedimientos y en nuestro pensar. Un


investigador oyó una vez a un prominente psicólogo defendiendo sus conclusiones
un tanto vagas cuando decía que prefería ser vago y tener razón, que claro y estar
errado. Pero ante ser “vago y tener razón” no se plantea el ser “claro y errado”, pues
también se puede ser claro y tener razón, y se puede sostener que lo más probable es
que el tener razón es algo que está decididamente del lado “claro” del asunto.

3. Nos permiten resumir los resultados de una manera significativa y cómoda. Las masas de
observaciones en sí mismas son abrumadoras y casi que carecen de significado. Antes
de que podamos ver el bosque al tiempo que los árboles, hay que poner orden en los
datos. La estadística nos ofrece medios incomparables para ordenar el caos, para ver
el panorama general en los resultados que se tienen.

4. Nos permiten deducir conclusiones generales, y el proceso de deducción de conclusiones se


efectúa según las reglas aceptadas. Además, siguiendo pasos estadísticos podemos saber
hasta donde se puede tener fe en una conclusión y hasta donde podemos ampliar
nuestras generalizaciones.

5. Nos permite predecir “qué tanto” sucederá de algo en ciertas condiciones que conocemos y que
hemos medido. Por ejemplo, podemos predecir la nota probable de un estudiante de
primer año en álgebra, si conocemos la puntuación del estudiante en una prueba de
aptitud académica general, la puntuación en una prueba de aptitud especial en
álgebra, la nota promedio en matemáticas de la escuela secundaria y tal vez el
4
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

número de horas semanales que dedica el estudiante al álgebra. Nuestra predicción


puede tener algún error porque no se han tenido en cuenta otros factores, pero los
métodos estadísticos también nos dirán cuál es el margen de error previsible al hacer
predicciones. Así pues, no solamente podemos hacer predicciones, sino que también
podemos saber hasta dónde podemos tener fe en ellas.

6. Nos permiten analizar algunos de los factores casuales subyacentes en sucesos complejos y que
de otra manera nos confundirían. En las ciencias sociales y en la educación en común con
ellas, es por lo general cierto que todo suceso o resultado se debe a numerosos
factores casuales. Las razones por la que una persona fracasa en una empresa o en
una profesión, por ejemplo, son variadas y numerosas. Los factores causales por lo
general se descubren y demuestran de la mejor manera por el método experimental.
Si se pudiera demostrar que, manteniendo constantes todos los demás factores,
ciertos empresarios fracasan en el grado en que poseen cierto defecto “X” de
personalidad - un rasgo - entonces es probable que X sea una causa de fracaso en ese
tipo de empresas.

Desafortunadamente, quien ejerce las ciencias sociales no puede tratar las personas y
sus negocios lo suficientemente para poner en marcha un buen experimento de este
tipo. Lo mejor que se puede hacer es un estudio estadístico, tomando a los
empresarios tal como los encontramos, trabajando en condiciones normales. Los
métodos estadísticos son por consiguiente y a menudo un sustituto necesario de los
experimentos. Incluso cuando son posibles los experimentos, los datos
experimentales deben someterse de ordinario a un tratamiento estadístico apropiado.
Los métodos estadísticos son por tanto los compañeros constantes de los
experimentos.

Etapas de la investigación

En la planificación de una investigación, la Estadística interviene en las siguientes etapas:

Determinación de los objetivos de la investigación.

Definición del universo (población) en estudio.

Determinación de las variables.

5
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Formulación de hipótesis.

Procedimientos de medición.

Selección del diseño.

Procedimientos de captación.

Procedimientos de elaboración y análisis.

Determinación de los objetivos de la investigación.

Al plantear los objetivos el investigador debe determinar qué técnicas estadísticas le van
a permitir alcanzar dichos objetivos. Es cierto, por otro lado, que no necesariamente
todos los objetivos serán alcanzados utilizando la Estadística; sin embargo en la
Planificación así como en la ejecución de los estudios de investigación, su uso es cada vez
mayor.

Definición del universo (población) en estudio.

En este punto la ayuda que la Estadística puede prestar al investigador es menor que en
el punto anterior; ya que es el investigador el que debe definir la población o universo de
estudio señalando los criterios de inclusión y de exclusión. Si el universo es muy grande
para ser estudiado en su totalidad, entonces el estudio se realizará a través de una
muestra. Esta actividad, es decir el muestreo, es típicamente estadística.

Determinación de las variables.

Es importante definir cada variable o característica que se va a estudiar, típificándolas y


además señalando la escala de medición para cada característica. El uso de la Estadística,
en ese sentido, es amplio.

Formulación de hipótesis.

La Estadística ayudará al investigador a verificar las hipótesis planteadas, las cuales


dependen del tipo de estudio, particularmente la Inferencia Estadística. La importancia
de la Estadística en este punto es igual que en el planteamiento de los objetivos.

Procedimientos de medición.

El investigador elegirá el o los procedimientos más adecuados para obtener datos


confiables.
6
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Selección del diseño.

La selección del diseño adecuado le corresponde al investigador, según la naturaleza del


problema, los objetivos de investigación y los recursos disponibles.

Procedimientos de captación.

En este paso el concurso de la Estadística es necesario, ya que nos indicará cuál o cuáles
son los procedimientos útiles para la obtención de datos, además puede determinar la
validez y confiabilidad de los instrumentos de medición.

Procedimientos de elaboración y análisis.

Esta etapa es típicamente estadística. Le permite al investigador una vez obtenido los
datos procesarlos y analizarlos estadísticamente. Aquí habitualmente se hace uso de la
Estadística Descriptiva y de la Inferencia si se trabaja con una muestra probabilística.

Programación y conducción de la investigación.

Procedimiento de Captación de Datos.

Cuando llega el momento de obtener los datos considerados indispensables para el


estudio o investigación, pueden ocurrir dos cosas:

1º Que los datos ya hayan sido obtenidos de las unidades de observación y que estén
publicados o registrados en alguna fuente. Estos datos utilizados para el estudio
reciben el nombre de datos secundarios.

2º Que los datos se tengan que obtener directamente de las unidades de observación.
Estos datos reciben el nombre de datos primarios.

Cuando llega el momento de obtener los datos, considerados indispensables para el


estudio, podemos recurrir a datos primarios o secundarios, estos últimos se recogen de
las fuentes de información, las cuales pueden ser historias clínicas, registros de hechos
vitales, anuarios estadísticos, censos de población y vivienda, Sunat, registros contables,
etc.

Existen tres procedimientos para obtener datos primarios:

a. Cuestionario: El sujeto en estudio lee las preguntas que están establecidas en un


7
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

formulario y registra las respuestas correspondientes en un documento.

b. Observación: Una persona observa al elemento en estudio y registra los datos que se
van produciendo.

c. Entrevista: El sujeto en estudio es interrogado por otra persona mediante un formulario


y esta se encarga de registrar las respuestas en un documento.

En los tres casos para recoger la información se utiliza un documento que contiene un
arreglo de enunciados y espacios para hacer anotaciones que se denomina formulario.

Diseño de formularios.

La información que se encuentra publicada ya ha sido sometida a un proceso de


elaboración, y por tanto, cuando va a ser utilizada debe de usarse un esquema que
resulte congruente al utilizado en la publicación y con las necesidades de presentación
que se tengan; pero a veces se acude a una fuente de datos constituida esencialmente por
los documentos en que se fue captando dicha información, y en tales casos habrá que
elaborar un formulario que permita la obtención de los datos contenidos en los registros
originales una forma conveniente. Ejemplos de tales situaciones estarían dados por
investigaciones basadas en la utilización de los libros del Registro Civil o de los
expedientes clínicos de un hospital, centro de salud o clínica.

En la obtención directa de la información, claramente se tendrá como condición previa la


elaboración del formulario, los datos identificados como indispensables se van a solicitar
en el formulario particular que se esté considerando.

Otros puntos que deben ser considerados en opinión de Aburto [Aburto, C. 1978: 38,
siguientes] son:

a. La precisión y claridad de las preguntas

Preguntas como: "¿Hasta qué año llegó usted en la escuela?" Permiten respuestas
como "Hasta tercero" y, sin embargo, resultaría perfectamente posible que la persona
no sepa nada de los que se supone que debe estudiarse en el tercer año, sencillamente
porque sólo asistió una semana, por ejemplo. En una situación como ésta resulta de
mayor utilidad el preguntar: “¿Cuál fue el último año que aprobó en la escuela?”.

A la pregunta “¿En qué trabaja?” Se pueden recibir varias respuestas según la


8
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

interpretación que le dé el informante; una de ellas podrá ser “En una oficina” y ello
podrá significar en la oficina de una fábrica, de un centro comercial o del gobierno, y
si el interés se centraba en la rama de actividad la respuesta no resulta útil y menos
todavía si lo que se quería averiguar era la posición en el trabajo.

b. El vocabulario utilizado

Toda actividad humana llega a generar cierto vocabulario que en ocasiones resulta
muy específico y que, cuando no lo es, normalmente tiene diferente significado en
otras actividades. Esto es olvidado con frecuencia por el investigador y, por
consiguiente, para evitar omisiones de respuestas o errores de interpretación, debe
tomarse en cuenta la familiaridad que pueda tener con la terminología utilizada el
personal que vaya a captar la información, así como el elemento objeto de estudio,
substituyendo, cuando se considere necesario, términos como anorexia en lugar de
falta de apetito, cefalea en lugar de dolor de cabeza, etc.

c. Orden de las preguntas

Resulta conveniente, tanto para la precisión de las respuestas como para la rapidez
con que se proporcionen, el que las preguntas no se formulen agrupadas por afinidad
de las cuestiones tratadas y que dentro de cada grupo no exista un orden
determinado, pues al informante le desconcierta el que con cierto tipo de preguntas se
le haya llevado a considerar una determinada situación, para que después se le cambie
bruscamente a otra y posteriormente se le haga volver a una que ya había sido
manejada previamente.

d. Espacio para las respuestas

Un defecto que con frecuencia se encuentra en los formularios es el que no se haya


considerado la extensión de la respuesta al destinar los espacios para registrarlas. Un
ejemplo de datos para los cuales, usualmente falta espacio es el domicilio, mientras
que en el que comúnmente sobre espacio es el relativo al sexo. Estas fallas del
formulario provocan dificultades a la persona que registra la información y con
frecuencia ilegibilidad para el que va a utilizarla. En el otro extremo, una extensión
innecesariamente grande del formulario aumenta los costos y los problemas de
manejo.
9
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

e. Respuestas posibles

Con frecuencia, al hacer una pregunta se establecen como posibilidades de respuesta


ciertos números de categorías en donde podría quedar clasificado el informante, y se
soslayan posibilidades como "No recuerda", "Lo ignora" y "No aplicable". La primera
situación puede presentarse cuando se pregunta, por ejemplo, cuántas veces se ha
encontrado el informante en determinada situación y se le sugieren como pueden
ocurrir respuestas “ninguna”, “1 ó 2”, “3 ó 4” y “5 ó +” y como puede ocurrir que
efectivamente no recuerde, el que registra la información se ve obligado a marcar
alguna de las categorías sugeridas falseando la información; la otra situación puede
presentarse cuando el informante es, por ejemplo, la esposa, y la pregunta es acerca de
los ingresos del esposo, los cuales ella ignora, y, finalmente, la otra situación puede
presentarse cuando se esté preguntando si sabe leer y escribir y sólo se sugieren dos
posibilidades, “si” o “no”, y el individuo que le correspondió ser investigado sea un
niño de 3 años, por ejemplo.

f. Prueba de formulario

Finalmente, el formulario debe ser probado en condiciones tan semejantes como sea
posible a la captación definitiva de los datos, para averiguar qué preguntas crean
confusión, redactarlas nuevamente, acudir al terreno otra vez y sólo cuando resulten
satisfactorias hacer la impresión definitiva.

Algunas clases de preguntas para encuestas:

Estructuradas

a. De dos opciones (dicotómicas)

Son aquellas que se responden de la siguiente forma Cierto/Falso, Sí/No;


Positivo/Negativo, etc. Se utilizan para determinar si se continúa la entrevista o no y
a la vez para inspirar confianza en el entrevistado.

Ejemplo: Al ser atendido en un establecimiento de salud, ¿Usted eligió ser atendido


en este establecimiento de salud?

1. Sí [ ] 2. No [ ]
10
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

b. De opciones múltiples

Si se prepara de manera acertada este tipo de preguntas, cualquier tipo de


cuestionario puede ser fácilmente elaborado, sin embargo, suele ser difícil
determinar todas las opciones posibles que podría necesitar el entrevistado, y aveces
el orden de las alternativas influyen en las respuestas.

Ejemplo: ¿Con quién vino al relleno sanitario?

1. Solo [ ] 2. Pareja [ ]

3. Hijo [ ] 4. Amigo [ ]

5. Padre [ ] 6. Personal del municipio [ ]

7. Otros [ ] ...........................................

c. Escala de valores

Este tipo de preguntas se emplean con frecuencia para determinar las opiniones o
actitudes acerca de un problema, una idea o un producto.

Ejemplo: Me guata la asignatura de Metodología de la Investigación

Me disgusta Me gusta
mucho mucho

_|____|____|____|____|____|____|____|____|____|____|_
-10 -8 -6 -4 -2 0 2 4 6 8 10

Ejemplo: ¿Cuál es su apreciación con respecto a la atención en la mina Antamina?

1. Malo [ ] 2. Regular [ ]

3. Bueno [ ] 4. Optimo [ ]

d. Escalas de clasificación

Escala que clasifica a los atributos desde “excelente” hasta “deficiente” o viceversa.

11
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Ejemplo: El servicio de Energía eléctrica en Huaraz, es:

1. Excelente [ ]

2. Muy buena [ ]

3. Buena [ ]

4. Regular [ ]

5. Deficiente [ ]

e. Escala de importancia

Se clasifica la escala de importancia de algún atributo desde “sin importancia” hasta


“muy importante”.

Ejemplo: El servicio de Internet en la escuela de Post gardo de la UNASAM, es en mi


opinión...

1. Muy importante [ ]

2. Importante [ ]

3. Poco importante [ ]

4. Nada importante [ ]

f. Escala de likert

Enunciado en el cual quienes responden manifiestan su acuerdo o desacuerdo. Este


tipo de escala es muy usado en estudios psicológicos, educativos, de salud, etc.

Ejemplo: ¿La Municipalidad de Huaraz tiene mejor disposición de los residuos


solidos que la Municipalidad de Independencia?

1. Fuerte discrepancia [ ]

2. Discrepancia [ ]

3. Ni de acuerdo ni discrepancia [ ]

4. Acuerdo [ ]

5. Fuerte acuerdo [ ]

12
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

g. Preguntas de control

Es importante incluir preguntas que sirvan para controlar la veracidad de las


respuestas de tal forma que se pueda dar valor a la investigación que se esta
realizando.

Ejemplo: se puede indagar si se ha apreciado la publicidad de un determinado


servicio o producto que interesa al investigador. Se puede preguntar: ¿Recuerda
usted haber visto o escuchado publicidad sobre los peligros de contaminación
ambiental en la ciudad de Huaraz?:

1. Si 2. No

Si la respuesta es Si, ¿Donde?

1. En la radio;

2. En la televisión;

3. En periódicos;

4. En afiches;

5. En vitrinas de los establecimientos de salud?

Si un gran número de personas responden “Sí, en la televisión”, y el Ministerio del


ambiente no hubiese recurrido a este medio de publicidad, se tendría mucha razón
en dudar de la veracidad de las respuestas.

Inestructuradas

a. Asociación de palabras

Se presentan varias palabras, una a la vez, y los entrevistados dicen o escriben la


primera palabra que se les viene a la mente.

Ejemplo: ¿Cuál es la primera palabra que se le viene a la mente cuando escucha las
siguientes frases o palabras?

Profesional de la salud: ________________________________

Empresa aseguradora: ______________________________

Mina: _________________________________________

13
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Sunat: _____________________________________________

Residuos solidos: ________________________________________

b. Terminación de relatos

Se presenta un relato incompleto y se pide a los encuestados que lo terminen.

c. Pregunta abierta

Se utiliza con frecuencia para determinar interés, motivaciones, etc. Este tipo de
preguntas por la complejidad que pueden tener las respuestas debe ser analizado
cuidadosamente por investigadores bien entrenados.

d. Formación de frases

Se le presenta al encuestado frases incompletas, una a la vez, y éste debe


completarlas.

e. Terminación de figuras

Se presenta a los encuestados una figura (dibujo) de dos personas, en donde una de
las cuales hace una afirmación acerca de algo, se pide a los investigados que se
identifiquen con una de ellas y que completen el parlamento que falta.

f. Test de apercepción temática

Se presenta un dibujo o una fotografía a los interrogados luego se les pide que
inventen un relato sobre lo que piensan que está ocurriendo o puede ocurrir en la
escena representada.

14
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Organización de Datos.

Una vez que se ha captado o recopilado la información de cada uno de los elementos del
conjunto en estudio, esta tiene que ser revisada, clasificada, presentada y resumida para
permitir su análisis e interpretación, este conjunto de actividades corresponde a la
organización de datos. También se le denomina elaboración de datos.

Revisión de Datos.

La revisión de datos tiene por objeto:

a. Determinar si se ha recibido todos los formularios o, cuando menos, en una


proporción que sea suficiente para no invalidar las conclusiones que se preveían
hacer.

b. Verificar que estén todas las respuestas requeridas, y

c. Localizar posibles incongruencias en la información proporcionada.

La revisión de datos constituye lo que se ha dado en llamar el control de calidad de la


información.

15
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

DEFINICIÓN DE ESTADÍSTICA
Definición 1.- La Estadística comprende el conjunto de métodos y procedimientos para
captar, elaborar, analizar e interpretar un conjunto de datos para basar decisiones y
predecir fenómenos que puedan expresarse cuantitativamente.

Definición 2.- La Estadística es una disciplina científica, que tiene un objetivo


fundamental, que es el de hacer una inferencia optima; el juicio que se está haciendo de
ella debe ser del menor error posible.

De acuerdo a estas definiciones a la Estadística la podemos dividir en dos grandes ramas:

Estadística Descriptiva. Cuyo propósito principal es la elaboración de datos, es decir:


clasificación, presentación de la información y el cálculo de ciertas medidas resúmenes,
que nos permitan describir las características de interés en el estudio.

Inferencia Estadística. Permite elaborar conclusiones probabilísticas sobre las


características de la población que es objeto de estudio en base a la información de una
muestra de dicha población.

Ejemplo: Interés: Determinar si existe relación entre el Control del Capital Intelectual y
el Cumplimiento de funciones en el Sistema Administrativo de la UNASAM

Población: El número de trabajadores administrativos de la UNASAM es de 230.

En efecto, el investigador decide conducir el estudio mediante una muestra de 100


trabajadores y determina que 45 cumplen sus funciones. Por consiguiente, mediante la
estadística descriptiva, se determina que la proporción de trabajadores que cumplen sus
funciones en la muestra es de p=0,45.

Sin embargo, el propósito del estudio es conocer algo sobre el cumplimiento de funciones
en la población y no tener conocimiento sobre el valor puntual en la muestra, en este caso
tenemos que recurrir a la inferencia estadística de modo que podamos pasar de la
muestra hacia la población. A continuación damos a conocer la definición de algunos
términos estadísticos:

16
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Unidad de análisis.- También se le conoce como elemento de la población y es aquella


unidad indivisible que es objeto de estudio, del cual se obtiene el dato estadístico (es el
contenido de la poblaciçon). Ejemplo: puede ser una persona, vivienda, animal, factura,
etc.

Marco de muestreo.- Permite identificar a los elementos de la población y que puede ser
una lista de personas, una relación de viviendas, un archivo, un mapa de una
determinada comunidad, etc. El marco debe estar completamente actualizado porque de
él se seleccionará la muestra.

Población.- Es el conjunto de personas, objetos o cosas con una característica o atributo


especial cuantificable, en un periodo y lugar determinado.

Dicho en otras palabras: Población es todo conjunto no vacío, bien determinado, en


términos de. Contenido, Condición o extensión, variable(s) de interés y tiempo de
observación.

Muestra.- Es un subconjunto de la población que se obtiene con la finalidad de estudiar


las características de la población, debe ser representativa y tener un tamaño apropiado.

Parámetro.- Es una medida de resumen que nos describe alguna característica de la


población. Para calcular dicho valor es necesario utilizar los valores de la población
completa. Algunos parámetros conocidos son:

- Media poblacional denotado por 

- Varianza poblacional denotado por 2

- Proporción poblacional denotado por  ó (P)

Estimador.- Es una medida de resumen que nos describe alguna característica de interés
en la muestra y cuyo valor es calculado usando sólo los valores de los elementos de una
muestra. Algunos estimadores conocidos y más usados son:


- Media muestral denotada por x

- Varianza muestral denotada por s

- Proporción muestral denotada por p

17
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Ejemplo:

Población: Niños menores de 5 años de la comunidad “San Fernando” de Lima

Interés: Estudiar el comportamiento de las siguientes características: Peso y


estado nutricional, en el mes de Junio del 2015.

Característica Parámetro Estimador


(población) (muestra)
 
x
Peso (kg) ( promedio poblacional)
( promedio muestral)
 p
Estado (proporción poblacional (proporción muestral
Nutricional de desnutridos) de desnutridos)

Variable(s).- Las variables son características de las personas u objetos que pueden tomar
diferentes valores. Ejemplo: peso, edad, sexo, número de hijos por familia, etc.

Ejemplo.-

- Población o Universo: Trabajadores del Sector Educación del Perú.

- Muestra: Trabajadores del Sector Educación de la ciudad de Huaraz.

- Unidad de Análisis: Cada trabajador del Sector Educación de la ciudad de


Huaraz.

- Variables: (entre otras, estas pueden ser:).

* Sexo: 1) Hombre 2) Mujer

* Edad: ____________ (años)

* Salario: _____________________ (Nuevos Soles)

* Nivel Educativo: 0) Sin nivel 1) Primaria

2) Secundaria 3) Superior

* Número de Hijos: ________


18
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Tipos de variable:

1. Variables cualitativas o categóricas.

Este tipo de variable indica la presencia o ausencia de una cualidad o atributo. Estas
variables pueden ser dicotómicas si solamente tienen dos categorías mutuamente
excluyentes.

Ejemplo:

- Sexo: masculino (m), femenino (f).

- Estado de salud: sano (s), enfermo (e).

- Estado nutricional: normal (n), desnutrido (d).

Cuando las variables cualitativas tienen más de dos categorías mutuamente


excluyentes se les denomina politómicas.

Ejemplo:

- Nivel socioeconómico: alto (a), medio (m), bajo (b).

- Grado de instrucción: sin instrucción (si), primaria (p), secundaria (s),


superior (sp).

- Estado civil: 1. soltera, 2. casada, 3. concubina, 4. divorciada, 5. separada.

2. Variables cuantitativas.

Son variables que pueden expresarse numéricamente.

Ejemplos:

- Número de hijos por familia.

- Número de admisiones diarias a un hospital

- Peso

- Talla

Las variables cuantitativas pueden ser discretas o continuas.

a. Variable cuantitativa discreta o discontinua.

Toma valores aislados y no puede tomar un valor entre dos consecutivos. Resultan
19
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

por lo general de un proceso de conteo. Ejemplo: Número de hijos por familia,


frecuencia cardíaca de cada paciente, número de dientes cariados por persona,
número de habitaciones por vivienda, cheques girados en un día determinado.

b. Variable cuantitativa continua.

Cuando toma cualquier número real, es decir, entre dos valores consecutivos
siempre encontraremos infinitos valores. Resultan por lo general de un proceso de
medición. Por ejemplo: peso, talla, perímetro cefálico, hemoglobina, presión
arterial, ingreso económico, temperatura, altitud, etc.

Escalas o niveles de Medición.

En cualquier estudio de investigación es necesario definir en que escala se hará la


medición de las variables propuestas. Existen fundamentalmente cuatro tipos de escalas:

1. Nominal: Para cada unidad de estudio se determina la pertenencia a una entre varias
categorías. Las categorías son mutuamente excluyentes y exhaustivas, y no es posible
establecer relaciones de orden entre las categorías. Por ejemplo las variables estado
civil, sexo, procedencia, se miden en escala nominal.

2. Ordinal: Al igual que en la escala nominal se determina la pertenencia de las unidades


a categorías. En este caso se considera que existe un grado de intensidad de la
propiedad medida, por lo que las categorías guardan un orden. De una unidad se
puede decir a que categoría pertenece, puede conocerse la frecuencia de cada
categoría y, además, cuál es la categoría que ocupa determinada posición de orden.
Por ejemplo, dolor: leve, moderado o intenso; severidad de una enfermedad: grado I,
grado II, grado III. Calidad, grados académicos, etc.

3. De intervalo: Se asignan números para indicar la intensidad de una característica, con


unidad de medida y origen arbitrarios, que se elige con base en conveniencias
prácticas, de tal manera que se mantiene la igualdad de los intervalos. Además de
estar ordenados, se permite hacer operaciones aritméticas. Las variables temperatura
y puntajes de un cuestionario de conocimientos se miden por ejemplo, en escalas de
intervalo. (Se reconoce también cuando el valor cero de la variable, no significa

20
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

ausencia de la misma)

4. De razón: Se asignan números para señalar la intensidad de una característica con


unidades de medida arbitraria, pero de origen fijo, lo que mantiene la igualdad de las
relaciones o proporciones. Se permiten las operaciones aritméticas con los números
que identifican las categorías. Por ejemplo, peso, talla, ingreso, CO2 en la sangre, etc.,
se miden en escala de razón. (Se reconoce también cuando el valor cero de la variable,
significa ausencia de la misma)

21
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

DISTRIBUCIÓN DE FRECUENCIAS
OBTENCIÓN Y PRESENTACIÓN DE DATOS:

OBTENCIÓN DE DATOS:

Los datos necesarios para confeccionar estadísticas provienen de varias fuentes:


recopilación esporádica o habitual, censos, encuestas, entrevistas, grupos focales,
experimentación, etc.

PRESENTACIÓN DE DATOS MEDIANTE TABLAS:

Definición.- La tabla estadística es el arreglo ordenado de filas y columnas de datos o


características relacionadas (variables), con el objeto de ofrecer información estadística de
fácil lectura, comparación e interpretación.

Partes Principales de una tabla Estadística.- Las partes principales de toda tabla
estadística son tres y éstas son: Encabezamiento, Cuerpo y Pié de tabla:

1. Encabezamiento: En principio es donde se coloca el número de tabla si es que se está


presentando más de una tabla. Luego se destaca el objeto de la tabla (qué, cómo,
dónde y cuándo). La redacción del encabezado debe ser breve, claro y completo tal
que se pueda deducir que tipo de información contiene la tabla (en otras palabras se
debe colocar la descripción de la población, con la variable(s) de interés que se esté
presentando).

2. Cuerpo: Indica la(s) variable(s), sus categorías o un período de tiempo. Se ubica en la


parte superior de la tabla. Se debe indicar las unidades de medida de la variable. Por
ejemplo: miles de dólares, miles de personas, millones de nuevos soles, etc. Esta
parte contiene la información o las denominadas frecuencias de ocurrencia de la
variable en estudio también los porcentajes de cada categoría.

3. Pié de tabla: También conocido como fuente, que sirve para anotar de donde y/o
cómo se obtuvo la información que se está presentando.

22
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Construcción de tablas de frecuencias:


Las tablas de frecuencias o de distribución de frecuencias son tablas de trabajo
estadístico, que presentan la distribución de un conjunto de elementos agrupados o
clasificados en las diferentes categorías de la variable.

Existen dos tipos de tablas de frecuencias, según la naturaleza de la variable:


Cuantitativa (discreta o continua) y cualitativa.

1. Tablas de frecuencias para variables cuantitativas

Realizada la recopilación de datos, denotaremos la variable por Y, y los datos


originales por: y1, y2,…, yn; donde Yi representa la i-ésima observación de la
variable (i= 1,2,..., k).

En toda tabla de distribución, se identifican los siguientes elementos:

1. Valor de la Variable: Se representa por X o por Y que resultan de la clasificación


de la variable.

2. Frecuencia Absoluta simple: Es el número de veces que se repite un


determinado valor de la variable; en el caso de intervalos es el número de
observaciones comprendidas en dicho intervalo. Se representa por ni con
(i=1,2,..., k) donde "k" es el número de valores distintos que toma la variable X,
Y o el número de intervalos considerados. La suma de las frecuencias absolutas
simples es igual al tamaño de la muestra. (ni0=0n).

3. Frecuencia Relativa simple: Se representa por hi con (i= 1,2,..., k), y está dado
por:

ni
hi % = *100
n

Donde n: número de observaciones. Se expresa como un porcentaje del total de


la muestra. La suma de las frecuencias relativas simples es igual a uno
(hi0=01)

4. Frecuencia Absoluta Acumulada: Se representa por Nj (i=1,2,..., k). Es el


número de observaciones menores o iguales que un determinado valor de la
23
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

variable. Equivale a la suma de las frecuencias absolutas simples desde n1 hasta


nj (i es un número entero menor que k). Es decir:

N j = n1 + n 2 + n3 + ... + n j

j
Nj  n
i1
i

5. Frecuencia Relativa Acumulada: Se representa por Hj (i=1,2,..., k). Es la suma


de las frecuencias relativas correspondientes a los intervalos cuyas marcas de
clases son menores o iguales a hj.

Es decir:

Nj
H j %= *100
n

La frecuencia relativa acumulada se obtiene también al dividir por "n" la


correspondiente frecuencia absoluta acumulada:

2. Tablas de frecuencias de variable discreta

Como se vio anteriormente, variable discreta es aquella cuyo valor se expresa sólo
por números enteros positivos.

La confección del cuadro con la distribución de frecuencias se aclarará con un


ejemplo.

Ejemplo: Se realiza una encuesta a ciertos Centros de Salud del área rural de Huaraz
para ver el Nº de trabajadores que laboran en un turno determinado, obteniéndose la
siguiente información:

7; 4; 6; 7; 10; 4; 5; 6; 7; 10; 6; 4; 5; 6; 8;
10; 8; 12; 7; 6; 8; 12; 5; 5; 10; 4; 5; 8; 10; 4.

Aquí los tres elementos básicos serán:

Población o muestra : 30 Centros de Salud (n=30)


Variable : X = número de trabajadores por Centro de Salud.
Datos : Xi (i=1, 2, 3,..., 30) que nos indican que habrá 30 valores
La Clasificación: Primero de ubica la observación máxima y luego la observación

24
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

mínima de Xi:
Xmin=4 Xmax=12

Es decir, los valores de la variable van de 4 a 12 que es el número de trabajadores que


tienen los 30 Centros de salud, es decir, 4; 5; 6; 7; 8; 9; 10; 11; 12 trabajadores luego la
variable original Xi tiene valores diferentes que son:

X1=4; X2=5; X3=6; X4=7; X5=8; X6=9; X7=10; X8=11; X9=12

Interpretación:

n1 = 5, Significa que hay 5 Centros de Salud que tienen 4 trabajadores.

N2 = 10, Significa que hay 10 Centros de Salud que tienen a lo más 5


trabajadores.

h1 = 16,7%, Significa que el 16,7% de Centros de Salud que tienen 4 trabajadores.

H2 = 33,3%, Significa que el 33,3% de Centros de Salud que tienen menos de 6


trabajadores.

Tabulación: Repite cada valor de Xi, es decir cuantos Centros de Salud hay en cada
una de las 8 categorías.

Nº Nº de Centros de
trabajadores Salud Nº Acumulado de C. Salud
Frecuencia Frecuencias
Xi Absoluta Relativa Absolutas Relativas
Tabulación Simple Simple acumuladas acumuladas
ni hi% Ni Hi%
4 IIIII 5 16,7 5 16,7
5 IIIII 5 16,7 10 33,3
6 IIIII 5 16,7 15 50,0
7 IIII 4 13,3 19 63,3
8 IIII 4 13,3 23 76,7
9 0 00,0 23 76,7
10 IIIII 5 16,7 28 93,3
11 0 00,0 28 93,3
12 II 2 06,7 30 100,0
TOTAL 30 100,0

25
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

3. Tablas de frecuencia de variable continua:

Como se vio anteriormente, una variable continua es aquella que puede tomar
cualquier valor del conjunto de los números reales.

Para visualizar y poner en evidencia el comportamiento de los datos, se recurre al


método estadístico de agrupar valores en intervalos de clase, lo cual se llama
distribución de frecuencias de datos agrupados.

Reglas generales para formar distribuciones de frecuencias

1. Hallar el rango (R) o recorrido, que es la diferencia entre el máximo valor y el


mínimo valor de la variable. Luego,

R = Xmáximo – Xmínimo

2. Valor de la Variable o Intervalo de Clase: Se representa por Y’i a los límites de los
intervalos de clase que resultan de la clasificación de la variable.

3. Seleccionar el número de intervalos de clase (Ic): El número de intervalos de clase


es arbitrario; sin embargo, es recomendable tener presente los siguientes criterios:
naturaleza de la variable, número de valores observados, recorrido de la variable,
unidad de medida de la variable, los objetivos del estudio que usa la información.

Se podría determinar el número de intervalos mediante la fórmula propuesta por


H. A. Sturges:

Ic = 1 + 3,322 log(n)

4. Determinar la amplitud (c) de cada intervalo

Rango R
c = -------------------- = ----
nº de intervalos Ic
Para facilitar los cálculos se recomienda que la amplitud de los intervalos se
redondee al entero más cercano e inmediato superior, tal que ésta sea exacta. En
muchos casos será necesario ampliar ligeramente el rango, de modo que "c" sea
un valor exacto y con el menor número de decimales. Nunca se reduce la
amplitud del rango.

5. Formar los intervalos de clase; definidos los intervalos cada uno de ellos se

26
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

denota por:

Li-1 : Límite inferior = Y’i-1


Li : Límite superior = Y’i

6. Marca de clase: Es el punto medio de cada intervalo, se denota como Yi; y se


calcula:

Yi ''1  Yi '
Yi=
2

Se calcula para cada intervalo.

Ejemplo: Un grupo de 50 estudiantes del primer grado de secundaria del colegio


Atusparia de Huaraz, obtuvo las siguientes calificaciones en una prueba de
matemática:

16 10 14 10 18 08 09 16 06 12

05 06 15 18 15 13 01 13 03 04

12 12 16 17 19 04 17 02 10 11

18 15 11 20 11 09 10 18 11 10

10 14 19 19 06 13 12 19 14 16

Como las notas varían de 01 a 20, trataremos a esta variable como si fuera continua y
agruparemos las notas en intervalos. Los intervalos se acostumbran a construir de la
forma “semi abierto”, es decir [........ Para este ejemplo consideraremos 5 intervalos
de igual amplitud. Por criterio del investigador no utilizamos la regla de Sturges.

En consecuencia los intervalos serán: [01 - 05. [05 - 09. [09 - 13. [13 - 17. [17 -
21. Como es evidente en el último intervalo se considera como límite superior un
valor que no existe, esto es usual en el primer y último intervalo de cualquier tabla.
A continuación la tabla.

27
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

[Y’i-1 - Y’i Yi ni hi% Ni Hi%

[01 - 05 3 5 10 5 10

[05 - 09 7 5 10 10 20

[09 - 13 11 16 32 26 52

[13 - 17 15 13 26 39 78

[17 - 21 19 11 22 50 100

Total 50 100 //// ////

Interpretaciones:

n3 = 16,  16 alumnos obtuvieron entre 05 y 09 puntos; incluso 05.

N4 = 39,  39 alumnos obtuvieron notas inferiores a 17.

h1 = 10%,  El 10% de los alumnos obtuvieron entre 01 y 05 puntos; incluso 01.

H2 = 20%,  El 20% de los alumnos obtuvieron notas menores que 09.

RECOMENDACIONES PARA LA CONSTRUCCIÓN DE TABLAS

a) Las tablas no deben ser complicadas, ni grandes ni largas; tienen que ser precisos y
claros.

b) Si se tiene más de dos variables, éstas deben estar relacionadas entre sí.

b) Las categorías consideradas en la tabla deben de estar arregladas de tal modo que se
facilite el análisis y las comparaciones. Por ejemplo:

- Los valores numéricos de la variable se arreglarán con frecuencia en forma


ascendente.

- El tiempo se arreglará en orden cronológico.

- La clasificación geográfica se puede arreglar en orden alfabético, o de acuerdo a la


importancia de las áreas o considerando la denominación numérica que tienen
(código UBIGEO)

28
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

- Si la variable es cualitativa, las categorías se pueden arreglar de acuerdo a su


importancia.

TABLA Nº 01

PERÚ: TASAS DE ANALFABETISMO DE LA POBLACIÓN DE 15 AÑOS Y


MÁS POR ÁREAS URBANA Y RURAL, SEGÚN GRUPOS DE EDAD. 1991

GRUPOS DE EDAD TOTAL URBANA RURAL


TOTAL 18,1 8,1 39,6
15 - 19 06,2 1,9 15,9
20 - 24 07,7 2,4 21,1
25 - 29 10,4 3,4 28,1
30 - 34 14,2 5,4 36,0
35 - 39 21,2 9,0 46,1
40 y más 33,0 17,5 60,2
Fuente Boletín de análisis demográfico Nº 29 INEI. 1996

TABLA Nº 12

GRADO DE SATISFACCIÓN DEL SISTEMA ADMINISTRATIVO Y EL


CUMPLIMIENTO DE FUNCIONES DE CONTABILIDAD

Grado de Satisfacción de la labor


del Sistema Administrativo Total
Funciones de
Contabilidad Poco Satisfecho Satisfecho
N % N % N %
Poco cumplido 42 70,0 8 17,8 50 47,6
Cumplido 18 30,0 37 82,2 55 52,4
Total 60 100,0 45 100,0 105 100,0
Fuente: Encuesta realizada por la investigadora.

2=28,115 gl=1 P-Valor=0,0001

29
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

PRESENTACIÓN DE DATOS MEDIANTE GRÁFICOS ESTADÍSTICOS:

GRÁFICOS ESTADÍSTICOS:

Un gráfico es una representación mediante figuras geométricas u otros elementos que


proporcionan visualmente un resumen de la información que interesa destacar, y lo más
importante, recordar. El gráfico cumple estos aspectos y es mejor que una tabla numérica
la que, a su vez tiene interés desde otros puntos de vista.

En todo trabajo de índole estadístico, se recomienda que la confección de un gráfico, pues


puede sugerir, a menudo la metodología más conveniente para el análisis de la
información. En efecto, en un buen gráfico se pueden apreciar la tendencia, variaciones y
anomalías del fenómeno representado, así como las relaciones entre dos o más series de
datos superpuestas en un mismo gráfico.

PRINCIPALES PARTES DE UN GRÁFICO:

1. TITULO: es la descripción del contenido del gráfico (idem que el encabezamiento de


la tabla).

2. DIAGRAMA: está dado por el propio dibujo de gráfico, y como en el cuerpo del
cuadro, están representados los datos indicados en el título.

3. ESCALAS Y/O LEYENDAS: son indicaciones donde se precisa la correspondencia


entre los elementos del gráfico y la naturaleza de las medidas representadas.

4. FUENTE: Se usa generalmente para designar la tabla de donde provienen los datos
graficados.

PRINCIPALES TIPOS DE GRÁFICOS

Al igual que las tablas, los gráficos que sirven para describir datos, son muchísimos y
quedan a la mejor inspiración del interesado con la sola condición de que el gráfico a
simple vista descubre el mayor número de detalles que posee.

30
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

A continuación presentamos una breve clasificación de los gráficos:

GRÁFICOS PARA VARIABLES CUALITATIVAS:

 Barras

 Circulares

 Pictogramas, entre otros

GRÁFICOS PARA VARIABLES CUANTITATIVAS DISCRETAS

 Bastones

 Circulares

 Mayor entero.

GRÁFICOS PARA VARIABLES CUANTITATIVAS CONTINUAS

 Histogramas

 Polígonos

 Circulares

 Ojivas

 Escalones

 Areas

 Lineales, entre otros.

 Tronco y hojas

 Cajas

31
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

MEDIDAS (Estadígrafos) DE TENDENCIA CENTRAL

Los ESTADÍGRAFOS de tendencia central son aquellos que se ubican generalmente en el


centro de la distribución. Estudiaremos brevemente la media aritmética, la mediana, la
moda. Como sus cálculos requieren de la aplicación de la matemática recordaremos
previamente algunos conceptos básicos.

* Notación de Sumatoria

En matemática para expresar una suma de términos se utiliza el símbolo  que


significa "sumatoria".

3
Ejemplo 1: Escribir los términos de X i 1
i . Esta expresión se lee: "sumatoria de los

elementos de la forma Xi, donde i varía desde 1 hasta 3" y su desarrollo es:
3


i 1
Xi  X1  X 2  X 3

3
Ejemplo 2: Escribir los términos de 
i 1
X i n i . Esta expresión se lee: "sumatoria de los

elementos de la forma Xi por fi, donde i varía desde 1 hasta 4" y su desarrollo es:
4

 X in i
i 1
 X 1n1  X 2n2  X 3n3  X 4n4

Ejemplo 3: Si X1 = 3, X2 = 8, X3 = 4, X4 = 3. n1 = 2, n2 = 7, n3 = 1, n4 = 2, calcular:
4 4
a) X
i 1
i b) 
i 1
Xi n i

4
a) X
i 1
i = 3 + 8 + 4 + 3 = 18

4
b) Xn
i 1
i i = (3)(2) + (8)(7) + (4)(1) + (3)(2)

= 6 + 56 + 4 + 6 = 72

32
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

MEDIA ARITMETICA

Es el estadígrafo más conocido, el más fácil de calcular, es muy sensible a los valores
extremos cuando estos son demasiado bajos o altos. Su notación es:

x, M , M , M[x] , E[x], μ .
1

La media Aritmética se define como la suma de todos los valores observados dividido
por el número de observaciones (n).

a) Fórmula para datos no agrupados:

X 
x i

Ejemplo 4: En una encuesta de ingresos mensuales, realizada para ver el costo de la


canasta familiar, se obtuvo la siguiente información en cuanto al número de hijos:

x1 = 1; x2 = 3; x3 = 2; x4 = 5; x5 = 4

x6 = 2; x7 = 4; x8 = 0; x9 = 1, x10 = 3

x11 = 4; x12 = 2; x13 = 3; x14 = 1, x15 = 4

x16 = 0; x17 = 2; x18 = 1; x19 = 5; x20 = 2

Solución:

Aplicando la fórmula anterior, se tiene:

 x i 49
X= = = 2,45
n 20

Ejemplo 5: Supongamos que en una agencia de Telefónica hay cinco ventanillas para
recibir reclamos de los abonados y que durante una semana se observó el número de
reclamos presentados en cada ventanilla obteniéndose los resultados siguientes:

33
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Ventanilla N° 1 2 3 4 5

N° de reclamos 45 43 25 17 30

Denotando: X = número de reclamos en ventanilla.

La media es:

45  43  25  17  30 160
X    32
5 5

Notamos que:

X1 Primer valor observado, es 45 reclamos

X2 Segundo valor observado es 43 reclamos

Y así sucesivamente. En consecuencia, la media X tiene la misma dimensión (número de


reclamos) y su valor se interpreta afirmando que:

En la semana de observación, el número medio de reclamos por ventanilla es 32, o


equivalentemente.

En la semana de observación se presentó un número medio de 32 reclamos por


ventanilla.

Ejemplo 6: Por ejemplo si las notas de un alumno en un curso son: 13; 16; 11; 08; 14 y
10 para hallar la media aritmética de sus notas procederemos de la siguiente manera:

13  16  11  08  14  10 72
X   12
6 6

b) Fórmula Para datos agrupados sin intervalos:

Si los datos están agrupados en una tabla de frecuencias, primero se multiplican los
valores de la variable por sus respectivas frecuencias, luego se suman estos productos
y por último se divide el resultado entre el número de datos.

34
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Ejemplo 7: X es la variable "edades de un grupo de profesores".

Xi ni Xi x ni
23 3 69
24 6 144
25 9 225
26 5 130
27 2 54
Total 25 622

622
La edad promedio es: X   24,88
25

Interpretación: "La edad promedio de este grupo de profesores es de 25 años".

La fórmula que usamos en este caso es:

 X .n
i 1
i i
X
n

c) Fórmula para datos agrupados con intervalos:

Para datos agrupados, el cálculo de la media aritmética, es como sigue:

 yi * n i
Y=
n

y1 . n 1 + y 2 . n 2 + ... + y m . n m
Y=
n

Ejemplo 8: Para los datos del Ejemplo 4, calcule la media aritmética si los datos se
presentan en la siguiente tabla:

35
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

TABLA Nº 1

yi ni yi.ni

0 2 0
1 4 4
2 5 10
3 3 9
4 4 16
5 2 10
 20 49

 y i n i 49
y= = = 2,45
n 20

Ejemplo 9: Procedimiento de cálculo de la media a partir de la distribución de


frecuencias con intervalos para el peso de 35 alumnos.

TABLA N° 2

Peso (Kg)

[y'i-1 - y'i) .yi .ni .yi.ni

47 - 55 51 8 408

55 - 63 59 5 295

63 - 71 67 4 268

71 - 79 75 6 450

79 - 87 83 8 664

87 -95 91 4 364

TOTAL 35 2 449

De este modo tenemos que la media es:

36
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Y 
 y .n i i

2449
 69,971
n 35

Esto es, el peso medio de los 35 alumnos es de 69 kilos con 971 gramos.

Ejemplo 10: La información dada en la tabla 3 consiste en la edad de 20 pacientes de sexo


masculino que presentaban problemas prostáticos atendidos en el departamento de
Urología del hospital Víctor Ramos Guardia, el mes de Enero del 2014.

TABLA N° 3

.
[y'i-1 - y'i) yi .ni .yi.ni

46 - 54 50 2 100
54 - 62 58 4 232
62 - 70 66 5 330
70 - 78 74 4 296
78 - 86 82 3 246
86 - 94 90 2 180

Total 20 1 384

1384
Y   69,2
20

Esto es, la edad media de los pacientes con problemas prostáticos es de 69,2 años. (69
años con 73 días)

La media aritmética también se puede calcular tomando como ponderaciones a las


frecuencias relativas.

Sabiendo que:

ni
hi =
n

Se tiene:

Y =  yi . hi

37
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Y  y1.h1  y 2 .h 2  y3 .h 3    y k .h k

Ejemplo 11: Para la información del ejemplo 5, encuentre la media aritmética usando las
frecuencias relativas:

TABLA N° 4

yi hi yi .hi

50 0,10 5,00
58 0,20 11,60
66 0,25 16,50
74 0,20 14,80
82 0,15 12,30
90 0,10 9,00

 1,00 69,20

Usando la fórmula anterior se tiene:

Y = 69,20

d) Media aritmetica general

Ejemplo 12: En un colegio se cuenta con dos secciones de primer grado de secundaria, si
la sección A que cuenta con 42 alumnos obtuvo una nota promedio de 15,6 en una
prueba bimestral y la sección B de 53 alumnos obtuvo 12,6 en la misma prueba, ¿Cuál
será el promedio del total de los alumnos de primer grado?

Para resolver este problema debemos calcular la media aritmética de la siguiente manera:

(42)(15,6)  (53)(12,6)
X 
42  53

655,2  667,8
X 
95

1323
X   13,93
95

Interpretación: La nota promedio del primer grado en la prueba bimestral es de 13,93.


38
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

En general: Si se tienen dos muestras de tamaños n1 y n2 y medias aritméticas X 1 y X 2 ,


la media aritmética general se calcula aplicando la siguiente fórmula:

n 1.X1  n 2 .X 2
X
n 1  n2

ALGUNAS VENTAJAS Y DESVENTAJAS

VENTAJAS:

a. La media aritmética es, la medida más fácil de entender y la más comúnmente usada.
Es un valor tal, que si se calculara para un grupo en el cual todos los elementos
fueran iguales, cada uno de ellos sería igual a su media aritmética, de donde
podemos deducir que la media aritmética de n elementos es un nuevo elemento
formado tomando una parte igual a 1/n de cada uno de los elementos originales.

b. Esta medida se define en forma rígida por una ecuación matemática muy fácil de
entender y algunas veces, se puede obtener cuando no es posible calcular otros tipos
de medidas de tendencia central y aun en el caso de no conocer los valores
individuales de la serie de datos.

c. La media aritmética es extraordinariamente estable en el muestreo

d. Es altamente sensible a cualquier cambio en los datos de la distribución.

e. Como una ventaja final de la media aritmética, podemos anotar el hecho de que es
excepcionalmente adaptable cuando se trata de hacer cálculos matemáticos
posteriores con él (promedio ponderado, métodos abreviados, promedio de
promedios).

DESVENTAJAS:

a. Es muy sensible a los valores muy grandes o muy pequeños (valores extremos),
especialmente a los primeros y a la inclusión de tales datos extremos en la
distribución que se esté estudiando, puede dar un promedio aritmético que no sea
realmente el representante típico del grupo.

39
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

b. Cuando una distribución es asimétrica en tal forma que la media aritmética la


mediana y la moda difieren en forma apreciable, debe considerarse siempre la
posibilidad de que el promedio aritmético pueda no ser el valor único representativo
de la serie.

c. Cuando la distribución tiene forma de U, es decir, parabólica, éste corresponde a los


valores menos comunes en la serie y por tanto, puede dar una idea irreal de la
distribución.

LA MEDIANA

En una ordenación creciente de los valores observados la Mediana es el valor que ocupa
la posición central (si n es impar) o es la semisuma de los dos valores centrales (si n es
n 1
par). La mediana se encuentra ubicada en la posición ( ) avo lugar, esto es en datos
2

discretos.

Ejemplo 13: Así para los valores 1, 0, 2, 4, 3 se tiene la ordenación creciente 0, 1, 2, 3, 4

La mediana es el dato central 2; esto es Me[X] =2; mientras que para los valores 2, 5, 7, 6,
4, 8 la ordenación creciente es 2, 4, 5, 6, 7, 8

La mediana es Me [X] = 1/2 (5+6) = 5,5

El símbolo utilizado es Me y se define como aquel valor de la variable que supera a no


más de la mitad de las observaciones y el mismo es superado por no más de la mitad de
las observaciones. Es el valor central.

Pasos a seguir en el cálculo de la mediana para datos continuos (intervalos):

a. Obtener las frecuencias absolutas acumuladas.

b. Buscar la mitad de las observaciones, por medio de n/2.

c. Localizar el resultado anterior n/2 en la columna de las frecuencias absolutas


acumuladas. Si no aparece, al valor inmediatamente anterior se le denomina Nj-1 y al
inmediatamente superior se le denomina Nj. Siendo éste (Ni) el intervalo donde se

40
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

encontrará el valor de la mediana.

d. Ubicarse en el intervalo donde se encontrará la mediana, esto es en el intervalo Ni e


identificar a cada uno de estos valores:

.y'i -1: que corresponde al límite inferior del intervalo.

C: la amplitud del intervalo.

Ni - 1: frecuencia acumulada anterior a la Ni.

.ni : frecuencia absoluta simple del intervalo seleccionado.

e. El valor de la mediana se encontrará mediante el uso de la siguiente fórmula:

n 
  N i 1 
M e [Y]  y i' 1  C 2 
 ni 
 
 

Ejemplo 14: Procedimiento de cálculo de la mediana a partir de la distribución de


frecuencias con intervalos para el peso de 35 alumnos.

TABLA N° 8

Peso (Kg)
[y'i-1 - y'i) .yi .ni Ni
47 - 55 51 8 8
55 - 63 59 5 13
63 - 71 67 4 17
71 - 79 75 6 23
79 - 87 83 8 31
87 -95 91 4 35
TOTAL 35 ---

De este modo tenemos que la mediana estará ubicada en el:

35/2 = 17,5 avo lugar

Siendo el intervalo elegido el que contiene a Ni = 23, luego:

41
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

 17,5  17 
M e [Y]  71  8   71  0,667  71,667
 6 

Y decimos que el peso mediano de los 35 alumnos considerados es de 71,667 kg.

Características de la mediana:

a. La suma de los valores absolutos de las desviaciones tienen su valor mínimo,


cuando se consideran las desviaciones con respecto a la mediana.

b. Una característica muy importante de la mediana es su insensibilidad hacia los


valores extremos. La mediana de 2, 4, 7, 6, 18 es 6 y también es 6 la mediana de 2, 4,
7, 6, 90.

c. La mediana es un valor o valor potencial que divide al arreglo creciente de los datos
de modo que hay igual número de ellos por debajo y por encima de la mediana.

d. Si cambia el número de observaciones, puede cambiar el valor de la mediana.

e. La mediana es de fácil cálculo, pero no es factible de manipulaciones algebraicas.

ALGUNAS VENTAJAS Y DESVENTAJAS

VENTAJAS:

a. La mediana tiene una definición rígida y el concepto que envuelve es tan claro que
cualquiera puede entenderlo aun no siendo familiar el término.

b. Si los datos están ordenados en un cuadro de frecuencias, esta medida es fácil de


calcular y por otro lado, los datos extremos no tienen ninguna influencia en ella.

c. Tiene menos estabilidad en el muestreo que la media aritmética, pero es más estable
que otras medidas.

d. Hay situaciones en que la única medida de tendencia central que puede calcularse es
la mediana, tal como sucede en el caso de una distribución cuyos intervalos extremos
no están definidos.

42
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

DESVENTAJAS:

a. No es tan conocida como la media aritmética.

b. Es necesario ordenar los datos para poderla calcular.

c. La mediana no se adapta a cálculos posteriores aritméticos, por cuanto que si la


obtenemos las medianas de diferentes grupos, no podemos obtener una mediana de
los grupos reunidos.

d. La mediana no es sensible a cambios de valores de los elementos que componen la


distribución.

LA MODA

Llamada también modo o valor modal se simboliza por Mo y se define como aquel valor
de la variable que presenta la mayor frecuencia.

Es la medida de posición más fácil de determinar pues sólo se requiere inspección del
conjunto de datos originales y no-cálculo; pero tiene la desventaja de que no siempre
existe (caso de distribución uniforme o todos los valores diferentes con igual frecuencia)
o puede haber dos o más valores con la frecuencia mayor. Por otro lado, el valor de la
moda podría ubicarla cerca de alguno de los extremos de la distribución y entonces no
sería una posición central. Por todo esto la moda no es una media muy utilizada;
solamente se usa cuando se requiere una aproximación rápida a la medida de posición.

Calculo de la moda:

a) Variable discreta. Observar el valor de la variable que presenta la frecuencia mas


elevada. El cual corresponderá a la moda.

43
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Ejemplo 15: Sean los datos de la siguiente tabla:

TABLA Nº 9

.xi .ni

0 8
1 12
2 30
3 20
4 10

 80

Observamos que el valor de la variable que presenta mayor frecuencia es x = 2 con


30 observaciones; por lo tanto la moda de la variable x es:

M o [X]  2

b) Variable continua: En el caso de variable continua, observar al intervalo que


presenta la frecuencia absoluta simple mas alta, a este valor más alto, se le
denominará ni. Este será el intervalo donde se encuentre ubicada la moda.

Ubicar a los valores ni - 1 y a ni + 1 que son los valores inmediatamente inferiores y


superiores a ni. De tal manera que el valor de la moda se encontrará haciendo uso de
la siguiente fórmula (cuando la amplitud es constante):

 D1 
M o [Y]  y 'i 1  C 
 D1  D2 

Donde:

Di = ni - ni - 1

D2 = ni - ni + 1

Siempre que las amplitudes de todos los intervalos sean iguales.

44
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Ejemplo 15: Encontrar la moda, haciendo uso de los datos de la siguiente tabla.

TABLA Nº 10

.y'i -1 - y'i .yi .ni

6 - 16 11 6
16 - 26 21 14
26 - 36 31 22 ni –1
36 - 46 41 38 ni
46 - 56 51 26 ni +1
56 - 66 61 14
66 - 76 71 10

Total -- 130

ni = 38; ni - 1 = 22; ni + 1 = 26; y'i - 1 = 36

D1 = 38 - 22 = 16; D2 = 38 - 26 = 12

Por lo tanto:

 16 
M o [Y]  36  10    41,714
 16  12 

ALGUNAS VENTAJAS Y DESVENTAJAS

VENTAJAS:

a. El hecho de que la moda indica el punto de mayor concentración, lo hace tal vez, la
mejor medida de tendencia central. Cuando una distribución es muy asimétrica,
claramente se ve que la moda es el más representativo del grupo, y en algunos casos,
si la moda y el promedio aritmético son significativamente diferentes del valor, es
preferible usar la moda.

b. En series polimodales, la moda permite dividir la distribución con fines de


estratificación.

DESVENTAJAS:

a. La moda es difícil de calcular en una serie agrupada y las aproximaciones de su


45
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

cálculo no son de mucha confianza.

b. La moda es muy inestable en el muestreo.

c. La moda no puede ser usada fácilmente en procesos algebraicos posteriores.

d. La moda no es sensible a cambio de valores de la distribución, a menos que tales


cambios afecten su propio valor.

e. No es recomendable en la variable continua cuando la amplitud en los intervalos es


diferente.

REGLAS PARA EL USO DE LAS MEDIDAS DE TENDENCIA CENTRAL

a. Cuando la serie tenga forma de progresión geométrica, debe usarse la media


geométrica. Mg[ ];

Fórmula para datos discretos M g X  n x 1 * x 2 * x 3 * ... * x n

Fórmula para datos agrupados M g Y  n y 1n 1 * y 2n 2 * y 3n 3 * ...y nk k

b. Para calcular la velocidad media debe usarse la media armónica.Ma[ ];

M a X 
n
Fórmula para datos discretos
1
x
i

M a Y 
n
Fórmula para datos agrupados k
ni

i 1 y i

c. Cuando la distribución sea muy asimétrica, debe considerarse la posibilidad de usar


la mediana o la moda.

d. Cuando la distribución tenga forma de U es decir que pueda representarse por una
curva cóncava de extremos iguales, debe usarse la moda.

e. Cuando quiera dársele importancia a valores pequeños de la variable es aconsejable


la media geométrica.

f. En una distribución cuyos valores extremos no están definidos, es aconsejable la

46
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

mediana o la moda.

g. Cuando haya alguna razón para pensar que el promedio aritmético no representa
muy bien a la distribución debido a que valores extremos lo afectan, o por otras
razones debe considerarse la posibilidad de usar la mediana y la moda.

h. Cuando la amplitud de la distribución no es constante, no debe usarse la moda.

i. Cuando se quiere promediar relaciones (tasas) se debe usar la media armónica.

j. En los demás casos debe usarse la media aritmética.

47
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Ejemplos Resueltos:

1º. Con los datos obtenidos sobre el número de hijos por familia, se pide calcular la
media aritmética, la mediana y la moda.

Xi ni Xini Ni

0 2 0 2
2 3 6 5
4 7 28 12
6 4 24 16
7 4 28 20

Total 20 86 -

Solución:

a. Media aritmética

86
M   4,3
20

b. La mediana (n+1)/2 = 10,5 avo lugar; Correspondiente a X = 4

Me = 4

c. La moda: la frecuencia absoluta más alta es 7; correspondiente a X = 4

MO = 4

2º. Con los datos, referente a una distribución asimétrica, se pide calcular la Media
aritmética, la Mediana y la moda.

Y'i-1 - Y'i Yi ni Yini Ni

2,75 - 4,25 3,5 4 14,00 4


4,25 - 5,75 5,0 16 80,00 20 -1
5,75 - 7,25 6,5 25 162,50
7,25 - 8,75 8,0 5 40,00 50

Total -- 50 296,50 -

48
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Solución:

a. Media aritmética

296,50
Y   5,93
50

b. La mediana (n/2) = 25

 25  20 
Me  5,75  1,5   6,05
 25 

c. La moda:

ni = 25; ni - 1 = 16; ni + 1 = 5

Entonces D1 = 25 - 16 = 9

D2 = 25 - 5 = 20

 9 
Mo  5,75  1,5   6,2155
 29 

3º. Si la media de 75 artículos es de 52,6 y la de 25 artículos es de 48,4 encuentre la


media de los 100 artículos.

Solución:

n1 = 75 X1 = 52,6

n2 = 25 X 2 = 48,4

X = ?

52,6(75)  48,4(25)
X   51,55
100

4º En una competencia atlética con 45 participantes, 20 compiten el primer día y los


restantes el día siguiente. Si en el primer día los 20 tienen un promedio de 48,4
puntos, ¿Cuál es el menor número de puntos que deben obtener en promedio los
restantes atletas, de modo que el puntaje medio de todo el equipo sea por lo menos
igual a 55?

49
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

Solución:

n = 45 X = 55

n1 = 20 X1= 48,4

n2 = 25 X 2 = ?

55 = 48,4(20) + X 2(25)
45
2,475 = 968 + 25X 2

X 2 = 60,28

5º. En un examen tomado a tres secciones de un curso de estadística de 91 alumnos, el


puntaje medio general fue de 69,3. Los puntajes medios de la secciones A y B fueron
70,4 y 64,2 respectivamente. Se perdieron los archivos con las notas de la sección C
pero los profesores recuerdan que sus secciones A y B tenían exactamente el mismo
número de alumnos, mientras que el profesor de la sección C menciona que la sección
tenía 5 estudiantes menos que la A. ¿Cuál fue el promedio de las notas de la sección
C?

Solución:

n = 91 X = 69,3

nA = nB X A = 70,40

nC = nA - 5 X B = 64,20

X C = ?

nA + nB+ nC = 91

2nA + (nA - 5 ) = 91  3nA = 96

nA = 96/3 = 32 nB = 32 nC = 27

69,3 = 70,4(32) + 64,2(32) + 27XC


91

X C = 1 999,1 = 74,04
27

50
____________________________________________________________
UNASAM
Apuntes de ESTADISTICA Angel D. Mendoza López

6º. Se sabe que ninguna de las sucursales de una empresa comercial tiene más de 9
empleados o menos de 7. La mayoría tiene 8 empleados, pero el 25% tiene 9
empleados y una de cada 10 sucursales tiene 7 empleados. ¿Cuál es el promedio de
empleados por sucursal?

Yi hi Yihi

7 0,10 0,70
8 0,65 5,20
9 0,25 2,25

Total 1,00 8,15

Solución:

Y =Yihi = 8,15

51
____________________________________________________________
UNASAM

También podría gustarte