Está en la página 1de 48

UNIVERSIDAD NACIONAL FEDERICO VILLARREAL

FACULTAD DE OCEANOGRAFIA, PESQUERIA, CIENCIAS


ALIMENTARIAS Y ACUICULTURA
Escuela Profesional de Ingeniería Pesquera

ESTADISTICA GENERAL Y
APLICADA
Separata de Estadística Descriptiva

PROFESOR: ING. CARLOS ENRIQUE MORALES CAUTI


ESTADÍSTICA GENERAL Y APLICADA 1
ESTADISTICA DESCRIPTIVA

INTRODUCCION A LA ESTADISTICA

Definición de Estadística
La Estadística es parte de método científico y se le define como un conjunto de
técnicas usadas para recopilar, organizar, presentar, analizar e interpretar datos,
con el fin de obtener conclusiones y tomar decisiones sobre determinados hechos
o fenómenos en estudio.
La Estadística puede ser Descriptiva o Inferencial, la ESTADISTICA DESCRIPTIVA
es el estudio que incluye la obtención, organización, presentación y descripción
de información numérica, mientras que con la ESTADISTICA INFERENCIAL a
través de la técnica de “inferencia estadística” se obtienen generalizaciones o se
toman decisiones en base a una información parcial o completa obtenida
mediante técnicas descriptivas. La Teoría de la Probabilidad es el gran puente
conceptual que une la estadística descriptiva e inferencial.

Población o Universo
Es un conjunto grande y completo de individuos, elementos o unidades que
presentan características comunes y observables. El proceso de recolección de la
información de todos los elementos de una población se denomina CENSO y sus
resultados se consideran con total certidumbre, las funciones estadísticas
asociadas a una población se denominan PARAMETROS POBLACIONALES.
Ejemplo: Las poblaciones pueden ser finitas (cantidad de docentes de una
Universidad) o infinitas (cantidad de coliformes fecales en un punto de muestreo
del río Rímac).

Muestra
Es un Sub-conjunto de la Población, con todas las características de ésta. El
proceso de selección de una parte de los elementos de una población se
denomina Muestreo y sus resultados se consideran con cierto grado de
incertidumbre. Las funciones estadísticas asociadas a una población se
denominan ESTADÍSTICOS MUESTRALES o ESTADÍGRAFO. Los Estadígrafos son
utilizados para estimar parámetros o también como valores de distribuciones de
probabilidad que permiten hacer inferencia estadística (estadístico de contraste).
Ejemplo: Para la realización de una encuesta municipal, seleccionamos 400
personas del total de población de electores de Lima Metropolitana.

Observaciones
Estadísticamente son los datos que se recolectan para su estudio.

ING. CARLOS ENRIQUE MORALES Página 1


ESTADÍSTICA GENERAL Y APLICADA 2
ESTADISTICA DESCRIPTIVA

Unidades de Observación
Constituyen los elementos o cosas observados, en un Diseño Experimental se
denominan Unidades experimentales.
Ejemplo: Si un técnico lleva a cabo una investigación sobre la alimentación de
los camarones en un estanque de engorde, para cada camarón el técnico
obtendrá la edad, peso, talla, etc. En este caso, los camarones constituyen las
unidades de observación; y la edad, peso y talla de cada camarón viene hacer
las observaciones, la cuantificación de éstas observaciones se denominan datos
que pueden ser univariantes (x), bivariantes (x,y) o multivariantes (x, y, z….).

Variables
Se define las variables, como magnitudes que tienden a sufrir modificaciones o
cambio dentro de un dominio determinado.
Es decir, las características que varían de individuo a individuo o de objeto a
objeto se llaman variables, mientras que las que permanecen inalterables, se
llaman constantes.
Generalmente las variables se designan con las últimas letras mayúsculas del
abecedario: X, Y, Z; y los valores de las variables se designan con letras
minúsculas x1, x2, x3,......., xn.
Ejemplo: Pueden ser una característica medible (peso, talla, ingresos, coeficiente
de inteligencia, grados de estudio, etc.) o una cualidad no medible (estado civil,
nacionalidad, sexo, etc.); en general variable es una característica que se puede
categorizar.

Clasificación de las Variables:


A) Por su generalidad o nivel de abstracción:
a) Teóricas
Son aquellas que se necesitan operacionalmente1; porque sus cualidades o
características no son fácilmente observables ni medibles. Ejemplo:
Desarrollo económico, rendimiento académico, hábitos de consumo, etc.
b) Empíricas
Son aquellas variables que no necesitan definirse operacionalmente porque
sus valores se identifican en forma inmediata y son fácilmente medibles.
Ejemplo: Edad, sexo, peso, talla, etc.
Podemos considerar a las variables intermedias que permiten especificar
a las variables teóricas, con el fin de hacerlas observables y medibles.

1
Operacionalizar una variable significa transformar las variables teóricas (no observables ni medibles)
en variables intermedias y luego en variables empíricas (observables y medibles).

ING. CARLOS ENRIQUE MORALES Página 2


ESTADÍSTICA GENERAL Y APLICADA 3
ESTADISTICA DESCRIPTIVA

B) Por su relación causal


a) Independiente
Generalmente se simbolizan estas variables con la letra mayúscula X; y son
aquellas que no dependen de ninguna variable dentro de un contexto
determinado.
Indica: causa, antecedente, determinante.
b) Dependientes
Generalmente se simbolizan estas variables con la letra mayúscula Y; y son
aquellas que dependen de otra u otras variables dentro de un contexto
determinado.
Indica: Efecto, resultado, consecuente.
c) Interviniente
Son variables independientes que no puede ser observadas directamente
pero cuyos efectos pueden ser establecidos de forma operativa, éstas
variables son aquellas que teóricamente afectan a las variables
dependientes pero que no pueden medirse ni manipularse. Son variables
poco concretas, difíciles de identificar, o mejor dicho de medir.
Ejemplo: La mala distribución del alimento en los estanques genera
mayor desnutrición en los peces, esto se debe al mal manejo del nivel
de alimentación.
X = Distribución del Alimento Variable Independiente
Y = Desnutrición en los peces Variable Dependiente
Z = Nivel de Alimentación Variable Interviniente

C) Por su naturaleza
a) Variables cualitativas

ING. CARLOS ENRIQUE MORALES Página 3


ESTADÍSTICA GENERAL Y APLICADA 4
ESTADISTICA DESCRIPTIVA

Cuando expresan una cualidad, características o atributo, tienen carácter


cualitativo, sus datos se expresan mediante una palabra, es no numérico.
Ejemplo: Estado civil, los colores, lugar de nacimiento, profesiones, sexo,
actividad económica, causas de accidentes, etc.
Las variables cualitativas se clasifican en:
Variables Nominales, que son aquellos que establecen la distinción de los
elementos en diversas categorías, basándose en una o más atributos o
propiedades observadas, sin implicar algún orden entre ellas. Distribuye a
la unidad de análisis en dos más categorías. En este nivel las variables
pueden ser:
- Dicotómicas: si tienen dos categorías o clases.
Ejemplo: SEXO  Macho - Hembra
- Tricotómicas: Si tienen tres categorías o clases.
Ejemplo: RAZA  Blanca – Negra - Amarilla
- Politómicas o multitómicas: Si tienen más de tres categorías.
Ejemplo: ESTADO CIVIL  Soltero – Casado – Viudo - Divorciado
Variables Ordinales, que son aquellas variables que implican orden entre
sus categorías, pero no grados de distancia iguales entre ellas; están
referidas a un orden o jerarquía, donde las categorías expresan una
posición de orden.
Ejemplo: nivel socio económico (alto, medio, bajo), grado de instrucción,
clases sociales, grado de simpatía, orden de mérito, etc.
b) Variables Cuantitativas
Cuando el valor se expresa por una cantidad, es de carácter numérico. El
dato o valor puede resultar de la operación de contar o medir.
Ejemplo: Edad, número de hijos por familia, ingresos, viviendas por centro
poblado, niveles de desempleo, producción, utilidades por empresa.
Las variables cuantitativas se clasifican en:
Variable Discreta, cuando el valor de la variable resulta de la operación de
contar, su valor está representado sólo por números naturales (enteros
positivos).
Ejemplos: Hijos por familia, número de accidentes por día, trabajadores
por empresas, población por distritos, habitaciones por vivienda, etc.
Variable Continua, Cuando la variable es susceptible de medirse, es toda
variable cuyo valor se obtiene por medición o comparación con una unidad
o patrón de medida. Las variables continuas pueden tener cualquier valor
dentro de su rango o recorrido, por lo tanto se expresa por cualquier
número real.

ING. CARLOS ENRIQUE MORALES Página 4


ESTADÍSTICA GENERAL Y APLICADA 5
ESTADISTICA DESCRIPTIVA

Ejemplos: áreas de parcela, ingresos monetarios, producción de tilapia,


número de accidentes por día, peso, temperatura, horas trabajadas, etc.

A manera de síntesis y por su finalidad estadística podemos clasificar las


variables en general como cuantitativas y cualitativas, generalmente el
estudio de variables cuantitativas corresponde a la estadística paramétrica
y el estudio de las variables cualitativas a la estadística No paramétrica.

Proceso estadístico
Son un conjunto de procedimientos que se aplican en secuencia lógica con el fin
de recopilar, organizar, presentar, analizar e interpretar datos de fenómenos
sujetos a variaciones, se realiza a través de las siguientes etapas:
a) Etapa de Planeamiento
b) Etapa de Recolección de Datos
c) Etapa de Organización de Datos
d) Etapa de Presentación de Datos
e) Etapa de Análisis de Interpretación de Datos

ING. CARLOS ENRIQUE MORALES Página 5


ESTADÍSTICA GENERAL Y APLICADA 6
ESTADISTICA DESCRIPTIVA

ETAPA DE PLANEAMIENTO

Planeamiento de la Investigación
Toda investigación implica un proceso que para ejecutarlo se debe de antemano
tener claro lo que se quiere alcanzar.
El diseño de la investigación o estudio se concibe en un Plan o Proyecto, cuyo
contenido depende del tipo de investigación a llevar a cabo. Sin embargo, en la
elaboración del Plan sugerimos tener en cuenta algunos puntos, como los
siguientes:
a) Planteamiento del Problema.
El origen del problema está en que frente a una determinada situación, no
existe respuesta o solución inmediata; para ello se hace necesario llevar a
cabo un proceso de investigación.
Por lo tanto, en este punto se concibe el estudio y se reflexiona sobre el
problema a investigar.
Ejemplo: ¿Por qué la falta de un modelo de gestión, no contribuye al
aprovechamiento eficientemente del potencial acuícola de las aguas
residuales?
b) Formulación de Objetivos.
Consiste en señalar detalladamente lo que se pretende investigar.
Responde a la pregunta ¿Para qué? o ¿Por qué? se quiere investigar.
La precisión en la formulación de los objetivos es de suma importancia en
la relación a la parte estadística, ya que de ellos depende la precisión del
tipo de información a recolectar.
Ejemplo: Desarrollar un modelo de Gestión mediante herramientas de
planeamiento y control para maximizar el potencial económico en la
actividad acuícola en aguas residuales.
c) Definición de la Población o Universo.
Consiste en determinar al conjunto del cual se obtendrá la información y
a quien se atribuirán los resultados obtenidos. De acuerdo a los objetivos
planteados, el estudio podrá incluir a toda la población o una muestra
representativa de ella.
Ejemplo: Aguas residuales de la costa norte del Perú
d) Determinación de Variables
Aquí se relacionan las variables a manejar en la investigación. Esta
selección de variables se debe hacer teniendo en cuenta los objetivos, a
fin de no recolectar información innecesaria u omitir parte de ella.
Asimismo la determinación de las variables permite la formulación de la

ING. CARLOS ENRIQUE MORALES Página 6


ESTADÍSTICA GENERAL Y APLICADA 7
ESTADISTICA DESCRIPTIVA

hipótesis. En estudios exploratorios y descriptivos, por lo general


predominan las variables dependientes e independientes. Pero en
estudios explicativos y correlacionales con frecuencia se puede encontrar
un tercer tipo de variable.
Ejemplo: X = Modelo de gestión (indicadores de eficacia y eficiencia);
Y = Producción acuícola (indicadores de productividad y calidad sanitaria)
e) Formulación de la Hipótesis.
Las Hipótesis son enunciados o afirmaciones sujetas a demostración. Toda
hipótesis manifiesta relaciones entre variables y su formulación es
importante en la medida que orienta a la investigación.
Ejemplo: Si se desarrolla un modelo de gestión centrándose en el
planeamiento y control de los recursos disponibles, entonces, se
aprovechará eficientemente el potencial acuícola de las aguas residuales.
f) Determinación de la Información a Recolectar y Procedimientos
para su Recolección.
Los objetivos, las variables y las hipótesis, permiten anticipar y
seleccionar las necesidades de información a recolectar, así como los
mecanismos de captación de información (observación, cuestionarios,
etc.).
Ejemplo: Guías de observación, controles biométricos
g) Procedimientos de Elaboración y Análisis de la Información.
En esta fase se anticipa, de acuerdo a la información a recolectar, los tipos
de tablas, cuadros, gráficos estadísticos que permitan organizar y analizar
la información. Asimismo se debe definir el mecanismo de tabulación a
usar (manual, mecánico, electrónico), y en caso necesario, las técnicas
inferenciales a utilizar.
h) Programación y Conducción de la Investigación.
Con el fin de concluir exitosamente la investigación, ésta se debe
programar, para ello se hace necesario calendarizar las actividades y
conducir la investigación de acuerdo a lo planeado.
i) Informe de la Investigación.
Aquí se debe esbozar el contenido del informe, teniendo en cuenta la
distribución del trabajo: Título, Introducción, Capítulos, Apéndices, etc.
Como se puede observar, los puntos f, g, son los que estarían
directamente relacionados con el campo de la Estadística. Sin embargo,
para la elaboración de los puntos f, g, se requiere necesariamente precisar
en forma coherente los puntos b, c, d, e. Es decir, encontramos la relación
entre la parte estadística y el método científico.

ING. CARLOS ENRIQUE MORALES Página 7


ESTADÍSTICA GENERAL Y APLICADA 8
ESTADISTICA DESCRIPTIVA

RECOLECCION DE DATOS

En esta etapa empieza la ejecución de la investigación, es decir, el investigador


pone en marcha la etapa de planeamiento.
A través de la recolección, se obtienen los datos que se requieren para alcanzar
los objetivos y demostrar las hipótesis de la investigación. La obtención de los datos
se hace teniendo en cuenta lo siguiente:

Fuentes de Información
Cuando se recoge la información es posible que los datos ya hayan sido obtenidos
de las unidades de observación y publicados y registrados por otros, o que los
datos se tengan que obtener directamente de las unidades de observación en
forma personal.
Según sea el caso, las fuentes de información pueden ser de dos tipos:
a) Fuente Primaria:
Si la información se obtiene directamente de la misma persona o entidad,
utilizando ciertas técnicas (entrevistas, cuestionarios, etc.).
Ejemplo:
 Aplicar un test a un grupo de estudiantes para determinar el nivel
intelectual.
 Llevar a cabo una encuesta para conocer la situación socio – económica
de los pobladores del asentamiento humano “X”.
b) Fuente Secundaria:
Si la información a obtener, ya ha sido recopilada y elaborada por otras
personas o instituciones.
Este tipo de información la encontramos en los informes estadísticos de las
Instituciones Públicas y Privadas. En el Perú, el Instituto Nacional de
estadística publica boletines estadísticos con respecto a la Producción,
Inversión, Población, Migración, salud, etc.

Sistemas de Recolección de información


Los datos pueden ser recogidos a través de:
a) Las Oficinas de Estadística, como instituciones responsables de recopilar,
procesar y publicar las estadísticas sociales y nacionales, por ejemplo el INEI.
b) Archivos o Registros Administrativos, como el Registro Civil, Registro
Electoral, escalafón de Personal, Padrón de Contribuyentes, etc. Estos
registros no tienen fines estadísticos, su función es de tipo legal y

ING. CARLOS ENRIQUE MORALES Página 8


ESTADÍSTICA GENERAL Y APLICADA 9
ESTADISTICA DESCRIPTIVA

administrativo, sin embargo, pueden utilizarse como fuentes de datos


estadísticos.
c) Documentos, boletines e informes estadísticos, que son las
publicaciones o estudios que preparan los organismos especializados.
d) Censos, Encuestas o Entrevistas, son fuentes directas y especiales, que se
construyen en un momento determinado, recopilando datos de una parte o
de la totalidad de una población. Los Elementos o Sujetos, de una población
sometida a estudio, que pueden ser personas, instituciones, animales o
simplemente objetos.
Observamos que las tres primeras fuentes son de tipo administrativo y
constituyen fuentes secundarias, por su parte, la última corresponde a la
investigación estadística, ya que permiten obtener datos originales, intencionales
y de primera mano, es decir, constituyen fuentes primarias.

Técnicas de Recolección de Datos


Existen muchos procedimientos para recoger la información, entre los cuales el
investigador debe elegir los que se adapten a las circunstancias o al tipo de
investigación.
Entre las técnicas más frecuentes se tiene:
a) La Observación:
La observación en el proceso de investigación es la acción de mirar con rigor,
en forma sistemática y profunda, con el interés de descubrir la importancia de
aquello que se observa. La observación es el método básico que se utiliza para
adquirir información acerca del mundo que nos rodea, y por lo tanto,
constituye la técnica primordial de la investigación científica. La observación
puede tener lugar en situaciones auténticas de la vida ordinaria o también en
el laboratorio.
 Según el lugar o ámbito donde se encuentran los datos, la observación
puede ser:
Observación documental, cuando los datos son recogidos en
manuscritos o impresos.
Observación de campo, que puede ser observación de monumentos de
campo y observación de conductas.
 Según como se relaciona el investigador con el objeto de estudio, la
observación puede ser:
Observación directa, cuando el investigador puede recoger y observar
datos mediante su propia observación, obtener información del
comportamiento tal como ocurre.

ING. CARLOS ENRIQUE MORALES Página 9


ESTADÍSTICA GENERAL Y APLICADA 10
ESTADISTICA DESCRIPTIVA

Observación indirecta, cuando el investigador verifica los datos que ha


tomado de otros, aquí el investigador no está presenten el momento de la
ocurrencia del fenómeno.
Observación no participante, cuando el investigador extrae sus datos,
pero sin una participación en los acontecimientos de la vida del grupo que
estudia.
Observación participante o activa, cuando el investigador, de una u
otra manera, se introduce y actúa en el grupo observado, de modo que se
le acepta como miembro, y es identificado como observador.
 Según los medios utilizados, la observación puede ser:
Observación no estructurada, asistemática y libre; aquí los hechos se
observan al natural, en forma espontánea, en el momento mismo, que en
muchas de las veces pueden sorprender al observador.
Observación estructurada, sistemática o regulada, aquí se tiene un plan
específico para la realización de las observaciones, para lo cual se recurre
al empleo de instrumentos o guías para la recopilación de datos.
b) Técnica Documental:
La técnica documental es un tipo de observación que recopila o busca sus
datos en documentos, fuentes escritas o gráficas de todo tipo. En los
documentos se tienen:
 Documentos académicos, constituido por la bibliografía más importante
para conocer el estado del conocimiento de una ciencia.
 Actas e informes, donde las actas son documentos que recogen lo
ocurrido en el momento mismo en que está pasando; en tanto que los
informes son documentos escritos después de lo ocurrido el
acontecimiento.
 Documentos personales, como las autobiografías, diarios, cartas,
historias de vidas y estudios de casos.
 Fotografías, planos, videos, etc.
c) La Entrevista:
La entrevista es una situación de interrelación o diálogo entre personas, es
una técnica donde una persona llamada entrevistador solicita al entrevistado
(que generalmente es una persona con amplio conocimiento en un tema
específico respecto al estudio que se está realizando), le proporciona algunos
datos o información. La entrevista es un diálogo intencionado entre personas.
El éxito de la entrevista como técnica de recolección, depende de la eficiencia
del trabajo del entrevistador. La entrevista como técnica de recolección,
presenta diversas modalidades, como:

ING. CARLOS ENRIQUE MORALES Página 10


ESTADÍSTICA GENERAL Y APLICADA 11
ESTADISTICA DESCRIPTIVA

 La entrevista asistemática o libre.


 Entrevista estructurada, en la cual se precisa previamente los puntos
interrogar, existe un libreto o cuestionario.
 Entrevista focalizada, donde la interrogación se centra alrededor de un solo
tema específico.
 Entrevista simultánea, cuando los entrevistados son varios al mismo
tiempo.
 Entrevista sucesiva, cuando son varias entrevistas, pero en diversos
momentos.
d) La Encuesta:
La encuesta o investigación es una técnica de recolección de datos, donde se
obtiene la información tal como se necesita, preparada exprofesamente y con
objetivo estadístico, para así obtener una probabilidad o porcentaje de
ocurrencia de algo y se realiza a una serie de personas que son seleccionadas
según un perfil especifico. Las encuestas permiten observar y registrar
características en las unidades de análisis de una determinada población o
muestra, delimitada en el tiempo y en el espacio. En toda encuesta se hace
uso de un cuestionario, cuyas respuestas se registran en el formulario o
cédula, en la encuesta se pueden buscar respuestas precisas o abiertas, pero
al contrario de la entrevista, las preguntas son cerradas pues su finalidad es
dar una respuesta precisa, donde no se da apertura a una conversación por
parte del encuestador puesto que se puede llegar a interferir en la respuesta
final del encuestado.
Cuando una encuesta está a la totalidad de elementos de una población, se
llama Censo; en tanto, cuando está a una parte representativa de esta
población, es decir una muestra, se llama encuesta por muestreo. La selección
de la muestra requiere de técnicas especiales que se analizan en la Teoría del
muestreo, que puede ser probabilístico y no probabilístico.
Hay cuatro maneras de obtener los datos y la información con la Técnica de
la Encuesta:
 Con una entrevista o diálogo con el encuestado basado en un cuestionario,
cuyos datos, terminada la entrevista se registran en una libreta de notas.
 Por empadronamiento, donde el empadronador pregunta o encuesta al
empadronado y registra los datos en el formulario.
a) Por correo, cuando se envían los formularios por correo al domicilio del
empadronado o unidad de análisis.
b) Por teléfono o fax, cuando las preguntas se formulan telefónicamente.
La redacción de preguntas debe ser clara, sencilla y comprensible, diseñado

ING. CARLOS ENRIQUE MORALES Página 11


ESTADÍSTICA GENERAL Y APLICADA 12
ESTADISTICA DESCRIPTIVA

para obtener el dato o respuesta esperada a las variables consideradas en la


investigación. Sólo debe incluirse preguntas que están asociadas a los
objetivos y propósitos del estudio.
Las variables, el cuestionario y el formulario deben ser evaluados antes de su
aplicación. Por ejemplo trabajar con una Matriz de Formulación y Evaluación
de Cuestionario, así como con la Encuesta Experimental.
El cuestionario:
Ya sea que se planifique una encuesta o una entrevista, estas técnicas de
recolección de información poseen un instrumento valioso y fundamental que
es el Cuestionario, dicho instrumento está constituido por un conjunto de
preguntas sistemáticamente elaboradas, que se formulan al encuestado o
entrevistado, con el propósito de obtener los datos de las variables
consideradas en el estudio. Cuando las preguntas se organizan y se imprimen,
se obtiene el formulario o cédula, que es el instrumento que se utiliza para
registrar las respuestas o datos. La elaboración del cuestionario requiere de
un conocimiento previo del fenómeno, tener precisado cuáles son las unidades
de análisis y qué aspectos interesa estudiar. El cuestionario debe ser adaptado
a las necesidades de la investigación y a las características del grupo que se
estudia. De aquí que su estructura y su forma deben estar cuidadosamente
elaboradas, la redacción de las preguntas requiere de una experiencia y para
comprobar su compresión, es recomendable someter a prueba todo tipo de
cuestionario.
Preparación del cuestionario y el formulario: La preparación y
presentación supone elaborar el formulario, que es el diseño del documento
donde se registran los datos referentes a la unidad de investigación, permite
obtener los datos para llenar los cuadros estadísticos establecidos. Su
preparación se efectúa durante la fase del planeamiento de la encuesta,
después de que están definidos aquellos aspectos que son fundamentales para
conseguir información de buena calidad y fácil de procesar.
Entre los criterios para preparar el cuestionario y el formulario tenemos:
 Objetivos de la investigación
 Sistemas de variables
 Características del informante.
 Tiempo disponible para efectuar la recolección.
 Técnica de recolección.
 Procedimiento de elaboración.
Entre las características formales del cuestionario y del formulario, tenemos:
 Forma y tamaño del formulario.

ING. CARLOS ENRIQUE MORALES Página 12


ESTADÍSTICA GENERAL Y APLICADA 13
ESTADISTICA DESCRIPTIVA

 Calidad del papel del formulario.


 Tipo y color de la impresión.
 Tipo de archivo.
Entre las formas y clases de preguntas, destacan:
a) Preguntas abiertas, llamadas también ilimitadas, son aquellas que el
investigado responde con su propio vocabulario, sin que se le ponga
alguna alternativa, conjunto de palabras o frases.
Ejemplo:
 Describa brevemente las tareas que realiza en el cargo que ocupa.
 Anote la temática de las revistas especializadas que usted conoce.
b) Preguntas cerradas dicotómicas, aquellas que sólo pueden
responderse por un SI o NO, o simplemente cuando sólo tienen dos
alternativas.
Ejemplo:
 ¿Sabe leer?
SI ( )1 NO ( )2
 Sexo:
Masculino ( )1 Femenino ( )2
 ¿Trabaja actualmente?
SI ( )1 NO ( )2
 ¿Está Ud. de acuerdo con el aborto?
SI ( )1 SI ( )2
c) Preguntas cerradas de elección múltiple, son aquellas que proponen
un conjunto de alternativas en la respuesta.
Ejemplo:
 Categoría Docente:
Principal ( )1 Auxiliar ( )3
Asociado ( )2 Jefe de Práctica ( )4
 Edad:
Menores de 20 años ( )1 De 40 a 49 años ( )4
De 20 a 29 años ( )2 De 50 años y más ( )5
De 30 a 39 años ( )3
 ¿Qué cosa buena para el país quisieras que ocurra en el siguiente
año?
1( ) Más inversión y trabajo.
2( ) Menos pobreza.
3( ) Menos corrupción y delincuencia.
4( ) Aumento de salarios.

ING. CARLOS ENRIQUE MORALES Página 13


ESTADÍSTICA GENERAL Y APLICADA 14
ESTADISTICA DESCRIPTIVA

5( ) Mejora de la Educación.
6( ) Otros
d) Preguntas literales, son preguntas abiertas cuyas respuestas se
expresan con una palabra o cantidad.
Ejemplo:
 ¿Cuál es su estado civil?
 ¿Cuál es su ocupación actual?
 ¿Cuál es su ingreso total?
 Fecha de nacimiento
e) Preguntas cuyas respuestas indican un grado de intensidad dentro de
una escala creciente o decreciente, ascendente o descendente. Hay
un abanico cerrado, donde el encuestado elige una de las
posibilidades.
Ejemplo:
 La gestión del Rector de la Universidad es:
Muy Buena ( ) Buena ( )
Regular ( ) Mala ( )
No opina ( )
 ¿Está Ud. de acuerdo con la política económica del gobierno?
Muy de acuerdo ( )
De acuerdo ( )
En desacuerdo ( )
No responde ( )
Entre las pautas para la redacción y el contenido de las preguntas, podemos
recomendar:
a) Incluir preguntas estrictamente necesarias para:
- Satisfacer los objetivos.
- Establecer controles de consistencia en las respuestas.
- Individualizar al informante.
b) Incluir preguntas para que el informante recuerde.
c) Evitar las preguntas que obliguen al informante a hacer cálculos y
pueda cometer errores.
d) Redactar en forma clara y directa
e) La pregunta no debe sugerir respuestas.
f) Colocar primero las preguntas más simples y menos confidenciales.
g) La redacción de las preguntas depende del tipo de recolección de
datos, no es lo mismo preguntar por correo (auto administrado) que
por empadronador.

ING. CARLOS ENRIQUE MORALES Página 14


ESTADÍSTICA GENERAL Y APLICADA 15
ESTADISTICA DESCRIPTIVA

Ejemplo de un formulario de encuesta:

Estudio: “PERFIL SOCIO ECONOMICO Y ACADEMICO DEL ESTUDIANTE


UNIVERSITARIO”

Esta encuesta es ESTRICTAMENTE CONFIDENCIAL tiene como finalidad recolectar


datos sobre los aspectos socio económicos, familiares y académicos del estudiante,
a fin de disponer de un marco de referencia, por tanto, agradecemos responder con
la mayor sinceridad. COLOQUE UNA X EN EL PARÉNTESIS DE SU RESPUESTA.

CODIGO O MATRICULA: AÑO O CICLO:


Especialidad:

I. DATOS GENERALES
1.1 SEXO:
1.3 En qué distrito vive o
Hombre ( ) 1 1.2 EDAD en años:
reside actualmente?
Mujer ( )2 Fecha de Nacimiento:

1.5 ESTADO CIVIL:


1.4 LUGAR DE NACIMIENTO
Soltero ( ) 1 Casado ( )2
Provincia:
Viudo ( ) 3 Divorciado ( ) 4
Departamento:
Conviviente ( ) 5 Separado ( ) 6

II. ANTECEDENTES EDUCATIVOS DE LA SECUNDARIA


2.1 En qué colegio terminó la Educación
2.2 Donde está ubicado su Colegio?
Secundaria?
Distrito:
Estatal ( ) 1 No Estatal ( ) 2
Provincia:
2.3 Cuándo (fecha) terminó la Educación
2.4 Qué año de estudio repitió alguna vez?
Secundaria?
(1°) (2°) (3°) (4°) (5°)
2.5 Indique las 3 asignaturas que más le
2.6 Qué asignatura desaprobó alguna vez en
agradaban durante la secundaria.
secundaria?
1.
1.
2.
2.
3.
3.
2.7 Está Ud. siguiendo la PROFESIÓN que pensó estudiar?
SI ( ) 1 NO ( ) 2

Qué carrera profesional le gustaría seguir?..........................................................................

III. ANTECEDENTES ECONOMICOS DEL ESTUDIANTE


3.1 Trabaja actualmente en algo? 3.2 Qué hace o que cargo desempeña?
Si ( )
Donde? ...................................................
3.2 Si TRABAJA. ¿En cuántos dólares estima 3.3 SI NO TRABAJA de quién depende
sus ingresos actuales? económicamente?
( ) 1 Menos de 50 ( ) 2 de 51 a 100
( ) 3 de 1001 a 150 ( ) 3 de 151 a 200 3.4 Cuándo (año) empezó a trabajar por
( ) 5 de 201 a 300 ( ) más de 300 primera vez?

ING. CARLOS ENRIQUE MORALES Página 15


ESTADÍSTICA GENERAL Y APLICADA 16
ESTADISTICA DESCRIPTIVA

IV. ASPECTOS ACADÉMICOS UNIVERSITARIOS :


4.1 Cuándo postuló por primera vez a una 4.2 Cuándo ingreso por primera vez a esta
universidad? universidad?

4.4 Qué asignaturas de semestre o años


4.3 En qué asignaturas o cursos está
anteriores le falta aprobar?
matriculado actualmente?
1.
4.5 En qué ciclo o año de estudios está
2.
matriculado ahora?
3.
4.
4.6 Ha seguido otra profesión?
5.
SI ( )
6.
Cuál? ................................................
7.
4.7 AL MES, cuándo estima que gasta en:
Derecho de enseñanza S/. 4.8 Cómo califica la enseñanza que viene
Material de enseñanza recibiendo en la Facultad?
Pasajes, refrigerios, etc. ________ Muy Buena ( ) 1 Buena ( ) 2
TOTAL Regular ( )3 Mala ( ) 4

V. ASPECTOS SOCIO FAMILIARES:


5.2 Vive actualmente con sus padres?
Con Ambos ( )1
5.1 Cuántos miembros integran su familia?
Con uno de ellos ( ) 2
Con ninguno ( )3

5.4 Señale en que intervalo se encuentran los


ingresos mensuales de: (US $)
5.3 Nivel Educativo de sus padres:
Dólares PADRE MADRE
PADRE MADRE
1. Menos de 100 ( )1 ( )1
1 ( ) Primaria Incompleta ( ) 1
2. 100 – 200 ( )2 ( )2
2 ( ) Primaria Completa ( )2
3. 201 – 300 ( )3 ( )3
3 ( ) Secund. Incompleta ( ) 3
4. 301 – 400 ( )4 ( )4
4 ( ) Secund. Completa ( )4
5. 401 – 500 ( )5 ( )5
5 ( ) Superior Incompleta ( ) 5
6. 501 – 600 ( )6 ( )6
6 ( ) Superior Completa ( )6
7. Más de 600 ( )7 ( )7

5.5 Actividad Económica de sus padres? 5.6 La casa donde vive actualmente es:
PADRE MADRE Alquilada ( )1
1 ( ) Comercio Ambulatorio ( ) 1 Compra Venta ( ) 2
2 ( ) Obrero ( )2 Propia ( )3
3 ( ) Empleado Público ( )3
4 ( ) Empleado Privado ( )4 5.7 Su familia tiene:
5 ( ) Empresa Propia ( )5 Videograbadora ( )1
6 ( ) Profesional Independ. ( ) 6 Auto o carro ( )2
7 ( ) Agricultor ( )7 Máquina de escribir ( )3
8 ( ) Trabajador eventual ( )8 Computadora ( )4
Internet ( )5
OBSERVACIONES Y COMENTARIOS:

Fecha: Responsable:

ING. CARLOS ENRIQUE MORALES Página 16


ESTADÍSTICA GENERAL Y APLICADA 17
ESTADISTICA DESCRIPTIVA

ELABORACIÓN DE DATOS

En la etapa de recolección se obtiene gran cantidad de datos, los mismos que se


encuentran en formularios, cuestionarios, etc., y totalmente desordenados. En esta
etapa se trata de organizar dichos datos y para ello es necesario cumplir dos
actividades: Revisión o crítica y clasificación de datos.

Revisión o Crítica de Datos.


La revisión de datos constituye lo que se ha dado en llamar control de calidad de
la información, dicha revisión tiene por objetivo:
a) Determinar si han recibido todos los formularios o, cuando menos, en una
proporción que sea suficiente para no invalidar las conclusiones que se
podrían hacer;
b) Verificar que estén registradas todas las respuestas requeridas y;
c) Localizar posibles incongruencias en la información proporcionada.
Entre las posibles causas del envío incompleto de formulario tenemos:
 Formularios o cuestionarios muy extensos.
 Ausencia de instrucciones claras.
 Bajo nivel educativo del informante.
 Dotación insuficiente o inoportuna de los formularios o cuestionarios.
Si no se han registrado todas las respuestas requeridas, puede deberse a:
 Formularios o cuestionarios mal diseñados.
 Negligencia del entrevistador ya que no recibió adiestramiento.
 Informante se niega a contestar la pregunta.
Las incongruencias provienen de respuestas, cuyos valores quedan fuera de lo
considerado como posible o probable. Por ejemplo, si se indica que una persona
tiene 10 años de edad y luego aparece su grado de instrucción como Educación
Superior, entonces es evidente que existen incongruencias.
Las causas las incongruencias pueden ser:
 Personal poco calificado e irresponsable.
 Preguntas confusas en el formulario que por su extensión provoca fatiga.
 Informante poco motivado que da como respuesta lo primero que se le
ocurre para salir del paso.
 Informante demasiado complaciente, pues piensa que negar o afirmar
determinada cosa va a ser recibido con beneplácito por el encuestador.
Algunas veces cuando se realizan encuestas de opinión sobre las
preferencias electorales suele haber “un voto escondido” (voto vergonzante
respecto a un candidato relacionado con cierto prejuicio)

ING. CARLOS ENRIQUE MORALES Página 17


ESTADÍSTICA GENERAL Y APLICADA 18
ESTADISTICA DESCRIPTIVA

Clasificación de Datos.
La clasificación tiene por objeto organizar los datos en categorías, pero teniendo
en cuenta la escala de medición de las variables:
a) Clasificación de los Datos medidos a nivel nominal u ordinal:
Para elaborar datos que pertenecen a variables Cualitativas de carácter
nominal u ordinal, es necesario conocer cómo se clasifica la variable, luego
se procede a la tabulación.
Ejemplo:
De carácter Nominal:

CATEGORÍA FRECUENCIA O
OCUPACIONAL CANTIDAD
Empleado
Obrero
Independiente
TOTAL

DISTRIBUCIÓN DE FRECUENCIA O
INGRESOS CANTIDAD
Alimentación
Vivienda
Salud
Recreación
Cultura
Otros

TOTAL

De carácter Ordinal:

GRADO DE FRECUENCIA O
DESNUTRICION CANTIDAD
Grado I
Grado II
Grado III
TOTAL

GRADO DE FRECUENCIA O
INSTRUCCION CANTIDAD
Analfabeto
Primaria
Secundaria
Superior
TOTAL

b) Clasificación de los datos medidos a nivel de intervalo o de razón:


La elaboración de datos cuyas variables a la escala de intervalo o de razón,
tiene otro tipo de tratamiento, estas variables tienen que ser Cuantitativas
y para su organización y posterior análisis, es necesario agruparlos en clases

ING. CARLOS ENRIQUE MORALES Página 18


ESTADÍSTICA GENERAL Y APLICADA 19
ESTADISTICA DESCRIPTIVA

o intervalos. Esta forma de organización se conoce con el nombre de


DISTRIBUCIÓN DE FRECUENCIAS.
Ejemplo: Hemos recogido información sobre el peso (medido en gramos) en
una muestra de 40 “camarones de río”, y que corresponden al estudio de los
camarones de la comunidad de Caltopa en Cañete, Lima. Los datos son los
siguientes:
21 34 22 18 23
29 19 23 20 32
24 21 16 16 23
27 17 26 19 29
20 24 21 23 22
23 16 23 21 24
22 23 20 19 20
18 22 35 25 21
Al observar los datos apreciamos la variabilidad y también el desorden en
que se encuentra haciéndose difícil el análisis, lo cual no permite destacar
los hechos más importantes para obtener conclusiones acertadas que nos
ayuden en la toma de decisiones.
De allí que se hace necesario ordenar los datos en una TABLA DE
DISTRIBUCIÓN DE FRECUENCIAS.
Para elaborar una Tabla de Distribución de Frecuencias, dependiendo del tipo
de variable cuantitativa, se deben seguir los siguientes pasos:
i) Determinamos la variable en estudio: la variable puede ser
Cuantitativa Continua o Cuantitativa Discreta.
En nuestro ejemplo se trata de una variable Continua
ii) Determinación del Rango (R), también llamado Recorrido o Alcance.
El Rango se define como la distancia entre el dato máximo y el dato
mínimo.
Se halla restando el dato mayor (XM) con el dato menor (Xm):
R = XM - Xm
Cuando se trata de una variable discreta usualmente se suma al valor
del Rango una unidad, vale decir R + 1.
Para el ejemplo que nos ocupa:
XM = 35
Xm = 16
Luego: R = 35 – 16 = 19
iii) Determinación del Número de Clases (K), El número de clases, es
el número de categorías o intervalos en el que se va a dividir la

ING. CARLOS ENRIQUE MORALES Página 19


ESTADÍSTICA GENERAL Y APLICADA 20
ESTADISTICA DESCRIPTIVA

información. El número de clases se puede fijar arbitrariamente,


dependiendo del número de datos que se tenga, por lo general el número
de clases a elegir, varía entre 5 a 15. Una forma de calcularlo es
determinando el valor de la raíz cuadrada del número de datos, vale
decir:
K = (n)1/2
Donde n= Número de datos
En nuestro ejemplo K = (40)1/2 = 6,32…..
Como k tiene que ser un valor entero, aplicando las reglas de
aproximación tenemos que K = 6 intervalos de clase.
Sin embargo, existe también otra forma más aceptada de determinar el
número de clases con bastante aproximación, la cual se le conoce con el
nombre de REGLA DE STURGES, y cuyo cálculo responde a la siguiente
formula:
K = 1 + 3.3 * Log (n)
Para nuestro ejemplo K = 1+3.3*Log (40) = 6,28….
Aplicando las reglas de aproximación tenemos que K = 6 intervalos de
clase. Esto significa que la información se dividirá en 6 clases (aunque
puede ser 5, 6 o 7 clases según sea el caso:
Ii
I1
I2
I3
I4
I5
K
I6

iv) Determinación del ancho de clase (C), llamado también amplitud


del intervalo, representa la cantidad de datos que están comprendidos
entre un intervalo de clase. Un intervalo se forma por dos límites que
van a definir una clase. Los Límites son los valores extremos de un
intervalo y son de dos tipos: límite superior y límite inferior. Cuando
un intervalo no tiene límite superior o inferior, se llama intervalo de
clase abierto.
Luego podemos definir también la amplitud del intervalo (C) como la
distancia entre el límite inferior y superior de un intervalo, y se halla
a través de la fórmula:
C=R/K

ING. CARLOS ENRIQUE MORALES Página 20


ESTADÍSTICA GENERAL Y APLICADA 21
ESTADISTICA DESCRIPTIVA

En nuestro ejemplo: C = 19 / 6 = 3,16…


El valor de C se redondea al entero sólo si los datos son expresados en
números enteros. Si los datos proporcionados están en decimales, C
se redondea de acuerdo al número de decimales que contienen cada
dato de la información. Ahora en cuanto al redondeo se asume que el
valor de C debe redondearse al entero superior más próximo, si la
aproximación es al entero; si es al centésimo, debe redondearse al
centésimo superior más próximo y así sucesivamente.
Para nuestro ejemplo como los datos están expresados como números
enteros, entonces redondeando al entero superior tenemos que C = 4.
v) Formación de los intervalos de clase (Ii), Formar los intervalos de
clase, significa hallar los límites inferior y superior de cada intervalo,
Como el, valor de C se redondea al valor entero o decimal superior más
próximo, según sea el caso, observamos que si cada intervalo tiene
una amplitud de 4, el nuevo rango de datos seria 4 x 6 = 24 (si C=R/K,
entonces R=C x K); pues notamos que es mayor que el rango real
(R=19), entonces se determina el exceso (24 – 19 = 5).
El valor de 5 que se tiene en este caso, se distribuye entre el valor
máximo y el valor mínimo del conjunto de datos. Por lo general se
agrega al mayor y se quita al menor, lo ideal será distribuirlo
equitativamente sin embargo usualmente no se puede dividir en forma
exacta, por ello la distribución suele ser dispareja, por ejemplo, se
podría agregar 3 al valor mayor y quitar 2 al valor menor, obteniéndose
los siguientes nuevos valores extremos:
Valor mínimo = 16 – 2 = 14
Valor máximo = 35 + 3 =38
El primer intervalo tiene como límite inferior el valor de 14 y como
límite superior 14 + 4 = 18. El segundo intervalo comenzará con el
valor 18 como límite inferior y su límite superior será 18 + 4 = 22 y
así sucesivamente los demás intervalos. Así tendremos:

Ii Xm – (Xm + C)
I1 14 – 18
I2 18 – 22
I3 22 – 26
I4 26 – 30
I5 30 – 34
I6 34 - 38

ING. CARLOS ENRIQUE MORALES Página 21


ESTADÍSTICA GENERAL Y APLICADA 22
ESTADISTICA DESCRIPTIVA

Al respecto podemos mencionar que los intervalos se pueden


establecer de dos formas: abierto a la izquierda y cerrado a la derecha
o por el contrario cerrado a la derecha y abierto a la izquierda. En
nuestro caso consideraremos los intervalos Abiertos en el límite inferior
y Cerrados por el límite superior, solo el primer intervalo se considerará
cerrado por la izquierda y la derecha.
También es importante mencionar que los intervalos no siempre van a
tener la misma amplitud, ello dependerá de acuerdo a la investigación
y a la necesidad de presentar la información para su análisis
correspondiente.
vi) Construcción de la tabla de Distribución de Frecuencias: Se
tienen que determinar las diferentes frecuencias que pueden ser
absolutas, relativas, porcentuales, angulares y sus respectivas
frecuencias acumuladas en orden ascendente y descendente. Así
tenemos:
Frecuencia absoluta simple (fi). Es el número de veces que se
repiten los valores dentro de los diferentes intervalos en que se ha
dividido la información. Para obtener la frecuencia absoluta de cada
clase, se efectúa la tabulación o conteo de datos que están contenidos
en un intervalo dado. La suma de todas las frecuencias absolutas debe
ser igual al número de datos.
Frecuencia absoluta acumulada (Fi). Se obtiene sumando y
acumulando los valores absolutos clase por clase en orden ascendente.
Se representa por:
En la 1ra. Clase: F1 = f1
En la 2da. Clase: F2 = f1 + f2
En la 3ra. Clase: F3 = f1 + f2 + f3
En la clase i: Fi = f1 + f2 + f3 .... + fi
En la última clase: Fn = f1 + f2 + f3 .... + fi + … + fn = n
La acumulación también puede ser en forma descendente (Fi*)
En la 1ra. Clase: F1* = n
En la 2da. Clase: F2* = n - f1
En la 3ra. Clase: F3* = n - f1 - f2
En la clase i: Fi* = n - f1 - f2 - f3 .... - fi-1
En la última clase: Fn* = n - f1 - f2 - f3.... - fi - … - fn-1 = fn
Es importante mencionar que también se pueden acumular ya sea en
forma ascendente o descendente otras frecuencias como las relativas,
porcentuales y angulares.

ING. CARLOS ENRIQUE MORALES Página 22


ESTADÍSTICA GENERAL Y APLICADA 23
ESTADISTICA DESCRIPTIVA

Frecuencia relativa (hi). Es el valor que resulta al dividir cada una


de las frecuencias absolutas simples entre el total de frecuencias o
número de datos. Así:
hi = fi / n
La suma de todas las frecuencias relativas debe ser igual a uno (1),
puesto que cada frecuencia relativa representa el tanto por uno.
Frecuencia porcentual (100%hi también hi%). Es el valor de la
frecuencia relativa multiplicado por 100. Así:
100%hi = hi x 100
La suma de todas las frecuencias porcentuales debe ser igual a cien
(100), puesto que cada frecuencia porcentual representa el tanto por
ciento.
Frecuencia angular (360°hi también hi°). Es el valor de la
frecuencia relativa multiplicado por 360. Así:
100%hi = hi x 360
La suma de todas las frecuencias angulares debe ser igual a trescientos
sesenta (360), puesto que cada frecuencia angular representa el grado
sexagesimal del sector circular correspondiente a la magnitud de la
frecuencia absoluta respectiva. Se utiliza la frecuencia angular cuando
se desean realizar gráficos de sectores circulares.
Punto medio o marca de clase (Xi). Se define como la semi – suma
de los límites inferior y superior de cada intervalo de clase.
Xi = (LIMITE INFERIOR + LIMITE SUPERIOR) / 2
La tabla de distribución de frecuencias puede quedar así:

Ii Xm – Xm + C Xi fi hi 100%hi Fi Fi*
I1 14 – 18 16 7 0,175 17,5 7 40
I2 18 – 22 20 15 0,425 42,5 22 33
I3 22 – 26 24 12 0,375 37,5 34 18
I4 26 – 30 28 3 0,075 7,5 37 6
I5 30 – 34 32 2 0,050 5,0 39 3
I6 34 - 38 36 1 0,025 2,5 40 1
Total: 40 1,000 100

Podemos decir que por ejemplo hay 16 camarones que pesan entre 14
a 18 gramos, o que un 5% de camarones pesan de 30 a 34 gramos,
también que hay 34 camarones que pesan hasta 26 gramos o que
tenemos 18 camarones que pesan más de 22 gramos.

ING. CARLOS ENRIQUE MORALES Página 23


ESTADÍSTICA GENERAL Y APLICADA 24
ESTADISTICA DESCRIPTIVA

Muchas veces cuando los datos siguen un patrón más o menos ordenados en
cifras enteras y decimales (decenas, centenas, etc.), se puede ordenar la
información mediante un DIAGRAMA DE TALLOS Y HOJAS.
En el enlace electrónico: http://www.estadisticaparatodos.es; se puede extraer
los siguiente:
El diagrama "tallo y hojas" (Stem-and-Leaf Diagram) permite obtener
simultáneamente una distribución de frecuencias de la variable y su
representación gráfica. Para construirlo basta separar en cada dato el último
dígito de la derecha (que constituye la hoja) del bloque de cifras restantes (que
formará el tallo).
Esta representación de los datos es semejante a la de un histograma pero
además de ser fáciles de elaborar, presentan más información que estos.
Ejemplos: Horarios de trenes, Comparación de dos distribuciones de la Edad de
20 personas cada una.
Ejemplo del Horario de Trenes:
Basándome en un artículo de Juan C. Dürsteler en InfoVis.net, tomamos
como ejemplo un horario de trenes confeccionado a partir de un díptico de la
línea Castelldefels-Barcelona/Sants recogido en la estación de Renfe.
Originalmente el horario ocupa una tabla de 10 filas y 9 columnas más una
columna "viuda" con el tren de las 22:38. Un total de 91 campos con formato
hh.mm cada uno, 455caracteres.
Díptico original Trayecto Castelldefels -> Barcelona-Sants

En el diagrama Stem & Leaf se representa la hora a la izquierda de la barra de


separación y los minutos de la salida de cada tren a la derecha. La frecuencia de
los trenes se deduce fácilmente de la longitud de las filas y es, además, muy fácil
ver en qué minutos de cada hora pasan típicamente los mismos.
Así tenemos el siguiente diagrama de tallos y hojas:
Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf

ING. CARLOS ENRIQUE MORALES Página 24


ESTADÍSTICA GENERAL Y APLICADA 25
ESTADISTICA DESCRIPTIVA

Por otra parte, dado que a algunas horas se repite exactamente el horario de los
trenes se puede reducir aún más el tamaño del gráfico, sin perder información y
ganando en claridad. Así tenemos el diagrama de tallos y hojas reducido:
Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf reducido

Ejemplo de comparación de distribuciones:


Podemos comparar, mediante estos diagramas, dos distribuciones de edad de 20
personas, cada uno:

El diagrama de tallos y hojas puede quedar así:

ING. CARLOS ENRIQUE MORALES Página 25


ESTADÍSTICA GENERAL Y APLICADA 26
ESTADISTICA DESCRIPTIVA

EJERCICIOS RESUELTOS – TABLA DE DISTRIBUCIÓN DE FRECUENCIAS

1. Sean los siguientes los pesos n = 50 personas, expresando en kilogramos.


Se pide construir una tabla de distribución de frecuencias absolutas
114 82 87 90 93 96 98 100 103 105
82 85 90 93 95 97 98 101 104 112
80 87 90 93 95 97 100 102 105 82
75 84 88 92 94 96 98 101 104 108
73 84 88 91 93 96 98 100 104 106

Solución:
El siguiente paso es ordenarlos sea en sentido creciente o decreciente.
Ordenaremos en sentido creciente:
73 82 87 90 93 96 98 100 103 105
75 84 88 91 93 96 98 100 104 106
80 84 88 92 94 96 98 101 104 108
82 85 90 93 95 97 98 101 104 112
82 87 90 93 95 97 100 102 105 114

Al ordenar el cuadro en sentido creciente podemos distinguir que hay un valor


menor o valor mínimo Vmin = 73, que hay un valor mayor o valor máximo V max
= 114, vemos que hay datos que se repiten.
Pero existen relaciones que no se perciben y para poder percibirlas se clasifican
los cincuenta (50) datos en grupos o conjuntos llamados intervalos o clases según
los siguientes pasos:

PRIMER PASO: Cálculo el del rango (R), recorrido o extensión de los datos, su
fórmula es:

R = VALOR MÁXIMO – VALOR MÍNIMO

Como se trata de una variable continua, el valor del rango queda tal como está.

R = Valor máximo -Valor mínimo


Valor máximo = 114, Valor mínimo = 73
R = 114-73
R = 41 es el recorrido inicial

ING. CARLOS ENRIQUE MORALES Página 26


ESTADÍSTICA GENERAL Y APLICADA 27
ESTADISTICA DESCRIPTIVA

SEGUNDO PASO: ¿Cuántas clases o intervalos necesitamos? Utilizamos la fórmula


de "Sturges"
K = 1 + 3,3 x log(n)

En donde: K = número de intervalos o clases


n = número de datos (tamaño de la muestra)
En la fórmula tenemos: K = 1+ 3.3*log (50); donde K = 6,607……
Como la fórmula de Sturges es un poco conservadora, nos dará un valor algo
menor que el necesario. Luego redondearemos este valor al entero de acuerdo a
las reglas de aproximación, en este caso K = 7 entonces tendremos 7 intervalos o
clases.

TERCER PASO: Como la fórmula de Sturges hemos obtenido 7 intervalos,


tendremos que dividir el recorrido en 7 partes iguales o 7intervalos.
El ancho para cada clase resulta de la fórmula C = R / K, para éste caso C = 41
/ 7 = 5,857……..
Solo en éste paso el valor de C se redondea al entero superior más próximo,
omitiendo las reglas de aproximación, para éste caso C = 6.
De la fórmula C = R / K, deducimos la fórmula R* = C x K ya sabemos que C = 6
y K = 7. Entonces el recorrido ampliado será:
R* = C x K R*= 6 x 7 = 42
CUARTO PASO: Vemos que el recorrido inicial se ha modificado, es decir existe
exceso E = R*–R = 42 – 41 = 1; como el valor es 1, ello significa que al valor
mínimo se le restará (E-1)/2 = 0 y al valor máximo se le suma (E+1)/2 = 1, si
por ejemplo del número el exceso hubiese sido cualquier número par, entonces la
resta y la suma al menor y mayor valor sería la mitad. En igual proporción sucede
si se trata de cifras decimales. Luego elaboramos la matriz de la distribución de
frecuencias.

QUINTO PASO: Comenzaremos a construir el primer intervalo de clases, para lo


cual al menor valor restamos 0, es decir 73-0=73, luego sumamos la amplitud 6
al valor 73, que será el extremo superior del primer Intervalo.
Extremo inferior + amplitud = 73 + 6 = 79
Obtenemos de este modo el primer intervalo 73  79
Para el segundo intervalo tenemos corno limite interior 79 y como número o límite
superior 79 + 6 = 85. Procedemos en la misma forma para los demás intervalos.

SEXTO PASO: Consiste en convertir que cada uno de los datos que se hallan dentro

ING. CARLOS ENRIQUE MORALES Página 27


ESTADÍSTICA GENERAL Y APLICADA 28
ESTADISTICA DESCRIPTIVA

de un mismo intervalo, estén representados por un mismo valor que se denomina


marca de clase. Las marcas de clase se obtienen promediando los extremos de
cada intervalo, Xi = (LI + LS)/2.
Luego se realiza la clasificación y conteo de los datos para finalmente construir la
tabla de distribución de frecuencias, en cada intervalo consideraremos, excepto
en el primero, abierto a la izquierda y cerrado a la derecha:
INTERVALOS MARCA DE CLASE FRECUENCIA
73  79 76 2
79  85 82 7
85  91 88 8
91  97 94 13
97  103 100 11
103  109 106 7
109  115 112 2
n=50

En este cuadro se puede observar que hay pocas personas que tienen peso mínimo
y pocas que tienen peso muy alto, es decir que esta distribución de la data sigue
una tendencia normal puesto que las clases ubicadas al centro tiene mayor
frecuencia que las clases ubicadas a los extremos.

2. Una institución educativa consta de 40 secciones, el número de alumnos por


sección se resume en la siguiente tabla, se desea ordenar y presentar la
información en un cuadro de distribución de frecuencias absolutas
62 20 48 69 23 39 35 44
39 41 21 35 35 19 29 26
43 43 38 47 47 28 37 38
48 47 47 46 46 37 45 45
30 51 68 48 48 43 46 56
Solución:
El siguiente paso es ordenarlo sea en sentido creciente o decreciente.
Ordenaremos en sentido creciente:
19 28 35 39 43 46 47 51
20 29 37 39 44 46 48 56
21 30 37 41 45 47 48 62
23 35 38 43 45 47 48 68
26 35 38 43 46 47 48 69

ING. CARLOS ENRIQUE MORALES Página 28


ESTADÍSTICA GENERAL Y APLICADA 29
ESTADISTICA DESCRIPTIVA

Al ordenar el cuadro en sentido creciente podemos distinguir que hay un valor


menor o valor mínimo Vmin = 19, que hay un valor mayor o valor máximo V max
= 69, vemos que hay datos que se repiten.
Como se trata de una variable cuantitativa discreta y el valor del rango R = 69 -
19 = 50 > 13, es necesario agruparlos en una tabla de distribución de frecuencias
(Si R < 13, los valores discretos se pueden trabajar como datos sueltos, sin
necesidad de intervalos de clases). Como los valores están muy dispersos, existen
relaciones que no se perciben y para poder percibirlas se clasifican los cuarenta
(40) datos en grupos o conjuntos llamados intervalos o clases según los siguientes
pasos:

PRIMER PASO: Cálculo el del recorrido o extensión de los datos. Se denota con la
letra R, se debe sumar el número 1 cuando los datos se expresan en números
enteros. Su fórmula para los valores discretos es:

R + 1 = (VALOR MÁXIMO – VALOR MÍNIMO) + 1

Aplicando la fórmula tenemos:


R + 1 = Valor máximo -Valor mínimo + 1
Valor máximo = 69
Valor mínimo = 19
R + 1 = (69-19)+1
R + 1 = 51 es el recorrido inicial

SEGUNDO PASO: ¿Cuántas clases o intervalos necesitamos? Utilizamos la fórmula


de "Sturges"
K = 1 + 3,3 x log(n)

En donde: K = número de intervalos o clases


n = número de datos (tamaño de la muestra)
En la fórmula tenemos: K = 1+ 3.3*log (40); donde K = 6,286……
Como la fórmula de Sturges es un poco conservadora, nos dará un valor algo
menor que del necesario. Luego redondearemos este valor al entero de acuerdo a
las reglas de aproximación, en este caso K = 6 entonces tendremos 6 intervalos o
clases.

TERCER PASO: Como la fórmula de Sturges hemos obtenido 6 intervalos,


tendremos que dividir el recorrido en 6 partes iguales o 6 intervalos.

ING. CARLOS ENRIQUE MORALES Página 29


ESTADÍSTICA GENERAL Y APLICADA 30
ESTADISTICA DESCRIPTIVA

El ancho para cada clase resulta de la fórmula C = (R+1) / K, para éste caso
C = 51 / 6 = 8,5
Solo en éste paso el valor de C se redondea al entero superior más próximo,
omitiendo las reglas de aproximación, para éste caso C = 9.
De la fórmula C = (R + 1) / K, deducimos la fórmula (R+1)* = C x K ya sabemos
que C = 9 y K = 6. Entonces el recorrido ampliado será:
(R+1)* = C x K (R+1)*= 9 x 6 = 54

CUARTO PASO: Vemos que el recorrido inicial al cual se le ha sumado una unidad
se ha modificado, es decir existe un exceso E = (R+1)*– (R+1) = 54 – 51 = 3;
como el valor es 3, ello significa que al valor mínimo se le restará (E-1)/2 = 1 y al
valor máximo se le suma (E+1)/2 = 2, si por ejemplo del número el exceso hubiese
sido cualquier número par, entonces la resta y la suma al menor y mayor valor
sería la mitad. En igual proporción sucede si se trata de cifras decimales. Luego
elaboramos la matriz de la distribución de frecuencias.

QUINTO PASO: Comenzaremos a construir el primer intervalo de clase, para lo


cual al menor valor restamos 1.
Es decir 19-1=18. Luego sumamos la amplitud 9 al valor 18, que será el extremo
superior del primer Intervalo.
Extremo inferior + amplitud = 18 + 9 = 27
Obtenemos de este modo el primer intervalo 18  27, Para el segundo intervalo
tenemos corno limite interior 27 y como número o límite superior 27 + 9 = 36.
Procediendo en la misma forma para los demás intervalos obteniendo el siguiente
cuadro:
INTERVALOS
18 - 27
27 - 36
36 - 45
45 - 54
54 - 63
63 - 72

SEXTO PASO: Consiste en convertir que cada uno de los datos que se hallan dentro
de un mismo intervalo, estén representados por un mismo valor que se denomina
marca de clase. Las marcas de clase se obtienen promediando los extremos de
cada intervalo, Xi = (LI + LS)/2.
Luego se realiza la clasificación y conteo de los datos para finalmente construir la

ING. CARLOS ENRIQUE MORALES Página 30


ESTADÍSTICA GENERAL Y APLICADA 31
ESTADISTICA DESCRIPTIVA

tabla de distribución de frecuencias, consideraremos los intervalos de clase,


abierto a la izquierda y cerrado a la derecha:
INTERVALOS MARCA DE CLASE FRECUENCIA
18 - 27 22,5 5
27 - 36 31,5 6
36 - 45 40,5 13
45 - 54 49,5 12
54 - 63 58,5 2
63 - 72 67,5 2
n=40

3. Los siguientes datos son las temperaturas observadas diariamente durante 50


días en el nevado turístico de Pastoruri en el departamento de Ancash. Según la
regla de Sturges, construir un Cuadro de Distribución de frecuencias absolutas (fi),
relativas (hi), porcentuales (h%), angulares (h°), absoluta acumulada en forma
ascendente y descendente. Indicar además las marcas de clase (Xi).
4 2 -2 6 -1 -8 1 -3 -7 9
1 -8 -5 2 -3 5 -13 -1 8 -15
1 2 1 -4 -7 -3 -5 -9 -17 9
-10 7 -15 2 7 -9 5 -9 -8 -6
-13 9 -9 3 -3 7 9 -4 9 -15
Solución:
N = 50
K=7
R = 9 – (-17) = 26
C = 26 / 7 = 3.7 = 4
R* = C x K = 4 x 7 = 28.
E = R*– R = 28 – 26 = 2, luego Xm-1 = -17 – 1 = -18
INTERVALOS Xi fi hi h% h° F F*
[-18;-14] -16 4 0.08 8 28.8 4 50
(-14;-10] -12 3 0.06 6 21.6 7 46
(-10;-6] -8 10 0.20 20 72.0 17 43
(-6 ; -2] -4 9 0.18 18 64.8 26 33
(-2 ; 2] 0 10 0.20 20 72.0 36 24
(2 ; 6] 4 5 0.10 10 36.0 41 14
(6 ;10] 8 9 0.18 18 64.8 50 9
n=50 1.00 100% 360°

ING. CARLOS ENRIQUE MORALES Página 31


ESTADÍSTICA GENERAL Y APLICADA 32
ESTADISTICA DESCRIPTIVA

4. De la producción de conservas selladas por una máquina automática se retiraron


30 muestras de latas, cada muestra constaba de 25 latas. Cada lata de conserva
se examinó con el criterio “pasa”, “no pasa”, y el número de piezas defectuosas
halladas en 30 muestras sucesivas fue la siguiente, hallar la moda y graficar la
información mediante un polígono de frecuencia absoluta.
Muestra N° Defectuosa Muestra N° Defectuosa Muestra N° Defectuosa
1 2 11 0 21 1
2 3 12 0 22 0
3 2 13 1 23 1
4 4 14 1 24 1
5 7 15 2 25 1
6 2 16 0 26 6
7 0 17 1 27 2
8 1 18 0 28 1
9 0 19 5 29 4
10 1 20 0 30 3

Solución:
N 30 Xi fi
max 7 0 8 Moda:
min 0 Mo 1 10 Mo=1
R 7-0 = 7 2 5
R=7 < 13 3 2
Datos individuales 4 2
5 1
6 1
7 1
sumatoria n = 30

ING. CARLOS ENRIQUE MORALES Página 32


ESTADÍSTICA GENERAL Y APLICADA 33
ESTADISTICA DESCRIPTIVA

5. La siguiente gráfica, representan los datos sobre velocidades (km/h) de 30 carros


que pasaron por un punto de control de velocidad. Si la velocidad máxima
permitida es 80 km/h, hallar el porcentaje de vehículos que cometieron una
infracción a las reglas de tránsito, así mismo determinar la velocidad que con
mayor frecuencia transitan los vehículos, así como también el dato de velocidad
que representa el “centro de gravedad” de la distribución de la data.

Solución:
Del gráfico deducimos: N=30; C = 16
Xm Xm+c Xi fi hi 100hi% Fi xi*fi
10 26 18 4 0.133 13.3 4 72
Md, Mo 26 42 34 12 0.400 40.0 16 408
42 58 50 7 0.233 23.3 23 350
58 74 66 4 0.133 13.3 27 264
74 90 82 2 0.067 6.7 29 164
90 106 98 1 0.034 3.4 30 98
sumatoria n= 30 1.000 100.0 1356

MEDIA 45.200 MEDIANA 40.667 MODA 35.846


SumaProd. 1356 N/2 15 LRI 26
LRI 26 DELTA 1 8
Fi-1 4 DELTA 2 5
fi(Md) 12

Clase ancho 100hi%

74 90 16 6.70 %
80 90 10 4.19 %

Vehiculos >80 km/h 7.59 %

6. Un gerente de una empresa de transporte de carga, recibe un fax desde


Tacna en el cual se representa un Cuadro de distribución de pesos en TM de
ciertos productos importados que tiene que transportar a Lima, pero el fax

ING. CARLOS ENRIQUE MORALES Página 33


ESTADÍSTICA GENERAL Y APLICADA 34
ESTADISTICA DESCRIPTIVA

recibido llega algo deteriorado por lo que el gerente ordena al Ingeniero a su


cargo solucione el problema. Para determinar los costos por flete el Ingeniero
deberá calcular los datos que no aparecen muy visibles en la siguiente tabla
y además representará dicha información mediante un histograma de
frecuencia relativa:
Pesos en TM # Productos Proporcionalidad Acumulación
[ 0 ; 10 ] 60 h1 60
] 10 ; 20 ] f2 0.4 F2
] 20 ; 30 ] 30 h3 170
] 30 ; 100 ] f4 0.1 F4
] 100 ; 200 ] f5 h5 200
Total productos = n 1.00

Solución:
Pesos # Proporc. Acum. Xi ancho base=1 Área Altura
0 TM10 Prod.
60 0.30 60 5 10 1 Histog.
0.30 relat.
0.300
10 20 80 0.40 140 15 10 1 0.40 0.400
20 30 30 0.15 170 25 10 1 0.15 0.150
30 100 20 0.10 190 65 70 7 0.10 0.014
100 200 10 0.05 200 150 100 10 0.05 0.005
Total 200 1.00
prod. =

pesos en TM de productos importados


0.50
0.400
0.40
0.300
0.30
0.20 0.150
0.10
0.014 0.005
0.00
5 15 25 65 150

Histograma de frec.porc.

Como los anchos de clase no son uniformes en todos los intervalos de clase, no
podemos graficar el histograma de frecuencias directamente tomando como altura
las magnitudes de las frecuencias relativas, pues como cada rectángulo del
histograma representa el área parcial de la distribución y si las bases de esos
rectángulos no son uniformes, es necesario calcular una nueva altura para cada
rectángulo en función de su área, de tal forma que guarden proporcionalidad con
las alturas iniciales. Para graficar el histograma de frecuencias se toman las
magnitudes de las nuevas alturas de cada rectángulo, usualmente en el eje de
las abscisas se colocan las clases reales, sin embargo cuando se utiliza el Excel,
está permitido graficar los histogramas a partir de las marcas de clase.

ING. CARLOS ENRIQUE MORALES Página 34


ESTADÍSTICA GENERAL Y APLICADA 35
ESTADISTICA DESCRIPTIVA

7. Una muestra de 70 datos da una media de 120 y una desviación típica de 6, otra
muestra de 30 datos da una media de 125 y una desviación típica de 5; si se
juntan las dos muestras en una sola muestra, hallar la media y la varianza de la
muestra reunida.
Solución:
n1 = 70, M(x1) = 120; S1 = 6
n2 = 30, M(x2) = 125; S2 = 5
n1 + n2 = 100

𝑛1 ∗ 𝑀(𝑥1 ) + 𝑛2 ∗ 𝑀(𝑥2 )
𝑀(𝑥) = = 121,50
𝑛
𝑛1
∑𝑛1 2
𝑖=1 𝑥𝑖
𝑆12 = − [𝑀(𝑥1 )]2 → ∑ 𝑥𝑖2 = 𝑛1 ∗ (𝑆12 + [𝑀(𝑥1 )]2 )
𝑛1
𝑖=1
𝑆12 = 70(36 + 1202 ) = 1 010 520

𝑛2
∑𝑛2 2
𝑖=1 𝑥𝑖
𝑆22 = − [𝑀(𝑥2 )]2 → ∑ 𝑥𝑖2 = 𝑛2 ∗ (𝑆22 + [𝑀(𝑥2 )]2 )
𝑛2
𝑖=1
𝑆22 = 30(25 + 1252 ) = 469 500

𝑛 𝑛1+𝑛2 𝑛1 𝑛2

∑ 𝑥𝑖2 = ∑ 𝑥𝑖2 = ∑ 𝑥𝑖2 + ∑ 𝑥𝑖2 = 1 010 520 + 469 500 = 1 480 020
𝑖=1 𝑖=1 𝑖=1 𝑖=1

∑𝑛𝑖=1 𝑥𝑖2 1 480 020


𝑆2 = − [𝑀(𝑥)]2 = − (121,50)2 = 37,95𝑢2
𝑛 100

8. El sueldo medio de los obreros de una fábrica es de $286 dólares, Si el 60% de


los obreros tienen menos de 30 años y percibe el 20% del total de los sueldos
¿cuánto es el sueldo medio de los obreros de al menos 30 años?
Solución:
60% de los obreros --> 20% de M(X) = 0,20*286 = 57,20 = M(X1)
Por dato tenemos: M(X) = 286 = 0.60 * 57,20 + (1-0.60) * M(X2)
286 = 34,32 + 0.40 * M(X2)
286 - 34.32 = 0.40 * M(X2)
201,68 = 0.40 * M(X2)
M(X2) = 201,68 / 0,40 = 504,2
60% --> (menos de 30) ---> $57.20
40% --> (al menos de 30) ---> $504.20

Respuesta: El sueldo medio de los obreros de al menos 30 años es $504.20

9. Los sueldos de los trabajadores de una empresa, se distribuye con una varianza
de 180 und.xm2. Se otorga un aumento general del 20% sobre el sueldo básico
de cada trabajador y además se asigna una bonificación de 50 u.m. a cada
trabajador. Calcular la varianza de los nuevos sueldos.
Solución:
Sea Xi = sueldo básico del trabajador i.

ING. CARLOS ENRIQUE MORALES Página 35


ESTADÍSTICA GENERAL Y APLICADA 36
ESTADISTICA DESCRIPTIVA

Entonces Yi = Xi + 0,2Xi + 50 = 1,2Xi + 50, es el nuevo sueldo del trabajador i.


Luego: V(Y) = V(1,2X+50) = (1,44).V(X) = (1,44)(180) = 259,2 unid.m 2.

Respuesta: La varianza de los nuevos sueldos es 259,2 unid.m2

10. En una sección de Estadística 24 estudiantes llevan el curso por primera vez, 6
llevan por segunda vez y 2 por tercera vez. Se sabe que 12 es el promedio de
notas de los que llevan por primera vez y que las notas de los que llevan por
segunda vez en promedio son superiores en un 10% de los que llevan por primera
vez. Calcular el promedio de notas de los que llevan el curso por tercera vez, si la
suma total de las notas es de 390.
Solución:
Primera vez: n1 = 24, M(x1) = 12
Segunda vez: n2 = 6, M(x2) = M(x1) + 10% * M(x1)
= 12 + 0.10(12) = 12 + 1,2 = 13,2
Tercera vez: n3 = 2, M(x3) =?

n = n1 + n2 + n3 = 24 + 6 + 2 = 32
𝑛1 ∗ 𝑀 (𝑥1 ) + 𝑛2 ∗ 𝑀(𝑥2 ) + 𝑛3 ∗ 𝑀(𝑥3 )
M (𝑥 ) =
𝑛
24 ∗ 12 + 6 ∗ 13,20 + 2 ∗ 𝑀(𝑥3 )
M(x) =
32
Sabemos que:
𝑛 𝑛
1
𝑀(𝑥 ) = ( ) ∗ ∑ 𝑥𝑖 ; 𝑑𝑜𝑛𝑑𝑒: 𝑛 ∗ 𝑀(𝑥 ) = ∑ 𝑥𝑖 = 390; 𝑙𝑢𝑒𝑔𝑜: 32 ∗ 𝑀 (𝑥 ) = 390
𝑛
𝑖=1 𝑖=1
32*M(x) = 288 + 79,2 + 2*M(x3)
390 = 288 + 79,2 + 2*M(x3)
M(x3) = (390 – 288 – 79,2) / 2 = 11,4

Respuesta: El promedio de notas de los que llevan el curso por tercera vez es
11,4 pts.

11. En una empresa trabajan 50 empleados, el sueldo mínimo es de S/. 750 soles y
el máximo S/. 2250 soles, el personal permanente y mejor remunerado gana como
mínimo S/.1750 soles y constituyen el 10% de la compañía, el resto es personal
contratado que tiene un haber máximo inferior a un trabajador permanente. Hallar
el sueldo promedio.
HABERES Xi fi
750 - 1750 1250 45
1750-2250 2000 5
n= 50
Solución:
M(x) = ((1250x45) + (2000x5)) / 50 = 1 325.00

Respuesta: El promedio es S/.1 325.00 soles.

ING. CARLOS ENRIQUE MORALES Página 36


ESTADÍSTICA GENERAL Y APLICADA 37
ESTADISTICA DESCRIPTIVA

EJERCICIOS PROPUESTOS DE ESTADÍSTICA DESCRIPTIVA

1. Determinar si son variables: Cualitativa (Nominal u Ordinal), Cuantitativa


(Continua o Discreta); que representan los siguientes enunciados:
a) El número de automóviles que circulan a diario por la vía expresa
...............................................
b) Las diferentes carreras profesionales que se pueden estudiar en la educación
superior ...................................................................................
c) La vida útil de una bombilla de luz ...........................................................
d) Los valores de pH que se obtienen de las soluciones ácidas y básicas que se
disponen en una práctica de laboratorio de Química
.....................................................
e) Los modelos de autos que circulan en Lima metropolitana
...................................................
f) La cantidad de estudiantes del curso de Estadística con estaturas entre 1.60
metros a 1.80 metros ........................................
g) El estado civil de los docentes de una Institución Educativa
........................................................
h) El voltaje que se produce cuando se hace girar un Dínamo
..................................................
i) Los datos sobre el aumento de peso en gramos de la trucha arco iris en la
fase juvenil .....................................................................
j) El sexo de los estudiantes de una universidad por facultades
...................................
k) Los grados militares delos Oficiales del Ejército del Perú
………………………………………….
l) Las edades de los docentes en una institución de educación superior
………..............................
m) El grado de instrucción de los padres de familia de una escuela secundaria
………………………………………………………………...
n) Los productos considerados como exportación tradicional
...................................................
o) Los niveles socioeconómicos (A, B, C, D, E, F) al que pertenecen los habitantes
de la provincia de Lima ..................................................................
p) Las densidades del agua en g/cm3 a diferentes temperaturas
..............................................
q) Temperaturas de un producto con código AS-1020 en °C
....................................................

ING. CARLOS ENRIQUE MORALES Página 37


ESTADÍSTICA GENERAL Y APLICADA 38
ESTADISTICA DESCRIPTIVA

r) Datos de velocidades (Km/h) de 80 automóviles que pasaron por un punto de


control de velocidad.......................................................................
s) Las variaciones de presión atmosférica recopiladas en la provincia de Canta
entre los 2000 y 2500 msnm .....................................................
t) Los valores de humedad relativa en porcentajes obtenida en una estación
meteorológica del SENAMHI.................................................................
u) Los índices de inflación del Perú en el periodo 1980-
2004...................................................
v) El promedio de notas finales individuales, por asignatura, obtenidas por los
alumnos del primer año de la escuela de Ingeniería
Pesquera.................................................................
w) Los resultados del lanzamiento de dos dados no cargados en 10 experimentos
aleatorios...................................................................

2. Se ha estudiado la variable: Estado Civil de los Docentes de una Universidad, en


las facultades de Ingeniería se ha encontrado a 14 Docentes Solteros, 21
Casados, 22 Viudos, y 15 Divorciados; en las facultades de Humanidades se ha
encontrado a 13 Solteros, 25 Casados, 13 Viudos y 14 Divorciados; y en las
facultades de Ciencias se han catalogado a 12 Solteros, 17 Casados, 14 Viudos,
y 16 Divorciados. Representar estos datos en un Cuadro de Distribución de
Frecuencias por facultad y hacer un gráfico de Barras y Sectores Circulares.

3. Se realiza una encuesta a 40 padres de familia de una institución educativa para


conocer el número de hijos que tienen. Elaborar una tabla de distribución de
frecuencias, señalando las frecuencias absolutas, relativas, y porcentuales.
Graficar mediante un diagrama de bastones e Interprete F 3, F4*, H3 y H4
3 5 2 4 4 2 5 1 3 4
3 3 4 5 5 3 3 2 3 4
3 3 2 3 5 5 5 4 4 2
3 4 3 1 1 4 5 4 3 3

4. En un estanque de juveniles de trucha “arco iris” (Onchorynchus mykiss) en la


estación piscícola de Ingenio (Huancayo), se seleccionó una muestra de 35
individuos para realizar los análisis biométricos respectivos, para poder
trasladarlos a los estanques de engorde. Los resultados de los pesos de cada
trucha expresados en gramos se muestran a continuación:
93 78 107 86 77 98 77
92 73 80 82 88 87 95

ING. CARLOS ENRIQUE MORALES Página 38


ESTADÍSTICA GENERAL Y APLICADA 39
ESTADISTICA DESCRIPTIVA

77 83 87 94 105 86 98
92 112 100 96 90 88 79
84 88 93 83 86 91 94
a) Desarrollar un Cuadro de Distribución de Frecuencias y los Gráficos
correspondientes de las frecuencias porcentuales (Histograma, Polígono, Ojiva
Ascendente y Descendente), utilizando la fórmula de Sturges.
b) ¿Qué porcentaje de truchas pasarán a los estanques de engorde sabiendo que
las truchas juveniles que pesan más de 100 gramos deben pasar?
c) Desarrollar las medidas de tendencia central: Media aritmética, mediana y
moda. Medidas de posición o cuátiles: Cuartil 1, 2, 3; Décil 3, 5, 7 y Percentil
25, 50,75.
d) Desarrollar las medidas dispersión: Rango, varianza, desviación estándar,
Desviación media, Desviación cuartil coeficiente de variación.
e) Analizar los coeficientes de asimetría de Pearson y Curtosis (deformaciones
horizontal y vertical)

5. En un trabajo de investigación realizado 30 caletas de la costa del Perú, sobre el


número de embarcaciones pesqueras menores de 5 TM por caleta, se tienen los
siguientes resultados:
20 15 23 35 32 29
17 37 35 33 42 37
45 47 53 30 13 28
38 47 32 35 18 40
34 12 44 37 32 16
a) Desarrollar un Cuadro de Distribución de Frecuencias utilizando la fórmula de
Sturges y graficar la información mediante un gráfico de sectores circulares.
b) Desarrollar las medidas de tendencia central: Media aritmética, mediana y
moda.
c) Determinar las medidas de localización o Cuántiles: Q1, Q3, P25, P50, P75.
d) Calcular las medidas de dispersión: Varianza, DS, Coeficiente de variación y
los coeficientes de Asimetría de Pearson y Curtosis.

6. Un gerente de una empresa de transporte de carga, recibe un fax desde Tacna


en el cual se representa un Cuadro de distribución de pesos en TM de ciertos
productos importados que tiene que transportar a Lima, pero el fax recibido llega
algo deteriorado por lo que el gerente ordena al Ingeniero a su cargo solucione
el problema. Para determinar los costos por flete el Ingeniero deberá calcular los
datos que no aparecen muy visibles en la siguiente tabla:

ING. CARLOS ENRIQUE MORALES Página 39


ESTADÍSTICA GENERAL Y APLICADA 40
ESTADISTICA DESCRIPTIVA

Pesos en TM # Productos Porcentaje Acumulación


[ 0 ; 10 ] 60 h%1 60
] 10 ; 20 ] f2 40 F2
] 20 ; 30 ] 30 h%3 170
] 30 ; 40 ] f4 10 F4
] 40 ; 50 ] f5 h%5 200
Total productos = n= 100

7. Determine la media, mediana y moda de los siguientes conjuntos de datos


correspondientes al número de personas que abordaron una determinada
camioneta rural de la línea “S” en los tres últimos días de trabajo. Además diga
si la distribución es unimodal, multimodal o uniforme.
a) 4 , 7 , 6 , 6 , 9 , 8 , 1 0 , 15 , 6 , 7
b) 8 , 4 , 7 , 8 , 4 , 6 , 9 , 8 , 6 , 10 , 1 5 , 4 , 8 , 6 , 4 , 8 , 9
c) 4 , 7 , 6 , 4 , 6 , 7 , 7 , 6 , 4

8. La siguiente tabla incompleta, muestra la distribución de frecuencias de puntajes


finales de una sección del curso de Estadística en una Universidad. Con referencia
a la tabla se pide:
Xi 52 100
fi 20 26 12 14 8 6 3 5 1
a) El límite superior de la quinta clase.
b) El límite inferior de la cuarta clase.
c) La marca de clase de la séptima clase.
d) la frecuencia absoluta de la octava clase.
e) Longitud de la primera clase.
f) La amplitud de la última clase.
g) El Rango

9. Encontrar la media aritmética de la siguiente distribución:


Clases Absolutas Frecuencia relativa
4-7 0.153
10 - 13 0.228
16 - 19 0.374
22 - 25 0.197
28 - 31 0.028
34 - 37 0.020

ING. CARLOS ENRIQUE MORALES Página 40


ESTADÍSTICA GENERAL Y APLICADA 41
ESTADISTICA DESCRIPTIVA

10. Si el salario promedio semanal de “n” obreros es S/. 200 soles y cada obrero
recibe un aumento general de S/. 85 soles semanales y una bonificación semanal
del 2% del salario incrementado ¿Cuál es el salario promedio actual semanal de
los “n” obreros?

11. El salario medio semanal pagado a los trabajadores de una compañía es de S/.
200 nuevos soles. Los salarios medios semanales pagados a hombres y mujeres
de la compañía son S/. 210 y S/. 150 nuevos soles respectivamente. Determinar
el porcentaje de hombres y mujeres que trabajan en la compañía.

12. Se desea ordenar 1320 datos de los cuales 35870 es el dato menor y 112946 es
el dato mayor, determine los intervalos de clase y las marcas de clase, según el
criterio de Sturges.

13. Los siguientes datos indican el peso expresado en kilogramos de ciertos roedores
codificados para su estudio en una zona alto andina del Perú:
4.2 6.9 8.2 5.3 6.1 5.6 6.2 10.4 10.6 2.6
5.9 8.6 8.1 5.6 5.3 4.3 6.3 6.5 7.5 5.4
6.1 8.2 5.2 5.7 2.0 2.0 6.7 5.0 3.7 6.8
9.1 4.0 8.8 3.5 5.4 5.4 7.8 5.8 5.8 5.1
4.7 5.5 9.2 6.0 9.8 9.8 3.9 5.7 6.9 5.0
5.8 5.6 6.6 5.4 6.0 6.0 7.1 4.8 7.4 5.8
6.9 9.4 7.8 2.6 5.2 5.2 5.6 8.5 3.0 5.5
4.0 7.3 6.0 9.3 8.6 8.6 3.3 6.3 9.7 5.2
6.4 2.5 5.8 5.2 5.1 5.1 6.7 7.5 8.4 4.1
7.7 6.3 7.5 2.3 9.2 5.4 5.0 3.1 5.8 6.8

Organizar la información en un Cuadro de Distribución de frecuencias y


determinar ¿Cuántos roedores pesan entre 3,6 y 6,6 kg y cuál es el porcentaje
de roedores que tienen más de 7.8 kg?

14. Un examen fue rendido por 80 alumnos de una sección A y 90 de una sección B.
En la sesión A se obtuvo un promedio de 1,8 y en la sección B un promedio de
12,5. Hallar la media aritmética de todos los estudiantes que rindieron dicho
examen.

15. El consumo mensual en m3de agua de una muestra de 225 viviendas, se


tabularon en una distribución de frecuencias simétrica de cinco intervalos de

ING. CARLOS ENRIQUE MORALES Página 41


ESTADÍSTICA GENERAL Y APLICADA 42
ESTADISTICA DESCRIPTIVA

amplitudes iguales. Si el consumo mínimo es de 35 m 3, y el consumo promedio


de 45 m3, y si 1/3 de la muestra consume al menos 43 m3 pero menos de 47 m3.
Calcular:
a) ¿Qué porcentaje de la muestra consume al menos 47 m3? R: r = 4, 75 de
225
b) ¿Cuántos m3 como mínimo consumen el 60% de las viviendas? R: P40 = 43,8.

16. Completar el siguiente cuadro que corresponde a una variable discreta:


Intervalos Xi ni hi H H*
66 -
- 8
- 0.525 0.700
-
- 100 0.900 0.175
- 108
- 2
40 1.00
a) Hallar e interpretar: La mediana, la moda, el Cuartel 3 y el coeficiente de
variación.
b) Construir una ojiva ascendente y un polígono de frecuencias porcentuales.
c) Interpretar el Índice de Asimetría de Pearson y el apuntamiento o Curtosis.

17. De la producción de conservas selladas por una máquina automática se retiraron


muestras de tamaño 25. Cada lata de conserva se examinó con el criterio “pasa,
no pasa” y el número de piezas defectuosas halladas en 30 muestras sucesivas
fue:
Muestra Defectuosas Muestra Defectuosas Muestra Defectuosas
01 2 11 0 21 1
02 3 12 0 22 0
03 2 13 1 23 1
04 5 14 1 24 1
05 7 15 2 25 1
06 2 16 0 26 1
07 0 17 1 27 6
08 1 18 0 28 2
09 0 19 0 29 1
10 1 20 0 30 2
a) En base a la fórmula de Sturges construir un cuadro de distribución de

ING. CARLOS ENRIQUE MORALES Página 42


ESTADÍSTICA GENERAL Y APLICADA 43
ESTADISTICA DESCRIPTIVA

frecuencias completo y graficar la distribución mediante un gráfico de


frecuencias absolutas; ¿Será necesario que todos los intervalos tengan el
mismo ancho de clase? y ¿Cuántas muestras tienen más de 4 defectuosos?
b) Gráficamente encuentre el número de muestras que tiene más de 5
defectuosos
c) En forma gráfica determine el Cuartil 3, Decil 8 y percentil 90

18. Se realiza una encuesta a los estudiantes del 5to. Año de secundaria sobre la
preferencia de las carreras profesionales que desean seguir en la universidad, el
resultado de ello se refleja en la siguiente tabla:

Carreras Número de
Profesionales Alumnos
Ingeniería Civil 230
Derecho 150
Medicina 100
Contabilidad 50
Sistemas e 45
Informática
Arquitectura 25
Administración 20
Economía 12
Educación 7
Biología 4
Enfermería 4
Sociología 1
Agronomía 1
Arqueología 1
Total n = 650
a) Graficar barras horizontales distribuyendo la información en 3 categorías:
Ciencias Biológicas, Ingeniería y Humanidades
b) Representar gráficamente el cuadro mediante un gráfico de barras y
Sectores Circulares.

19. De acuerdo al censo desarrollado en 1995, se sabe que en esa fecha habían
9,789 trabajadores en una universidad entre docentes y administrativos, sin
embargo se sospecha que en la actualidad este número se ha ido incrementando
paulatinamente. Una Empresa Aseguradora desea determinar de acuerdo a una

ING. CARLOS ENRIQUE MORALES Página 43


ESTADÍSTICA GENERAL Y APLICADA 44
ESTADISTICA DESCRIPTIVA

tabla específica, las edades de los trabajadores con el fin de establecer un plan
de seguro grupal, sin que de ello se enteren las autoridades universitarias, para
lo cual realizan una encuesta sobre una muestra de 70 trabajadores a nivel de
todas las facultades, ello con el fin de tener un panorama previo a la realización
de un contrato con la Universidad. La distribución que se construyó fue la
siguiente:
Edades de los Número de
Trabajadores Trabajadores
20 – 30 8
30 – 40 15
40 – 50 30
50 – 60 12
60 - 70 5
Total n = 70
a) Trazar el polígono de frecuencias porcentuales y la ojiva correspondiente.
b) ¿Cuántos trabajadores tienen menos de 50 años? ¿Y qué porcentaje
representan?
c) ¿Cuántos trabajadores tienen 50 años o más? ¿Y qué porcentaje
representan?
d) ¿Qué porcentaje de trabajadores tienen entre 30 a 45 años?

20. La siguiente distribución se realizó de acuerdo al criterio de cierto analista y se


refiere a la duración en horas (vida útil) de un lote de 500 bombillas de luz de
100 voltios:
(Vida útil) Número de
Duración en horas focos
[ 300 ; 500 ] 50
] LI2 ; 700 ] 150
] 700 ;LS3 ] f4
] 1,100 ; 1,200] 25
Total n = 500

a) Completar el Cuadro de Distribución de Frecuencias, Además desarrollar


la amplitud de cada intervalo (Ancho de clase), las frecuencias relativas y
las frecuencias relativas rectificadas, y las frecuencias relativas
acumuladas en forma ascendente.
b) Trazar la Ojiva Menor (“menos que”) de frecuencias relativas acumuladas.

ING. CARLOS ENRIQUE MORALES Página 44


ESTADÍSTICA GENERAL Y APLICADA 45
ESTADISTICA DESCRIPTIVA

c) Representar el Histograma de frecuencias relativas determinando su


respectiva altura. (Recordar que los histogramas son gráficos
rectangulares que representan las frecuencias de los intervalos mediante
áreas y no mediante alturas).

21. Una empresa de servicio tiene 60 trabajadores, cuyo sueldo promedio al año es
S/. 8 500 nuevos soles, con una desviación estándar de S/. 2 850 nuevos soles.
Los ejecutivos de la empresa acuerdan en fijar nuevos sueldos para compensar
el alza del costo de vida equivalente al 50,2% de los sueldos anteriores, además
de un aumento adicional por movilidad de S/. 600 nuevos soles anuales. Hallar
el promedio de los nuevos sueldos y su varianza.

22. Construya una tabla de distribución de frecuencias a partir del siguiente gráfico:

ING. CARLOS ENRIQUE MORALES Página 45


ESTADÍSTICA GENERAL Y APLICADA 46
ESTADISTICA DESCRIPTIVA

23. En una sección de Estadística, 24 estudiantes llevan el curso por primera vez, 6
llevan por segunda vez y 2 por tercera vez. Se sabe que 12 es el promedio de
notas de los que llevan por primera vez y que las notas de los que llevan por
segunda vez en promedio son superiores en un 10% de los que llevan por
primera vez. Calcular el promedio de notas de los que llevan el curso por tercera
vez si la suma total de notas es 390. (R: 11,4)

24. El promedio aritmético de las edades de cuatro trabajadores en una planta es 48


años. Ninguno de ellos es menor que 45 ¿Cuál es la edad máxima que podría
tener una de ellas?

25. Los puntajes obtenidos por 8 individuos que se sometieron a un test de aptitud
suman 484 puntos. Los cuadrados de dichos puntajes suman 30 062. Hallar la
Desviación estándar y el Coeficiente de Variación.

26. En base a la siguiente información F1 = F3; F2 = F4; completar el siguiente


cuadro de distribución de frecuencia:
Clases Reales fi Fi H%
- 29
-
-
- 16 90
- 57.5
Total 80

27. Se aplicó un test a los grupos A, B, C c/u con 40; 25 y 30 individuos;


obteniéndose en los tres grupos igual media aritmética de los puntajes y con
desviación estándar para: SA = 15; SC = 12; si la desviación estándar general es
12,86 ¿cuánto es la varianza del grupo B?

28. Las alturas de los jugadores de un equipo de baloncesto son:


Altura N° de jugadores
1,70 - 1,80 4
1,80 - 1,90 12
1,90 - 2,00 7
¿Cuántos jugadores se encuentran por encima de la media más una desviación
típica? (considerar M(x ) + σ , el valor a partir del cual se halla la respuesta)

ING. CARLOS ENRIQUE MORALES Página 46