Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA GENERAL
1.2 Muestra:
Es el subconjunto de la población que es estudiado y a partir de la cual se sacan conclusiones sobre
las características de la población. La muestra debe ser representativa, en el sentido de que las
conclusiones obtenidas deben servir para el total de la población.
Las muestras pueden ser probabilísticas o no probabilísticas. Una muestra probabilística se elige
mediante reglas matemáticas, por lo que la probabilidad de selección de cada unidad es conocida de
antemano. Por el contrario, una muestra no probabilística no se rige por las reglas matemáticas de la
probabilidad. De ahí que, mientras en las muestras probabilísticas es posible calcular el tamaño del
error muestral, no es factible hacerlo en el caso de las muestras no probabilísticas. Ejemplos de éstas
últimas son la muestra accesible (que está conformada por personas de fácil acceso para el
investigador como ser colegas o alumnos de su clase.) y la muestra voluntaria (donde los sujetos de
la muestra no han sido seleccionados matemáticamente). [ n = (N*300)/(N + 299) ]
¿Cómo calcular la muestra correcta?
El cálculo del tamaño de la muestra es uno de los aspectos a concretar en las fases previas de la
investigación comercial y determina el grado de credibilidad que concederemos a los resultados
obtenidos.
Una fórmula muy extendida que orienta sobre el cálculo del tamaño de la muestra para datos globales
es la siguiente:
1
MODULO TRANSVERSAL: MATEMATICA
Ejemplo 1: si los resultados de una encuesta dicen que 100 personas comprarían un
producto y tenemos un error muestral del 5% comprarán entre 95 y 105 personas.
Ejemplo 2: si hacemos una encuesta de satisfacción a los empleados con un error muestral
del 3% y el 60% de los encuestados se muestran satisfechos significa que entre el 57% y el
63% (60% +/- 3%) del total de los empleados de la empresa lo estarán.
Ejemplo 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener
el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de
votos estará en el intervalo 52-58% (55% +/- 3%).
p: es la proporción de individuos que poseen en la población la característica de estudio. Este dato es
generalmente desconocido y se suele suponer que p = q = 0,5 que es la opción más segura.
q: es la proporción de individuos que no poseen esa característica, es decir, es 1-p.
n: es el tamaño de la muestra (número de encuestas que vamos a hacer).
Varios ejemplos:
Ejemplo 1: para realizar una encuesta de satisfacción a clientes de un determinado modelo
de coche del que hemos vendido 10000 unidades (N), en la que queremos una confianza del
95,5% que determina que k=2, deseamos un error muestral del 5% (e) y consideramos que
estarán satisfechos el 50% (p = q = 0,5) necesitaríamos una muestra de 385 clientes.
Ejemplo 2: contrastar el porcentaje de personas de un país que ven un determinado
programa de televisión. Si la población del país es de 40 millones de personas, estimamos
que lo ve el 20% de la población (p = 0,2 y q = 0,8), queremos una confianza del 95,5% que
determina que k=2 y estamos dispuestos a asumir un error muestral del 5% (e)
necesitaríamos una muestra de 256 personas.
1.3 Individuo:
Cada uno de los elementos de la muestra o de la población (personas, tornillos, hospitales,
comercios) y sobre los que recaerá la observación.
1.4 Variable:
Cada uno de los rasgos o característica de los elementos de una población y que varían de un
individuo a otro (salario, color de ojos, sexo, número de hijos).
Las variables pueden ser cualitativas o cuantitativas. Generalmente se utiliza el término “modalidad”
cuando hablamos de caracteres cualitativos y el término “valor” cuando estudiamos caracteres
cuantitativos. Una variable no es sino el conjunto de las distintas modalidades o valores que toma un
carácter.
2
MODULO TRANSVERSAL: MATEMATICA
1.4.1 Variables cualitativas (o categóricas): aquellas que no aparecen en forma numérica, sino
como categorías o atributos (sexo, profesión, color de ojos). Las variables cualitativas sólo pueden ser
nominales u ordinales.
Cualitativa Nominal: hace referencia a datos que sólo pueden clasificarse en categorías;
existen sólo conteos; no existe orden particular para los grupos. Ejemplo: color de ojos.
Cualitativa Ordinal: corresponde a aquellos datos que se pueden agrupar en categorías y
“ordenarlas” según algún tipo de gradación. Ejemplo; nivel de dolor, nivel de preferencia.
1.4.2 Variables cuantitativas: las que pueden expresarse numéricamente (temperatura, salario,
número de goles en un partido). Se pueden cuantificar los resultados experimentales por medio de
instrumentos adoptando unidades de medida para valorar los diferentes resultados. Variables
cuantitativas según el tipo de valores que pueda tomar pueden ser discretas o continuas.
Cuantitativa discreta: son el resultado de contar y sólo toman valores enteros (número de
hijos).
Cuantitativa continua: son el resultado de medir, y pueden contener decimales
(temperatura, peso, altura). Se pueden subdividir a voluntad. Pueden tomar, entonces,
cualquier valor de un determinado intervalo.
PRACTICA DIRIGIDA Nº 01
1) Opinión del estudiante del I.E.S.T.P.”L.E.V.” sobre la calidad del servicio de fotocopiado en el
presente año.
2) Rendimiento académico de los estudiantes becados en el I.S.T.P.”L.E.V.”.
3) Opinión de los ciudadanos de la provincia de Ilo ante el aumento del sueldo mínimo vital.
4) Número de vehículos que transita por la calle Moquegua, los sábados por la noche.
5) Hábitos de compra de los visitantes a la ciudad de Tacna en el mes de diciembre.
6) Número de niños comprendidos entre 0 a 2 años en la provincia de Ilo.
7) Efectos secundarios que produce en los adultos que padecen alergia nasal, por el uso de una
píldora que pretende lanzar al mercado.
8) Hábitos de alimentación en la población de la provincia de Ilo.
9) Preferencias de las personas por el consumo de panetón, durante el mes de diciembre.
10) Preferencia por un candidato a la alcaldía de la provincia de Ilo.
11) Producción mensual de leche, producida por la vacas en una semana.
12) Enfermedades de transmisión sexual (ETS) a los jóvenes de un Colegio “X” entre 12 y 18
años.
13) Tipo de música que más escuchan estudiantes del I.E.S.T.P.”L.E.V.” .
14) Numero de estudiantes que llegan tarde durante las dos primeras horas de clase.
15) Tipos de autos que circulan en la provincia de Ilo
16) Profesión de una persona.
17) Consumo de gasolina por cada 100 km.
3
MODULO TRANSVERSAL: MATEMATICA
4
MODULO TRANSVERSAL: MATEMATICA
¿Cómo voy a recolectar los datos?
En esta etapa realizará una lista de preguntas que le servirán para alcanzar la información que
desea. Las preguntas se pueden hacer personalmente (entrevista) o a distancia (encuestas
telefónicas o por correo).
a. La Entrevista: Es una conversación entre dos personas, frente a frente, para intercambiar
información, ideas, opiniones o sentimientos sobre el tema a investigar.
Se usan preguntas abiertas y
se motiva al entrevistado a
hablar con libertad.
Ventajas:
Profundizan mas sobre un tema que las sesiones de grupo
Hay un libre intercambio de información
No hay presión social para estar de acuerdo con alguna respuesta
Dan un panorama general comprensible
Sirven para análisis de temas confidenciales
Comprender un comportamiento complicado
Para obtener información de expertos
Desventajas:
Es difícil encontrar un entrevistador hábil
La falta de estructura hace que los resultados sean muy variables
Datos difíciles de analizar e interpretar
Requiere la intervención de un
experto
b. Los Grupos de Discusión: Para tener una visión general y rápida de lo que un grupo de
personas piensa, puede usar un grupo de discusión. En estos grupos, a manera de plática
informal un moderador hace la entrevista para encontrar la información deseada.
Ventajas:
5
MODULO TRANSVERSAL: MATEMATICA
c. La Encuesta: Es una serie de preguntas que puede realizarse personalmente, por teléfono,
correo o por correo electrónico. Según su diseño estas pueden ser:
Estructurada: es un cuestionario con preguntas que requieren selección de una sola
respuesta.
Semi-estructurada: contiene preguntas de selección y preguntas abiertas.
Ventajas:
Es fácil de aplicar Datos fáciles de procesar e interpretar
Datos obtenidos confiables
Reduce variación de
resultados
Desventajas:
Falta de colaboración de los entrevistados No son fáciles de
Se pueden perder algunos datos como creencias y redactar
sentimientos
6
MODULO TRANSVERSAL: MATEMATICA
El observador no pregunta ni
se comunica con las
personas observadas.
Ventajas:
Mide el comportamiento real N
Permite observar patrones de comportamiento que de otra forma no pueden o
estudiarse
son costosos
Desventajas:
Puede que no se encuentre la razón de un Puede ser no ético
comportamiento
La percepción del investigador puede cambiar los datos
Recomendaciones
Si son muchas personas y su ubicación es lejana se pueden hacer encuestas, ya sea por teléfono o
escritas, etc. Si son pocas personas las que tienen mucho conocimiento del tema, se usará una
entrevista a profundidad.
7
MODULO TRANSVERSAL: MATEMATICA
Toda pregunta debe tener respuesta ya que sería imposible saber si una persona posee o no
cierta característica, si no se obtuvo la información al respecto. Así, cada pregunta necesita una
categoría final para asegurar que se dé alguna respuesta ya sea ella desconocida, no informa, no
especifica u otra.
Ejemplo: Al preguntar si ha padecido de rubéola durante el embarazo, no solamente debe
preguntar si o no, sino también si desconoce.
Debe usarse un lenguaje claro y poco técnico.
Ejemplo: Si queremos saber si una persona padece de cefaleas frecuentes, debe preguntarse si
padece de dolores de cabeza frecuentes.
Evitar respuestas inducidas.
Ejemplo: Ud. nunca ha padecido de tuberculosis. Con esta pregunta estamos induciendo a la
persona a que su respuesta sea negativa.
4º PLANEAR COMO SE ANOTARÁN LAS RESPUESTAS El espacio que se deja debe ser
adecuado para las respuestas que se esperan y siempre que sea posible se adoptará el sistema que
exige el menor esfuerzo.
Ejemplo: a) Sexo: b) Sexo: Femenino
Masculino
En el inciso a), se pone nombre y en el inciso b), se marca con una cruz; éste último es de menor
esfuerzo.
Puede usarse otro método que sea la utilización de un código, por ejemplo, ¿Debe existir una revisión
periódica del salario mínimo?
1. Si
2. No
3. No sabe o no opina
5º ELECCION DE VARIAS RESPUESTAS Debe procurarse que se pueda elegir entre varias
respuestas, evitando ambigüedad u omisión de datos.
Ejemplo: Enfermedades que Ud. ha padecido.
8
MODULO TRANSVERSAL: MATEMATICA
7º REALIZAR ESTUDIO PILOTO Debe realizarse un estudio piloto antes que el formulario sea
impreso de manera definitiva, con el fin de probarlo y ver la operatividad del formulario y para darse
cuenta de la fallas que pueda tener y hacer las correcciones necesarias.
8º REDACTAR LAS INSTRUCCIONES NECESARIAS Aunque se debe tratar que cada pregunta
sea autoexplicativa, de ser necesario, debe redactarse las instrucciones de cómo anotar las
respuestas. Estas pueden imprimirse en el mismo formulario o a aparte cuando son muy extensas
3.- Técnicas de Muestreo
3.1.- Muestreo probabilísticos
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de
ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de
tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo
probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más
recomendables.
3.1.2.- Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos
los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se
parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la
muestra son los que ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos
de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra:
k=N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k.
El riesgo se este tipo de muestreo está en los casos en que se dan periodicidades en la población ya
que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una
homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra
sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si
empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o
sólo mujeres, no podría haber una representación de los dos sexos.
3.1.3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores
ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra.
Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran
homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la
profesión, el municipio de residencia, el sexo, el estado civil, etc). Lo que se pretende con este tipo de
9
MODULO TRANSVERSAL: MATEMATICA
muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente
en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de
la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un
conocimiento detallado de la población. (tamaño geográfico, sexos, edades,...)
La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede ser:
Afijación Simple: A cada estrato le corresponde igual número de elementos muestrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la población en
cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se
considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la
desviación.
Ejemplo:
Supongamos que estamos interesados en estudiar el grado de aceptación del nuevo enfoque
educativo por parte de los padres de familia de una determinada provincia. A tal efecto seleccionamos
una muestra de 600 sujetos. Conocemos por los datos del ministerio que de los 10000 niños
escolarizados en las edades que nos interesan, 6000 acuden a colegios públicos, 3000 a colegios
privados concertados y 1000 a colegios privados no concertados. Como estamos interesados en que
en nuestra muestra estén representados todos los tipos de colegio, realizamos un muestreo
estratificado empleando como variable de estratificación el tipo de centro.
Si empleamos una afijación simple elegiríamos 200 niños de cada tipo de centro, pero en este caso
parece más razonable utilizar una afijación proporcional pues hay bastante diferencia en el tamaño
de los estratos. Por consiguiente, calculamos que proporción supone cada uno de los estratos
respecto de la población para poder reflejarlo en la muestra.
Colegios públicos: 6000/10000=0.60
Colegios privados concertados: 3000/10000=0.30
Colegios privados no concertados: 1000/10000=0.10
Para conocer el tamaño de cada estrato en la muestra no tenemos más que multiplicar esa
proporción por el tamaño muestral.
Colegios públicos: 0.60x600=360 sujetos
Colegios privados concertados: 0.30x600=180 sujetos
Colegios privados no concertados: 0.10x600= 60 sujetos
3.1.4.- Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están
pensados para seleccionar directamente los elementos de la población, es decir, que las unidades
muestrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral
es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado.
Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc,
son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales. Cuando los conglomerados son área geográficas suele
hablarse de "muestreo por áreas".
10
MODULO TRANSVERSAL: MATEMATICA
3.2.2.- Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo
deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos
supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en
anteriores votaciones han marcado tendencias de voto.
11
MODULO TRANSVERSAL: MATEMATICA
1. Recolección (medición)
En esta etapa se recoge la información cualitativa y cuantitativa señalada en el diseño de la
investigación. En vista de que los datos recogidos suelen tener diferentes magnitudes o intensidades
en cada elemento observado (por ejemplo el peso o la talla de un grupo de personas), a dicha
información o datos también se les conoce como variables.
Por lo anterior, puede decirse que esta etapa del método estadístico consiste en la medición de las
variables.
La recolección o medición puede realizarse de diferentes maneras; a veces ocurre por simple
observación y en otras ocasiones se requiere de complejos procedimientos de medición; en algunas
ocasiones basta con una sola medición y en otras se requiere una serie de ellas a lo largo de amplios
períodos de tiempo.
2. Recuento (cómputo)
En esta etapa del método estadístico la información recogida es sometida a revisión, clasificación y
cómputo numérico.
A veces el recuento puede realizarse de manera muy simple, por ejemplo con rayas o palotes; en
otras ocasiones se requiere el empleo de tarjetas con los datos y, en investigaciones con mucha
información y muchos casos, puede requerirse el empleo de computadoras y programas especiales
para el manejo de bases de datos.
En términos generales puede decirse que el recuento consiste en la cuantificación de la frecuencia
conque aparecen las diversas características medidas en los elementos en estudio; por ejemplo: el
número de personas de sexo femenino y el de personas de sexo masculino o el número de niños con
peso menor a 3 kilos y el número de niños con peso igual o mayor a dicha cifra.
12
MODULO TRANSVERSAL: MATEMATICA
3. Presentación
En esta etapa del método estadístico se elaboran los cuadros y los gráficos que permiten una
inspección precisa y rápida de los datos.
La elaboración de cuadros, que también suelen llamarse tablas, tiene por propósito acomodar los
datos de manera que se pueda efectuar una revisión numérica precisa de los mismos.
La elaboración de gráficos tiene por propósito facilitar la inspección visual rápida de la información.
Casi siempre a cada cuadro con datos le puede corresponder una gráfica pertinente que represente la
misma información.
Presentar la misma información tanto en un cuadro como en su correspondiente gráfico permite
obtener una clara idea de la distribución de las frecuencias de las características estudiadas.
4. Síntesis
En esta etapa la información es resumida en forma de medidas que permiten expresar de manera
sintética las principales propiedades numéricas de grandes series o agrupamientos de datos.
La condensación de la información, en forma de medidas llamadas de resumen, tiene por propósito
facilitar la comprensión global de las características fundamentales de los agrupamientos de datos.
Tales medidas de resumen, al ser comunicadas, permiten a los interlocutores evocar de una misma
manera la esencia de los datos; por ejemplo, cuando alguien informa que el promedio de
calificaciones de un grupo de alumnos es 9,6 en una escala que va del O al 10, la imagen que se
transmite es la de un grupo con buen aprovechamiento escolar; igualmente, cuando se dice que el
porcentaje de defunciones con una cierta técnica quirúrgica es de 80%, las personas que escuchan
se imaginan que se trata de un procedimiento peligroso.
La información cualitativa, como el sexo, la ocupación o los tipos de enfermedades, requiere ser
condensada a través de medidas de resumen diferentes a la que se usan para sintetizar la
información cuantitativa o numérica como el peso, la talla o la concentración de glucosa. Entre las
principales medidas de resumen para sintetizar a los datos cualitativos se encuentran las razones, las
proporciones y las tasas.
Entre las principales medidas para sintetizar los datos cuantitativos se encuentra la moda y la
amplitud, la mediana y los percentiles, el promedio y la desviación estándar.
5. Análisis
En esta etapa, mediante fórmulas estadísticas apropiadas y el uso de tablas específicamente
diseñadas, se efectúa la comparación de las medidas de resumen previamente calculadas: por
ejemplo, si antes se han calculado los promedios de peso de dos grupos de personas sometidas a
diferentes dietas, el análisis estadístico de los datos consiste en la comparación de ambos promedios
con el propósito de decidir si parece haber diferencias significativas entre tales promedios.
Existen procedimientos bien establecidos para la comparación de las medidas de resumen que se
hayan calculado en la etapa de descripción. Tales procedimientos, conocidos como pruebas de
análisis estadístico cuentan con sus fórmulas y procedimientos propios, Cada prueba de análisis
13
MODULO TRANSVERSAL: MATEMATICA
estadístico debe utilizarse siempre en función del tipo de diseño de investigación que se haya
seleccionado para la comprobación de cada consecuencia verificable deducida a partir de la hipótesis
general de investigación.
Clasificados
DATOS deben
Ordenados
ser Presentados
en
Tablas Comprensión
para
y Descripción
facilitar Análisis
Gráficos
1. Organización de Datos
14
MODULO TRANSVERSAL: MATEMATICA
Título
Encabezado
Cuerpo
Fuente
Supongamos que se tiene una población constituida con 2000 Computadores viejos de la
universidad San Agustín de Arequipa y deseamos examinarlos, con el fin de determinar el
número de piezas defectuosas que contiene cada computador se toma una muestra de
tamaño n=20, correspondiente a una investigación parcial.
x1 = 3 x2 = 2 x3 = 0 x4 = 2 x5 = 3 x6 = 3 x7 = 1 x8 = 1 x9 = 0 x10 = 1
x11=3 x12=3 x13=4 x14=4 x15=3 x16=2 x17=4 x18=2 x19=4 x20=2
15
MODULO TRANSVERSAL: MATEMATICA
3
4
n=
Algunas Interpretaciones:
f1 =
…………….…………………………………………………………………………..
h4% =
…………………………………………………………………………………………
F3=
…………………………………………………………………………………………
H2 =
……………………………………………………………………………………….
EJERCICIO 2
Una fábrica de gaseosas proyecta lanzar al mercado un nuevo sabor. Se realiza un test de
aceptación de dicho sabor en una muestra de 30 niños, utilizando una escala de 10 puntos,
para medir el grado de aceptación. Los puntos obtenidos de los 30 niños fueron:
2,6,8,7,4,5,10,6,6,7,6,7,3,8,7,6,8,6,5,4,7,8,5,7,7,6,7,7,2,7.
• ¿Cuál es la población?
• ¿Cuál es la muestra?
• ¿Cuál es la variable?
• ¿La variable es cualitativa o cuantitativa?
• ¿Cuál es la escala de medida?
• ¿Construya una tabla de distribución de frecuencias
16
MODULO TRANSVERSAL: MATEMATICA
r=
b) Intervalo de Clase
Ejemplo: 16 ; 19 Se deben considerar los niños que se dedican a ver televisión
desde ………… horas hasta menos de ………… horas
semanales
c) Límites de Clase
Li ; Ls
Li = Límite inferior
Ls = Límite superior
Ejemplo: Li = , Ls =
d) Ancho de Clase o Amplitud del Intervalo (W) conocido como TIC tamaño del intervalo
de clase
W = Ls – Li
Ejemplo: W =
e) Marca de Clase ( x` )
x`= Li + Ls
2
Ejemplo: X`=
Observaciones:
Regla de Sturges K = 1 + 3,3 log n n: tamaño de la muestra o número de
datos
K = 1 + 3,3 log ( )
K=
17
MODULO TRANSVERSAL: MATEMATICA
EJERCICIO 3
Los siguientes datos son las edades de una muestra aleatoria de 50 personas jubiladas
entrevistadas durante el mes noviembre de 2010
71 65 66 61 54 93 60 86 70 70
73 73 55 63 56 62 76 54 82 79
76 68 53 58 80 85 56 61 61 64
65 62 90 69 76 79 77 54 64 74
65 65 61 56 63 80 56 71 79 84
Datos agrupados en una tabla sin intervalos 1,01 Habitante 30 1,98 Habitante 20 1,49
Habitante 10 1,62 Habitante 29 1,20 Habitante 19 1,77 Habitante 9 1,73 Habitante 28 1,45
Habitante 18 1,64 Habitante 8 1,16 Habitante 27 1,42 Habitante 17 1,40 Habitante 7 1,37
Habitante 26 1,20 Habitante 16 1,39 Habitante 6 1,48 Habitante 25 1,98 Habitante 15 1,92
Habitante 5 1,52 Habitante 24 1,81 Habitante 14 1,71 Habitante 4 1,86 Habitante 23 1,60
Habitante 13 1,57 Habitante 3 1,59 Habitante 22 1,16 Habitante 12 1,48 Habitante 2 1,21
Habitante 21 1,53 Habitante 11 1,15 Habitante 1 Estatura Habitante Estatura Habitante
Estatura Habitante
Presentación de datos agrupados
PRACTICA Nº 01 EN EXCEL
18
MODULO TRANSVERSAL: MATEMATICA
2º Trabaje con fórmulas para el llenado de las columnas: Fi, hi, Hi, hi%.Hi%
19
MODULO TRANSVERSAL: MATEMATICA
3º Cuadro final
20
MODULO TRANSVERSAL: MATEMATICA
PRACTICA Nº 02 EN EXCEL
2º Trabaje con fórmulas para el llenado de las columnas: fi, Fi, hi, Hi, hi%.Hi%
21
MODULO TRANSVERSAL: MATEMATICA
22
MODULO TRANSVERSAL: MATEMATICA
23
MODULO TRANSVERSAL: MATEMATICA
3º Cuadro final
PRACTICA DIRIGIDA
22 33 60 33 32 30 47 37 61 38 k = 1 + 3,3 * log n
34 30 47 41 55 67 32 49 46 21 w = r/k
42 42 46 43 53 48 46 26 51 23 r = xmax - xmin
56 41 57 24 45 62 31 51 47 52
Ii fi Fi hi Hi
5
0,42
0,65
] 0,15
24
MODULO TRANSVERSAL: MATEMATICA
PROBLEMA
La mortalidad de los médicos por cáncer pulmonar en relación con el hábito de fumar.
Método Estadístico
1. Recolección
2. Recuento
3. Presentación
4. Síntesis
5. Análisis
REALIDAD
Con el mismo sistema de enumeración empleado en el esquema anterior, identifique las etapas del
Método Estadístico que se encuentren presentes en el siguiente relato y anote las letras
correspondientes en los recuadros de los párrafos (algunos recuadros pueden quedar vacíos):
Al revisar las estadísticas de enfermedades y defunciones por enfermedades pulmonares se
encontró que casi todos los casos de enfisema pulmonar y varios de cáncer pulmonar tenían en
muchas ocasiones el antecedente de tabaquismo crónico.
Sin saber el por qué de tal relación, en un estudio de numerosos casos de cáncer pulmonar se
observó que alrededor del 70% de los enfermos eran antiguos fumadores.
Esto hizo pensar que el consumo de tabaco pudiera ser un factor favorecedor o causal del
cáncer pulmonar.
Si lo anterior fuera cierto, podría inferirse lo siguiente a) Un grupo de fumadores de determinada
edad, sexo y nivel socioeconómico presentaría un número mayor de muertes por cáncer
pulmonar que un grupo de no fumadores de edad, sexo y nivel socioeconómico similares y b)
La frecuencia de cáncer pulmonar sería mayor al aumentar el número de cigarrillos
consumidos.
Luego de discutir si convenía formar un grupo de médicos fumadores y seguirlo a lo largo de
varios años o formar un grupo de médicos fumadores y uno de no fumadores, se resolvió hacer
la investigación enviando un cuestionario a un único pero numeroso grupo de médicos del
Reino Unido.
De ellos, se solicitaron datos individuales sobre, edad y hábitos de fumar por medio del
cuestionario de referencia. Dicho cuestionario fue puesto a prueba para comprobar que medía
con precisión las diversas variables en estudio. Se establecieron además conexiones con el
Registro de Defunciones para asegurar la información sobre la mortalidad por cáncer pulmonar
que fuera ocurriendo en los médicos a quienes se incluyó en el estudio.
Aunque el número de datos preguntados a cada médico era pequeño, la cantidad de médicos a
quienes se envió el cuestionario sumaba varios miles. Por ello tuvo que hacerse uso de las que
en esa época se consideraban modernas computadoras.
Los datos se mostraron solamente en forma de cuadros o tablas.
El resumen de la información obtenida se expresó en tasas de mortalidad por cada mil médicos.
Las tasas de mortalidad por cada mil médicos fueron comparadas para averiguar si parecían
existir diferencias significativas, desde el punto de vista estadístico entre quienes murieron por
cáncer pulmonar según el antecedente de si fumaban o no.
25
MODULO TRANSVERSAL: MATEMATICA
Los resultados mostraron que el riesgo de morir fue 14 veces mayor en fumadores que en no
fumadores. También se observó que en los fumadores la frecuencia de estas muertes aumentó
cuando la cantidad de tabaco que se consumía era mayor.
Preguntas dicotómicas. Son aquellas que tienen únicamente dos respuestas posibles: "Si" o "No" y
permiten identificar claramente la opinión del entrevistado en cierto tema.
26
MODULO TRANSVERSAL: MATEMATICA
Preguntas ponderativas. Son aquellas en las que el entrevistado emite un juicio de valor y sirven
para determinar tendencias. Por ejemplo: ¿Cómo califica la calidad del producto X? 1) Excelente 2)
Muy buena 3) Buena 4) Regular 5) Mala
Preguntas filtro. Son aquellas preguntas que permiten, en función de las respuestas obtenidas,
establecer una selección cuantitativa o una clasificación de las personas interrogadas.
El sentido de las respuestas condiciona la formulación sucesiva de una serie u otra de las preguntas.
Las preguntas filtro son siempre cerradas. ejem.
¿Tiene usted credencial para votar?
Si (continuar encuesta)
No (dar gracias y terminar)
Preguntas complementarias. Son una serie de preguntas encadenadas que se complementan entre
sí, con el fin de profundizar en un determinado tema. Suelen ir precedidas de una pregunta filtro.
Ejem.
Si tiene credencial para votar ¿cuantas veces la ha usado?.
Las preguntas abiertas (aquellas en las que el entrevistado expresa libremente su opinión) son
buenas para captar matices, pero son más difíciles de analizar.
CUESTIONARIO ESTRUCTURADO
Buenos días / tardes, trabajamos para la empresa Investigaciones agrupadas y estamos realizando
un estudio sobre los hábitos de consumo de tabaco. Por favor, sería Ud. tan amable de contestar
algunas preguntas al respecto.
Cuestionario nº______
27
P1.- Ud. es o ha La salud propia
sido fumador de 1234
tabaco 56789
Si La educación
No 1234
56789
P2.- ¿De qué tipo El precio del
de tabaco? tabaco 1234
Cigarrillos rubios 56789
Las leyes
Puros restrictivas
Cigarrillos negros 123456789
El respeto a
Pipa terceros
Picadura 123456789
El qué dirán
1234
Otros 56789
tipos Los deseos de la
pareja 1 2 3 4 5
P3.- ¿Cuantas 6789
veces fuma al Su simple
día? voluntad
entre 0 y 5 veces 123456789
entre 6 y 10
veces
entre 11 y 20
veces
más de 20 veces
P4.- ¿Donde
fuma Ud. con
más frecuencia?
En mi casa
en el trabajo
cuando estoy con
los amigos
Otras
veces:_________
______
P5.- ¿Cual es la
principal razón
por la que fuma?
Me gusta mucho
Me calma los
nervios
Me entretiene
Es un acto social
CUESTIONARIO SEMIESTRUCTURADO
Buenos días / tardes, trabajamos para la empresa Investigaciones agrupadas y estamos realizando
un estudio sobre los hábitos de consumo de tabaco. Por favor, sería Ud. tan amable
de contestar algunas preguntas al respecto.
Cuestionario nº______
P1.- Preguntar si ha sido fumador
P2.- Preguntar qué tipo de tabaco fumaba
P3.- Preguntar la cantidad de tabaco fumado al día
P4.- Preguntar sobre lugar de preferencia para fumar
P5.- Preguntar sobre las razones por las que fuma
P6.- Preguntar sobre los principales motivos por los que dejaría de fumar
En este ejemplo se registrarán las respuestas bien de forma literal en espacios reservados al
efecto, o bien mediante grabación de las mismas, que será analizada con posterioridad.
CUESTIONARIO NO ESTRUCTURADO
Buenos días / tardes, trabajamos para la empresa Investigaciones agrupadas y estamos
realizando un estudio sobre los hábitos de consumo de tabaco. Por favor, sería Ud. tan amable
de contestar algunas preguntas al respecto.
Cuestionario nº______
Entrevistador, marque una vez haya formulado la pregunta correspondiente
Ha sido fumador
Tipo de tabaco fumaba
Cantidad de tabaco fumado al día
Lugar de preferencia para fumar
Razones por las que fuma
Principales motivos por los que dejaría de fumar
En este ejemplo se registrarán las respuestas bien de forma literal en espacios reservados al
efecto, o bien mediante grabación de las mismas, que será analizada con posterioridad.
29
MODULO TRANSVERSAL: MATEMATICA
y normas estadísticos. Cabe anotar que para la presentación final hay que
tener
en cuenta a quien va dirigida la información por lo tanto es indispensable
combinar
gráficos, tablas y/o cuadros con el fin de que la información llegue con
claridad y
permita hacer los análisis fácilmente. El avance tecnológico y la
masificación de
las computadoras hacen que estas tareas manualmente engorrosas sean
realizadas fácilmente y en muy corto tiempo
6 PUBLICACION
Es la etapa final de entrega de la información después de revisada, donde
quedan
consignados todo los resultados de la investigación. Estos resultados
deben
presentarse adecuadamente de tal forma que puedan servir para estudios
posteriores.APELLIDOS Y NOMBRES:
……………………………………………………..
CARRERA PROFESIONAL:…………………………………………………….
Notación: , x n
xi
x = i = 1 = x1 + x2 + x3 + … + xn
n n
Donde: n = tamaño de la muestra
x = la media de la muestra
Ejemplo: Las notas obtenidas en 5 prácticas calificadas es: 12, 14, 10, 18, 10; entonces la
nota promedio o la MA de las notas es:
x = 12 + 14 + 10 + 18 + 10 =
5
31
MODULO TRANSVERSAL: MATEMATICA
Ejemplo: La siguiente tabla corresponde al ingreso mensual promedio (en soles) de cierto
número de familias. halle la media
Ii fi x`i x`i fi
300 ; 400
40
400 ; 500 35
500 ; 600 15
600 ; 700
] 10
La Mediana
Ejemplo: 15 12 17 13 14
1ro. Ordenamos: 12 13 14 15 17
2do. L = n + 1 = 3 Me = 2
Antes y después de la mediana existe el mismo número de datos
Ejemplo:
Edades de 8 profesores de UNI : 30 23 45 27 34 48 28 41
1ro. Ordenamos:
2do. L = n + 1 = Me = + =
2 2
Se observa que hay ……… profesores cuya edad es menor a ………. años y …..…
profesores cuya edad es mayor a ………. años
nº de nº de
hijos familias Fi
0 2
32
MODULO TRANSVERSAL: MATEMATICA
1 4
2 8
3 4
4 6
Nº de
Nota alumnos Fi
11 2
12 7
13 11
14 13
15 4
16 2
17 1
n – Fm –1 TIC
Me = LIm + 2
fm
K Lii - LSi ] fi Fi
1 92,3 - 94,8 ] 2
2 94,8 - 97,3 ] 6
3 97,3 - 99,8 ] 9
4 99,8 - 102,3 ] 15
5 102,3 - 104,8 ] 10
6 104,8 - 107,3 ] 5
7 107,3 - 109,8 ] 3
1.3 La Moda
Es el valor que se repite el mayor número de veces
Ejemplo 1: 2 2 5 7 9 9 9 10 10 11 Mo =
Ejemplo 2: 3 5 7 10 11 13
Ejemplo 3: 2 2 3 4 5 5 6 7 tiene
xi fi
0 20
1 30
2 50
3 10
4 1
33
MODULO TRANSVERSAL: MATEMATICA
Mo = LI + d1 TIC
d1 + d2
d1 = / f – f - 1 /
d2 = / f – f + 1 /
= número de clase que tiene mayor frecuencia
LI = límite inferior de la clase modal
TIC = tamaño del intervalo de clase
Ejemplo:
K Lii - LSi ] fi
1 92,3 - 94,8 ] 2
2 94,8 - 97,3 ] 6
3 97,3 - 99,8 ] 9
4 99,8 - 102,3 ] 15
5 102,3 - 104,8 ] 10
6 104,8 - 107,3 ] 5
7 107,3 - 109,8 ] 3
APELLIDOS Y NOMBRES:…………………………...…………..
CARRERA PROFESIONAL:……………………………………….
2. Medidas de Dispersión
Así como las medidas de tendencia central nos permiten identificar el punto central de los datos, las
Medidas de dispersión nos permiten reconocer que tanto se dispersan los datos alrededor del punto
central; es decir, nos indican cuanto se desvían las observaciones alrededor de su promedio
aritmético (Media). Este tipo de medidas son parámetros informativos que nos permiten conocer como
los valores de los datos se reparten a través de eje X, mediante un valor numérico que representa el
promedio de dispersión de los datos. Las medidas de dispersión más importantes y las más utilizadas
son la Varianza y la Desviación estándar (o Típica).
2.2 Varianza
34
MODULO TRANSVERSAL: MATEMATICA
Ejemplo
Tú y tus amigos han medido las alturas de sus perros (en milímetros):
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Ma = 394 mm.
así que la altura media es 394 mm. Vamos a dibujar esto en el gráfico:
35
MODULO TRANSVERSAL: MATEMATICA
Para calcular la varianza, toma cada diferencia, elévala al cuadrado, y haz la media:
y lo bueno de la desviación estándar es que es útil: ahora veremos qué alturas están a distancia
menos de la desviación estándar (147mm) de la media:
Así que usando la desviación estándar tenemos una manera "estándar" de saber qué es normal, o
extra grande o extra pequeño.
Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... ¡pero que no se
enteren!
36
MODULO TRANSVERSAL: MATEMATICA
K Li Ls fi X`i
Total 48
II Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en
el momento de andar por primera vez:
37
MODULO TRANSVERSAL: MATEMATICA
Meses Niños
9 1
10 4
11 9
12 16
13 11
14 8
15 1
[10, 15] ]15, 20] ]20, 25] ]25, 30] ]30, 35]
fi 3 5 7 4 2
xi fi
[ 10; 20 ] 15 1
] 20; 30 ] 25 8
] 30; 40 ] 35 10
] 40; 50 ] 45 9
] 50; 60 ] 55 8
] 60; 70 ] 65 4
] 70; 80 ] 75 2
38
MODULO TRANSVERSAL: MATEMATICA
37)
II Identifique en cada enunciado el tipo de variable:
Clasificamos estas variables en cualitativas o cuantitativas (señalando si son discretas o
continuas).
1. a) Provincia de residencia. Cualitativa.
2. b) Número de vecinos de un edificio. Cuantitativa discreta.
3. c). Cualitativa.
4. d) Número de llamadas telefónicas. Cuantitativa discreta.
5. e) Cuantitativa continua.
1º DECIDIR SOBRE LOS DATOS QUE SE RECOGERÁN En todo formulario se debe recoger sólo
los datos útiles y adecuados al estudio. Formularios muy extensos conspiran contra la exacta
recolección de los datos. Es conveniente:
Hacer una lista de todos los datos que sean necesario recoger de acuerda a la finalidad del
estudio.
Considerar cuáles datos son factibles de recoger de manera fidedigna y exacta.
Limitar a aquellos datos prácticos a recoger y que se usará.
39
MODULO TRANSVERSAL: MATEMATICA
pregunta necesita una categoría final para asegurar que se dé alguna respuesta ya
sea ella desconocida, no informa, no especifica u otra.
Ejemplo: Al preguntar si ha padecido de rubéola durante el embarazo, no solamente
debe preguntar si o no, sino también si desconoce.
Debe usarse un lenguaje claro y poco técnico.
Ejemplo: Si queremos saber si una persona padece de cefaleas frecuentes, debe
preguntarse si padece de dolores de cabeza frecuentes.
Evitar respuestas inducidas.
Ejemplo: Ud. nunca ha padecido de tuberculosis. Con esta pregunta estamos
induciendo a la persona a que su respuesta sea negativa.
cómo anotar las respuestas. Estas pueden imprimirse en el mismo formulario o a aparte
cuando son muy extensas.
3. Sueldo recibido el último mes por los profesores de una institución educativa.
41
MODULO TRANSVERSAL: MATEMATICA
13. Opinión de los alumnos de una institución educativa sobre la recuperación de clases
los días sábados.
17. Grado de instrucción de los padres de los alumnos del ISTP “Luis E. Valcárcel”.
18. Opinión de los alumnos del ISTP “Luis E. Valcárcel” sobre las autoridades
estudiantiles.
19. Porcentaje del presupuesto anual del estado aplicado a la educación en los últimos
10 años.
2. Se realizó una encuesta para determinar las preferencias de los estudiantes con
respecto a las autoridades estudiantiles. Con este fin se entrevistaron a 1500
estudiantes y 600 de ellos están a favor del candidato López.
3. En cierta comunidad, se desea precisar la cantidad de estudiantes de educación
primaria que tienen problemas de aprendizaje. Se seleccionó a 80 jóvenes y 20 de
ellos presentaron problemas de aprendizaje.
42
MODULO TRANSVERSAL: MATEMATICA
43
MODULO TRANSVERSAL: MATEMATICA
PRACTICA DIRIGIDA
44
MODULO TRANSVERSAL: MATEMATICA
24. Sueldo recibido el último mes por los profesores de una institución educativa.
39. Grado de instrucción de los padres de los alumnos del ISTP “Luis E.
Valcárcel”.
40. Opinión de los alumnos del ISTP “Luis E. Valcárcel” sobre las autoridades
estudiantiles.
41. Porcentaje del presupuesto anual del estado aplicado a la educación en los
últimos 10 años.
43. Color de los ojos de los alumnos del primer semestre del ISTP “Luis E.
Valcárcel”
45
MODULO TRANSVERSAL: MATEMATICA
Ejemplo: Se realiza una encuesta a un conjunto de 16 familias sobre el número de hijos. Los
resultados en el orden obtenido son: x1= 2, x2=1, x3=3, x4=1, x5=2, x6=1, x7=3, x8=0, x9=2,
x10=1, x11=2, x12=3, x13=4, x14=1, x15=1, x16=2
1º El conjunto de observaciones es de tamaño16, luego n= 16
2º El número de observaciones diferentes, m= 5; estos son: y 1=0, y2=1, y3=2, y4=3,
y5=4
3º Contemos ahora el número de familias con 0, 1, 2, 3 y 4 hijos respectivamente.
Obteniéndose las frecuencias absolutas ( ni ) : n1=1, n2=6, n3=5, n4=3, n5=1
46