Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PRIMERA SEMANA
INTRODUCCION
La estadística, como campo de estudio, es el arte y la ciencia de dar sentido a los datos
numéricos.
Cuando un grupo de gerentes tiene que decidir cómo elaborar un nuevo producto alimenticio
congelado, o construir un nuevo hotel, o que buscan los clientes en un nuevo restaurante puede
guiarse por sus propios gustos e intuición u obtener datos tomados de una encuesta acerca de las
preferencias de los consumidores.
Cuando un psicólogo necesita seleccionar a la persona ideal para un puesto debe clasificarlo e
acuerdo a estándares hechos en base la estadística.
INTRODUCCION
La estadística, como campo de estudio, es el arte y la ciencia de dar sentido a los datos numéricos.
Cuando un grupo de gerentes tiene que decidir cómo elaborar un nuevo producto alimenticio
congelado, puede guiarse por sus propios gustos e intuición u obtener datos tomados de una
encuesta acerca de las preferencias de los consumidores.
Cuando los cigüeñales para automóviles que produce una fundadora se rechazan debido a
problemas con la calidad, los directores de los departamentos de diseño, ingeniería, compras y
producción pueden discutir entre sí, tratando de culparse los unos a los otros, o pueden obtener
datos para determinar qué es lo que ocasiona el problema.
Como verán, Obtener y Utilizar datos en forma inteligente resuelve muchos problemas.
Prácticamente todo gerente (presidente de una corporación, miembro de un consejo de
administración, director de un hospital, ingeniero) tiene la necesidad y la ocasión de tratar con
datos. El pensamiento estadístico es indispensable, tanto al tratar con las operaciones cotidianas,
como al buscar oportunidades para mejorar.
La necesidad puede ser obvia, como en el caso de los altos ejecutivos de empresas crediticias que
deben analizar el comportamiento de cientos de clientes a los que se les han hecho préstamos, o
del director de un hospital que tiene que contabilizar todos los días la disponibilidad de camas y
quirófanos. En otros casos, la oportunidad puede ser menos obvia (y por consiguiente más
valiosa); por ejemplo, los gerentes de un banco quizá no se dan cuenta de que podrían
experimentar con el número anticipado de clientes para reducir las colas en las ventanillas y los
tiempos de espera de sus usuarios en los cajeros automáticos.
RECOPILACIÓN DE DATOS
Para ser útiles, los datos se deben recopilar y poner a nuestra disposición.
La simple decisión de medir y recopilar los datos relevantes es el comienzo indispensable para
usarlos en la solución de problemas.
La primera decisión consiste entonces en determinar lo que se quiere medir. A menudo, las
variables más fáciles de medir no son las más relevantes para resolver un problema. Precisar un
Licenciado en Estadística
-2-
poco el problema ayuda a determinar los datos que se han de reunir y cuáles son las variables
importantes, no las más fáciles de medir.
La segunda decisión tiene que ver con la forma en que se obtiene la información.
Con frecuencia los datos se pueden recopilar en el trabajo diario; si se establece algún plan, la
información acerca de la producción, las ventas, el número de clientes, efectivo (por ejemplo) se
puede registrar-y hacer accesible como parte de la operación cotidiana. Otras veces, los datos se
deben buscar deliberadamente.
Un paso importante en la obtención de datos es el muestreo.
Un grupo dedicado a la investigación del mercado que examina la reacción de los consumidores
ante un nuevo diseño de habitaciones para hoteles no puede, en realidad, entrevistar a todos los
compradores potenciales e, inevitablemente, los datos se obtienen de una muestra limitada de
éstos.
Otra forma de recopilar datos es la experimentación.
El grupo dedicado a la investigación del mercado, en vez de proponer un único modelo de las
habitaciones a (una muestra de) los compradores potenciales, podría presentar varios diseños que
combinen distintas características e investigar cuál de ellos fue el de mayor aceptación.
EL PAPEL DE LA COMPUTADORA
Las computadoras pueden obtener medidas de los datos con sencillez y claridad; de esta manera,
los gerentes tienen abierta la oportunidad de explorar los datos en vez de apoyarse en fórmulas
estereotipadas, y es posible comunicar los resultados con claridad y efectividad por medio de
gráficas y diagramas. Las computadoras reducen el tedio en el análisis de los datos y permiten que
éste sea más eficiente; sin embargo el ser humano siempre es quien decide qué datos utilizar,
escoge los métodos de análisis, comprueba las hipótesis e interpreta los resultados razonablemente.
Mientras la inteligencia artificial no haga avances considerables, la inteligencia humana seguirá
siendo indispensable.
Licenciado en Estadística
-3-
CONCEPTO DE ESTADISTICA
En el uso cotidiano, el término “estadísticas” indica hechos numéricos. Sin embargo, el campo o
tema de la estadística abarca mucho más que hechos numéricos.
CAMPOS DE LA ESTADISTICA
EE
SS
TT
AA
DD
ESTADÍSTICA
ESTADÍSTICA ESTADÍSTICA
ESTADÍSTICA
ÍÍ
DESCRIPTIVA SS INFERENCIAL
DESCRIPTIVA INFERENCIAL
TT
II
CC
AA
La mayor parte de la información estadística que aparece en los diarios, revistas, informes y
demás publicaciones consiste en datos resumidos y presentados en forma comprensible para el
lector. Esos resúmenes de datos, que pueden ser tabulares, gráficos o numéricos, se llaman
“Estadísticas Descriptivas”.
En muchos casos se buscan los datos de un gran grupo de elementos (individuos, acciones,
votantes, amas de casa, productos, clientes, etc), (POBLACIÓN). Ahora, debido al tiempo, al
costo y a otras consideraciones, se reúnen datos sólo de una pequeña parte del gran grupo
(MUESTRA.) Uno de los mayores aportes de la estadística es que los datos de una muestra
Licenciado en Estadística
-4-
pueden emplearse para elaborar estimaciones y probar hipótesis acerca de las características de una
población. A este proceso se le denomina “Inferencia Estadística”.
DEFINICIONES ESTADISTICAS BASICAS
Analicemos la siguiente tabla, muestra el Sueldo del director ejecutivo, Ramo industrial, Ventas
anuales, Calificación del rendimiento por parte de los accionistas, Número de empleados en la
sede principal y Tiempo de Experiencia del Director Ejecutivo; para 5 empresas importantes en el
Perú.
La paga del director ejecutivo con calificación de 1 indica que la empresa pertenece al grupo con
la mejor relación de sueldo a rendimiento de las acciones. Una calificación de 2 indica que la
empresa es semejante a otras que tienen una relación muy buena aunque no la mejor. Las
empresas con la peor relación de sueldos del director ejecutivo a rendimiento de acciones tiene
calificación de 5.
TABLA Nº 02
CARACTERÍSTICAS PRINCIPALES DE 5 EMPRESAS IMPORTANTES DEL PERÚ.
Sueldo del Ventas Tiempo de expe
Califica Nº de
COMPAÑÍA Direct.Ejec. Ramo anuales. del Dir.Ejec.
ción empleados
($miles) ($millones) (años)
NESTLE 3344 Alimenticia 14045 4 115 9.5
PETROPERÚ 8925 Petróleo 9565 3 150 8.3
ALTOMAYO 1410 Alimenticia 5567 1 62 9.4
TELEFÓNICA 2437 Telecomunicacio 18546 5 122 10.7
nes
BACKUS 1490 Bebidas 12140 2 98 11.5
Fuente: Ministerio de trabajo, Perú.
Una “CONSTANTE”; es un valor, atributo de una realidad, que permanece inalterable en cada
uno de los elementos en estudio. Es decir no varía para los elementos.
Una “VARIABLE”; es una característica, propiedad, o atributo de una realidad, que puede
cambiar para cada elemento, este cambio puede ser cualitativa o cuantitativamente. En el ejemplo
anterior, El sueldo del Director ejecutivo varía en cada empresa; el ramo al cual se dedica la
empresa también varía, de igual manera el número de empleados en la sede principal, o la
calificación...
Variable.- A la característica bajo estudio se le conoce como variable. Esta puede ser de
naturaleza cualitativa o cuantitativa.
La distribución de la población, será la distribución de la variable aleatoria X, siendo discreta o
continua según sea X.
Esto depende del planteamiento inicial de la investigación. “El quienes van a ser medidos”,
depende de precisar claramente el problema a investigar y los objetivos de la investigación.
Licenciado en Estadística
-5-
En nuestro ejemplo, Unidad de análisis viene a ser cada una de las empresas importantes del
Perú considerada en la tabla. Así tenemos:
Nestlé.
Petroperú.
Altomayo.
Telefónica.
Backus.
De esto podemos decir que:
“UNIDAD DE ANÁLISIS”; Son las entidades, sujetos, objetos, realidades, de las cuales se
obtienen la información deseada (datos). En nuestro caso cada empresa individual es un elemento.
Es la mínima expresión en la que se mide una variable.
Los “DATOS”; son las mediciones obtenidas en cada variable para cada unidad de análisis en
estudio.
POBLACIÓN: Se define como población o universo al conjunto de todos los elementos de interés
en un estudio, es decir todas las unidades de análisis.
En realidad pocas veces se puede medir a toda la población, por lo que obtenemos o seleccionamos
una muestra y desde luego se pretende que este subconjunto sea un reflejo fiel del conjunto de la
población
Al proceso de selección de una muestra de n elementos de la población se llama muestreo.
Habitualmente es imposible o innecesario tener todos los datos de la población. Los datos de sólo
una parte de la población (muestra) pueden dar la información necesaria para generalizar acerca de
los parámetros de la población que por lo general son desconocidos
ESTIMADOR: Valor obtenido de una muestra, trata de estimar el verdadero valor de la población,
susceptible al error.
Una vez definida la unidad de análisis podremos delimitar una población que va a ser estudiada y
sobre la cual se pretende generalizar los resultados.
Licenciado en Estadística
-6-
VARIABLES
De la información anterior, podemos distinguir:
¿Cuáles son constantes?, y ¿Cuáles son Variables?
Constante: 1) Empresa importante del Perú. Permanece igual para
todos los elementos.
2) Director Ejecutivo de la Empresa.
Licenciado en Estadística
-7-
CLASIFICACION DE VARIABLES
Sabemos que Una variable es “la característica que cambia para cada elemento”
TABLA Nº 02
CARACTERÍSTICAS PRINCIPALES DE 5 EMPRESAS IMPORTANTES DEL PERÚ.
Sueldo del Ventas Tiempo de expe
Califica Nº de
COMPAÑÍA Direct.Ejec. Ramo anuales. del Dir.Ejec.
ción empleados
($miles) ($millones) (años)
NESTLE 3344 Alimenticia 14045 4 115 9.5
PETROPERÚ 8925 Petróleo 9565 3 150 8.3
ALTOMAYO 1410 Alimenticia 5567 1 62 9.4
TELEFÓNICA 2437 Telecomunicacio 18546 5 122 10.7
nes
BACKUS 1490 Bebidas 12140 2 98 11.5
Fuente: Ministerio de trabajo, Perú.
Sabemos que contamos con 6 variables, de las cuáles por su NATURALEZA, pueden ser
CUALITATIVAS O CUANTITATIVAS.
CUALITATIVAS CUANTITATIVAS
Rama a la que se dedica la empresa. Sueldo del Director Ejecutivo.
Ventas anuales.
Calificación de la paga del director Tiempo de experiencia del Director
ejecutivo. Ejecutivo.
Nº de empleados en la sede principal.
Licenciado en Estadística
-8-
Una “VARIABLE CUALITATIVA” expresa una cualidad o un atributo; es decir, son
identificadores o nombres asignados a un atributo de cada elemento. Estos pueden ser numerales o
no numerales. En nuestro ejemplo, la variable Ramo de la empresa es no numeral. Sin embargo en
algunos casos para facilitar la recolección de datos y su procesamiento, se recurre a una técnica llamada
codificación, la cual consiste en usar claves numéricas para indicar características no numerales. Así
tenemos en nuestro ejemplo:
Una variable “CUANTITATIVA CONTINUA”, es aquella que expresa valores decimales, es decir,
se pueden contar con los números reales. En nuestro ejemplo sería la variable: Tiempo de
Experiencia del Director Ejecutivo (en años).
Contínuas serían:
Otros ejemplos de variables cuantitativas
El peso de cualquier persona.
La longitud de una varilla de construcción.
La altura de una antena de televisión.
Etc.
Licenciado en Estadística
-9-
Sea otro ejemplo: El Centro de Investigación JOSAVI, por encargo del Ministerio de Salud está interesado
en conocer si: “El escaso fomento de la educación alimentaria en la población, genera mayor desnutrición
infantil en las familias con bajo nivel de instrucción”. Para ello, es indispensable conocer con qué tipo de
variables se va a trabajar.
Ahora, cuáles son ellas:
Una variable “DEPENDIENTE” (Y); es aquella que depende de otra u otras variables
dentro de un contexto determinado. Indica: efecto, resultado, consecuente, se simboliza con
la letra mayúscula Y.
MEDICIÓN.
Es el proceso de mapear o asignar números a objetos u observaciones.
La clase de medición alcanzada es una función de las reglas según las cuales los números se
asignan a los objetos
Las operaciones y relaciones empleadas en obtener las puntuaciones definen y limitan las
manipulaciones y operaciones que son permitidas al manipular las puntuaciones.
Teniendo en cuenta esta definición, Una escala de medición es la fuerza con la que una variable
puede obtener información para el manejo de los datos.
Licenciado en Estadística
- 10 -
ESCALAS DE MEDICIÓN.
¿Cuál es la escala en la que son medidas las variables?
Se debe tener en cuenta 4 niveles de medición: NOMINAL, ORDINAL, de INTERVALO y de
RAZÓN. Para conocer más de ésta clasificación observemos el siguiente cuadro resumen.
ESCALA
NOMINAL ORDINAL INTERVALO RAZÓN
CARACT.
Nivel más Asignación de Distancias iguales Cero significativo y
elemental de valores a lo largo entre puntos. no arbitrario.
medición. de alguna No hay un punto de El cero indica que
Asignación de dimensión partida o cero nada de la cantidad
rótulos. subyacente. inherente (natural) en está presente. Para
La única operación Implica datos que el que la cantidad valores en este
que puede hacerse pueden esté totalmente nivel, tanto las
CUALIDADES
es el conteo. acomodarse en ausente). diferencias como las
algún orden, pero razones tienen
no es posible significado.
determinar
diferencias entre
los valores de los
datos.
EJEMPLOS Género Orden de
Puntajes en Edad. (una
(masculino, llegada en una
pruebas de persona tiene 25
femenino). carrera (1ero,
inteligencia. años de edad,
Preferencia
2do, ...5to).
Temperatura. pero para llegar a
(gusta, no gusta). Estado
(Si la temperatura ella,
Estado nutricional del
del sábado fue 30º necesariamente
Civil (soltero, paciente
y la del miércoles ha tenido que
casado, viudo, (desnutrido,
15º, no significa partir de cero
divorciado). normal, obeso).
que fue el doble años.
Nivel socio
sino 15º menos. Peso.
Rendimiento
económico (alto, Tiempo de
medio bajo).
académico. servicio.
Estatura.
QUÉ SE PUEDE Cada observación Una observación se Un puntaje difiere de Un valor es el doble
DECIR pertenece a su clasifica arriba o otro en alguna de otro o ninguna
propia categoría. debajo de otra. medida que tiene cantidad de esa
intervalos variable puede
equiespaciados. existir.
Licenciado en Estadística
- 11 -
Otros ejemplos de Nivel De medición de Intervalo:
Las temperaturas promedios anuales (en grados Celsius) de las capitales de todos los departamentos
del Perú en el año 2002.
Otros ejemplos de Nivel de Razón:
Pesos de los objetos plásticos desechados por los hogares de la ciudad de Piura (0 kg significa que
no se desecho plástico, y 10 kg si pesan el doble que 5 kg).
Escala para medir las actitudes (LIKERT, GUTTMAN), Cuestionarios (ENCUESTA), Análisis
de Contenido, Observación, Pruebas e inventarios estandarizados, Sesiones en profundidad,
Otras formas...
LAS ENCUESTAS
preguntas identificación
Según acción
contenido intención
opinión
información
motivos
1. Definición
La Encuesta es una técnica cuantitativa que consiste en una investigación realizada sobre una
muestra de sujetos, representativa de un colectivo más amplio que se lleva a cabo en el contexto de
la vida cotidiana, utilizando procedimientos estandarizados de interrogación con el fin de
conseguir mediciones cuantitativas sobre una gran cantidad de características objetivas y
subjetivas de la población.
Ventajas:
- Técnica más utilizada y que permite obtener información de casi cualquier tipo de población.
- Permite obtener información sobre hechos pasados de los encuestados.
- Gran capacidad para estandarizar datos, lo que permite su tratamiento informático y el análisis
estadístico.
Licenciado en Estadística
- 12 -
- Relativamente barata para la información que se obtiene con ello.
Inconvenientes:
- No permite analizar con profundidad temas complejos (recurrir a grupos de discusión).
2. Tipos de cuestionarios.
a) entrevista personal hacen uso de encuestadores
b) por correo envío por correo de un cuestionario, es + barata, pero tienen el inconveniente de
un índice de respuesta no elevado, por lo que hay que hacer sucesivas oleadas, lo que puede
hacer que nuestra muestra no sea representativa.
c) Cuestionarios telefónicos no controlamos a la persona que responde, son baratas.
d) Cuestionarios auto-adictos se realizan a una población cautiva.
3. Tipos de preguntas:
a) Según la contestación que admitan:
- abiertas (preguntas que sólo formulan las pregunta, sin establecer categorías de respuesta)
Se deben utilizar muy poco en las encuestas porque después de la encuesta hay que cerrarlas y
luego estandarizarlas.
- Cerradas: Dicotónicas (establecen sólo 2 alternativas de respuesta, “Si o No” y a veces
Ns/Nc)Se deben utilizar sólo para temas muy bien definidos que admiten estas 2 alternativas
como respuesta.
Categorizadas (además de la pregunta, establecen las categorias de respuesta)a su vez se
subdividen en:
De respuesta espontáneael encuestador no debe leerle la respuesta al encuestado.
De respuesta sugeridael entrevistador lee las preguntas al encuestado.
De valoración el entrevistador lee una escala de intensidad creciente o decreciente de
categorías de respuesta.
- Filtro se utilizan mucho en los cuestionarios para eliminar aquellas personas que no les
afecten determinadas preguntas, es decir que marcan la realización o no de preguntas
posteriores.
- Batería todas las preguntas tratan sobre un mismo tema y que siempre deben ir juntas en el
cuestionario en forma de batería, empezando por las + sencillas y luego las + complejas. Esto
se denomina “embudo de preguntas”.
- De control se utilizan para comprobar la veracidad de las respuestas de los encuestados y
normalmente lo que se hace en estos casos es colocar la misma pregunta pero redactada de
forma distinta en lugares separados una de la otra.
- Amortiguadoras se refieren a que cuando estamos preguntando temas escabrosos o
pensamos que serán reticentes a contestar, hay que preguntar suavizando la pregunta y no
preguntar de modo brusco y directo.
Licenciado en Estadística
- 13 -
c) Según su contenido:
- Identificación sitúan las condiciones en la estructura social. Ej. Edad, sexo, profesión.
- Acción tratan sobre las accioens de los entrevistados. Ej. ¿Va al cine?¿fuma?.
- Intención indagan sobre las intenciones de los encuestados. Ej. ¿Va a votar?
- Opinión tratan sobre la opinión encuestados sobre determinados temas. Ej. ¿Qué piensa
sobre...?
- Información analizan el grado de conocimiento de los encuestados sobre determinados
temas.
- Motivos tratan de saber el porqué de determinadas opiniones o actos.
ELABORACIÓN DE CUESTIONARIOS.
Las formas de recolección de datos son un componente céntrico en la mayor parte de los estudios
de investigación. Los tres medios de comunicación se basan en un cuestionario.
Un cuestionario es un plan formalizado para recolectar datos de los encuestados. La función del
cuestionario es la medición del comportamiento pasado, de las actitudes y de las características del
encuestado.
La medición de actitudes ha crecido en importancia, así como el número de técnicas para su
medición. Estas técnicas generalmente se incorporan al cuestionario. Los aspectos involucrados en
el diseño del cuestionario se relacionan directamente con el desarrollo y administración de estas
técnicas de medición de actitudes.
Licenciado en Estadística
- 14 -
3. Instrucciones: Se refieren a comentarios realizados al entrevistador o encuestado con
relación a la forma de utilizar el cuestionario. Estos comentarios aparecen directamente en
el cuestionario cuando se emplea una encuesta por correo. En el caso de las entrevistas
personales y telefónicas se incluye una hoja por separado titulada "instrucciones para el
entrevistador" en la cual se explica el objetivo del estudio, plan de muestreo y otros
aspectos del proceso de recolección de datos. Además, el cuestionario puede contener
instrucciones especiales referidas con el uso de preguntas específicas.
4. Información solicitada: Constituye la parte más grande del cuestionario.
5. Datos de clasificación: Tratan sobre las características del encuestado. Estos datos los
suministra directamente el encuestado en el caso de una encuesta por correo. En las
personales y telefónicas el entrevistador recolecta los datos o, en algunos casos, puede
estimar tipos más sensibles de datos basado en la observación, por ejemplo, el ingreso.
Fuente de datos es el lugar, la institución, personas o elementos de donde se obtienen los datos para cada
una de las variables o aspectos, necesarios en una investigación o estudio.
Mencionaremos algunas de ellas:
Las Oficinas de Estadística (INEI). Es la institución responsable de recopilar, procesar y publicar
las estadísticas sociales, económicas, demográficas, académicas de nuestro país.
Archivos o Registros Administrativos. Aquí encontramos al Registro Civil, Registro Electoral,
Escalafón de Personal, Patrón de contribuyentes, etc.
Documentos. Boletines o informes estadísticos, que son las publicaciones o estudios que preparan
las organismos especializados.
Encuestas y Censos. Son fuentes directas y especiales, que se constituyen en un momento
determinado, recopilando datos de una parte o de la totalidad de una población.
Los elementos o sujetos. De una población sometida a estudio, que pueden ser pernas,
instituciones o simplemente objetos. En este caso, a estos elementos se les llama Unidades de
análisis o unidades de observación.
Licenciado en Estadística
- 15 -
cual se especifica la población y/o muestra usada, también debe contener los métodos y técnicas para
obtener los datos y el procedimiento seguido para el análisis de la información.
Por tanto, Estadística e investigación científica guardan estrecha relación, porque la Estadística es
Herramienta de Investigación Científica.
Licenciado en Estadística