Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1. El fenómeno estadístico
Son aquellos que se caracterizan por la aleatoriedad o azar de su comportamiento.
Un fenómeno estadístico tiene un comportamiento más o menos estable, o al menos, posible de delinear cuando se le considera
como un todo, pero, la multiplicidad de eventos particulares que lo componen son imposibles de predecir.
Vemos en un supermercado a cientos de personas en el proceso de comprar. Eligen productos, comparan precios, marcas,
contenidos, envases. Para los administradores del local es imposible determinar la compra, por ejemplo, de la señora Juanita,
pero, podrían determinar, a nivel general qué, cuándo y cuánto compra el conjunto de todos sus clientes, por ejemplo, en una
semana. Aun así, pueden darse diferencias y cambios impredecibles en los hábitos de consumo de los clientes, atribuibles a
factores políticos, policiales, climáticos, etc.
Las técnicas y métodos estadísticos nos acercan a delinear la realidad disminuyendo la incertidumbre que la caracteriza, pero
nunca llegará a predecirla sino es con cierto grado de incertidumbre.
En resumen, los fenómenos estadísticos, llamados también aleatorios, estocásticos o no determinísticos, se caracterizan
porque:
• Constituyen un todo con un perfil general o patrón cognoscible, cuando se cuenta con una gran cantidad de
observaciones.
• Sus resultados particulares no son predecibles.
2. Estadística
Ciencia que estudia los métodos y técnicas para obtener datos provenientes de fenómenos aleatorios, para organizarlos,
presentarlos e interpretarlos en el contexto donde surgen, con el objeto de construir una comprensión del fenómeno que les
dio origen. Muchas veces el propósito de un estudio estadístico es construir conocimiento con un interés científico explicativo,
mientras que otras veces es para tomar decisiones en el ámbito económico, político, comercial, etc.
Por ejemplo, cuando surgió la COVID-19 Chile, poco se sabía de ella. Las primeras investigaciones se dirigieron a caracterizar
las personas enfermas en cuanto sexo, edad y otros aspectos biológicos, sicosociales y culturales, que ayudaron a construir
un perfil de la población susceptible de ser atacada por el virus. Una vez hecho esto, se procedió a la toma de decisiones para
controlar la enfermedad y evitar su expansión.
3. Concepto de probabilidad
El concepto de probabilidad subyace a todo trabajo estadístico. Si la Estadística, como ciencia, provee los métodos y técnicas
para el tratamiento de variables azarosas, la teoría de la probabilidad provee el andamiaje teórico y operativo para cuantificar
esa incertidumbre.
3.1. Probablemente:
Según Max Black1, la palabra “`probablemente” implica “posiblemente” y excluye “seguramente”. Lo que es probable
ni es seguro, ni imposible. Todo el que dice que “probablemente extraerá una bola negra de una urna”, indica que es
posible que extraiga tal bola y también que no es seguro que vaya a ser así.
3.2. Probabilidad:
Es el grado de verosimilitud que se le atribuye a un enunciado, o el grado de certeza o confianza que pueden tener
nuestras creencias acerca de sucesos futuros. La probabilidad también puede expresarse mediante un valor
numérico y, en ese caso, la probabilidad es una medida de la posibilidad de un acontecimiento, expresada mediante
un número real que va entre cero y uno.
5. Tipos de Estadística
5.1. Estadística descriptiva: rama de la Estadística que se ocupa de describir y caracterizar muestras de datos,
respecto de características cuyo estudio interesa. Por esta razón también se le llama estadística de muestras.
5.2. Estadística inferencial: rama de la Estadística cuyo objetivo es obtener conclusiones generales acerca de una
población en estudio, a partir de los resultados de una muestra. Por esta razón también se le llama estadística de
poblaciones.
Por ejemplo, sobre la base de los resultados de una encuesta a 2.350 personas, se puede inferir lo que puede
ocurrir en una población de quince millones y medio de personas.2
6. Población: Conjunto de todos los sujetos cuyo estudio interesa. También se puede comprender una población como el
conjunto de todas las medidas o datos a estudiar. El tamaño de la población se simboliza N.
Ejemplos:
• Usuarios de Internet en Chile
1
Inducción y probabilidad, Cátedra, Madrid 1984.
2
La inferencia estadística utiliza, como se puede advertir, el razonamiento inductivo, que es aquel que va desde
lo particular a lo general.
2
• Accidentes de tránsito en la región Metropolitana
• Microempresas del sector agroindustrial
• Sandías producidas en Paine
7. Censo: Estudio estadístico que abarca el 100% de una población. Muchas veces, realizar un estudio así resulta imposible o
antieconómico. Por ejemplo, estudiar las preferencias presidenciales de la población de votantes es prácticamente imposible,
tanto como lo es medir la cantidad de madera que puede rendir un bosque de 350 mil árboles de 15 años de edad.
En Chile se realiza un censo de población y vivienda cada diez años. El último de ellos se realizó el año 2017.
8. Muestra: Subconjunto de la población que se extrae con el objeto de estudiar las características poblacionales.
8.1. Algunas ventajas de trabajar con muestras:
• Es más rápido, ya que se estudian menos sujetos.
• Es más barato, ya que al ser menos sujetos en estudio, se requieren menos recursos.
• Si la muestra es representativa, se obtienen resultados muy cercanos a la realidad poblacional.
• Al ser menos sujetos involucrados, se les puede estudiar detalladamente.
9. Tamaño de la muestra: es el número de elementos de la población que se seleccionan para estudiar. Se representa por la
letra n minúscula.
El tamaño de la muestra varía desde un individuo, hasta la población total. Sin embargo, un estudio se encarece al aumentar el
tamaño de la muestra. Por esta razón, siempre ha de tratarse de trabajar con la menor muestra posible, con la consideración
de que, a menor tamaño de muestra, mayor es el error o incertidumbre de los resultados. Existen métodos para el cálculo del
tamaño óptimo de la muestra.
10. Muestreo
10.1. Concepto de muestreo:
Comprende los métodos y técnicas para calcular el tamaño de la muestra y para seleccionar los individuos que la
conformarán.
Se denomina muestreo a la operación de seleccionar la muestra de la población a investigar. El principio fundamenta
que guía el muestreo estadístico es que todos los sujetos de la población tengan la misma probabilidad de salir
seleccionados. De este modo se logra una muestra estadística, que es la que funda la posibilidad de hacer
inferencias válidas.
El muestreo más elemental es el muestreo aleatorio simple (mas), que consiste en asignar a cada individuo de la
población un número. La muestra se selecciona por sorteo, con ayuda de algún mecanismo como tómbola,
programas computacionales (RANDOM) o tablas de números al azar.
3
10.2. Importancia del muestreo:
Para los efectos de inferencia, es imprescindible que la muestra sea aleatoria, de otra manera no hay posibilidad de
inferir en forma válida. Dicho de otro modo, solo es posible realizar inferencias válidas sobre la base de muestras
aleatorias. Este tipo de muestra también se suele llamar muestra estadística.
Esta exigencia se debe a que todo el proceso de inferencia está basado en el cálculo de probabilidades.
10.3.1. Muestreo aleatorio simple: Consiste en asignar una identidad, generalmente un número, a cada
uno de los elementos de la población. Se sortean los seleccionados mediante un mecanismo aleatorio, es
decir, a través de un método independiente del operador.
En el caso planteado:
A: Se puede escribir el nombre de cada uno de ellos en papelitos en una caja y luego extraer 8 papelitos.
B: También puede otorgarse un número entero del 1 al 40 a cada uno de ellos. Los seleccionados se pueden
obtener de papelitos dentro de una caja, con una tómbola o empleando números al azar originados en una
calculadora o programa computacional.
10.3.2. Muestreo estratificado: consiste en seleccionar la muestra con una composición referida a una
característica conocida en la población. En el caso anterior, se puede estratificar respecto del sexo.
Como los hombres representan el 62,5% del total, se calcula la proporción de la muestra que les
corresponde. En este caso, el 62,5% de 8 es 5. Por lo tanto, se seleccionarían 5 hombres y 3 mujeres.
10.3.3. Muestreo por conglomerados: cuando los elementos a seleccionar están distribuidos en grupos
más o menos homogéneos (conglomerados), se puede seleccionar a algunos de ellos y luego elegir la
muestra solo de los conglomerados seleccionados.
En este caso se pueden seleccionar aleatoriamente algunos de los cinco departamentos, por ejemplo, tres.
Luego se selecciona dentro de ellos a los ocho trabajadores requeridos, en forma proporcional al tamaño
de cada conglomerado, independiente del sexo.
Existen muchas técnicas de muestreo basadas en estos procedimientos básicos. La mayoría de ellos combinan muestreos de
distinto tipo.
11. Variable:
Característica de los sujetos en estudio, que adopta distintas medidas, valores o categorías entre los componentes de una
muestra o población.
Ejemplos:
• Color de automóvil preferido por las mujeres
• Número de hijos por familia
4
• Sistema de previsión social de las personas
• Grado de acuerdo de los ciudadanos con la reforma a la Constitución Política de Chile
12.1. Variable cualitativa: son aquellas en las que las características de los sujetos u objetos estudiados se
expresan en términos cualitativos.
El trabajo estadístico con estas variables implica asignar o ubicar a cada individuo estudiado en una categoría
dentro de un conjunto de dos a más categorías posibles.
Ejemplo: medio de transporte para llegar a su trabajo de los trabajadores del sector comercio. Los valores de la
variable pueden ser Metro, bus, taxi, bicicleta, etc.
12.2. Variable cuantitativa: son aquellas en las que las características de los sujetos u objetos en estudio se
expresan en términos numéricos.
El trabajo estadístico con este tipo de variables implica asignar a cada individuo estudiado un número dentro de un
conjunto de valores numéricos posibles.
Ejemplo: Precio de la bencina en distintas bencineras en un día determinado. Los valores posibles de la variable van
desde $622 hasta $709 (por ejemplo).
La distinción entre variable cualitativa y cuantitativa es relevante a la hora de decidir los procedimientos estadísticos que se
aplicarán a los datos. Los cualitativos no aceptan operaciones matemáticas, mientras que los cuantitativos sí.
13.1. Variable nominal: la variable nominal corresponde a una mera clasificación de los sujetos u objetos en estudio
en categorías cualitativas mutuamente excluyentes.
13.1.1. Variable binomial o dicotómica: clasificación en una de dos categorías posibles, mutuamente
excluyentes.
Por ejemplo: sector geográfico de residencia: Urbano – Rural. Definida así, las personas pueden ser
clasificadas como “urbano” o como “rural”. No hay otra posibilidad.
13.1.2. Variable multinomial: clasificación en una de más de dos categorías posibles, mutuamente excluyentes.
Por ejemplo: Sabor preferido de helado: frutilla, bocado, vainilla, chocolate. Definida así, la preferencia de las
personas pueden ser clasificadas en una de las cuatro posibilidades. No hay otra.
5
13.2. Variable ordinal: corresponde a una clasificación de los sujetos u objetos en estudio en categorías cualitativas
mutuamente excluyentes. Estas categorías presentan distintos grados de presencia o intensidad de la variable,
desde un nivel nulo o muy leve hasta un nivel muy fuerte o máximo.
Por ejemplo: Estado general de salud: Bueno, regular, malo. Es una escala ordinal de tres valores.
Cuando se trabaja con este tipo de variable, es frecuente asignarle a los valores un número que sirve para codificar
y manipular los datos. Por ejemplo, en la escala ordinal de cuatro valores:
Estado general de salud:
4 = Muy Bueno;
3 = Bueno;
2 = Regular;
1 = Malo.
El asignar números a las categorías, sin embargo, no hace de la variable una característica numérica. Lo que se ha
hecho es solamente reemplazar una categoría semántica por un número. La variable sigue siendo cualitativa,
ordinal.
13.3. Variable discreta: En este tipo de variable, la escala de medición da origen a números enteros: -1, 0, 1, 2, etc.
En la variable discreta, no pueden darse números decimales. Solo enteros.
Ejemplo: Nº de hijos por familia: 0, 1, 2, 3, …
13.4. Variable continua: En este tipo de variable, la escala de medición da origen a números reales. Esto significa
que se pueden dar números decimales, lo que implica que existen infinitos valores posibles de la variable.
Ejemplo: Temperatura corporal de los pacientes atendidos en un centro de urgencia: 36,8ºC; 37,5ºC; 39,5ºC, etc.
Binomiales
Nominales
Cualitativas Multinomiales
(alfanuméricas)
Ordinales
Variables
Discretas
Cuantitativas
(numéricas)
Continuas
Muy importante: Lo que se puede y lo que no se puede hacer estadísticamente con los datos, depende del tipo de variable. La
definición clara de las variables en estudio y su correcta y oportuna clasificación es central en el trabajo estadístico, ya que
los procedimientos y técnicas que se empleen para su manipulación, presentación y análisis dependen de ello.
6
15. Las variables en el SPSS
El paquete estadístico SPSS considera tres tipos de variable, bajo la opción “Medida”.
Nominal. Una variable puede ser tratada como nominal cuando sus valores representan categorías que no obedecen
a una ordenación intrínseca.
Ordinal. Una variable puede ser tratada como ordinal cuando sus valores representan categorías con alguna
ordenación intrínseca. Por ejemplo los niveles de satisfacción con un servicio, que vayan desde muy insatisfecho
hasta muy satisfecho.
Escala. Una variable puede ser tratada como de escala cuando sus valores representan categorías ordenadas con
una métrica con significado, por lo que son adecuadas las comparaciones de distancia entre valores. Se trata de
variables con valores numéricos propiamente tales, ya sean discretos o continuos.
Esta escala no es exhaustiva, porque deja fuera las personas que tienen otro sistema previsional y los que no tienen
ningún sistema.
Mejor:
¿Cuál es su sistema de salud?
1: Fonasa
2: Isapre
3: Otro
4: Ninguno
5: No sabe, no responde
Esta escala puede generar problemas, ya que la persona que estudió educación media también estudió educación básica.
Además, tal como está planteada, la escala tampoco es exhaustiva.
Se evita este problema definiendo correctamente la variable y, sobre todo, haciendo correctamente la pregunta:
7
Mejor:
¿Cuál es su último nivel de estudios aprobados?
1: Sin estudios
2: Educación Básica
3: Educación Media
4: Educación Superior
Por ejemplo:
X = Tasa de desempleo; Y = Sector de residencia
X 1 = Tasa de desempleo; X 2 = Sector de residencia
TDES = Tasa de desempleo; SRES = Sector de residencia
3
Ver Kaoru Ishikawa, Qué es el control total de la calidad.
8
-Algo que caracterizó al ex entrenador de la selección nacional de fútbol Marcelo Bielsa, es el estudio estadístico de
los partidos de fúlbol, como herramienta de planificación de partidos. 4
Solución:
La pregunta 36 de este cuestionario es, en verdad, un conjunto de 5 preguntas, cada una de las cuales tiene dos valores
binomiales (SÍ-NO). Por lo tanto la alternativa correcta es: D.
4
Carcuro, Pedro – Abarzúa, Esteban. “Me pongo de pie”. Aguilar, 2009.
9
Solución:
2.1. Objetivo: describir y caracterizar el crecimiento y desarrollo en el primer año de vida de los niños atendidos por el sistema
público de salud en Chile.
2.2. Población: niños atendidos por el sistema público de salud en Chile.
2.3. Muestra: 723 recién nacidos seleccionados al azar en hospitales públicos de la región Metropolitana.
2.4. Variables:
Sexo: variable dicotómica
Peso: variable continua
Talla: variable continua
Circunferencia cefálica: variable continua
Valoración del peso: variable ordinal
Número de hermanos: variable discreta
Edad de la madre: variable continua
3.1. Construya una tabla que muestre la composición de la muestra por sexo y región.
Solución:
Del total de 2.450, se deben repartir, por región, en 20%, 36% y 44%.
10
Ahora, la muestra de cada región se debe dividir entre hombres y mujeres, de acuerdo a lo establecido:
Completando la tabla:
REGIÓN
SEXO Total
Norte Metropolitana Sur
Hombre 262 511 455 1.228
Mujer 228 567 427 1.222
Total 490 1.078 882 2.450
Solución:
Que todos los elementos de la población tengan la misma probabilidad de salir seleccionados, a través de métodos
independientes de la voluntad del investigador.
Es (son) correcta(s):
A) Solo I B) Solo I y II C) Solo II y III D) Solo I y III E) I, II y III
11
3. Consumo de verduras
Se requiere construir preguntas para una encuesta sobre hábitos alimenticios en la población, para lo cual se proponen las
siguientes preguntas:
3.1. De las tres preguntas, ¿cuál(es) de ellas mide el consumo de verduras en forma cualitativa?
A) Ninguna B) Solo I C) Solo II D) Solo I y II E) I, II y III
3.2. De las tres preguntas, ¿cuál(es) de ellas mide el consumo de verduras en escala ordinal?
A) Ninguna B) Solo I C) Solo II D) Solo I y II E) I, II y III
4. Hábitos de estudio
Con el objeto de estudiar los hábitos de estudio de los estudiantes de Educación General Básica (EGB), se selecciona una
muestra de 1.347 estudiantes hombres y 1.058 estudiantes mujeres, de un total de 2.294.567 estudiantes de EGB del año
escolar 2007. La información se obtiene mediante encuesta a los seleccionados.
En el estudio se incluyeron las siguientes variables, con la escala señalada:
X 1 : Tipo de establecimiento: Particular pagado; Particular subvencionado; Municipal; Otro.
X 2 : Número de hermanos que estudian EGB: 0, 1, 2, …
X 3 : Horas de estudio autónomo: horas semanales dedicadas a estudio autónomo.
X 4 : Asistencia a clases: grado de asistencia a clases: 3 = Buena; 2 = Regular; 1 = Mala
X 5 : Género: 1 = Masculino; 2 = Femenino
12
4.2. De la muestra, ¿qué % representa el segmento de estudiantes mujeres?
A) 5,8% B) 27,3%º C) 44,0% D) 56,0% E) 78,5%
4.3. De acuerdo a los datos, aproximadamente, ¿qué proporción representa la muestra seleccionada respecto de la población?
A) 0,105%B) 5,92% C) 4,63% D) 7,85% E) 1,04%
4.4. De las siguientes variables estudiadas:
I: Número de hermanos que estudian EGB
II: Horas de estudio autónomo
III: Asistencia a clases
4.7. En este caso, estudiar una muestra en vez de toda la población, tiene como desventaja:
I: Existe un error o incertidumbre respecto de los resultados
II: En el trabajo con muestras los resultados no son confiables
III: Los resultados tardan mucho en obtenerse
5. En estadística, el trabajo con muestras de una población, en vez de trabajar con toda la población, se fundamenta en que:
I: Muchas veces es imposible acceder a toda la población
II: Se desconoce lo que ocurre en la población
III: El trabajo con muestras tiene un menor costo
13
Es (son) correcta(s):
A) Solo III B) Solo I y II C) Solo II y III D) Solo I y III E) I, II y III
14
ACTIVIDADES, RECURSOS Y FUENTES COMPLEMENTARIAS
Se Sugiere:
1. Visitas al sitio del Instituto Nacional de Estadísticas (INE): se sugiere curiosear qué hace el INE, cuál es su misión, visión y
principios institucionales; qué estudios realiza y qué publica. Por ejemplo, sería interesante ver qué novedades trajo el censo
2012 http://www.ine.cl/
2. Visitar el sitio con explicación y ejemplos de estadística descriptiva básica y glosario. Apropiado para quienes se inician en
el ámbito de la estadística. http://www.cortland.edu/flteach/stats/stat-sp.html
Según las estadísticas, de cada cuatro niños que nacen, uno es chino. Por suerte yo solo
tengo tres hijos.
15