Fabrio Ruiz Estadistica1

Normalmente los primeros estudios estadísticos que se hacían eran los censos,
que son estudios descriptivos sobre todos los integrantes de una población. La
elaboración de censos comenzó en la Edad Antigua, y sigue dándose en nuestros
días. Los censos aportan mucha información, puesto que se pregunta a todo el
mundo, pero su ejecución suele ser cara y lleva mucho tiempo, porque hay que
preguntar a la población y después hay que procesar los datos obtenidos.
Una forma de agilizar la recogida y tratamiento de la información sobre algunas

características de la población era (y es) a través de los registros, que son listados
en los que los ciudadanos tienen que inscribirse cuando por ejemplo nace algún
hijo o hija, hay algún matrimonio o alguna defunción etc.
Con el tiempo y el desarrollo científico surgieron alternativas a los censos: las

encuestas a sólo una parte de la población y la posterior generalización a toda la
población de los resultados obtenidos para la muestra, pero para ello fue
necesario el desarrollo de la Teoría de la Probabilidad (rama de las Matemáticas),
de la Inferencia Estadística y del Muestreo (ramas de la Estadística) que se dio en
la Edad Moderna y Contemporánea. El desarrollo científico y filosófico también
propició la aplicación de la Estadística a las ciencias sociales con fines no
políticos, y además el surgimiento de nuevas técnicas y herramientas amplió las
posibilidades de su uso: aparte de ser estudios descriptivos, la Estadística también
puede emplearse para estudiar y cuantificar relaciones entre variables (análisis de
los datos).
La Historia ofrece gran cantidad de ejemplos de actividad estadística. En antiguas

civilizaciones como Babilonia, Egipto, China, Roma etc. era normal que se
elaboraran recuentos de la población. La estadística aparece incluso en los textos
sagrados de varias religiones. Por ejemplo en la Biblia, en el libro de los Números,
se menciona la elaboración de un censo de población, en el que se anotaría
específicamente los varones mayores de 20 años (aptos para ir a la guerra):
Tomad el encabezamiento de toda la congregación de los hijos de Israel por sus

familias, por las
casas de sus padres, con la cuenta de los nombres, todos los varones por sus
cabezas: 3. De veinte años arriba, todos los que pueden salir á la guerra en Israel,
los contaréis tú y Aarón por suscuadrillas.
(libro de los Números, cap. 1).
A continuación haremos un breve recorrido por las cuatro grandes etapas de la

Historia, y el desarrollo de la Estadística en cada momento
En la Edad Antigua
En la Edad Antigua (aprox. surgimiento de la escritura – Caída del Imperio

Romano en el 476 d.C.) la actividad estadística consistía principalmente en
elaborar censos, tanto de población como de tierras. El objetivo de estos censos
solía ser facilitar la gestión de las labores tributarias, obtener datos sobre el
número de personas que podrían servir en el ejército (normalmente hombres de
ciertas edades) o establecer repartos de tierras u otros bienes. Todas las grandes
civilizaciones: Mesopotamia, Egipto de alguna mantera u otra hicieron recuentos
de su población
En Egipto la actividad estadística comenzó con la Dinastía I, en el año 3050 a.C.

Los faraones ordenaban la ejecución de censos con fines similares a los que
acabamos de describir. El historiador griego Herodoto indica que algunos de los
censos de riqueza y población se hacían para planificar la construcción de las
pirámides. El faraón de la Dinastía XIX Ramses II (1279 – 1213 a.C.) mandó
elaborar un censo para establecer un nuevo reparto de tierras. En China, en el año
2238 a.C. el emperador Yao manda elaborar un censo general que recogió datos
sobre la actividad agrícola, industrial y comercial. En la antigua Grecia también se
realizaron censos para cuantificar la distribución y posesión de la tierra y otras
riquezas, organizar el servicio militar y determinar el derecho a voto de los
ciudadanos.
Los censos y la actividad estadística tuvieron especial importancia en la antigua

Roma. Durante el Imperio Romano se establecieron registros de nacimientos y
defunciones, y se elaboraron estudios sobre los ciudadanos del Imperio, sus
tierras y riquezas. El rey romano Servio Tulio (578 – 535 a.C.) elaboró un catastro
de todos los dominios de Roma. Mandó crear un registro en el que los propietarios
debían inscribir sus fincas, personal de servidumbre, esclavos y bestias de tiro que
se
poseyeran. Los censos se elaboraban cada cinco años (lustrum).
La Edad Media
Durante la Edad Media (aprox. 476 – 1453 d.C.) la estadística no experimentó

grandes avances. Cabe destacar el trabajo de Isidoro de Sevilla quien llevó a cabo
una tarea de recopilación y clasificación de datos de diversa naturaleza cuyos
resultados publicó en la obra Originum sive Etymologiarum. También pueden
citarse varios censos, como el de Carlomagno en 762, para conocer la extensión
de tierras pertenecientes a la Iglesia, o el registro de propiedades, extensión y
valor de las tierras de la Iglesia que se preparó en 1085 por orden de Guillermo I el
Conquistador. En la América prehispánica también se elaboraban censos. Por
ejemplo en lo que actualmente es el país de México, en el año 1116 durante la
segunda migración de las tribus chichimecas el rey Xólotl ordenó que fueran
censados todos sus súbditos. Para contarlos, cada uno tiró una piedra en un
montón al que se llamó Nepohualco; el proceso contabilizó un total de 3.200.000
personas.
Como puede verse con todos estos ejemplos hasta el momento, la actividad
estadística consiste en recopilar información con fines exclusivamente
organizativos. Los otros usos que hoy día tiene la Estadística como el estudio de
relaciones entre variables, predicciones, estudio de poblaciones a través de
muestras etc. aún no se habían desarrollado.
La Edad Moderna
Durante la Edad Moderna (aprox. 1454 – 1789), al igual que en los periodos
anteriores, se continúa con la obtención de información a través de censos. Por
ejemplo en España podemos destacar el Censo de Pecheros (1528), el de los
Obispos (1587), el Censo de los Millones (1591), o el Censo del Conde de Aranda
(1768) entre otros. En Inglaterra la epidemia de peste de la década de 1500
provoca que comiencen a publicarse semanalmente datos sobre defunciones (Bills
of Mortality). Con el tiempo a estos datos de mortalidad se le añadieron datos de
nacimientos por sexo. El comerciante inglés John Graunt está considerado uno de
los fundadores de la estadística moderna. En su obra Natural and political
observations (1662) realiza un análisis de los datos recogidos en las tablas de
mortalidad anteriores; por ejemplo hace predicciones sobre los fallecimientos y
nacimientos que cabría esperar en el futuro. Gaspar Neumann, un profesor
alemán del siglo XVII demostró, basándose en los registros de defunciones de la
época, que la creencia popular de que en los años acabados en siete moría más
gente era falsa.
Los estudios tanto de Graunt como de Neumann son un ejemplo de que en la

Edad Moderna, por un lado, se comienza a hacer análisis de datos, es decir, la
estadística se empieza a usar para algo más que para describir la realidad (hay
tantas personas, de las cuales hay tantas que son mujeres, y tantas en edad de ir
a la guerra etc) sino que también se utiliza para sacar conclusiones; por otro lado
su uso deja de ser exclusivamente político, sino que se amplía a otros campos (el
estudio de Gaspar Neumann no tenía fines políticos, solo pretendía desmentir una
creencia popular). Además, el desarrollo de la Estadística como ciencia con una
base matemática detrás amplió las utilidades de la estadística: cada vez se podían
hacer más cosas con los datos. El desarrollo científico-matemático que se dio en
la Edad Moderna aportó mucho a la Estadística.
Científicos como Copérnico, Galileo, Bacon, Descartes etc. contribuyeron con sus
investigaciones y experimentos al desarrollo del método científico, que es un
conjunto de pautas que debe seguir un estudio para ser considerado científico,
método que luego se usó para analizar fenómenos sociales.
La Edad Contemporánea
En la Edad Contemporánea (aprox. 1789 – actualidad) la estadística continúa

desarrollándose y cada vez más deprisa. Se continúan haciendo estudios de
población tipo censos, por ejemplo, en España podemos destacar el censo de
Floridablanca (1787) y Godoy (1797). En Estados Unidos en 1790 bajo el mandato
del presidente George Washington se elabora el primer censo de población del
país.
En esta época los estudios demográficos, económicos y sociales, tanto si tenían

fines políticos como si no, tienen cada vez más importancia. El desarrollo de las
Matemáticas y de otras ciencias proporcionó técnicas analíticas que permiten
establecer relaciones entre variables, el grado de influencia de una sobre otra y
predicciones. La recogida y procesamiento de la información también experimenta
un avance importante. El desarrollo del Muestreo y la Inferencia estadística hacen
posible que el estudio de la población a través de solo una parte de ella (que se
conoce como muestra), lo que facilita y abarata los procesos de recogida (no hay
que preguntar a tanta gente) y procesamiento de los datos (hay que tratar menos
datos).
El Propósito de la Estadística
Hoy día, la Estadística constituye una herramienta que no puede faltar en el

análisis de datos provenientes de una investigación, porque desde la concepción
de la idea de lo que se va a investigar, pasando por la definición de objetivos,
hipótesis, variables, recolección de los datos, organización, revisión, clasificación,
tabulación y producción de los resultados para su análisis y posibles propuestas o
soluciones a lo planteado, resulta importante saber dar un uso apropiado a las
diferentes medidas y modelos estadísticos para el mencionado análisis a fin de
que los resultados obtenidos representen un verdadero aporte a la solución de los
problemas inherentes al campo en donde se desarrollan las actividades inherentes
a las diferentes investigaciones.
Conceptos Básicos de la Estadística
Los primeros estudios estadísticos eran demográficos así que se ha conservado

gran parte del vocabulario.
 Población: Es el conjunto sobre el que se realizará el estudio

estadístico.
 Individuo o Unidad Estadística: Cada uno de los elementos que
componen la población.
 Muestra: Conjunto representativo de la población pero más pequeño
que esta.
 Muestreo: Es la reunión de los datos sobre una muestra que serán el
objeto de nuestro estudio estadístico.
 Valor: Son todos los resultados que podemos obtener. En el caso de
una moneda serían cara y cruz.
 Dato: Los distintos valores que obtenemos para cada individuo. Si
lanzamos la moneda al aire tres veces obtendríamos 3 datos; por
ejemplo: cruz, cara, cruz.
Importancia de la Estadística
En la actualidad la Estadística se ha constituido en una herramienta importante en

los procesos de investigación, puesto que permite planear la investigación,
recolectar, organizar, representar, interpretar y analizar la información referente a
individuos u observaciones de un fenómeno al cual se le estudian característica en
común, en una población o en una muestra.
El análisis permite describir comportamientos de la información, obtener
conclusiones y dar recomendaciones para la toma de decisiones. Algunos
fenómenos presentan características aleatorias, por lo tanto, es conveniente
estudiar la posibilidad de ocurrencia de eventos relacionados con dicho fenómeno,
a esa posibilidad se le denominara probabilidad. Con su estudio, se analiza los
resultados de los fenómenos o experimentos aleatorios y con ellos es posible
tomar decisiones en presencia de incertidumbre. En cada uno de los experimentos
el interés es asociar números a los resultados de esos experimentos y estos son
los valores para las variables aleatorias; con ellas se construyen los modelos
necesarios para estudiar las situaciones estadísticas con las distribuciones de
probabilidad.
Diferencias entre estadística Descriptiva e Inferencial
Descriptiva Inferencial
Es el conjunto de métodos estadísticos Busca deducir y sacar conclusiones
que describen y/o caracterizan un acerca de situaciones generales más
grupo de datos. allá del conjunto de datos obtenidos.
Métodos empleados para resumir las Métodos que implican el uso de datos
características clave de datos muestrales para hacer
conocidos. generalizaciones o inferencias acerca
de una población.
Se Caracteriza por: Se Caracteriza Por:
Examinar diferencias entre grupos.
Caracterizar un grupo de datos Examinar si las variables están
Examinar tendencias o distribuciones asociadas.
Comparar promedios entre grupos.
Predecir una variable a partir de otra.
Métodos de Análisis Métodos de Análisis
Medidas de tendencia central: 1. t-test
2. Análisis de varianza
1. Media 3. Correlación
2. Mediana 4. Regresión
3. Moda
4. Medidas de variabilidad:
5. Varianza
6. Desviación estándar
7. Rango
8. Frecuencia
Escala de Una Variable
Papel en la pregunta de investigación
Podemos diferenciar las variables en función del papel que desempeñen en

nuestra pregunta de investigación. Si estudiamos la asociación entre dos variables
las denominaremos como dependiente e independiente, respectivamente. La que
recibe el nombre de dependiente (variable resultado o efecto) es aquella que
pensamos viene condicionada por la otra variable, que denominamos
independiente (variable explicativa o de exposición). Por ejemplo, si queremos
estudiar la prevalencia de diabetes en una muestra de población y conocer las
variaciones según la edad y el sexo de sus componentes, la presencia de diabetes
sería la variable dependiente y la edad y el sexo las independientes. Por el
contrario, si estudiamos la influencia de la diabetes sobre los niveles de presión
arterial, esta sería la variable dependiente y la diabetes se consideraría variable
independiente.
Número de valores posibles de su espacio muestral
Son variables continuas las que pueden adoptar un número teóricamente infinito
de valores a lo largo de un continuo (ejemplo: talla, peso). Son discretas cuando
solo son posibles un número finito de valores (ejemplo: número de hijos de una
pareja; esta variable no puede tener fracciones). A la hora de identificar las
variables continuas debemos tener en cuenta que, aunque los valores
teóricamente posibles sean infinitos, muchas muestras contienen valores finitos,
bien por tener escasas observaciones o por falta de precisión en la medición
(ejemplo: medición sin decimales).
Las variables discretas pueden medirse en cualquier escala, aunque

habitualmente se medirán en escalas nominales u ordinales, mientras que las
variables continuas solo pueden medirse en escalas de intervalos y de razones.
Escalas de medición de variables
Uno de los elementos fundamentales de la definición de una variable es el tipo de

escala que utilizaremos para medirla. En función de la escala elegida decidiremos
su codificación, tratamiento informático y estadístico.
Hay cuatro tipos de escalas de medición, que ordenadas en orden creciente de

potencia, según la proporción de información que contienen, son:
Nominal.
Ordinal.
De intervalos.
De razones o ratios.
Escala nominal
Consta de dos o más categorías mutuamente excluyentes. Si solo hay dos, se

llama escala nominal dicotómica. A cada categoría se le suele asignar un número
de código sin significado cuantitativo, lo que facilita su introducción en bases de
datos. En cualquier situación, si se usa una codificación propia, debe tenerse claro
lo que significa cada código para cada variable.
Escala ordinal
Las variables ordinales tienen la cualidad adicional, respecto a la escala nominal,

de que sus categorías están ordenadas por rango; cada clase posee una misma
relación posicional con la siguiente; es decir, la escala muestra situaciones
escalonadas.
Escalas de intervalos
Las escalas de intervalos poseen la cualidad adicional de que los intervalos entre
sus clases son iguales. Diferencias iguales entre cualquier par de números de la
escala indican diferencias también iguales en el atributo sometido a medición.
Veamos un ejemplo: la diferencia de temperatura entre una habitación a 22 grados
centígrados y otra a 26 es la misma que la existente entre dos a 33 y 37 grados
centígrados, respectivamente.
Sin embargo, la razón entre los números de la escala no es necesariamente la

misma que la existente entre las cantidades del atributo. Ejemplo: una habitación a
20 grados no está el doble caliente que otra a 10. Ello se debe a que el cero de la
escala no expresa el valor nulo o ausencia de atributo.
Escalas de razones
Su cualidad adicional es que el cero sí indica ausencia de atributo. En

consecuencia, la razón entre dos números de la escala es igual a la existente
entre las cantidades del atributo medido. Ejemplos:
Peso: medido en kilogramos.
Concentración de glucosa en una muestra: medida en mg/dl.
Tasa de mortalidad: muertes por 1000 personas en riesgo.
Ingresos: medidos en euros.
Las escalas de intervalos y razones se llaman también métricas o dimensionales.

Las variables continuas van a medirse con escalas de razones o intervalos, por lo
que es habitual que nos refiramos a ellas englobándolas como escalas continuas,
ya que comparten estrategias de análisis, como la elección del test estadístico.
Algunos paquetes estadísticos, como SPSS, las denominan simplemente
“escalas”.
Cuando en la recogida de una variable continua (escala de razones o intervalos)

no podemos recoger valores a partir de un límite (por ejemplo: cargas virales
superiores a 100 000), si optamos por mantener esas observaciones en el análisis,
la variable se comporta en ese rango como una variable ordinal.
En la tabla 2 presentamos un resumen de las características de las diferentes
escalas de medida.
Tabla 2. Características de las diferentes escalas de medida de variables.

Mostrar/Ocultar
Elección de las escalas
La selección de una escala estará determinada por la definición operativa de la

variable que hayamos realizado y por los métodos disponibles para medirla. Para
algunas variables solo existirá un tipo de escala elegible, mientras que para la
mayoría tendremos varias alternativas.
En general, siempre que sea posible, interesa utilizar en la recogida de datos la

escala más precisa, aunque no sea la que posteriormente se utilice en el
tratamiento estadístico. Ello nos permitirá adecuar la decisión, una vez conocida la
verdadera distribución de nuestros datos. Por ejemplo, siempre será preferible
recoger el número de cigarrillos que fuma una persona al día que el dato
categorizado como <10, 10-20, >20; la primera estrategia facilitará la búsqueda
durante el análisis de puntos de corte distintos a los empleados a priori.
Cuando se categorizan algunas variables, como la edad o los ingresos

económicos, pasan de ser variables continuas (de intervalos o de razones) a
variables ordinales o nominales, según los puntos de corte elegidos.
Si una variable continua se limita en uno de sus extremos con una categoría
abierta (por ejemplo, carga viral mayor de 100 000), forzamos que tenga que ser
considerada como ordinal.
Las categorías de las variables deben estar clara y operativamente definidas, la

escala debe ser exhaustiva (incluir todas las posibilidades) y las clases
mutuamente excluyentes (cada observación solo puede ser asignada a una
opción). A menudo tendremos que recurrir a categorías complementarias que
cubran todo el espectro como “otras”, “no aplicable” o “desconocido”, o establecer
un orden de prioridades en caso de opciones intermedias.

Fabrio Ruiz Estadistica1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Fabrio Ruiz Estadistica1

Cargado por

Copyright:

Formatos disponibles

Normalmente los primeros estudios estadísticos que se hacían eran los censos,

Una forma de agilizar la recogida y tratamiento de la información sobre algunas

Con el tiempo y el desarrollo científico surgieron alternativas a los censos: las

La Historia ofrece gran cantidad de ejemplos de actividad estadística. En antiguas

Tomad el encabezamiento de toda la congregación de los hijos de Israel por sus

(libro de los Números, cap. 1).

A continuación haremos un breve recorrido por las cuatro grandes etapas de la

En la Edad Antigua (aprox. surgimiento de la escritura – Caída del Imperio

En Egipto la actividad estadística comenzó con la Dinastía I, en el año 3050 a.C.

Los censos y la actividad estadística tuvieron especial importancia en la antigua

poseyeran. Los censos se elaboraban cada cinco años (lustrum).

Durante la Edad Media (aprox. 476 – 1453 d.C.) la estadística no experimentó

Los estudios tanto de Graunt como de Neumann son un ejemplo de que en la

En la Edad Contemporánea (aprox. 1789 – actualidad) la estadística continúa

En esta época los estudios demográficos, económicos y sociales, tanto si tenían

Hoy día, la Estadística constituye una herramienta que no puede faltar en el

Conceptos Básicos de la Estadística

Los primeros estudios estadísticos eran demográficos así que se ha conservado

 Población: Es el conjunto sobre el que se realizará el estudio

En la actualidad la Estadística se ha constituido en una herramienta importante en

Papel en la pregunta de investigación

Podemos diferenciar las variables en función del papel que desempeñen en

Número de valores posibles de su espacio muestral

Las variables discretas pueden medirse en cualquier escala, aunque

Uno de los elementos fundamentales de la definición de una variable es el tipo de

Hay cuatro tipos de escalas de medición, que ordenadas en orden creciente de

Consta de dos o más categorías mutuamente excluyentes. Si solo hay dos, se

Las variables ordinales tienen la cualidad adicional, respecto a la escala nominal,

Sin embargo, la razón entre los números de la escala no es necesariamente la

Su cualidad adicional es que el cero sí indica ausencia de atributo. En

Peso: medido en kilogramos.

Concentración de glucosa en una muestra: medida en mg/dl.

Tasa de mortalidad: muertes por 1000 personas en riesgo.

Ingresos: medidos en euros.

Las escalas de intervalos y razones se llaman también métricas o dimensionales.

Cuando en la recogida de una variable continua (escala de razones o intervalos)

Tabla 2. Características de las diferentes escalas de medida de variables.

Elección de las escalas

La selección de una escala estará determinada por la definición operativa de la

En general, siempre que sea posible, interesa utilizar en la recogida de datos la

Cuando se categorizan algunas variables, como la edad o los ingresos

Las categorías de las variables deben estar clara y operativamente definidas, la

También podría gustarte