Está en la página 1de 22

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA

CENTRO UNIVERSITARIO DE PETÉN


CARRERAS: INGENIERÍA FORESTAL
CURSO: MÉTODOS ESTADÍSTICOS
AÑO: 2019

UNIDAD I. ASPECTOS INTRODUCTORIOS

La palabra Estadística se origina, en las técnicas de recolección, organización,


conservación, y tratamiento de los datos propios de un Estado, con que los antiguos
gobernantes controlaban sus súbditos y dominios económicos. Estas técnicas
evolucionaron a la par con el desarrollo de las matemáticas, utilizando sus herramientas
en el proceso del análisis e interpretación de la información.

En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas que partiendo de
observaciones muestrales o históricas, crean modelos lógico-matemáticos que se
"aventuran" describir o pronosticar un determinado fenómeno con cierto grado de
certidumbre medible.

La estadística es la tecnología del método científico, o que es el conocimiento relacionado


con la toma de decisiones en condiciones de incertidumbre, o que la estadística son
métodos para obtener conclusiones a partir de los resultados de los experimentos o
procesos, o que es un método para describir o medir las propiedades de una población. En
fin, no se trata de discutir si la estadística es una ciencia, una técnica o una herramienta,
sino de la utilización de sus métodos en provecho de la evolución del conocimiento.

La estadística hace inferencias sobre una población, partiendo de una muestra


representativa de ella. Es a partir del proceso del diseño y toma de la muestra desde
donde comienzan a definirse las bondades y confiabilidad de nuestras aseveraciones,
hechas, preferentemente, con un mínimo costo y mínimo error posible.

La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende
mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto
grado de incertidumbre... y la Estadística ayuda en la incertidumbre, trabaja con ella y nos
orienta para tomar las decisiones con un determinado grado de confianza.

1.1. CONCEPTOS BÁSICOS SOBRE ESTADÍSTICA

ESTADÍSTICA: definir la estadística es una tarea difícil porque tendríamos que definir cada
una de las técnicas que se emplean en los diferentes campos en los que interviene. Sin
embargo, diremos, en forma general, que la estadística es un conjunto de técnicas que,
partiendo de la observación de fenómenos, permiten al investigador obtener conclusiones
útiles sobre ellos.

1
La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa
concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al
análisis de estos datos unos significados precisos o unas previsiones para el futuro. La
estadística, en general, es la ciencia que trata de la recopilación, organización
presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma
de decisión más efectiva. Otros autores tienen definiciones de la Estadística semejantes a
las anteriores, y algunos otros no tan semejantes. Para Chacón esta se define como “la
ciencia que tiene por objeto el estudio cuantitativo de los colectivos”; otros la definen
como la expresión cuantitativa del conocimiento dispuesta en forma adecuada para el
escrutinio y análisis.

La más aceptada, sin embargo, es la de Minguez, que define la Estadística como “La ciencia
que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su
intensidad, deducir las leyes que los rigen y hacer su predicción próxima”.

Los estudiantes confunden comúnmente los demás términos asociados con las
Estadísticas, una confusión que es conveniente aclarar debido a que esta palabra tiene tres
significados: la palabra estadística, en primer término se usa para referirse a la información
estadística; también se utiliza para referirse al conjunto de técnicas y métodos que se
utilizan para analizar la información estadística; y el término estadístico, en singular y en
masculino, se refiere a una medida derivada de una muestra.

Podemos resumir que la estadística es la Ciencia que se encarga de la recopilación,


organización, análisis, interpretación, y su resumen, para tomar decisiones razonables en
base a la inferencia de un conjunto de datos.

La estadística se divide en dos grandes ramas de estudio que son: La estadística


descriptiva o deductiva, la cual se encarga de la recolección, clasificación y descripción de
datos muestrales o poblacionales, para su interpretación y análisis, consiste sobre todo en
la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier actividad
relacionada con los datos y está diseñada para resumir o describir los mismos sin factores
pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos,
como tales; y la estadística matemática o inferencial o inductiva, que desarrolla modelos
teóricos que se ajusten a una determinada realidad con cierto grado de confianza. Estas
dos ramas no son independientes; por el contrario, son complementarias y entre ambas
dan la suficiente ilustración sobre una posible realidad futura, con el fin de que quien
tenga poder de decisión, tome las medidas necesarias para transformar ese futuro o para
mantener las condiciones existentes, investiga o analiza una población partiendo de una
muestra tomada.

MÉTODOS ESTADÍSTICOS. Es el conjunto de los métodos que se utilizan para medir las
características de la información, para resumir los valores individuales, y para analizar los
datos a fin de extraerles el máximo de información, es lo que se llama métodos
estadísticos.

2
En estadística, la materia prima son los datos y el producto final son un conjunto de
conclusiones sobre el fenómeno que ha originado esos datos. Un dato es un valor concreto
que toma una variable en un momento dado en un individuo. Los individuos serán los
objetos de los que obtenemos los datos. Los individuos pueden ser desde personas a
simples objetos. Denominaremos variable a la característica de interés, y que puede tomar
un valor diferente en cada individuo. Si la característica de interés tomase siempre el
mismo valor, ya no sería una variable, sino una constante. Una variable podría tomar
valores diferentes incluso en un mismo individuo, si las condiciones cambiasen cada vez
que repetimos la medición de la variable.

DATOS: en estadística, la materia prima son los datos y el producto final son un conjunto
de conclusiones sobre el fenómeno que ha originado esos datos. Un dato es un valor
concreto que toma una variable en un momento dado en un individuo, siendo sus
medidas, valores o características susceptibles de ser observados y contados. Los
individuos serán los objetos de los que obtenemos los datos. Los individuos pueden ser
desde personas a simples objetos.

Un dato es el valor observado de una variable en un individuo en una medición. Se suele


decir también que un dato es la realización de una variable. Por ejemplo, una variable
puede ser la temperatura de una habitación, y un dato será la temperatura de una
habitación en un instante dado. La estatura es una variable, y mi estatura es un dato. A
efectos de lo que nos interesa en estadística, los datos se pueden clasificar según varios
criterios.

Datos individuales

Un dato individual es un dato de un solo individuo, mientras que un dato estadístico es un


dato de una muestra o de una población en su conjunto. Por ejemplo, la edad de Juan es
un dato individual, mientras que el promedio de edades de una muestra o población de
personas es un dato estadístico.

Desde ya, puede ocurrir que ambos no coincidan: la edad de Juan puede ser 37 años, y el
promedio de edades de la muestra donde está incluido Juan es 23 años.

Por esta razón un dato estadístico nada dice respecto de los individuos, porque solamente
describe la muestra o población.

Datos estadísticos

Los datos estadísticos que describen una muestra suelen llamarse estadísticos (por
ejemplo, el promedio de ingresos mensuales de las personas de una muestra), mientras
que los datos estadísticos descriptores de una población suelen llamarse parámetros (por
ejemplo, el promedio de ingresos mensuales de las personas de una población).

3
Los datos estadísticos no son otra cosa que el producto de las observaciones efectuadas en
las personas y objetos en los cuales se produce el fenómeno que queremos estudiar. Dicho
en otras palabras, son los antecedentes (en cifras) necesarios para llegar al conocimiento
de un hecho o para reducir las consecuencias de este. Los datos estadísticos se pueden
encontrar de forma no ordenada, por lo que es muy difícil en general, obtener
conclusiones de los datos presentados de esta manera. Para poder obtener una precisa y
rápida información con propósitos de descripción o análisis, estos deben organizarse de
una manera sistemática; es decir, se requiere que los datos sean clasificados. Esta
clasificación u organización puede muy bien hacerse antes de la recopilación de los datos.

Ejemplo: si se quiere conocer las características de los estudiantes del CUDEP, la


recolección de la información debe clasificar a cada estudiante sobre la base de: Carrera
que estudia, edad, semestre de estudios, etc. Vemos pues que la clasificación marca la
pauta de la clase de datos que debe ser obtenido.

Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos, cronológicos y


geográficos.

Datos Cualitativos. Cuando los datos son cualitativos, la diferencia entre ellos es de
clase y no de cantidad. Ejemplo: Si deseamos clasificar los estudiantes que cursan la
materia de estadística I por su estado civil, observamos que pueden existir solteros,
casados, divorciados, viudos.

Datos cuantitativos. Cuando los valores de los datos representan diferentes magnitudes,
decimos que son datos cuantitativos. Ejemplo: se clasifican las estudiantes de Turismo de
acuerdo a sus notas, observamos que los valores (nota) representan diferentes
magnitudes.

Datos cronológicos. Cuando los valores de los datos varían en diferentes instantes o
períodos de tiempo, los datos son reconocidos como cronológicos. Ejemplo: al registrar los
promedios de notas de los Alumnos de turismo o de forestal en los diferentes semestres.

Datos geográficos. Cuando los datos están referidos a una localidad geográfica se dicen
que son datos geográficos. Ejemplo: el número de estudiantes de educación superior en
las distintas regiones del país.

LOS DATOS Y SU ESTRUCTURA

Los datos son la materia prima con que trabaja la estadística, del mismo modo que la
madera es la materia prima con que trabaja el carpintero. Así como este procesa o
transforma la madera para obtener un producto útil, así también el estadístico procesa o
transforma los datos para obtener información útil. Tanto los datos como la madera no se
inventan: se extraen de la realidad; en todo caso el secreto está en recoger la madera o los
datos más adecuados a los objetivos del trabajo a realizar.

4
De una manera general, puede definirse técnicamente dato como una categoría asignada
a una variable de una unidad de análisis.

Por ejemplo, "Luis tiene 1.70 metros de estatura" es un dato, donde ‘Luis’ es la unidad de
análisis, ‘estatura’ es la variable, y ‘1.70 metros’ es la categoría asignada.

Como puede apreciarse, todo dato tienen al menos tres componentes: una unidad de
análisis, una variable y una categoría.

La unidad de análisis es el elemento del cual se predica una propiedad y característica.


Puede ser una persona, una familia, un animal, una sustancia química, o un objeto como
una dentadura o una mesa.

La variable es la característica, propiedad o atributo que se predica de la unidad de


análisis.

Por ejemplo, la edad de una persona, el grado de cohesión para una familia, el nivel de
aprendizaje alcanzado para un animal, el peso específico para una sustancia química, el
nivel de salud para una dentadura, y el tamaño para una mesa.

Pueden entonces también definirse población estadística (o simplemente población) como


el conjunto de datos acerca de unidades de análisis (individuos, objetos) en relación a una
misma característica, propiedad o atributo (variable).

Sobre una misma población demográfica pueden definirse varias poblaciones de datos,
una para cada variable. Por ejemplo, en el conjunto de habitantes de un país (población
demográfica), puede definirse una población referida a la variable edad (el conjunto de
edades de los habitantes), a la variable ocupación (el conjunto de ocupaciones de los
habitantes), a la variable sexo (el conjunto de condiciones de sexo de los habitantes).

La categoría es cada una de las posibles variaciones de una variable. Categorías de la


variable sexo son masculino y femenino, de la variable ocupación pueden ser arquitecto,
médico, etcétera, y de la variable edad pueden ser 10 años, 11 años, otras más.

Cuando la variable se mide cuantitativamente, es decir cuando se expresa numéricamente,


a la categoría suele llamársele valor. En estos casos, el dato incluye también una unidad de
medida, como por ejemplo años, cantidad de hijos, grados de temperatura, cantidad de
piezas dentarias, centímetros, etc. El valor es, entonces, cada una de las posibles
variaciones de una variable cuantitativa.

FUENTES DE DATOS ESTADÍSTICOS

Los datos estadísticos necesarios para la comprensión de los hechos pueden obtenerse a
través de fuentes primarias y fuentes secundarias.

5
Fuentes de datos primarias. Es la persona o institución que ha recolectado directamente
los datos.

Fuentes secundarias. Son las publicaciones y trabajos hechos por personas o entidades
que no han recolectado directamente la información. Las fuentes primarias más
confiables, son las efectuadas por oficinas gubernamentales encargadas para tal fin.

En la práctica, es aconsejable utilizar fuentes de datos primarias y en última instancia


cuando estas no existan, usar estadísticas de fuentes secundarias. Con este último tipo no
debemos pasar por alto que la calidad de las conclusiones estadísticas depende en grado
sumo de la exactitud de los datos que se recaben. De nada serviría usar técnicas
estadísticas precisas y refinadas para llegar a conclusiones valederas, si estas técnicas no
son aplicadas a datos adecuados o confiables.

Cuando un investigador quiere obtener datos estadísticos relativo a un estudio que desea
efectuar, puede elegir entre una fuente primaria o en su defecto, una secundaria. O
recopilar los datos por sí mismo. La posibilidad mencionada en último término podrá
deberse bien a la inexistencia de los datos o bien a que estos no se encuentran
discriminados en la forma requerida.

Ejemplo: si un investigador quiere conocer el número de alumnos repitentes en educación


media, clasificados por ciclos, para los últimos diez años, el investigador puede usar una
fuente primaria, tal como la memoria y cuenta que recopila el Ministerio de Educación
cada año.

Método para la colección de datos. En estadística se emplean una variedad de métodos


distintos para obtener información de los que se desea investigar. Discutiremos aquí los
métodos más importantes, incluyendo las ventajas y limitaciones de estos.

La entrevista personal. Los datos estadísticos necesarios para una investigación, se reúnen
frecuentemente mediante un proceso que consiste en enviar un entrevistador o agente,
directamente a la persona investigada. El investigador efectuará a esta persona una serie
de preguntas previamente escritas en un cuestionario o boleta, donde anotará las
respuestas correspondientes. Este procedimiento que se conoce con el nombre de
entrevista personal, permite obtener una información más veraz y completa que la que
proporcionan otros métodos, debido a que al tener contacto directo con la persona
entrevistada, el entrevistador podrá aclarar cualquier duda que se presente sobre el
cuestionario o investigación.

Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje de las
preguntas al nivel intelectual de las personas entrevistadas.

6
Una de las desventajas de este método se debe a que si el entrevistador no obra de buena
fé o no tiene un entrenamiento adecuado, puede alterar las respuestas por las personas
entrevistadas. Otra desventaja es su alto costo, ya que resulta bastante oneroso el
entrenamiento de los agentes o entrenadores y los supervisores de estos, sobre todo si se
trata de una investigación extensa.

Cuestionarios por correo. Consiste en enviar por correo el cuestionario acompañado por
el instructivo necesario, dando en este no solo las instrucciones pertinentes para cada una
de las preguntas, sino también una breve explicación del objeto de la encuesta con el fin
de evitar interpretaciones erróneas.

Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento, puesto
que no hay que incluir gastos de entrenamiento de personal, el único gasto sería el de
franqueo postal.

Dentro de las desventajas de este procedimiento podemos señalar que solo un porcentaje
bastante bajo de estos es devuelto, en algunos casos no estamos seguros de que los
formularios hayan sido recibidos por sus destinatarios y que hayan sido respondido por
ellos mismos. Lo que trae como consecuencia que la información se obtenga con una serie
de errores difíciles de precisar por el investigador.

Entrevista por teléfono. Como lo indica su nombre, este método consiste en telefonear a
la persona a entrevistar y hacerle una serie de preguntas. Este método es bastante simple
y económico, ya que el entrenamiento y supervisión de las personas encargadas de
efectuar las preguntas es siempre fácil.

Entre las limitaciones que presenta este método podemos señalar el número de preguntas
que pueden formularse es relativamente limitado; además las investigaciones efectuadas
por este método tienen un carácter selectivo, debido a que muchas de las personas que
potencialmente podrían ser investigadas no posee servicio telefónico, por lo que quedan
sin la posibilidad de ser entrevistados.

POBLACIÓN: es el conjunto de todos los datos posibles de una variable. O sea, es el


universo colectivo o el conjunto de todos los elementos, medidas, individuos u objetos
que tienen una característica común, o el mayor grupo de elementos, individuos, datos,
por los cuales se tiene cierto interés en un momento dado. O sea, el conjunto de todos los
individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno
que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la
población será el total de las viviendas de dicha ciudad. O el caso de un aula de 83
alumnos, la población de estaturas son las 83 estaturas. Las poblaciones se pueden dividir
o considerar en base al número de valores o datos: poblaciones finitas y poblaciones
infinitas.

7
Poblaciones finitas: tiene un número finito o fijo de elementos o valores.

Poblaciones infinitas: poblaciones que tienen o poseen un número indeterminado o muy


grande de valores o elementos.

MUESTRA: subconjunto que seleccionamos de la población, sea es un subconjunto de la


población o parte de ésta, que se puede seleccionar científicamente o por medio de
cálculo matemático. Por medio de una o varias muestras se puede inferir informaciones de
interés de una población. De la población se extrae una o más muestras. Por ejemplo, en
el aula de 83 alumnos, una muestra de estaturas sería la estatura de sólo 20 de ellos. Así,
si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información
sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele
seleccionar un subgrupo (muestra) que se entienda que es suficientemente
representativo.

Muestreo
Esto no es más que el procedimiento empleado para obtener una o más muestras de una
población; el muestreo es una técnica que sirve para obtener una o más muestras de
población.

Este se realiza una vez que se ha establecido un marco muestral representativo de la


población, se procede a la selección de los elementos de la muestra aunque hay muchos
diseños de la muestra.

Al tomar varias muestras de una población, las estadísticas que calculamos para cada
muestra no necesariamente serían iguales, y lo más probable es que variaran de una
muestra a otra.

Ejemplo:
Consideremos como una población a los estudiantes de educación de la Escuela
San Carlos, determinando por lo menos dos caracteres ser estudiados en dicha población:
 Religión de los estudiantes
 Sexo.

Censo
Se entiende por censo aquella numeración que se efectúa a todos y cada uno de
los caracteres componentes de una población. Para Levin & Rubin (1996) “Algunas veces
es posible y práctico examinar a cada persona o elemento de la población que deseamos
describir. A esto lo llamamos una numeración completa o censo. Utilizamos el muestreo
cuando no es posible contar o medir todos los elementos de la población.
Si es posible listar (o enumerar) y observar cada elemento de la población, los
censos se utilizan rara vez porque a menudo su compilación es bastante difícil, consume
mucho tiempo por lo que resulta demasiado costoso.

8
Encuesta
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son
observaciones parciales. El diseño de encuestas es exclusivo de las ciencias sociales y
parte de la premisa de que si queremos conocer algo sobre el comportamiento de las
personas, lo mejor, más directo y simple es preguntárselo directamente a ellas. (Cadenas,
1974). Según Antonio Napolitano “La encuesta, es un método mediante el cual se quiere
averiguar. Se efectúa a través de cuestionarios verbales o escritos que son aplicados a un
gran número de personas”.

INDIVIDUO: cualquier elemento que porte información sobre el fenómeno que se estudia.
Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si
estudiamos el precio de la vivienda, cada vivienda es un individuo.

PARÁMETRO: Son todas aquellas medidas que describen numéricamente la característica


de una población, y son representadas por letras griegas, como la µ (media aritmética), σ²
(varianza), σ (desviación estándar), y otras.

ESTADÍSTICO: Son todas aquellas medidas que describen numéricamente la características


de una muestra, y son representadas por letras de nuestro alfabeto, como (media
aritmética), S² (varianza), S (desviación estándar), y otras.

VARIABLE: denominaremos variable a la característica de interés, y que puede tomar un


valor diferente en cada individuo, la que cambiando de individuo a individuo. Si la
característica de interés tomase siempre el mismo valor, ya no sería una variable, sino una
constante. Una variable podría tomar valores diferentes incluso en un mismo individuo, si
las condiciones cambiasen cada vez que repetimos la medición de la variable.

Las variables pueden ser de dos tipos:

Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo:


nacionalidad, color de la piel, sexo).

Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos


anuales).

Las variables también se pueden clasificar en:

Variables unidimensionales: sólo recogen información sobre una característica (por


ejemplo: edad de los alumnos de una clase).

Variables bidimensionales: recogen información sobre dos características de la población


(por ejemplo: edad y altura de los alumnos de una clase).

9
Variables pluridimensionales: recogen información sobre tres o más características (por
ejemplo: edad, altura y peso de los alumnos de una clase).

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.), relacionadas al proceso de
contar. Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo,
nunca podrá ser 3.45). Las variables discretas serán aquellas que pueden tomar solo un
número limitado de valores separados y no continuos; son aquellas que solo toman un
determinado números de valores, porque entre dos valores consecutivos no pueden
tomar ningún otro; por ejemplo el número de estudiantes de una clase es una variable
discreta ya que solo tomará los valores 1, 2, 3, 4... Nótese que no encontramos valor como
1.5 estudiantes

Una variable discreta es aquella en la cual, dados dos valores consecutivos, no puede
adoptar ningún valor intermedio (por ejemplo entre 32 y 33 dientes, no puede hablarse de
32.5 dientes). No obstante en muchos casos el tratamiento estadístico hace que a
variables discretas las trabajemos como si fuesen continuas y viceversa.

Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la
velocidad de un vehículo puede ser 80.3 km/h, 94.57 Km./h...etcétera.

Las variables continuas se caracterizan por el hecho de que para todo par de valores
siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado
para realizar un trabajo, etcétera). Una variable es continua, cuando puede tomar infinitos
valores intermedios dentro de dos valores consecutivos. Por ejemplo, la estatura, el peso,
la temperatura.

Ejemplo: En una escuela de educación pública se procedió a recoger las medidas de talla y
peso de los niños que a párvulos.
Niño Peso (lb.) Talla (m.)
José 48.30 1.15
Julio 50.50 1.20
Pedro 55.00 1.10
Luis 45.70 1.18

Una variable es continua cuando, dados dos valores consecutivos, la variable puede
adoptar muchos valores intermedios (por ejemplo entre 1 y 2 metros, puede haber
muchas longitudes posibles).

1.2. HISTORIA DE LA ESTADÍSTICA

Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones
lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población

10
y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y
población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo
Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.

En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos


estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra
parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de
conocer el número de la población.

También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron
censos periódicamente con fines tributarios, sociales (división de tierras) y militares
(cálculo de recursos y hombres disponibles). La investigación histórica revela que se
realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y
ponderar la potencia guerrera.

Pero fueron los romanos, maestros de la organización política, quienes mejor supieron
emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población
y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y
matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas
en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos
empadronamientos de la población bajo la autoridad del imperio.

Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas
operaciones estadísticas, con la notable excepción de las relaciones de tierras
pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en
el 762 D.C. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos.
En Inglaterra, Guillermo el Conquistador recopiló el Domesday Book o libro del Gran
Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras
de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra.

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de


revivir la técnica romana, los métodos estadísticos permanecieron casi olvidados durante
la Edad Media.

Durante los siglos XV, XVI, y XVII, hombres como Leonardo da Vinci, Nicolás Copérnico,
Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron grandes
operaciones al método científico, de tal forma que cuando se crearon los Estados
Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de
aplicarse a los datos económicos.

Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor
que Enrique VII tenía por la peste. Más o menos por la misma época, en Francia la ley
exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios. Durante un
brote de peste que apareció a fines de la década de 1500, el gobierno inglés comenzó a

11
publicar estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en
1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y
fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que abarcaban
treinta años y efectuó predicciones sobre el número de personas que morirían de varias
enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabría
esperar. El trabajo de Graunt, condensado en su obra Natural and Political
Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales ...
Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis
estadístico.

Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los
recursos nacionales, comprensiva de datos sobre organización política, instrucciones
sociales, comercio y poderío militar. Durante el siglo XVII aportó indicaciones más
concretas de métodos de observación y análisis cuantitativo y amplió los campos de la
inferencia y la teoría Estadística.

Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica
como resultado de la especulación sobre si la población aumentaba, decrecía o
permanecía estática.

En los tiempos modernos tales métodos fueron resucitados por algunos reyes que
necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos
países. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar
en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau.
Este investigador se propuso destruir la antigua creencia popular de que en los años
terminados en siete moría más gente que en los restantes, y para lograrlo hurgó
pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de
partidas de defunción pudo demostrar que en tales años no fallecían más personas que en
los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés
Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida
humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan
todas las compañías de seguros.

Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres,
Lagrange y Laplace desarrollaron la teoría de probabilidades. No obstante durante cierto
tiempo, la teoría de las probabilidades limitó su aplicación a los juegos de azar y hasta el
siglo XVIII no comenzó a aplicarse a los grandes problemas científicos.

Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra


estadística, que extrajo del término italiano statista (estadista). Creía, y con sobrada razón,
que los datos de la nueva ciencia serían el aliado más eficaz del gobernante consciente. La
raíz remota de la palabra se halla, por otra parte, en el término latino status, que significa
estado o situación; esta etimología aumenta el valor intrínseco de la palabra, por cuanto la
estadística revela el sentido cuantitativo de las más variadas situaciones.

12
Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la
teoría de la probabilidad para su uso en las ciencias sociales y resolver la aplicación del
principio de promedios y de la variabilidad a los fenómenos sociales. Quételect fue el
primero en realizar la aplicación práctica de todo el método estadístico, entonces
conocido, a las diversas ramas de la ciencia.

Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos


fundamentales para la teoría estadística; la teoría de los errores de observación, aportada
por Laplace y Gauss; y la teoría de los mínimos cuadrados desarrollada por Laplace, Gauss
y Lagendre. A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por
Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las
variables. De aquí partió el desarrollo del coeficiente de correlación creado por Karl
Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H. Hooker y
G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.

Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo


del cálculo de probabilidades, particularmente en la rama denominada indeterminismo o
relatividad, se ha demostrado que el determinismo fue reconocido en la Física como
resultado de las investigaciones atómicas y que este principio se juzga aplicable tanto a las
ciencias sociales como a las físicas.

1.3. CONCEPTOS MATEMÁTICOS BÁSICOS PARA LA ESTADÍSTICA

La estadística generalmente se apoya en la aritmética y el álgebra elemental, con aplicaciones


de cálculo integral y diferencial en la parte de la inferencia. De uso frecuente tenemos
algunas propiedades de la suma, tal como:
Propiedad conmutativa: si a y b representan dos números reales: a + b = b + a.
Propiedad asociativa: si a, b y c representan tres números reales: (a + b) + c = a + (b + c).
Propiedad distributiva: si a, b y n representan tres números reales: n(a + b) = na + nb.
Propiedad neutro aditivo: el cero es el único número neutro en la operación aritmética de la
suma: a + 0 = 0 + a = a.

Se incluye también los teoremas o propiedades de la Notación Sumatoria; así como algunos
casos de factorización, las funciones y otras más, incluyendo la Teoría de Conjuntos. Se les
recomienda estudiar sobre conjuntos visto en el ciclo básico y en la primaria.

La sumatoria y sus propiedades

La notación sumatoria significa sumar todos los valores obtenidos de una colección de
información transformados en datos, incluyendo algunas constantes y de acuerdo a la
operación solicitada y aplicando las propiedades matemáticas. Para este caso los
matemáticos la han creado como:

13
Σ que se lee: sumatoria cuando i es igual a 1 hasta m
i=1

Revisar sus calculadoras electrónicas, para conocer donde están las funciones. Algunos
programas de cómputo traen incorporadas la notación sumatoria, como el caso de la hoja
electrónica Excel de Microsoft Office versión 2012.

Función

Sean los X & Y, una función de X hacia Y, es una regla que asigna a cada elemento x del
conjunto X un elemento y del conjunto Y y sólo uno. Esto se expresa y = f(x), y se lee: y es
función de x; en donde x es la variable independiente, e y es la variable dependiente.

Por ejemplo: si se contrata una persona por un salario de Q 3,000.00 semanales más cada Q
200.00 por propinas de cada equipo industrial armado; en esta forma de pago, el salario es
función de las propinas, y la ley de dependencia o de correspondencia es:
P = 3,000 + 200(x).
En donde: P es el pago (variable dependiente) y x el número de equipos armados (variable
independiente).

Ejemplo. Si en cierta semana el trabajador produjo 9 equipos, hallar el valor del pago.
P = 3,000 + 200(9) = 3,000 + 1800 = 4,800.

1.4. NÚMEROS, MEDIDAS Y ESCALAS DE VALORES

Los números son utilizados por la Estadística para medir las variables como parte del estudio
cuantitativo de lo colectivo, para expresar sus categorías o sus intensidades.

Números cardinales o continuos: expresan cantidades, como por ejemplo: 10 metros, 10


pájaros, 10 personas, 10 árboles, 10 colores, etc.

Números ordinales: son números que expresan propiedad de orden, que nos indica que un
número es menor que otro, igual o mayor que otro, por lo que nos interesa solamente el
orden que ocupan en un conjunto numérico o de datos. En un edificio de cinco niveles, se
mide de abajo hacia arriba, desde el primero hasta el quinto, por lo que se establece un
orden.

Números nominales: estos números nos sirven para nombrar o nominar, que carecen de
propiedades aritméticas ni de orden. Ejemplo: el numero telefónico 79262336, no
representa una cantidad, sino un número que identifica a una persona; el número 1 de un
equipo de balompié, no representa una cantidad ni orden alguno, pero puede decirse que es
el portero del equipo u ocupar otro puesto.

LA MEDICIÓN

14
Los datos se obtienen a través un proceso llamado medición. Desde este punto de vista,
puede definirse medición como el proceso por el cual asignamos una categoría (o un
valor) a una variable, para determinada unidad de análisis.

Ejemplo: cuando decimos que Martín es varón, estamos haciendo una medición, porque
estamos asignando una categoría (varón) a una variable (sexo) para una unidad de análisis
(Martín).

Se pueden hacer mediciones con mayor o menor grado de precisión. Cuanto más precisa
sea la medición, más información nos suministra sobre la variable y, por tanto, sobre la
unidad de análisis. No es lo mismo decir que una persona es alta, a decir que mide 1.83
metros.

Los diferentes grados de precisión o de contenido informativo de una medición se suelen


caracterizar como niveles de medición. Típicamente se definen tres niveles de medición, y
en cada uno de ellos la obtención del dato o resultado de la medición será diferente, para
el efecto, utilizamos las escalas o niveles de valores de los números.

MEDIDA DE LAS VARIABLES Y SUS ESCALAS O NIVELES DE VALORES

Escala Nominal: La escala de medida nominal, puede considerarse la escala de nivel más
bajo de precisión, y consiste en la asignación, puramente arbitraria de números o símbolos
a cada una de las diferentes categorías en las cuales podemos dividir el carácter que
observamos, sin que puedan establecerse relaciones entre dichas categorías, a no ser el de
que cada elemento pueda pertenecer a una y solo una de estas categorías. Se utilizan
para categorías de variables nominales.

Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma
sean equivalentes respecto del atributo o propiedad en estudio, después de lo cual se
asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se
le atribuyan números, puede ser una de las razones por las cuales se le conoce como
“medidas nominales”.

Por ejemplo, podemos estar interesados en clasificar los


estudiantes de la Universidad de San Carlos de acuerdos a la
carrera que cursan.

15
Carrera Número asignada a la categoría

Arqueología 1

Agropecuaria 2

Bosques 3

Turismo 4

Se ha de tener presente que los números asignados a cada categoría sirven única y
exclusivamente para identificar la categoría y no poseen propiedades cuantitativas.

Otros ejemplos puede ser el tener que investigar y categorizar entre macho o hembra, por
lo que se estratifica, y los animales que pertenezcan a una sola categoría se estarían
ubicando dentro de la variable dicotómica macho o en la de hembra, pero no en ambas ni
en ninguna de éstas; aunque tengan grados de diferencia entre las categorías se toman
sólo dos categorías, es decir se dicotomiza artificialmente.

El número de eventos u objetos que pertenecen a una categoría se llama frecuencia.

16
Escala Ordinal: en caso de que puedan detectarse diversos grados de un atributo o
propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces
puede recurrirse a la propiedad de “orden” de los números asignándolo a los
objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de
B, puede inferirse que A posee un mayor grado de atributo que B.

La asignación de números a las distintas categorías no puede ser completamente


arbitraria, debe hacerse atendiendo al orden existente entre éstas.

Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de
poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de
posición, como por ejemplo la mediana.

Ejemplo: al asignar un número a los pacientes de una consulta médica, según el orden de
llegada, estamos llevando una escala ordinal, es decir que al primero en llegar le
asignamos el Nº 1, al siguiente el Nº 2 y así sucesivamente, de esta forma, cada
número representará una categoría en general, con un solo elemento y se puede
establecer relaciones entre ellas, ya que los números asignados guardan la misma
relación que el orden de llegada a la consulta.

Se establece una relación de orden entre las variables, además de la relación de


equivalencia dentro de las categorías, se establece una relación de orden entre
ellas, utilizando números ordinales. La escala ordinal exige orden entre las
categorías antes de iniciar cualquier medición.

Escala Cardinal: es más refinada en precisión que la ordinal y por consiguiente, que la
nominal, el nivel científico más alto es el de la cuantificación, y a este nivel para medir
escalas asociadas, se emplean los números cardinales; teniendo dos tipos: escalas de
intervalos y escalas de razón.

17
Escala de intervalos: la escala de intervalos iguales, está caracterizada por una unidad de
medida común y constante que asigna un número igual al número de unidades
equivalentes a la de la magnitud que posea el elemento observado. Es importante
destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningún momento ausencia de la magnitud que estamos midiendo.
Esta escala, además de poseer las características de la escala ordinal,
encontramos que la asignación de los números a los elemento es tan precisa que
podemos determinar la magnitud de los intervalos (distancia) entre todos los
elementos de la escala. Sin lugar a dudas, podemos decir que la escala de
intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que
posean esta escala de medida pueden calculársele todas las medidas estadísticas a
excepción del coeficiente de variación. O sea, que la escala de intervalos es aquella
que utiliza como cero un valor arbitrario.

Ejemplo: El lapso transcurrido entre 1998-1999 es igual al que transcurrió entre 2000-
2001.

Escala de Cocientes o Razones:

El nivel de medida más elevado es el de cocientes o razones, y se diferencia de las escalas


de intervalos iguales únicamente por poseer un punto cero propio como origen; es
decir, que el valor cero de esta escala significa ausencia de la magnitud que
estamos midiendo. Si se observa una carencia total de propiedad, se dispone de
una unidad de medida para el efecto. A iguales diferencias entre los números
asignados corresponden iguales diferencias en el grado de atributo presente en el
objeto de estudio. Además, siendo que cero ya no es arbitrario, sino un valor
absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la
propiedad presente en B.

O sea, que la escala de razones o cocientes es aquella que utiliza un cero real.

Ejemplo: En una encuesta realizada en un barrio de esta localidad se observó que hay
familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de
hijos que aquellas que tienen 3 hijos.

Ejemplos de datos en diferentes niveles de medición:

Nivel de Nivel nominal Nivel ordinal Nivel Nivel


medición cuantit cuantitativo
ativo continuo
discret
o

DATO Martín es Elena terminó Juan María tiene 70

18
electricista la secundaria tiene pulsaciones por
32 minuto
dientes

Unidad de Martín Elena Juan María


análisis

Variable Oficio Nivel de Cantid Frecuencia


instrucción ad de cardiaca
piezas
dentari
as

Categoría o Electricista Secundaria 32 70


valor completa

Unidad de ------------- ------------ Diente Pulsaciones por


medida minuto

En el nivel nominal, medir significa simplemente asignar un atributo a una unidad de


análisis (Martín es electricista).

En el nivel ordinal, medir significa asignar un atributo a una unidad de análisis cuyas
categorías pueden ser ordenadas en una serie creciente o decreciente (la categoría
‘secundaria completa’ puede ordenarse en una serie, pues está entre ‘secundaria
incompleta’ y ‘universitaria incompleta’).

En el nivel cuantitativo, medir significa además asignar un atributo a una unidad de análisis
de modo tal que la categoría asignada permita saber ‘cuánto’ mayor o menor es respecto
de otra categoría, es decir, especifica la distancia o intervalo entre categorías (la categoría
70 es el doble de la categoría 35).

1.5. VERDADERO VALOR DE LAS MEDICIONES, COCIENTES, PROPORCIONES Y PORCENTAJES

Verdadero valor de las mediciones: dos son las formas de reunir datos acerca de las
variables: si éstos son cuantitativos, se cuenta (contabiliza) el número de casos que tienen
cierta característica, y si son variables cualitativas, se miden utilizando una escala cardinal.

En las variables cualitativas, no pueden haber fracciones entre los enteros, ya que es poco
útil, tal como decir que en existen en un hato ganadero 20.3 vacas, que se denominan
variables continuas.

En las variables cuantitativas, pueden existir fracciones entre las variables, tal como la

19
medición de una longitud, que puede ser: 30.78 metros, que se les denomina también como
variables continuas.

Dependiendo de la escala de valores que utilice así será el verdadero valor de la medición
que se efectúe, para lo que es necesario considerar la aproximación, en preferencia que la
apreciación, que sería para el caso de medir una longitud, en metros, centímetros,
milímetros, pies, yardas, pulgadas u otra dimensional que se le puede aportar a la medición
que se lleve a cabo. La aproximación es objetiva y la apreciación es subjetiva.

Redondeo: Para el redondeo de cifras decimales, se aplica la regla del computador que dice:
cualquier número que desee aproximarse hasta cierto número de cifras convencionalmente
fijado, debe:
a) incrementarse en una unidad el último dígito fijado, si los que siguen exceden el
valor de 5 …
b) no cambiar el último dígito, si los que siguen son menores que el valor de 5 …
c) si los dígitos que siguen al último fijado son exactamente el valor 5 y el último es
impar, incrementarlo en una unidad; lógicamente, si es par no se incrementa.
Ejemplos: redondear a 4 decimales los siguientes números:

1.- 3.5614326 = 3.5614.


2.- 7.6166501 = 7.6166.
3.- 0.751450 = 0.7514.
4.- 0.193751 = 0.1938.

Razones, proporcionalidades, proporciones y porcentajes

Razón: es una relación entre dos cantidades que permite compararlas, que puede ser por
diferencia o aritmética y por cociente o geométrica. Ejemplo: siendo a y b dos números,
establecer razones por diferencia y por conciente:
a – b, razón aritmética o por diferencia.

a/b, razón geométrica o por cociente.

Proporcionalidad: la razón por cociente es la proporcionalidad entre las dos cantidades que
conforman el cociente.

En el cociente X/Y = q, entonces al aumentar la X aumenta la q, lo que nos indica que el valor
de q es directamente proporcional al de X. En cambio si aumenta el valor de la Y, no aumenta
el valor de q, se expresa que el valor de q, es inversamente proporcional al valor de Y.

Proporciones: una proporción es la igualdad de dos razones por cociente. Si a/b = q; y c/d = q;
entonces a/b = c/d; o se puede expresar: a : b :: c : d; que se lee, a es b como c es a d, en
donde a y c son los antecedentes (o extremos) y b y d son los consecuentes (o medios); y al
multiplicarlos, se obtiene ad = bc.

20
Teorema: en toda proporción el producto de los términos medios es igual al producto de los
términos extremos.

Ejemplos:
15/3 = 35/7; (15)(7) = (35)(3) = 105, proporción es verdadera.

30:105 = 46:160; (105)(46) ≠ (30) (160), proporción es falsa.

Porcentaje: en una razón de proporcionalidad el denominador o divisor recibe el nombre de


base. La razón de proporcionalidad para su uso en porcentaje tiene como base 100.

El tanto por ciento, es una proporcionalidad que se establece con base 100, utilizando el
signo %.

El porcentaje es el valor calculado por cada 100 unidades contenidas en una cantidad.

La diferencia entre porcentaje y tanto por ciento, es que el tanto por ciento (%) es el número
de unidades que se toma por cada ciento, el porcentaje expresa el total de unidades que se
debe de tomar de una cantidad considerada como base. En todo problema de tanto por
ciento se forma la proporcionalidad: porcentaje/base = tasa o coeficiente; o en otra forma:
porcentaje entre la base = tasa o coeficiente.

Ejemplos:
1.- El jefe de una planta industrial contó en la producción semanal 950 piezas normales y 110
defectuosas e informó:

110/950 = 0.116 x 100 = 11.6% defectuosas, o sea que tomó como base las normales.
La información correcta debe tener como base la producción total, o sea: 110/1060 = 0.104 x
100 = 10.4% defectuosas.

2.- Un comerciante compra un producto al por mayor en Q 360.00 y lo vende en Q 522.00,


determinar la utilidad obtenida.

El comerciante asumió que su utilidad obtenida fue de Q 522.00 – Q 360.00 = Q 162.00,


diciendo que su ganancia es del 31%, ya que calculó así: Q 162.00/Q 522.00 = 0.31 x 100 =
31%, tomando como base el precio de venta. Sin embargo, si se toma como base su
inversión, la utilidad es: Q 162.00/Q 360.00 = 0.45 x 100 = 45%, que es la real.

REFERENCIAS BIBLIOGRÁFICAS

1. Campbell D. y Stanley J. 1995. Diseños experimentales y cuasiexperimentales en la


investigación social. Buenos Aires: Amorrortu.

21
2. Cazau P. 1991. Introducción a la investigación en ciencias sociales. Buenos Aires:
Rundinuskin editores.

3 Cortada N. 1994. Diseño estadístico para investigadores en ciencias sociales y de la


conducta. Buenos Aires: Eudeba.

4. http://www.monografias.com/trabajos19/la-estadistica/la-estadistica.shtml

22

También podría gustarte