Está en la página 1de 20

Apuntes sobre Estadística

APUNTES SOBRE ESTADISTICA


Conceptos y Definiciones
(Borrador para corrección)

"Hay tres tipos de mentiras —


mentiras, grandes mentiras y
estadísticas".
Benjamín Disraeli (1804 -1881):

Héctor Medina Disla

Santo domingo, D. N.
Febrero 2011

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 1
Apuntes sobre Estadística

RESEÑA HISTORICA DE LA ESTADÍSTICA

La palabra estadística proviene de una voz italiana statista (que significa


“estadística”). La acuñó Gottfried Achenwall (1719-1772), un profesor en
MARLBOROUGH y Gottigen. El Dr. E. A. W. Zimerman introdujo el término en
Inglaterra. Su uso lo divulgó el Sr. Jhon Sinclair en su obra titulada Statistical
Account of Scotland (1791-1799), pero ya antes del siglo ZVIII se acostumbraba
registrar y emplear datos.

Las estadísticas oficiales del gobierno tienen la misma antigüedad que la historia
escrita. En el Antiguo Testamento encontramos varias relaciones de censos. Los
gobiernos de Babilonia, Egipto y Roma, reunían registros detallados de la
población y de los recursos.

En la Edad Media, los gobiernos empezaron a asentar en documentos la


propiedad del suelo. En el año 762 D.C., el emperador Carlos Magno pidió
descripciones pormenorizadas de las propiedades de la iglesia.

A principios del siglo XIX, terminó un censo estadístico de los esclavos que
vivían vinculados a la tierra. Hacia 1086, Guillermo, el Conquistador ordenó la
redacción del libro Dosmeday Book, un documento de la propiedad, extensión y
valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadístico
de Inglaterra.

Debido al temor que Enrique VII tenia por la peste en Inglaterra empezaron a
registrarse las funciones en 1532 más o menos por la misma época, en Francia
la ley exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios.

Durante un brote de peste que apareció a fines de la década de 1500, el


gobierno inglés comenzó a publicar estadísticas semanales de los decesos. Esa
costumbre continuó muchos años, y en 1632 estos Bills of Mortality contenían
los nacimientos y fallecimientos por sexo. En 1662 el capitán John Grount usó
documentos que abarcaban treinta años y efectuó predicciones sobre el número
de personas que morirían de varias enfermedades y sobre las proporciones de
nacimientos de varones y mujeres que cabía esperar. El trabajo de Grount,
condensado en su obra titulada Natural and Political Observation...Made Upon
The Bills of Mortality, fue un esfuerzo innovador en el análisis estadística. Por la
eficacia con que se sirvió de los documentos antiguos para predecir eventos
futuros, fue admitido como miembro de la Royal Society Original.

La historia del desarrollo de la teoría estadística y de su aplicación es muy largo.


Aquí hemos limitado a mencionar aquellos que hicieron importantes
aportaciones a esta disciplina.

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 2
Apuntes sobre Estadística

A modo de resumen la historia de la Estadística ha pasado por las siguientes etapas.

 Censo en el antiguo Egipto, 3050 años a. C. (descritos por Heródoto)


 Censo agrícola, industrial y comercial del emperador Yao en China, 2338 años
a. C. (Confucio 550 a. C)
 Primer censo realizado por Moisés en el desierto de Sinaí. (1444 a. C.)
 Segundo censo de realizado por Moisés en las llanuras de Moab. (1444 a. C.)
 Censo de Cesar Augusto, 762 años a. C.
 Los censos cada cinco años establecidos por los Romanos.
 Recopilación de la cantidad de tierra por Pipino El Breve 758
 Censo Carlos Magno 762 d. C.
 Censos en Francia, 900 d. C.
 Recopilación Domesday Book o libro del Gran Catastro para el año 1086 de
Guillermo El Conquistador.
 Desarrollo de la Estadística Matemática, De Moivre y Bernouilli, 1600
 Desarrollo de la Distribución Normal por De Moivre, 1733
 Trabajo sobre cálculo de probabilidades, Laplace y Gauss, 1800
 Estudio de Francis Galton, (1822-1911) sobre correlación
 Karl Pearson, (1857-1936) ampliación del estudio de Galton y funda la
Biométrica y la Distribución Chi-cuadrado
 Desarrollo de estudio para muestras pequeñas, William Gosset, (1876-1937).
 Desarrollo de técnicas estadísticas para la Agricultura, Biología y Genética por
Ronald Fisher, (1890-1962).
 Desarrollo de la teoría sobre prueba de hipótesis entre 1936 y 1938 por J.
Neyman, 1894 y E. S. Pearson 1895.
 Análisis secuencial orientado al campo de la genética, por Abraham Wald (1902-
1950).

Ahora bien, ¿qué podemos hacer con la Estadística1?

 Sacar conclusiones a partir de un conjunto de datos


 Manejo de la incertidumbre
 Muestreo
 Hacer proyecciones y pronósticos
 Establecer asociaciones
 Toma de decisiones bajo incertidumbre

1
Tomado de Paul newbold: Estadística para los Negocios y La Economía

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 3
Apuntes sobre Estadística

I. INTRODUCCION

Las estadísticas, "como algunos pasteles, son buenas si se sabe quién las hizo y se
está seguro de los ingredientes." (Lawrence Lowell, 1909)

La Estadística puede definirse como una metodología científica que permite


recolectar, organizar y procesar datos que proporcionen información que sirvan de
base para la toma de decisión. Por ejemplo aplicar una encuesta para conocer la
preferencia del electorado, aplicar un tratamiento especial a un grupo de personas y
observar el resultado, buscar datos sobre la matrícula estudiantil, u otro tema en
particular. En cambio, cuando hablamos de Estadísticas nos referimos a un conjunto
de medidas o indicadores que describen el comportamiento de un fenómeno de
interés en un momento determinado. Por ejemplo, el porcentaje de lectores que
prefieren a un candidato en particular, el tiempo necesario para realizar unas tarea, las
unidades producidas diariamente por una empresa, las ventas de una empresa, etc.

Es decir que las estadísticas representan el fin u objetivo que buscamos y la


Estadística el medio para conseguirlo.

1.1 DIVISION DE LA ESTADISTICA

La Estadística como metodología científica se divide en dos ramas, la Estadística


Descriptiva y la Estadística Inferencial

Estadística Descriptiva: Es un conjunto de métodos y técnicas que permiten


describir un conjunto específico de datos. La Estadística Descriptiva como su nombre lo
indica, describe un grupo particular. Sus principales herramientas son.
1) Cálculo de porcentaje y tasas
2) Presentación tabular, (cuadros y tablas)
3) Presentación gráfica
4) Cálculo de medidas de Medidas de Tendencia Central, (promedios)
5) Cálculo de medidas de dispersión o variabilidad
6) Cálculo de números índice.
7) Otras técnicas descriptivas.

Estadística Inferencial: Se refiere a un conjunto de métodos y técnicas que permite


obtener información acerca de una población completa, con solo estudiar una parte
de ella (muestra). La Estadística Inferencial nos permite llevar los resultados obtenidos
en una muestra a la población. Sus principales herramientas son: Cálculo de
probabilidades, muestreo y distribución muestral, estimación, prueba de hipótesis,
análisis de varianza, análisis de regresión y correlación, otras.

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 4
Apuntes sobre Estadística

1.2. Conceptos y Definiciones

1. Población: Es un conjunto de elementos con características parecidas o similares


y que son de interés para la realización de un estudio. En términos estadísticos una
población se define de acuerdo a lo que se desea investigar o estudiar. Por ejemplo si
queremos conocer el rendimiento escolar de los/as niños/as de la educación básica,
entonces nuestra población va a estar definida por la cantidad de niños/as inscrito en
los curso de la educación básica o si queremos evaluar la calidad de la producción de
una empresa, nuestra población estará formada por todas las unidades producidas por
la empresa durante el periodo de interés.

Muestra: Es un subconjunto de la población que se toma para fines de desarrollar una


investigación. Cuando un estudio se hace a partir de una muestra, esta debe ser
representativa y significativa.

Se dice que una muestra es representativa cuando los elementos que componen
dicha muestra contienen las mismas características que los elementos en la
población de la cual se tomó dicha muestra, el concepto de representatividad se
refiere a los aspectos cualitativos de la muestra. Por ejemplo si quisiéramos conocer la
preferencia política de los estudiantes de la UASD una muestra sería representativa si
en la misma se incluyen estudiantes de todas las edades, de todas las carreras, de
ambos sexo, de todos los centros regionales, etc. de forma tal que al observar la
muestra es como si observáramos la población en miniatura.

Por su parte el concepto de significación tiene que ver con la cantidad de elementos
que conforma la muestra. En este sentido, no existe un número de elementos
específico para que una muestra sea significativa, sino, que la cantidad de elementos
necesarios para que la muestra sea significativa varía de acuerdo a la características
de la población. Si la población a estudiar es muy variable, se requerirá de un mayor
número de elementos para que la muestra sea significativa que si la población tiende a
ser homogénea, en cuyo caso un muestra pequeña puede ser significativa.

2. Parámetro: Es una medida de referencia la cual se calcula a partir de datos de una


población completa. El parámetro se refiere a la medida de una variable en la
población. Por ejemplo, cuando se aplican las Pruebas Nacionales y se obtiene el
promedio de las calificaciones, esta medida es un parámetro de las calificaciones de
los estudiantes.

3. Estimador o Estadígrafo: Es una medida calculada a partir de los datos obtenidos


en una muestra y se utiliza para estimar el valor del parámetro, ya que en la mayoría de
los casos, se hace difícil y muy costoso conocer el valor real o verdadero de la variable.
Por ejemplo cuando se toma una muestra para conocer la preferencia política de la
población, los porcentajes que se obtienen a partir de la encuesta son estimadores del
porcentaje de real de preferencia de todos/as las votantes.

1.3 FUENTES DE DATOS

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 5
Apuntes sobre Estadística

Ya se ha dicho que la Estadística es una metodología científica que permite obtener


datos que al ser procesados se convierten en estadísticas o indicadores relacionados a
una o múltiples variables. Podemos decir entonces que el quehacer de la Estadística se
centra en dar respuestas a una serie de preguntas o interrogantes que surgen en un
momento determinado sobre un tema en particular, por ejemplo, ¿Cuál es la bebida
gaseosa preferida por la población?, ¿por qué las personas prefieren un banco en
particular para depositar sus ahorros?, ¿qué porcentaje de la producción está saliendo
defectuoso?, ¿cuál será el nivel de precios para el próximo semestre?, ¿Cómo
podemos motivar a los/as estudiantes?, ¿cuál método de enseñanza es más efectivo
para lograr el aprendizaje en los/as estudiantes? y así sucesivamente.

Para dar respuestas a estas preguntas debemos recurrir a la búsqueda de datos y en


tal sentido debemos de responder a las siguientes preguntas ¿cuáles son las fuentes
para obtener datos? O ¿de donde obtendremos datos para dar respuesta a nuestra
pregunta?

En primer lugar vamos a clasificar las fuentes de datos atendiendo al origen de los
datos y en este sentido las fuentes de datos pueden ser primarias y secundarias. Las
fuentes de datos primarias son aquellas en las cuales los datos son generados por
quien o quienes realizan la investigación, es decir que son datos de primera mano,
hechos “a la medida” como lo señala Dillon2, es decir que las fuentes primarias se
utilizan para cubrir una necesidad de información específica.

1.3.1 Fuentes primarias de datos

Las principales fuentes primarias de datos son el Censo, La Encuesta o Estudios por
Muestreo y Los Experimentos.

1. Censo: Es un tipo de investigación en la cual se estudian todos los elementos de


una población determinada. El censo tiene las ventajas de que proporciona
información sobre una población completa, con un bajo margen de error y además
permite la ubicación física de cada uno de los miembros de la población. Tiene la
desventaja de que resulta muy costoso en términos económicos, de tiempo y de
materiales.

2. Estudios por Muestreo: Son estudios en los cuales solo se estudia una parte de la
población, es decir una muestra. Los estudios por muestreo tienen las ventajas de que
proporcionan información útil y confiable sobre una población en corto tiempo y además
resultan menos costosos que un censo. Tienen las desventajas de que no proporcionan
información sobre la ubicación física de de los elementos de una población y de que si
no se diseña de manera adecuada puede proporcionar información distorsionada sobre
el comportamiento del fenómeno que se está estudiando.

2
William Dillon, Thomas J. Madden y Neil H. Firtle: “La Investigación de Mercados. Entornos de
Marketing”

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 6
Apuntes sobre Estadística

3. Experimentos: Son estudios especializados en los cuales un grupo de elementos


de la población es sometido a un tratamiento o condición especial y los resultados
obtenidos con dicho tratamiento se comparan con los resultados de otro grupo que
no ha sido sometido al tratamiento o con los del mismo grupo cuando no ha sido
sometido al tratamiento o condición especial. El grupo sometido al tratamiento recibe el
nombre de grupo experimental y el grupo con el cual se comparan los resultados
recibe el nombre de grupo de control.

El objetivo principal de los diseños experimentales es conocer el efecto que tiene en la


población estudiada la exposición de esta a un tratamiento o condición especial.

1.3.2 Fuentes secundarias de datos

Las fuentes secundarias son aquellas en las cuales los datos se encuentran publicados
en forma de reportes. Las fuentes de datos secundarias pueden ser externas o
internas. Las fuentes secundarias internas son aquellas en las cuales los reportes son
el resultado del registro de las actividades de quien lleva a cabo la investigación, en
cambio las fuentes secundarias externas son aquellas en las cuales los datos se
encuentran en reportes o publicaciones realizados por entidades ajenas a quien o
quienes realizan la investigación.

Las principales fuentes secundarias de datos son los registros internos de la empresa y
los reportes de datos de otras organizaciones o externos.

1. Registros internos de la organización: son fuentes secundarias de datos y se


refieren al conjunto de datos que se origina como resultado del registro
continuo y sistemático de las actividades de una organización.
2. Reportes de datos externos: es un conjunto de datos que pueden ser de
interés para dar respuesta a nuestras interrogantes y que han sido generado por
organizaciones o entidades externas a quien realiza la investigación.

Los registros externos como fuente de información tienen las ventajas de que son
de fácil acceso, tienen un costo más bajo que las demás fuentes de datos y
además están disponibles en el momento requerido. Tienen la desventaja de que
quien realiza la investigación no dispone de los mecanismos de control para
garantizar la calidad y la confiabilidad de los datos incluidos en los reportes, así
como el formato y la cantidad de datos existentes no siempre se corresponde con
los requeridos por el investigador.

1.4 VARIABLES Y SU CLASIFICACIÓN

Una Variable es una característica que puede variar de un elemento a otro en la


población estudiada. Ejemplos: peso corporal de las personas, tamaño las aulas
universitarias, estatura de las personas, número de asignaturas cursadas por los
estudiantes por semestre, etc.

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 7
Apuntes sobre Estadística

Las variables se dividen en dos grupos: Cualitativas y Cuantitativas

Variables cualitativas: son aquellas variables que describen una cualidad o atributo
en el elemento estudiado, estas variables responden la pregunta ¿cuál?, ejemplos de
estas variables pueden ser: religión que profesan los dominicanos, partido político
preferido, color de la piel, sexo de los y las estudiantes, raza, carrera estudiada, etc.

Variables cuantitativas: son aquellas variables que describen una cantidad en el


elemento estudiado. Las variables cuantitativas responden la pregunta ¿cuánto?, por
ejemplo: número de estudiante por aula, venta diaria de una empresa, número de hijos
por familia, estatura de los estudiantes que cursan estadística en este semestre, etc.

Las variables cuantitativas se dividen en dos categorías: Continuas y discontinuas o


discretas.

Variables cuantitativas continuas: son aquellas variables cuantitativas cuyos


resultados pueden expresarse en números fraccionarios o decimales. Estas
variables provienen de un proceso de medición, por ejemplo el nivel de ingreso de
las personas, consumo familiar, estatura de las personas, gasto diario de los
estudiantes, etc.

Variables cuantitativas discontinuas o discretas: son aquellas variables


cuantitativas cuyos resultados se expresan en números enteros, es decir que no
admiten valores decimales. Las variables cuantitativas discontinuas o discretas
provienen de un proceso de conteo, por ejemplo número de asignaturas por estudiante,
número de estudiantes por aula, número de personas que llega a un restaurante de
comida rápida, etc.

Obsérvese que las variables cuantitativas continuas pueden expresarse en número


fraccionarios y las discretas o discontinuas se expresan en números enteros, por lo
que, aunque en muchas ocasiones expresamos una variable en número enteros, no
significa que sea discreta, por ejemplo, el gasto en transporte, mayormente lo
expresamos en número entero, sin embargo, es una variable continua, pues el
resultado admite valores fraccionarios, pero el número de asignaturas cursada por
ejemplo solo se expresa en número enteros pues no admite valores fraccionarios.

1.5 MEDICION Y ESCALA DE MEDICIÓN

Daniel3 señala “cuando la mayoría de las personas escuchan o leen la palabra


medición piensan en actividades tales como usar cintas métricas para determinar la
longitud, anchura o circunferencia de algún objeto, pesar un objeto o persona, y
determinar el volumen de alguna sustancia como cuando un cocinero mezcla las
cantidades de ingredientes específicas de una receta. A la palabra medición, sin
embargo, puede dársele una definición más científica que la acostumbrada”

3
Wayne W., Daniel & James C. Terrell: “Estadística para Administración y Economía” Tomo I. Editora
McGraw-Hill. 7ª. Edición. Junio 2000.

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 8
Apuntes sobre Estadística

En efecto la medición va más allá de determinar cantidad, longitud, volumen o cualquier


otra medida de interés. En el ámbito de la Estadística cuando nos referimos a medición
llegamos un poco más profundo, así por ejemplo hablamos de la medición de la
personalidad, de la medición de los niveles de tolerancia, los niveles de preferencia por
un servicio o un producto, etcétera.

Para el desarrollo de este curso enteremos por Medición al proceso mediante el cual
se le asigna un numeral (número, letra o símbolo) a una variable. Por ejemplo si
estamos realizando una investigación sobre las características de la población
estudiantil podremos incluir variables como la edad, el sexo, el número de asignaturas
cursadas el gasto diario, percepción sobre los servicios de la biblioteca, las asignaturas
más preferidas y muchas otras variables.

En cada una de estas variables tendremos una medición en cada uno de los elementos
estudiados, así por ejemplo, para la edad nos referiremos a los años cumplidos y por lo
tanto tendremos medidas numéricas, (23, 21, 19, 35,…..), para la variable sexo
podríamos asignarle un número por ejemplo uno para masculino y dos para femenino o
viceversa, pero de igual forma podríamos asignarle una letra, M para los masculinos y
F para las femeninas o un símbolo para diferenciar cada sexo, de la siguiente manera
♂ para los masculinos y ♀ para las femeninas

De igual forma para la variable número de asignaturas de registraría el número que


representa la cantidad de asignaturas inscrita, por ejemplo, 3, 6, 5, 4,…… y par la
variable gasto también se registraría el número que representa el monto del gasto
diario, 100, 150, 60, 180, ……. y la variable relacionada con la percepción sobre los
servicios de la biblioteca podemos asignarle una calificación desde cero a cinco,
tomando el cero como una percepción de los servicios como muy malos y cinco una
percepción de que los servicios son excelentes.

Para la variable relacionada con las asignaturas más preferidas, podríamos establecer
un registro en orden de importancia, para que la persona estudiada nos diga en orden
de preferencia cuales son las asignaturas preferidas, en tal sentido podríamos
establecer el primer lugar para la más preferida, el segundo para la segunda más
preferida y así, sucesivamente.

Lo que se quiere señalar es que hay diferente forma en como podemos establecer la
medición para una variable, es decir que hay diferente tipo de escala para medir una o
múltiples variables, pudiendo entonces establecer una definición para la escala de
medición.

Escala de Medición: Es la forma en como se mide una variable, es decir que la


escala de medición es el proceso mediante el cual se le asigna un numeral a cada
variable. Existen cuatro tipos de escala de medición: nominal, ordinal, de intervalo y
de razón o proporción.

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 9
Apuntes sobre Estadística

Escala Nominal: Es aquella escala de medición en la cual los numerales asignados


a cada valor o atributo no representa ningún orden de jerarquía, de importancia o
preferencia. En este tipo de escala los numerales solo se utilizan para identificar los
valores o atributos de cada variable. Ej.: los numerales o códigos asignados a las
variables cualitativas, los números asignados a los integrantes de un equipo béisbol, la
matrícula estudiantil, etc.

Escala Ordinal: Es aquella escala en la cual los numerales se asignan a cada variable
de acuerdo a un orden de jerarquía, importancia o de preferencia. En este tipo de
escala, cada numeral representa un tramo jerárquico, de preferencia o de
importancia. Ej.: los códigos asignados a los cargos en una empresa, preferencia de un
producto según su orden de importancia, el número asignado a las placas de los
vehículos oficiales, el grado académico de las personas, etc.

Tanto la escala ordinal como la nominal se usan en la medición de variables


cualitativas.

Escala de Intervalo: Es una escala cuantitativa cuya característica principal, es que


no parte de un cero absoluto, es decir que el punto a partir del cual se empieza a
medir es arbitrario. En este tipo de escala la presencia del cero como de medida de la
variable no representa ausencia de la variable. Ej.: Las escalas usadas para medir la
temperatura, la intensidad de un temblor de tierra, coeficiente inteligente, etc.

Escala de Razón o Proporción: Es una escala cuantitativa cuya característica


principal es que el proceso de medición de inicia a partir de un cero absoluto, es decir,
que la presencia del cero como medida de la variable significa la ausencia de esta. A
este tipo de escala corresponden la mayoría de las variables con que trabajamos a
diario, ejemplo, peso corporal, tamaño de las personas, consumo familiar, ventas de
una empresa, distancia recorrida, unidades producidas, distancia recorrida diariamente,
etc.

1.6 PASOS DE UNA INVESTIGACIÓN ESTADÍSTICA

Cuando nos planteamos una interrogante sobre un tema en particular, nos


vemos en la necesidad de buscar datos que nos proporcionen las informaciones
necesarias para dar respuesta a dicha interrogante, este proceso de búsqueda
de datos conlleva la realización de una investigación la cual requiere de cinco

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 10
Apuntes sobre Estadística

pasos fundamentales4: planeación, diseño de la investigación, recolección de


datos, procesamiento y análisis y presentación de resultados.

Figura no. 1: Pasos de una investigación

Planeación Diseño del


Estudio

Análisis y Recolección
presentación de datos

Procesa-
miento

Aunque estos pasos pueden y varían atendiendo a los criterios del investigador
en términos generales estos pasos representan el proceso lógico de una
investigación aunque reciban diferentes nombres. A continuación se hace una
descripción breve de cada uno de estos.

1. Planeación: Es la fase en la cual se definen los aspectos administrativo y


operativos de la investigación. Esta fase comprende entre otras actividades, el
establecimiento de los objetivos: general y específicos, alcance de la
investigación, población de estudio, presupuesto necesario, cronograma de
actividades y plan de análisis o resultados esperados.

2. Diseño del estudio: En esta fase se define y se diseña el instrumento de


recolección de datos (cuestionario, entrevistas, observación, entre otros) y se
define además, la metodología a seguir para la aplicación del instrumento de
recolección de datos.

3. Recolección de datos: Es la fase que requiere de más tiempo y consiste en


la aplicación del instrumento de recolección de datos definido en el diseño del
estudio de acuerdo a la metodología establecida. En esta fase la persona a
cargo de la investigación y su equipo de trabajo se lanzan al terreno para
recolectar los datos que una vez procesados darán respuestas a los objetivos de
la investigación.

4
Ver a Lincoln L. Chao: “Estadística para las Ciencias Administrativas.” Tercera Edición. Editora
McGraw-Hill

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 11
Apuntes sobre Estadística

4. Procesamiento de datos: Es la fase en la cual se obtienen los cuadros y


tablas, así como las medidas o indicadores estadísticas que permiten describir
el comportamiento de la población estudiada, así como dar respuestas a los
objetivos planteados en la fase de planeación. La fase de procesamiento de los
datos conlleva cuatro actividades esenciales previas: Limpieza y organización
de los datos, codificación, digitación y edición.

La limpieza y organización de los datos se refiera al proceso mediante el cual se


verifican la calidad de los datos obtenidos, se enumeran los instrumentos de
recolección de datos utilizados, verificación del cumplimiento de las metas en
cuanto a la cantidad y calidad. La codificación por su parte es la actividad que
permite asignar un código numérico a cada respuesta del instrumento de
recolección de datos. Esto se hace con la finalidad de facilitar el proceso de
digitación.

La digitación es el proceso mediante el cual los datos son introducidos al


computador con el fin de que el procesamiento sea más eficiente. La edición por
su parte es un proceso de verificación, es decir, con la edición de los datos
verificamos que se haya digitado lo que realmente se ha respondido en el
instrumento de recolección de datos.

5. Análisis y presentación de resultados: Es la fase es la cual se analizan


los resultados obtenidos, estableciendo descripción de la población estudiada,
comparaciones y asociaciones entre variables, inferencia muestral, entre otras.
En la fase de procesamiento y además se dan a conocer los resultados
obtenidos en la investigación.

Veamos un ejemplo relacionado con el proceso de investigación. En el semestre


2006-1 de la UASD, el trabajo final de un grupo de estudiantes fue medir el
rendimiento, (tomando para ello el promedio de las calificaciones) de un grupo
de estudiantes tanto en las escuelas públicas como en las escuelas privadas.
De esta forma la población estaba definida, así como los objetivos del trabajo
de investigación.

Como se podrán imaginar, el presupuesto era pequeño y no predeterminado,


pero tengan por seguro que aquellas personas que no pasaron de curso se lo
encontraron más costoso, pero bueno, ese no es el caso ahora.

El instrumento de recolección de datos fue un cuestionario, el cual se muestra


en la figura número dos y la metodología consistió en tomar una muestra de
estudiantes de las escuelas públicas y otra muestra en colegios privados.

El cuestionario utilizado como instrumento de recolección de datos se muestra


en la figura número dos de la página siguiente.

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 12
Apuntes sobre Estadística

Figura no. 2. Instrumento de recolección de datos utilizado en el estudio

Estudio sobre el rendimiento escolar


Formulario de recolección de datos

1. Nombre y apellidos del estudiante __________________________

2. Edad ______ 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante _____________________________

5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 1. Promovido 2. Repitiente


7. Calificación en Matemáticas ______
8. Calificación en Español ______
9. Calificación en Sociales ______
10. Calificación en Naturales _____

La metodología consistió en tomar una muestra de treinta estudiantes de la


escuela pública y treinta de la escuela privada. La fuente de datos utilizada fue
el registro de cada estudiante en la escuela, procediendo a completar el
instrumento de recolección de datos diseñado

A continuación se presenta una muestra del instrumento de recolección de


datos completado durante la tercera fase del estudio. Por conveniencia las
respuestas se han subrayado de forma que se puedan identificar fácilmente.

Nótese que los cuestionarios no están numerados y si lo estuvieran no


representan una jerarquía o importancia, sino que el numeral asignado es una
escala nominal.

Figura no. 3: Instrumentos de recolección de datos completados


Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo
Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Rodolfo Peña 1. Nombre y apellidos del estudiante Raúl Arias

2. Edad 15 2. Edad 12

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante: Con padre y madre 4. Con quien vive el estudiante: con ambos padres

5. Tipo de escuela: ública


1. Pública 2. Privada 5. Tipo de escuela: ública
1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 69 7. Calificación en Matemáticas 67
8. Calificación en Español 75 8. Calificación en Español 69
9. Calificación en Sociales 72 9. Calificación en Sociales 64
10. Calificación en Naturales 71 10. Calificación en Naturales 69

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 13
Apuntes sobre Estadística

Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo


Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Paola Moción 1. Nombre y apellidos del estudiante: Yordi González

2. Edad 10 2. Edad 11

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante Tía 4. Con quien vive el estudiante: con la madre

5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 80 7. Calificación en Matemáticas 70
8. Calificación en Español 78 8. Calificación en Español 68
9. Calificación en Sociales 76 9. Calificación en Sociales 65
10. Calificación en Naturales 80 10. Calificación en Naturales 65

Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo


Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Ashley Ciprián 1. Nombre y apellidos del estudiante Vicente Mejía

2. Edad 9 años 2. Edad 13 años

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante ambos padres 4. Con quien vive el estudiante con la madre

5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 85 7. Calificación en Matemáticas 65
8. Calificación en Español 80 8. Calificación en Español 70
9. Calificación en Sociales 82 9. Calificación en Sociales 78
10. Calificación en Naturales 78 10. Calificación en Naturales 70

Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo


Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Cándida Beatriz 1. Nombre y apellidos del estudiante Manuel Fontana

2. Edad 11 años 2. Edad 10 años

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante ambos padres 4. Con quien vive el estudiante con una tía

5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 83 7. Calificación en Matemáticas 88
8. Calificación en Español 90 8. Calificación en Español 90
9. Calificación en Sociales 89 9. Calificación en Sociales 89
10. Calificación en Naturales 91 10. Calificación en Naturales 85

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 14
Apuntes sobre Estadística

Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo


Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos

1. Nombre y apellidos del estudiante Charly Cepeda 1. Nombre y apellidos del estudiante Helena Parache

2. Edad 13 años 2. Edad 11 años

3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino

4. Con quien vive el estudiante ambos padres 4. Con quien vive el estudiante con ambos padres

5. Tipo de escuela: 1. Pública 2. Privada 5. Tipo de escuela: 1. Pública 2. Privada

6. Condición del estudiante: 6. Condición del estudiante:


1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 77 7. Calificación en Matemáticas 77
8. Calificación en Español 78 8. Calificación en Español 72
9. Calificación en Sociales 83 9. Calificación en Sociales 81
10. Calificación en Naturales 78 10. Calificación en Naturales 65

Una vez agotada la tercera fase, la recolección de datos, nos dedicamos a


cuarta fase, el procesamiento de los datos, recordando que esta fase incluye la
organización, codificación, digitación y edición, para luego obtener los cuadros
y tablas, así como las medidas estadísticas que nos permitan dar respuestas a
los objetivos planteados.

En el caso que nos ocupa para la organización podemos por ejemplo asignar un
número a cada instrumento completado. Para la codificación, el trabajo se
reduce significativamente, ya que el instrumento diseñado tiene cada pregunta
pre-codificada, por ejemplo, para el sexo se le asigna el número uno a los de
sexo masculino y el dos a las de sexo femenino, de igual forma a los y las
estudiantes de escuelas públicas se le asigna el número uno y los y las de
colegios privados el número dos.

Sin embargo, en el caso de la pregunta relacionada a con quien vive el o la


estudiante, es recomendable establecer un código numérico para las posibles
respuestas, ya que en el instrumento esta es una pregunta abierta. Los códigos
asignados son: el número uno para los y as que viven con ambos padres,
(padre y madre), el dos para los y las que viven solo con la madre, el tres para
los y las que viven solo con el padre y el cuatro para los y las que viven con
otro familiar.

La importancia de asignar un código numérico es que el proceso de digitación


se hace más eficiente y se cometen menos errores. Un ejemplo se muestra a
continuación con los dos primeros cuestionarioos

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 15
Apuntes sobre Estadística

Figura no. 4: instrumentos de datos completados y codificados


Universidad Autónoma de Santo Domingo Universidad Autónoma de Santo Domingo
Estudio sobre el rendimiento escolar Estudio sobre el rendimiento escolar
Formulario de recolección de datos Formulario de recolección de datos
No. 1 No. 2
1. Nombre y apellidos del estudiante Rodolfo Peña 1. Nombre y apellidos del estudiante Raúl Arias
2. Edad 15 2. Edad 12
3. Sexo: 1. Masculino 2. Femenino 3. Sexo: 1. Masculino 2. Femenino
4. Con quien vive el estudiante: 1 4. Con quien vive el estudiante: 1
5. Tipo de escuela: ública
1. Pública 2. Privada 5. Tipo de escuela: ública
1. Pública 2. Privada
6. Condición del estudiante: 6. Condición del estudiante:
1. Promovido 2. Repitiente 1. Promovido 2. Repitiente
7. Calificación en Matemáticas 69 7. Calificación en Matemáticas 67
8. Calificación en Español 75 8. Calificación en Español 69
9. Calificación en Sociales 72 9. Calificación en Sociales 64
10. Calificación en Naturales 71 10. Calificación en Naturales 69

Como se muestra en la figura anterior, a la derecha aparece el número


asignado al instrumento y en la pregunta de con quien vive el o la estudiante
se ha asignado como respuesta el número uno ya que en ambos casos los
estudiantes viven con ambos padres.

Para la digitación se podría colocar los datos en una matriz, colocando cada
variable en las columnas y cada fila para los elementos estudiados. En este
caso vamos a utilizar la hoja de cálculo de Excel para la digitación como se
muestra en la figura número cinco. (Es preciso aclarar que existen numerosos
programas en los que se puede hace la digitación, se ha elegido el Excel por la
disponibilidad y facilidad del mismo)

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 16
Apuntes sobre Estadística

Figura no. 5: Ilustración de la digitación en Excel

El proceso de edición de los datos sería imprimir los datos digitados y luego
verificar si el proceso de digitación se ha hecho correctamente.

Una vez que se ha realizado el proceso de digitación y edición de los datos, se


procede a obtener los cuadros y tablas, así como las medidas estadísticas que
nos permitan dar respuesta a los objetivos del trabajo de investigación, pero
sobre este particular volveremos a tratarlo en los capítulos siguientes.

1.2 PRESENTACIÓN DE RESULTADOS

Una vez que se ha completado el proceso de investigación con el análisis de los


resultados, el paso siguiente consiste en presentar dichos resultados a la
entidad interesada. Para hacerlo existen cinco formas que describiremos
brevemente a continuación:

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 17
Apuntes sobre Estadística

1. Presentación oral: Cuando los resultados de la investigación se presentan


en forma de discurso. Por ejemplo, muchas organizaciones, (empresas, partidos
políticos, ONG`s, entre otras) convocan a una rueda de prensa o a un
encuentro con el objetivo de dar a conocer los resultados de una investigación
determinada.

La presentación oral tiene la ventaja de que es fácil de preparar y su costo es


bajo, sin embargo, presenta la desventaja de que quien recibe la información va
olvidando los primeros datos en la medida en que se avanza con el suministro
de información.

2. Presentación escrita: Es aquella en la cual los resultados de una


investigación se presentan en un informe en forma de texto. La presentación de
los resultados de una investigación presentados en un informe, requieren de
una mayor formalidad y de un esfuerzo mayor. Un informe con los resultados
de una investigación consta de seis partes esenciales.

2.1 Hoja y/o carta de presentación: en esta parte se presenta de manera


formal los resultados de la investigación.

2.2 Índice de contenido: en esta parte del informe se establece o describe la


ubicación física de cada una de las partes contenidas en el informe.

2.3 Resumen ejecutivo: como lo indica su nombre, es un resumen que


contiene los principales resultados de la investigación. Su objetivo
fundamental es describir el comportamiento de la población estudiada
de manera rápida y precisa sin adentrarse en detalles.

2.4 Cuerpo del trabajo: En esta parte se describen de manera detallada


todos los resultados de la investigación, incluye la presentación de
cuadros, tablas, gráfico, descripción textual, así como el cálculo de
medidas estadísticas.

2.5 Conclusiones: las conclusiones representan el juicio extraído de los


resultados de la investigación. Se refieren a los puntos a los cuales llega
quien o quienes realizan el estudio después de analizar de manera
detallada los resultados obtenidos. Las conclusiones dan respuestas a
las interrogantes establecidas y a los objetivos planteados en la fase de
planeación.

2.6 Recomendaciones: se refiere al conjunto de sugerencias o curso de


acción que se sugieren seguir a partir de los resultados de la
investigación.

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 18
Apuntes sobre Estadística

2.7 Anexos: en esta parte del informe se incluye toda información que sea
relevante para el estudio que se realiza y que por alguna razón no se incluyó en
el cuerpo del trabajo, por ejemplo cuadros, copia del o los instrumentos de
recolección de datos utilizados, cronograma de actividades, fotografías, copias
de artículos, de leyes, entre otros.

3) Presentación tabular: es aquella es la que los resultados de una


investigación se presentan en forma de cuadros o tablas. Un cuadro o tabla
estadística se compone de tres partes esenciales y una opcional.

3.1 Título: en este se detalla de manera clara, precisa y lo más corto


posible los datos incluidos en el cuadro. El título es de vital importancia
a fin de edificar a la persona interesada sobre la información que se
presenta en el cuadro o la tabla de que se trate.

3.2 Cuerpo o armazón: es un arreglo matricial, (arreglo de filas y


columnas) en el cual se detallan los datos especificados en el título. El
cuerpo o armazón está compuesto de dos partes:

3.2.1 La columna principal, en la cual se describe la variable o las


variables a presentar en el cuadro.

3.2.2 Las columnas secundarias, es las cuales se describen los valores


relacionados a cada valor o atributo de la variable.

3.3 Fuente: es la parte del cuadro en la cual se específica el origen de los


datos presentados en dicho cuadro. La importancia de la fuente es que
al informar sobre el origen de los datos descrito en la tabla, permite, de
alguna manera, evaluar la calidad y confiabilidad de los mismos.

Nota aclaratoria: se utiliza para


Cuadro No: Sexo de los estudiantes
especificar cualquier detalle o de Est-XXX, sección XX
aclaración referente a los datos
SEXO No. %
incluidos en el cuadro. Por ejemplo, en
el cuadro que se muestra a MASCULINO 9 26.5
continuación se podría incluir una FEMENINO 25 73.5
nota aclaratoria para indicar que solo TOTAL 34 100.0
se incluyen a los estudiantes que Fuente: Clase 17/01/2004
asistieron ese día a la clase o que
incluye a otros “colados” de otra sección de la que se trate.

4) Presentación gráfica: es aquella en la cual los resultados de una


investigación se presentan en forma de gráfico. La importancia de la
presentación gráfica es que permite observar el comportamiento de una
variable sin entrar en detalles, solo con observar el cuadro.

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 19
Apuntes sobre Estadística

Se x o d e l o s e s t u d i a n t e s d e E s t -x x x , s e c c i ó n
00

26.5%

73.5%
MASCU LIN O F EMEN I N O

Fuente: clase del 7/01/2004

Por ejemplo, al
observar un recibo Comparación mensual de su consumo
de la facturación 700
de la electricidad,
600
se muestra un
gráfico como el que 500
vemos a nuestra 400
derecha,
300
observamos como
ha variado el 200
consumo, si se ha 100
consumido más o
0
se ha consumido
Abr May Jun Jul Ago Sep Oct Nov Dic Ene Fe b Mar Abr
menos.

Una presentación gráfica contiene los mismos elementos que un cuadro o


tabla, es decir: título, cuerpo, fuente y nota aclaratoria.

5) Presentación Mixta: es aquella en la cual quien o quienes realizan la


investigación utilizan para la presentación de los resultados del estudio dos o
más formas de presentación de datos.

Elaborado
Elaborado por H. Medina Disla. Febrero 201
2011. 20

También podría gustarte