Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Importancia
La estadística es la ciencia que estudia los métodos que permiten realizar este
proceso para variables aleatorias. Estos métodos permiten resumir datos y acotar el
papel de la casualidad (azar).
Muestra
La muestra en sentido genérico, es una parte del universo, que reúne todas las
condiciones o características de la población, de manera que sea lo más pequeña
posible, pero sin perder exactitud.
Muestreo
Al tomar varias muestras de una población, las estadísticas que calculamos para
cada muestra no necesariamente serían iguales, y lo más probable es que variaran de
una muestra a otra.
Bajo esta clasificación, hay tres tipos comunes de métodos de muestreo. Estos
son, muestreo simple, doble y múltiple.
Muestreo simple
Este tipo de muestreo toma solamente una muestra de una población dada para el
propósito de inferencia estadística. Puesto que solamente una muestra es tomada, el
tamaño de muestra debe ser lo suficientemente grande para extraer una conclusión.
Muestreo doble
Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra
no es decisivo, una segunda muestra es extraída de la misma población. Las dos
muestras son combinadas para analizar los resultados. Este método permite a una
persona principiar con una muestra relativamente pequeña para ahorrar costos y
tiempo. Si la primera muestra arroja una resultado definitivo, la segunda muestra puede
no necesitarse.
Muestreo múltiple
El procedimiento bajo este método es similar al expuesto en el muestreo doble,
excepto que el número de muestras sucesivas requerido para llegar a una decisión es
más de dos muestras.
Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes:
a. Basados en el juicio de una persona.
b. Selección aleatoria (al azar)
Muestreo de juicio
Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados
mediante juicio personal. La persona que selecciona los elementos de la muestra,
usualmente es un experto en la medida dada. Una muestra de juicio es llamada una
muestra probabilística, puesto que este método está basado en los puntos de vista
subjetivos de una persona y la teoría de la probabilidad no puede ser empleada para
medir el error de muestreo, Las principales ventajas de una muestra de juicio son la
facilidad de obtenerla y que el costo usualmente es bajo.
Muestreo Aleatorio
Una muestra se dice que es extraída al azar cuando la manera de selección es tal,
que cada elemento de la población tiene igual oportunidad de ser seleccionado. Una
muestra aleatoria es también llamada una muestra probabilística son generalmente
preferidas por los estadísticos porque la selección de las muestras es objetiva y el error
muestral puede ser medido en términos de probabilidad bajo la curva normal. Los tipos
comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático,
muestreo estratificado y muestreo de conglomerados.
Para obtener una muestra aleatoria simple, cada elemento en la población tenga
la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a
una muestra aleatoria simple. Por conveniencia, este método pude ser reemplazado por
una tabla de números aleatorios. Cuando una población es infinita, es obvio que la
tarea de numerar cada elemento de la población es infinita, es obvio que la tarea de
numerar cada elemento de la población es imposible. Por lo tanto, ciertas
modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes
de muestreo aleatorio modificado son sistemáticos, estratificados y de conglomerados.
B. Muestreo sistemático.
Una muestra sistemática es obtenida cuando los elementos son seleccionados en
una manera ordenada. La manera de la selección depende del número de elementos
incluidos en la población y el tamaño de la muestra. El número de elementos en la
población es, primero, dividido por el número deseado en la muestra. El cociente
indicará si cada décimo, cada onceavo, o cada centésimo elemento en la población va a
ser seleccionado.
C. Muestreo Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la población
en grupos, llamados estratos, que son más homogéneos que la población como un todo.
Los elementos de la muestra son entonces seleccionados al azar o por un
método sistemático de cada estrato. Las estimaciones de la población, basadas en la
muestra estratificada, usualmente tienen mayor precisión (o menor error muestral) que
si la población entera muestreada mediante muestreo aleatorio simple. El número de
elementos seleccionado de cada estrato puede ser proporcional o desproporcional al
tamaño del estrato en relación con la población.
D. Muestreo de conglomerados.
Para obtener una muestra de conglomerados, primero dividir la población en
grupos que son convenientes para el muestreo. En seguida, seleccionar una porción de
los grupos al azar o por un método sistemático. Finalmente, tomar todos los elementos
o parte de ellos al azar o por un método sistemático de los grupos seleccionados para
obtener una muestra. Bajo este método, aunque no todos los grupos son muestreados,
cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es
aleatoria.
Por otra parte, una muestra de conglomerados puede producir la misma precisión en la
estimación que una muestra aleatoria simple, si la variación de los elementos
individuales dentro de cada conglomerado es tan grande como la de la población.
Variable: Fenómeno que puede tomar diversos valores. Las variables pueden ser
de dos tipos:
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
la velocidad de un vehículo puede ser 80,3 Km./h, 94,57 Km./h...etc.
a) Medición Nominal.
En este nivel de medición se establecen categorías distintivas que no implican un
orden específico. Por ejemplo, si la unidad de análisis es un grupo de personas, para
clasificarlas se puede establecer la categoría sexo con dos niveles, masculino (M) y
femenino (F), los respondientes solo tienen que señalar su género, no se requiere de un
orden real.
Así, si se asignan números a estos niveles solo sirven para identificación y puede
ser indistinto: 1=M, 2=F o bien, se pueden invertir los números sin que afecte la
medición: 1=F y 2=M. En resumen en la escala nominal se asignan números a eventos
con el propósito de identificarlos. No existe ningún referente cuantitativo. Sirve para
nombrar las unidades de análisis en una investigación y es utilizada en cárceles,
escuelas, deportes, etc.
b) Medición Ordinal.
Se establecen categorías con dos o mas niveles que implican un orden inherente
entre si. La escala de medición ordinal es cuantitativa porque permite ordenar a los
eventos en función de la mayor o menor posesión de un atributo o característica. Por
ejemplo, en las instituciones escolares de nivel básico suelen formar por estatura a los
estudiantes, se desarrolla un orden cuantitativo pero no suministra medidas de los
sujetos.
Las formas mas comunes de variables ordinales son ítems (reactivos)
actitudinales estableciendo una serie de niveles que expresan una actitud de acuerdo o
desacuerdo con respecto a algún referente. Por ejemplo, ante el ítem: La economía
mexicana debe dolarizarse, el respondiente puede marcar su respuesta de acuerdo a las
siguientes alternativas:
___ Totalmente de acuerdo
___ De acuerdo
___ Indiferente
___ En desacuerdo
___ Totalmente en desacuerdo
Las anteriores alternativas de respuesta pueden codificarse con números que van
del uno al cinco que sugieren un orden preestablecido pero no implican una distancia
entre un número y otro. Las escalas de actitudes son ordinales pero son tratadas como
variables continuas (Therese L. Baker, 1997).
c) Medición de Intervalo.
La medición de intervalo posee las características de la medición nominal y
ordinal. Establece la distancia entre una medida y otra. La escala de intervalo se aplica
a variables continuas pero carece de un punto cero absoluto. El ejemplo mas
representativo de este tipo de medición es un termómetro, cuando registra cero grados
centígrados de temperatura indica el nivel de congelación del agua y cuando registra
100 grados centígrados indica el nivel de ebullición, el punto cero es arbitrario no real,
lo que significa que en este punto no hay ausencia de temperatura.
d) Medición de Razón.
Una escala de medición de razón incluye las características de los tres anteriores
niveles de medición anteriores (nominal, ordinal e intervalo). Determina la distancia
exacta entre los intervalos de una categoría. Adicionalmente tiene un punto cero
absoluto, es decir, en el punto cero no existe la característica o atributo que se mide.
Las variables de ingreso, edad, número de hijos, etc. son ejemplos de este tipo de
escala. El nivel de medición de razón se aplica tanto a variables continuas como
discretas.
Datos Estadísticos:
Los datos estadísticos no son otra cosa que el producto de las observaciones
efectuadas en las personas y objetos en los cuales se produce el fenómeno que
queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras) necesarios
para llegar al conocimiento de un hecho o para reducir las consecuencias de este.
Los datos estadísticos se pueden encontrar de forma no ordenada, por lo que es
muy difícil en general, obtener conclusiones de los datos presentados de esta manera.
Para poder obtener una precisa y rápida información con propósitos de descripción o
análisis, estos deben organizarse de una manera sistemática; es decir, se requiere que
los datos sean clasificados. Esta clasificación u organización puede muy bien hacerse
antes de la recopilación de los datos.
Ejemplo:
Si se quiere conocer las características de los estudiantes del Núcleo San Carlos
de la UNESR, que solicitan préstamo a la biblioteca de dicha Universidad, la
recolección de la información debe clasificar a cada estudiante sobre la base de:
Carrera que estudia, edad, semestre de estudios, etc. Vemos pues que la clasificación
marca la pauta de la clase de datos que debe ser obtenido.
Datos Cualitativos:
Cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de
cantidad.
Ejemplo:
Si deseamos clasificar los estudiantes que cursan la materia de estadística I por su
estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.
Datos cuantitativos:
Cuando los valores de los datos representan diferentes magnitudes, decimos que
son datos cuantitativos.
Ejemplo:
Se clasifican los estudiantes del Núcleo Anzoátegui de la UDO de acuerdo a sus
notas, observamos que los valores (nota) representan diferentes magnitudes.
Datos cronológicos:
Cuando los valores de los datos varían en diferentes instantes o períodos de
tiempo, los datos son reconocidos como cronológicos.
Ejemplo:
Al registrar los promedios de notas de los Alumnos del Núcleo Anzoátegui de la
UDO en los diferentes semestres.
Datos geográficos:
Cuando los datos están referidos a una localidad geográfica se dicen que son
datos geográficos.
Ejemplo
El número de estudiantes de educación superior en las distintas regiones del país.
Las fuentes primarias más confiables, son las efectuadas por oficinas
gubernamentales encargadas de tal fin.
Ejemplo:
Si un investigador quiere conocer el número de alumnos repitientes en educación
media, clasificados por ciclos, para los últimos diez años, el investigador puede usar
una fuente primaria, tal como la memoria y cuenta el Ministerio de Educación cada
año.
Método para la recolección de datos:
En estadística se emplean una variedad de métodos distintos para obtener
información de los que se desea investigar. Discutiremos aquí los métodos más
importantes, incluyendo las ventajas y limitaciones de estos.
Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento,
puesto que no hay que incluir gastos de entrenamiento de personal, el único gasto sería
el de franqueo postal.
Entre las limitaciones que presenta este método podemos señalar el número de
preguntas que pueden formularse es relativamente limitado; además las investigaciones
efectuadas por este método tienen un carácter selectivo, debido a que muchas de las
personas que potencialmente podrían ser investigadas no posee servicio telefónico, por
lo que quedan sin la posibilidad de ser entrevistados.
Cuestionarios:
Cualquiera que sea el método por el que se decida el investigador para recabar
información, es necesario elaborar un estudio de preguntas.
Como es natural, estas partes, así como las preguntas, varían de acuerdo a la
finalidad de la encuesta. En algunos tipos de investigación, la parte referente a los
datos personales es eliminada por no tener ningún tipo de interés para el estudio.
Consideraciones que debemos tomar en cuenta:
• El cuestionario debe ser conciso; tratar en los posible de que con el menor
número de preguntas, se obtenga la mejor información.
• Claridad de la redacción; evitar preguntas ambiguas o que sugieran respuestas
incorrectas, por lo que deben estar formuladas las preguntas de la forma más
sencilla.
• Discreción: un cuestionario hecho a conciencia, no debe tener preguntas
indiscretas o curiosas, sobre datos personales que puedan ofender al
entrevistado.
• Facilidad de contestación: se deben evitar, en lo posible, las preguntas de
respuestas libres o abiertas y también la formulación de preguntas que
requieran cálculos numéricos por parte del entrevistado.
• Orden de las preguntas: estas deben tener una secuencia y un orden lógico,
agruparlas procurando que se relacionen unas con otras.
Distribución de fecuencias
Medidas de dispersion
Las medidas de dispersión muestran la variabilidad de una distribución, indicando por
medio de un número si las diferentes puntuaciones de una variable están muy alejadas
de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea,
más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían
mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula
la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la
suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias
para salvar este problema. Una es tomando las desviaciones en valor absoluto
(Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).
El rango estadístico es la diferencia entre el valor mínimo y el valor máximo en un
grupo de números. Para averiguar el rango de un grupo de números:
• Ordenamos los números según su tamaño.
• Restamos el valor mínimo del valor máximo.
Ejemplo
Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus
valores se encuentran en un rango de:
Rango = 100 – 1 =99
Varianza
La varianza es una variable estadística que mide la dispersión de los valores respecto a
un valor central (media), es decir, la media de las diferencias cuadráticas de las
puntuaciones respecto a su media aritmética.
Propiedades
• La varianza es siempre positiva o 0:
• Si a los datos de la distribución les sumamos una cantidad constante la varianza
no se modifica.
Yi = X i + k
Cuartiles. Son los puntos que dividen a una distribución de valores en cuatro
porciones iguales o intervalos
Deciles. Son los cuartiles que dividen una distribución en 10 tantos o intervalos,
por lo que se tienen 9 puntos de división, los deciles, que originan los 10 intervalos.
CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de
ubicación o clasificación de las personas cuando atienden características tales como
peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99),
leídos primer percentil,..., percentil 99.
Coeficiente de asimetría
Mide el grado de asimetría de la distribución con respecto a la media. Un valor
positivo de este indicador significa que la distribución se encuentra sesgada hacia
la izquierda (orientación positiva). Un resultado negativo significa que la
distribución se sesga a la derecha.
justo sólo hay dos valores en los datos, :a,b, y hay exactamente la
mitad de datos igual a :a y :b.
La desviación estándar (o desviación típica) es una medida de dispersión para variables
de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva.
Es una medida (cuadrática) que informa de la media de distancias que tienen los datos
respecto de su media aritmética, expresada en las mismas unidades que la variable.
Para abordar las cuestiones que comentábamos en el párrafo anterior, nos valemos de
herramientas como la varianza y la desviación estándar. Ambas medidas están
estrechamente relacionadas ya que definimos una a partir de la otra.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que representan
los datos en su distribución respecto de la media aritmética de dicha distribución, con
objeto de tener una visión de los mismos más acorde con la realidad a la hora de
describirlos e interpretarlos para la toma de decisiones.
El coeficiente de variación es útil para comparar dispersiones a escalas distintas pues
es una medida invariante ante cambios de escala. Por otro lado presenta problemas ya
que a diferencia de la desviación típica este coeficiente es variable ante cambios de
origen. Por ello es importante que todos los valores sean positivos y su media de por
tanto un valor positivo.
Exigimos que:
Se calcula: