Está en la página 1de 14

1.-Estadística: Concepto. División.

Importancia

La estadística se puede definir como el conjunto de métodos científicos ligados a


la toma, organización, recopilación, presentación y análisis de datos, tanto para la
deducción de conclusiones como para tomar decisiones razonables de acuerdo con
tales análisis.

Los objetivos de la investigación científica se pueden entender, de un modo muy


general, en términos de encontrar y describir las variables de interés y las relaciones
entre ellas, para el problema en estudio.

La estadística es la ciencia que estudia los métodos que permiten realizar este
proceso para variables aleatorias. Estos métodos permiten resumir datos y acotar el
papel de la casualidad (azar).

Los métodos estadísticos tradicionalmente se utilizan para propósitos


descriptivos, para organizar y resumir datos numéricos. La estadística descriptiva, por
ejemplo trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y
el cálculo de medidas descriptivas.

Ahora bien, las técnicas estadísticas se aplican de manera amplia en


mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de
consumidores; análisis de resultados en deportes; administradores de instituciones; en
la educación; organismos políticos; médicos; y por otras personas que intervienen en la
toma de decisiones. Durante el siglo XX, la creación de instrumentos precisos para
asuntos de salud pública (epidemiología, bioestadística, etc.) y propósitos económicos
y sociales (tasa de desempleo, econometría, etc.) necesitó de avances sustanciales en
las practicas estadísticas.

Hoy el uso de la estadística se ha extendido más allá de sus orígenes como un


servicio al estado o al gobierno. Personas y organizaciones usan estadística para
entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios
y otras áreas. La estadística es pensada generalmente no como un sub-área de las
matemáticas sino como una ciencia diferente "aliada". Muchas universidades tienen
departamentos en matemáticas y estadística separadamente. La estadística es enseñada
en departamentos tan diversos como psicología, educación y salud pública.

La estadística la podemos dividir en estadística descriptiva y estadística


inferencial

La estadística inferencial o inductiva sirve extrapolar los resultados obtenidos en


el análisis de los datos y a partir de ello predecir acerca de la población, con un
margen de confianza conocido

La estadística descriptiva o deductiva se construye a partir de los datos y la


inferencia sobre la población no se puede realizar, al menos con una confianza
determinada, la representación de la información obtenida de los datos se representa
mediante el uso de unos cuantos parámetros y algunas graficas planteadas de tal forma
que den importancia los mismos datos.

2.- Población y muestra. Muestreo.

El concepto de población en estadística va más allá de lo que comúnmente se


conoce como tal. Una población se precisa como un conjunto finito o infinito de
personas u objetos que presentan características comunes.

El tamaño que tiene una población es un factor de suma importancia en el


proceso de investigación estadística, y este tamaño vienen dado por el número de
elementos que constituyen la población, según el número de elementos la población
puede ser finita o infinita. Cuando el número de elementos que integra la población es
muy grande, se puede considerar a esta como una población infinita, por ejemplo; el
conjunto de todos los números positivos. Una población finita es aquella que está
formada por un limitado número de elementos, por ejemplo; el número de estudiante
del Núcleo San Carlos de la Universidad Nacional Experimental Simón Rodríguez.

Cuando la población es muy grande, es obvio que la observación de todos los


elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para hacerlo.
Para solucionar este inconveniente se utiliza una muestra estadística.

Es a menudo imposible o poco práctico observar la totalidad de los individuos,


sobre todos si estos son muchos. En lugar de examinar el grupo entero llamado
población o universo, se examina una pequeña parte del grupo llamada muestra.

Muestra

La muestra en sentido genérico, es una parte del universo, que reúne todas las
condiciones o características de la población, de manera que sea lo más pequeña
posible, pero sin perder exactitud.

El estudio de muestras es más sencillo que el estudio de la población completa;


cuesta menos y lleva menos tiempo. Por último se aprobado que el examen de una
población entera todavía permite la aceptación de elementos defectuosos, por tanto, en
algunos casos, el muestreo puede elevar el nivel de calidad.

Una muestra representativa contiene las características relevantes de la población


en las mismas proporciones que están incluidas en tal población.

Los expertos en estadística recogen datos de una muestra. Utilizan esta


información para hacer referencias sobre la población que está representada por la
muestra. En consecuencia muestra y población son conceptos relativos. Una población
es un todo y una muestra es una fracción o segmento de ese todo.

Muestreo

Conociendo los términos de población y muestra es más fácil entender lo que es


muestreo
Esto no es más que el procedimiento empleado para obtener una o más muestras
de una población; el muestreo es una técnica que sirve para obtener una o más
muestras de población.

Este se realiza una vez que se ha establecido un marco muestral representativo


de la población, se procede a la selección de los elementos de la muestra aunque hay
muchos diseños de la muestra.

Al tomar varias muestras de una población, las estadísticas que calculamos para
cada muestra no necesariamente serían iguales, y lo más probable es que variaran de
una muestra a otra.

Métodos de muestreo clasificados de acuerdo con el número de muestras tomadas


de una población.

Bajo esta clasificación, hay tres tipos comunes de métodos de muestreo. Estos
son, muestreo simple, doble y múltiple.

Muestreo simple
Este tipo de muestreo toma solamente una muestra de una población dada para el
propósito de inferencia estadística. Puesto que solamente una muestra es tomada, el
tamaño de muestra debe ser lo suficientemente grande para extraer una conclusión.

Una muestra grande muchas veces cuesta demasiado dinero y tiempo.

Muestreo doble
Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra
no es decisivo, una segunda muestra es extraída de la misma población. Las dos
muestras son combinadas para analizar los resultados. Este método permite a una
persona principiar con una muestra relativamente pequeña para ahorrar costos y
tiempo. Si la primera muestra arroja una resultado definitivo, la segunda muestra puede
no necesitarse.

Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la


primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una calidad
muy pobre, el lote es rechazado. Solamente si la primera muestra arroja una calidad
intermedia, será requerirá la segunda muestra.

Muestreo múltiple
El procedimiento bajo este método es similar al expuesto en el muestreo doble,
excepto que el número de muestras sucesivas requerido para llegar a una decisión es
más de dos muestras.

Métodos de muestreo clasificados de acuerdo con las maneras usadas en seleccionar


los elementos de una muestra.

Los elementos de una muestra pueden ser seleccionados de dos maneras diferentes:
a. Basados en el juicio de una persona.
b. Selección aleatoria (al azar)
Muestreo de juicio
Una muestra es llamada muestra de juicio cuando sus elementos son seleccionados
mediante juicio personal. La persona que selecciona los elementos de la muestra,
usualmente es un experto en la medida dada. Una muestra de juicio es llamada una
muestra probabilística, puesto que este método está basado en los puntos de vista
subjetivos de una persona y la teoría de la probabilidad no puede ser empleada para
medir el error de muestreo, Las principales ventajas de una muestra de juicio son la
facilidad de obtenerla y que el costo usualmente es bajo.

Muestreo Aleatorio
Una muestra se dice que es extraída al azar cuando la manera de selección es tal,
que cada elemento de la población tiene igual oportunidad de ser seleccionado. Una
muestra aleatoria es también llamada una muestra probabilística son generalmente
preferidas por los estadísticos porque la selección de las muestras es objetiva y el error
muestral puede ser medido en términos de probabilidad bajo la curva normal. Los tipos
comunes de muestreo aleatorio son el muestreo aleatorio simple, muestreo sistemático,
muestreo estratificado y muestreo de conglomerados.

A. Muestreo aleatorio simple


Una muestra aleatoria simple es seleccionada de tal manera que cada muestra
posible del mismo tamaño tiene igual probabilidad de ser seleccionada de la población.

Para obtener una muestra aleatoria simple, cada elemento en la población tenga
la misma probabilidad de ser seleccionado, el plan de muestreo puede no conducir a
una muestra aleatoria simple. Por conveniencia, este método pude ser reemplazado por
una tabla de números aleatorios. Cuando una población es infinita, es obvio que la
tarea de numerar cada elemento de la población es infinita, es obvio que la tarea de
numerar cada elemento de la población es imposible. Por lo tanto, ciertas
modificaciones del muestreo aleatorio simple son necesarias. Los tipos más comunes
de muestreo aleatorio modificado son sistemáticos, estratificados y de conglomerados.

B. Muestreo sistemático.
Una muestra sistemática es obtenida cuando los elementos son seleccionados en
una manera ordenada. La manera de la selección depende del número de elementos
incluidos en la población y el tamaño de la muestra. El número de elementos en la
población es, primero, dividido por el número deseado en la muestra. El cociente
indicará si cada décimo, cada onceavo, o cada centésimo elemento en la población va a
ser seleccionado.

El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una


muestra sistemática puede dar la misma precisión de estimación acerca de la población,
que una muestra aleatoria simple cuando los elementos en la población están
ordenados al azar.

C. Muestreo Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la población
en grupos, llamados estratos, que son más homogéneos que la población como un todo.
Los elementos de la muestra son entonces seleccionados al azar o por un
método sistemático de cada estrato. Las estimaciones de la población, basadas en la
muestra estratificada, usualmente tienen mayor precisión (o menor error muestral) que
si la población entera muestreada mediante muestreo aleatorio simple. El número de
elementos seleccionado de cada estrato puede ser proporcional o desproporcional al
tamaño del estrato en relación con la población.

D. Muestreo de conglomerados.
Para obtener una muestra de conglomerados, primero dividir la población en
grupos que son convenientes para el muestreo. En seguida, seleccionar una porción de
los grupos al azar o por un método sistemático. Finalmente, tomar todos los elementos
o parte de ellos al azar o por un método sistemático de los grupos seleccionados para
obtener una muestra. Bajo este método, aunque no todos los grupos son muestreados,
cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto la muestra es
aleatoria.

Una muestra de conglomerados, usualmente produce un mayor error muestral


(por lo tanto, da menor precisión de las estimaciones acerca de la población) que una
muestra aleatoria simple del mismo tamaño. Los elementos individuales dentro de cada
"conglomerado" tienden usualmente a ser iguales. Por ejemplo la gente rica puede vivir
en el mismo barrio, mientras que la gente pobre puede vivir en otra área. No todas las
áreas son muestreadas en un muestreo de áreas. La variación entre los elementos
obtenidos de las áreas seleccionadas es, por lo tanto, frecuentemente mayor que la
obtenida si la población entera es muestreada mediante muestreo aleatorio simple. Esta
debilidad puede reducida cuando se incrementa el tamaño de la muestra de área.

El incremento del tamaño de la muestra puede fácilmente ser hecho en muestra


de área. Los entrevistadores no tienen que caminar demasiado lejos en una pequeña
área para entrevistar más familias. Por lo tanto, una muestra grande de área puede ser
obtenida dentro de un corto período de tiempo y a bajo costo.

Por otra parte, una muestra de conglomerados puede producir la misma precisión en la
estimación que una muestra aleatoria simple, si la variación de los elementos
individuales dentro de cada conglomerado es tan grande como la de la población.

3.- Caracteres cualitativos y cuantitativos. Variables discretas y continuas

Variable: Fenómeno que puede tomar diversos valores. Las variables pueden ser
de dos tipos:

Variables cualitativas o atributos: no se pueden medir numéricamente (por


ejemplo: nacionalidad, color de la piel, sexo).

Variables cuantitativas: tienen valor numérico (edad, precio de un producto,


ingresos anuales

Por su parte, las variables cuantitativas se pueden clasificar en discretas y


continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo:
número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).

Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo,
la velocidad de un vehículo puede ser 80,3 Km./h, 94,57 Km./h...etc.

4.- Niveles de medición

Medir significa “asignar números a objetos y eventos de acuerdo a reglas”


(Stevens, 1951), esta definición es adecuada para el área de ciencias naturales, en el
campo de las ciencias sociales medir es “el proceso de vincular conceptos abstractos
con indicadores empíricos” (Carmines y Zeller, 1979, p. 10).

La medición de las variables puede realizarse por medio de cuatro escalas de


medición. Dos de las escalas miden variables categóricas y las otras dos miden
variables numéricas (Therese L. Baker, 1997). Los niveles de medición son las escalas
nominal, ordinal, de intervalo y de razón. Se utilizan para ayudar en la clasificación de
las variables, el diseño de las preguntas para medir variables, e incluso indican el tipo
de análisis estadístico apropiado para el tratamiento de los datos.

Una característica esencial de la medición es la dependencia que tiene de la


posibilidad de variación. La validez y la confiabilidad de la medición de una variable
depende de las decisiones que se tomen para operacionalizarla y lograr una adecuada
comprensión del concepto evitando imprecisiones y ambigüedad, por en caso
contrario, la variable corre el riesgo inherente de ser invalidada debido a que no
produce información confiable.

a) Medición Nominal.
En este nivel de medición se establecen categorías distintivas que no implican un
orden específico. Por ejemplo, si la unidad de análisis es un grupo de personas, para
clasificarlas se puede establecer la categoría sexo con dos niveles, masculino (M) y
femenino (F), los respondientes solo tienen que señalar su género, no se requiere de un
orden real.

Así, si se asignan números a estos niveles solo sirven para identificación y puede
ser indistinto: 1=M, 2=F o bien, se pueden invertir los números sin que afecte la
medición: 1=F y 2=M. En resumen en la escala nominal se asignan números a eventos
con el propósito de identificarlos. No existe ningún referente cuantitativo. Sirve para
nombrar las unidades de análisis en una investigación y es utilizada en cárceles,
escuelas, deportes, etc.

b) Medición Ordinal.
Se establecen categorías con dos o mas niveles que implican un orden inherente
entre si. La escala de medición ordinal es cuantitativa porque permite ordenar a los
eventos en función de la mayor o menor posesión de un atributo o característica. Por
ejemplo, en las instituciones escolares de nivel básico suelen formar por estatura a los
estudiantes, se desarrolla un orden cuantitativo pero no suministra medidas de los
sujetos.
Las formas mas comunes de variables ordinales son ítems (reactivos)
actitudinales estableciendo una serie de niveles que expresan una actitud de acuerdo o
desacuerdo con respecto a algún referente. Por ejemplo, ante el ítem: La economía
mexicana debe dolarizarse, el respondiente puede marcar su respuesta de acuerdo a las
siguientes alternativas:
___ Totalmente de acuerdo
___ De acuerdo
___ Indiferente
___ En desacuerdo
___ Totalmente en desacuerdo

Las anteriores alternativas de respuesta pueden codificarse con números que van
del uno al cinco que sugieren un orden preestablecido pero no implican una distancia
entre un número y otro. Las escalas de actitudes son ordinales pero son tratadas como
variables continuas (Therese L. Baker, 1997).

c) Medición de Intervalo.
La medición de intervalo posee las características de la medición nominal y
ordinal. Establece la distancia entre una medida y otra. La escala de intervalo se aplica
a variables continuas pero carece de un punto cero absoluto. El ejemplo mas
representativo de este tipo de medición es un termómetro, cuando registra cero grados
centígrados de temperatura indica el nivel de congelación del agua y cuando registra
100 grados centígrados indica el nivel de ebullición, el punto cero es arbitrario no real,
lo que significa que en este punto no hay ausencia de temperatura.

Una persona que en un examen de matemáticas que obtiene una puntuación de


cero no significa que carezca de conocimientos, el punto cero es arbitrario por que
sigue existiendo la característica medida.

d) Medición de Razón.
Una escala de medición de razón incluye las características de los tres anteriores
niveles de medición anteriores (nominal, ordinal e intervalo). Determina la distancia
exacta entre los intervalos de una categoría. Adicionalmente tiene un punto cero
absoluto, es decir, en el punto cero no existe la característica o atributo que se mide.
Las variables de ingreso, edad, número de hijos, etc. son ejemplos de este tipo de
escala. El nivel de medición de razón se aplica tanto a variables continuas como
discretas.

5.- manejo de datos

Datos Estadísticos:
Los datos estadísticos no son otra cosa que el producto de las observaciones
efectuadas en las personas y objetos en los cuales se produce el fenómeno que
queremos estudiar. Dicho en otras palabras, son los antecedentes (en cifras) necesarios
para llegar al conocimiento de un hecho o para reducir las consecuencias de este.
Los datos estadísticos se pueden encontrar de forma no ordenada, por lo que es
muy difícil en general, obtener conclusiones de los datos presentados de esta manera.
Para poder obtener una precisa y rápida información con propósitos de descripción o
análisis, estos deben organizarse de una manera sistemática; es decir, se requiere que
los datos sean clasificados. Esta clasificación u organización puede muy bien hacerse
antes de la recopilación de los datos.

Ejemplo:
Si se quiere conocer las características de los estudiantes del Núcleo San Carlos
de la UNESR, que solicitan préstamo a la biblioteca de dicha Universidad, la
recolección de la información debe clasificar a cada estudiante sobre la base de:
Carrera que estudia, edad, semestre de estudios, etc. Vemos pues que la clasificación
marca la pauta de la clase de datos que debe ser obtenido.

Clasificación de los datos


Los datos estadísticos pueden ser clasificados en cualitativos, cuantitativos,
cronológicos y geográficos.

Datos Cualitativos:
Cuando los datos son cuantitativos, la diferencia entre ellos es de clase y no de
cantidad.

Ejemplo:
Si deseamos clasificar los estudiantes que cursan la materia de estadística I por su
estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.

Datos cuantitativos:
Cuando los valores de los datos representan diferentes magnitudes, decimos que
son datos cuantitativos.

Ejemplo:
Se clasifican los estudiantes del Núcleo Anzoátegui de la UDO de acuerdo a sus
notas, observamos que los valores (nota) representan diferentes magnitudes.

Datos cronológicos:
Cuando los valores de los datos varían en diferentes instantes o períodos de
tiempo, los datos son reconocidos como cronológicos.

Ejemplo:
Al registrar los promedios de notas de los Alumnos del Núcleo Anzoátegui de la
UDO en los diferentes semestres.

Datos geográficos:
Cuando los datos están referidos a una localidad geográfica se dicen que son
datos geográficos.

Ejemplo
El número de estudiantes de educación superior en las distintas regiones del país.

Fuentes de datos Estadísticos:


Los datos estadísticos necesarios para la comprensión de los hechos pueden
obtenerse a través de fuentes primarias y fuentes secundarias.
Fuentes de datos primarias: es la persona o institución que ha recolectado
directamente los datos.

Fuentes secundarias: son las publicaciones y trabajos hechos por personas o


entidades que no han recolectado directamente la información.

Las fuentes primarias más confiables, son las efectuadas por oficinas
gubernamentales encargadas de tal fin.

En la práctica, es aconsejable utilizar fuentes de datos primarias y en última


instancia cuando estas no existan, usar estadísticas de fuentes secundarias. Con este
último tipo no debemos pasar por alto que la calidad de las conclusiones estadísticas
dependen en grado sumo de la exactitud de los datos que se recaben. De anda serviría
usar técnicas estadísticas precisas y refinadas para llegar a conclusiones valederas, si
estas técnicas no son aplicadas a datos adecuados o confiables.

Cuando un investigador quiere obtener datos estadísticos relativo a un estudio


que desea efectuar, puede elegir entre una fuente primaria o en su defecto, una
secundaria. O recopilar los datos por sí mismo. La posibilidad mencionada en último
termino podrá deberse bien a la inexistencia de los datos o bien a que esto no se
encuentran discriminados en la forma requerida.

Ejemplo:
Si un investigador quiere conocer el número de alumnos repitientes en educación
media, clasificados por ciclos, para los últimos diez años, el investigador puede usar
una fuente primaria, tal como la memoria y cuenta el Ministerio de Educación cada
año.
Método para la recolección de datos:
En estadística se emplean una variedad de métodos distintos para obtener
información de los que se desea investigar. Discutiremos aquí los métodos más
importantes, incluyendo las ventajas y limitaciones de estos.

La entrevista personal: los datos estadísticos necesarios para una investigación,


se reúnen frecuentemente mediante un proceso que consiste en enviar un entrevistador
o agente, directamente a la persona investigada. El investigador efectuará a esta
persona una serie de preguntas previamente escritas en un cuestionario o boleta, donde
anotará las respuestas correspondientes. Este procedimiento que se conoce con el
nombre de entrevista personal, permite obtener una información más veraz y completa
que la que proporcionan otros métodos, debido a que al tener contacto directo con la
persona entrevistada, el entrevistador podrá aclarar cualquier duda que se presente
sobre el cuestionario o investigación.

Otra ventaja es la posibilidad que tienen los entrevistadores de adaptar el lenguaje


de las preguntas al nivel intelectual de las personas entrevistadas.

Una de las desventajas de este método se debe a que si el entrevistador no obra de


buena fe o no tiene un entrenamiento adecuado, puede alterar las respuestas por las
personas entrevistadas.
Otra desventaja es su alto costo, ya que resulta bastante oneroso el entrenamiento
de los agentes o entrenadores y los supervisores de estos, sobre todo si se trata de una
investigación extensa.

Cuestionarios por correo: consiste en enviar por correo el cuestionario


acompañado por el instructivo necesario, dando en este no solo las instrucciones
pertinentes para cada una de las preguntas, sino también una breve explicación del
objeto de la encuesta con el fin de evitar interpretaciones erróneas.

Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento,
puesto que no hay que incluir gastos de entrenamiento de personal, el único gasto sería
el de franqueo postal.

Dentro de las desventajas de este procedimiento podemos señalar que solo un


porcentaje bastante bajo de estos es devuelto, en algunos casos no estamos seguros de
que los formularios hayan sido recibidos por sus destinatarios y que hayan sido
respondido por ellos mismos. Lo que trae como consecuencia que la información se
obtenga con una serie de errores difíciles de precisar por el investigador.

Entrevista por teléfono: como lo indica su nombre, este método consiste en


telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este método es
bastante simple y económico, ya que el entrenamiento y supervisión de las personas
encargadas de efectuar las preguntas es siempre fácil.

Entre las limitaciones que presenta este método podemos señalar el número de
preguntas que pueden formularse es relativamente limitado; además las investigaciones
efectuadas por este método tienen un carácter selectivo, debido a que muchas de las
personas que potencialmente podrían ser investigadas no posee servicio telefónico, por
lo que quedan sin la posibilidad de ser entrevistados.

Instrumentos para la recolección de datos:

Cuestionarios:
Cualquiera que sea el método por el que se decida el investigador para recabar
información, es necesario elaborar un estudio de preguntas.

Los cuestionarios en general, constan de las siguientes partes:


a. La identificación del cuestionario: nombre del patrocinante de la encuesta,
(oficial o privada), nombre de la encuesta, número del cuestionario, nombre del
encuestador, lugar y fecha de la entrevista.
b. Datos de identificación y de carácter social del encuestado: apellidos, nombres,
cédula de identidad, nacionalidad, sexo, edad o fecha de nacimiento, estado
civil, grado de instrucción, ocupación actual, ingresos, etc.
c. Datos propios de la investigación, son los datos que interesa conocer para
construir el propósito de la investigación.

Como es natural, estas partes, así como las preguntas, varían de acuerdo a la
finalidad de la encuesta. En algunos tipos de investigación, la parte referente a los
datos personales es eliminada por no tener ningún tipo de interés para el estudio.
Consideraciones que debemos tomar en cuenta:
• El cuestionario debe ser conciso; tratar en los posible de que con el menor
número de preguntas, se obtenga la mejor información.
• Claridad de la redacción; evitar preguntas ambiguas o que sugieran respuestas
incorrectas, por lo que deben estar formuladas las preguntas de la forma más
sencilla.
• Discreción: un cuestionario hecho a conciencia, no debe tener preguntas
indiscretas o curiosas, sobre datos personales que puedan ofender al
entrevistado.
• Facilidad de contestación: se deben evitar, en lo posible, las preguntas de
respuestas libres o abiertas y también la formulación de preguntas que
requieran cálculos numéricos por parte del entrevistado.
• Orden de las preguntas: estas deben tener una secuencia y un orden lógico,
agruparlas procurando que se relacionen unas con otras.

Distribución de fecuencias

Medidas de dispersion
Las medidas de dispersión muestran la variabilidad de una distribución, indicando por
medio de un número si las diferentes puntuaciones de una variable están muy alejadas
de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea,
más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían
mucho entre ellos.
Para calcular la variabilidad que una distribución tiene respecto de su media, se calcula
la media de las desviaciones de las puntuaciones respecto a la media aritmética. Pero la
suma de las desviaciones es siempre cero, así que se adoptan dos clases de estrategias
para salvar este problema. Una es tomando las desviaciones en valor absoluto
(Desviación media) y otra es tomando las desviaciones al cuadrado (Varianza).
El rango estadístico es la diferencia entre el valor mínimo y el valor máximo en un
grupo de números. Para averiguar el rango de un grupo de números:
• Ordenamos los números según su tamaño.
• Restamos el valor mínimo del valor máximo.
Ejemplo
Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus
valores se encuentran en un rango de:
Rango = 100 – 1 =99

Varianza
La varianza es una variable estadística que mide la dispersión de los valores respecto a
un valor central (media), es decir, la media de las diferencias cuadráticas de las
puntuaciones respecto a su media aritmética.

Propiedades
• La varianza es siempre positiva o 0:
• Si a los datos de la distribución les sumamos una cantidad constante la varianza
no se modifica.
Yi = X i + k

• Si a los datos de la distribución les multiplicamos una constante, la varianza


queda multiplicada por el cuadrado de esa constante.

• Propiedad distributiva: V(X + Y) = V(X) + V(Y)

Cuartiles. Son los puntos que dividen a una distribución de valores en cuatro
porciones iguales o intervalos

Deciles. Son los cuartiles que dividen una distribución en 10 tantos o intervalos,
por lo que se tienen 9 puntos de división, los deciles, que originan los 10 intervalos.

CENTILES O PERCENTILES
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de
ubicación o clasificación de las personas cuando atienden características tales como
peso, estatura, etc.

Los percentiles son ciertos números que dividen la sucesión de datos ordenados en
cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99),
leídos primer percentil,..., percentil 99.

Coeficiente de asimetría
Mide el grado de asimetría de la distribución con respecto a la media. Un valor
positivo de este indicador significa que la distribución se encuentra sesgada hacia
la izquierda (orientación positiva). Un resultado negativo significa que la
distribución se sesga a la derecha.

Coeficiente de Correlación de Pearson


El coeficiente de correlación de Pearson, r, nos permite saber si el ajuste de la nube de
puntos a la recta de regresión obtenida es satisfactorio. Se define como el cociente
entre la covarianza y el producto de las desviaciones típicas (raíz cuadrada de las
varianzas).

Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar mediante


cualquiera de las dos expresiones siguientes:
Propìedades
• El coeficiente de correlación, r, presenta valores entre –1 y +1.
• Cuando r es próximo a 0, no hay correlación lineal entre las variables. La nube
de puntos está muy dispersa o bien no forma una línea recta. No se puede trazar
una recta de regresión.
• Cuando r es cercano a +1, hay una buena correlación positiva entre las
variables según un modelo lineal y la recta de regresión que se determine tendrá
pendiente positiva, será creciente.
• Cuando r es cercano a -1, hay una buena correlación negativa entre las
variables según un modelo lineal y la recta de regresión que se determine tendrá
pendiente negativa: es decreciente.

La desviación media es la media de las diferencias en valor absoluto de los valores a la


media.

Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil


manipular dicha función al no ser derivable.
Siendo más formales, la desviación media debería llamarse desviación absoluta
respecto a la media, para evitar confusiones con otra medida de dispersión, la
desviación absoluta respecto a la mediana, DM, cuya fórmula es la misma,
sustituyendo la media aritmética por la mediana M. Pero tal precisión no es
relevante, porque la desviación absoluta respecto a la mediana es de uso todavía menos
frecuente.
La desviación absoluta respecto a la media, Dm, la desviación absoluta respecto a la
mediana, DM, y la desviación típica, σ, de un mismo conjunto de valores verifican la
desigualdad:

Siempre ocurre que


Donde el Rango es igual a
Rango = valor máximo − valor mínimo
Dm = 0 cuando los datos son exactamente iguales (e iguales a la media aritmética)

justo sólo hay dos valores en los datos, :a,b, y hay exactamente la
mitad de datos igual a :a y :b.
La desviación estándar (o desviación típica) es una medida de dispersión para variables
de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva.
Es una medida (cuadrática) que informa de la media de distancias que tienen los datos
respecto de su media aritmética, expresada en las mismas unidades que la variable.
Para abordar las cuestiones que comentábamos en el párrafo anterior, nos valemos de
herramientas como la varianza y la desviación estándar. Ambas medidas están
estrechamente relacionadas ya que definimos una a partir de la otra.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer también la desviación que representan
los datos en su distribución respecto de la media aritmética de dicha distribución, con
objeto de tener una visión de los mismos más acorde con la realidad a la hora de
describirlos e interpretarlos para la toma de decisiones.
El coeficiente de variación es útil para comparar dispersiones a escalas distintas pues
es una medida invariante ante cambios de escala. Por otro lado presenta problemas ya
que a diferencia de la desviación típica este coeficiente es variable ante cambios de
origen. Por ello es importante que todos los valores sean positivos y su media de por
tanto un valor positivo.
Exigimos que:
Se calcula:

Donde σ es la desviación típica. Se puede dar en tanto por ciento calculando:

Por exceso. cuando el número♣REDONDEO DE DATOS “Técnicas de Redondeo”


Criterio♣inmediato posterior es 5 o mayor que 5, entonces se aumenta en uno del
número par más próximo. Cuando el número dado está justamente a la mitad (que
termina en 5) del recorrido entre dos números, se acostumbra en tales situaciones
redondear al “número par” más próximo al número que antecede al 5

NOTA: Otro coeficiente es el coeficiente de asimetría de Bowley, menos utilizado. El


cual esta basado en la posición de los cuartiles y la mediana, para lo cual los
relacionaremos de acuerdo con la siguiente expresión:
C3 + C1 − 2Me
Ab=
C3 + C1

También podría gustarte