Documentos de Académico
Documentos de Profesional
Documentos de Cultura
UNIDAD I:
La estadística y la investigación
Facilitador Participante
Alirio Lopez Paz S. Luis Miguel
C.I. 25.444.053
La estadística
La investigación
Una unidad de observación es la unidad descrita por los datos que uno analiza. Por
ejemplo, en un estudio de la demanda de dinero, la unidad de observación podría
elegirse como individuo, con diferentes observaciones (puntos de datos) para un punto
dado en el tiempo que difieren en cuanto a qué individuo se refieren; o la unidad de
observación podría ser el país, con diferentes observaciones que difieren solo con
respecto al país al que se refieren.
Un estudio puede tener una unidad de observación y una unidad de análisis diferentes:
por ejemplo, en la investigación comunitaria, el diseño de la investigación puede
recopilar datos a nivel individual de observación, pero el nivel de análisis puede ser a
nivel de vecindario, extrayendo conclusiones sobre las características del vecindario a
partir de datos recogidos de particulares. En conjunto, la unidad de observación y el
nivel de análisis definen la población de una empresa de investigación.
Variables
Las propiedades del sistema numérico asociadas con las escalas de medición son la
identidad, magnitud, igual intervalo y cero absoluto (Stevens, 1957):
1-Identidad: cada número tiene un significado particular.
2-Magnitud: los números tienen un orden inherente ascendente o descendente.
3-Intervalos iguales: las diferencias entre números en cualquier punto de la escala son
las mismas (la diferencia entre 10 y 20 es la misma que entre 100 y 110).
4-Cero absoluto: el punto cero en la escala de medición representa la ausencia de la
propiedad que se estudia.
Niveles de Medición.
Una variable es cualquier cantidad que puede ser medida y cuyo valor varía a través de
la población. Por ejemplo, si consideramos una población de estudiantes, la
nacionalidad del estudiante, género, calificaciones, etc. son todas las variables
definidas, y su valor correspondiente diferirá para cada estudiante.
El tipo de prueba estadística que puede utilizarse para llegar a una conclusión sobre la
población en general depende del nivel de medición de la variable considerada. El nivel
de medición de una variable no es otra cosa que la naturaleza matemática de una
variable o cómo se mide una variable.
Una característica esencial de la medición es la dependencia que tiene de la
posibilidad de variación. La validez y la confiabilidad de la medición de una variable
depende de las decisiones que se tomen para operacionalizarla y lograr una adecuada
comprensión del concepto evitando imprecisiones y ambigüedad, por en caso contrario,
la variable corre el riesgo inherente de ser invalidada debido a que no produce
información confiable.
Escalas de Medición.
1) La escala nominal. Comprende los datos nominales que no tienen un orden: los
datos dicotómicos solo pueden tomar dos valores posibles (como vivo o muerto). Es el
nivel de medición más débil. Los números u otros símbolos se usan simplemente para
clasificar un objeto, persona o característica. Ejemplos: número de ficha clínica, de
teléfono, de permiso de circulación, números en las camisetas de un equipo de fútbol.
En una escala nominal, la operación consiste en dividir una clase determinada en un
conjunto de subclases mutuamente excluyentes. La única relación envuelta es la de
equivalencia, simbolizada por el signo =, o su ausencia, por el símbolo ≠.
2) Escala ordinal o de rangos. Comprende los datos ordinales con un mínimo de tres
valores posibles y con un número total limitado. Los objetos en una categoría no sólo
son diferentes de los objetos en otras categorías de esa misma escala sino que tienen
alguna relación con ellos. Relaciones típicas son: mayor, más alto, más difícil, más
enfermo, menos grave. Su significado específico depende de la naturaleza de la
relación que define esa escala. Ejemplos: escalas de clase socioeconómica, grados de
un linfoma, grados de Mallampati, clasificación ASA. Muchas pruebas o escalas de
evaluación resultan en puntajes que tienen la fortaleza de rangos: el puntaje del Mini
Mental State, la escala de Glasgow o el puntaje APACHE son buenos ejemplos. Aun
cuando estos puntajes pueden parecer más precisos que los rangos, generalmente no
cumplen con los requisitos de escalas de mayor nivel y deben ser consideradas como
ordinales.
La diferencia fundamental entre una escala nominal y la ordinal estriba en que ésta
incorpora la relación de “mayor que” (>) o “menor que” (<) a la de equivalencia (=).
Cualquier transformación que no altere el orden de las clases es permisible. La mejor
descripción de la tendencia central es la mediana ya que ésta no se ve afectada por
cambios de puntajes, en tanto no se altere el número de cuentas sobre o bajo ella. Con
la escala ordinal es posible usar todo el rango de pruebas estadísticas conocidas como
“estadísticas ordinales o de rango” o “no paramétricas”. La única presunción de estas
pruebas es que los puntajes deben ser sacados de una distribución continua.
Las escalas visuales análogas (EVA) pertenecen estrictamente a este grupo y en rigor
debieran ser analizadas con pruebas no paramétricas. Sin embargo, algunos autores
han aducido que el error introducido por un análisis paramétrico es de escasa magnitud
y que no altera las conclusiones, por lo que bien puede aprovecharse la mayor potencia
de las pruebas paramétricas, práctica ampliamente aceptada en la literatura
anestesiológica.
El orden de las escalas indica la cantidad relativa de información que contiene cada una
de las ellas. Las mediciones de un nivel de información concreto pueden transformarse
o reescalarse a un nivel inferior, pero no es posible reescalar las variables a un nivel
superior al que se midieron realmente. Al reescalar a un nivel inferior se pierde
información, hecho que tiende a aumentar el error tipo II, de no encontrar una diferencia
cuando en realidad existe, si todo lo demás se mantiene igual. En otras palabras,
reescalar a un nivel inferior reduce la potencia estadística por lo que debe evitarse; por
ejemplo, reducir la edad a dos o más grupos, transformando una variable continua en
una categórica.
UNIDAD II
Presentación y sistematización de Datos
Presentación y sistematización de Datos
Las tablas de frecuencias son recuadros en los que se señalan los datos estadísticos
de manera organizada con la frecuencia de cada uno de los valores que puede tomar la
variable a estudiar. Se muestran en columnas y filas con el propósito de analizar,
sintetizar e ilustrar la información procedente de los datos recopilados de una de las
investigaciones o estudios determinados
Las frecuencias son el número de períodos que se repite un valor determinado de una
variable. Por ejemplo; si se mide la edad de 6 personas y se obtiene 22, 21, 30, 24, 22 y
30 se tiene que la frecuencia de 22 es 2, es decir, dos personas de veintidós años. 21
tendrá frecuencia 1, 24 frecuencia 1 y 30 frecuencia 2.
Los niños entre 0 años y 2 años constituyen 78,33% de los niños observados.
- Diagrama de barras
Ejemplo: Hemos encuestado a 50 estudiantes del colegio sobre su deporte favorito. Los
resultados los hemos organizado en esta tabla de frecuencias.
Se trazan puntos o marcas que representan esos datos y se unen con segmentos.
En este ejemplo hemos tomado las temperaturas mínimas durante una semana de la
estación meteorológica del colegio y lo hemos representado como una línea poligonal
que nos indica muy bien las variaciones.
UNIDAD III
Reducción de las observaciones
Medidas de posición
Las medidas de posición son valores que permiten dividir el conjunto de datos en partes
porcentuales iguales y se usan para clasificar una observación dentro de una población
o muestra. Las medidas de posición más usuales son los cuartiles, los deciles y los
percentiles.
Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales. % de los datos. Se dividen por 4 Como se
calculan? dividen el conjunto en cuatro partes iguales. Por ejemplo, si el conjunto de
datos es de 20 elementos, N=20, tendremos que el sujeto del primer cuartil es el
(N+1)/4=(20+1)/4=21/4=5,25.
Deciles
El percentil es una medida de posición usada en estadística que indica, una vez
ordenados los datos de menor a mayor, el valor de la variable por debajo del cual se
encuentra un porcentaje dado de observaciones en un grupo. Como se resuelve?
El percentil es una medida de posición no central. Por ejemplo, si el conjunto tiene 199
elementos, (N+1)·i/100=200·50/100=100, por lo que el percentil 50 será P50=X100.
- Ordenamos de menor a mayor: 1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18,
20
- N = número de muestras = 16 muestras
- x = (N · i) / 4 = (16 · 1) / 4 = 4
- Como x = 4 es un número sin decimales, entonces el cuartil 1 es el valor de la
muestra que ocupa la posición 4
- Q1 (cuartil 1) = 9
Las medidas de tendencia central son parámetros estadísticos que informan sobre el
centro de la distribución de la muestra o población estadística. Son medidas
estadísticas que pretenden resumir en un solo valor a un conjunto de valores.
Representan un centro en torno al cual se encuentra ubicado el conjunto de los datos.
Las medidas de tendencia central más utilizadas son
= 6.75
Así, la media es 6.75.
Trabajador Salario
1 €. 1.236
2 €. 1.236
3 €. 859
4 €. 486
5 €. 1.536
6 €. 1.536
7 €. 1.621
8 €. 978
9 €. 1.236
10 €. 768
- Número de valores: 6
Calculamos la Varianza:
Número de valores: 6
- Número de valores: 6
Como conclusión tenemos que el segundo alumno saca mejores notas (media
aritmética = 13 respecto a 10 del primero) pero sin embargo es menos constante
ya que su desviación típica es mucho más alta (vemos como saca notas muy
diferentes).
Desviación media
Donde:
x̄ : media aritmética de los datos.
x1, x2, x3, …, xn: datos.
xi: cada uno de los datos.
n: número de datos.
Ejemplo: Calcular la desviación media de los siguientes datos: 3, 5, 8, 6, 2, 4, 7 y 5.
Sumamos los datos y calculamos su media aritmética, teniendo en cuenta que son 8
datos (n = 8).
Ahora sí, calculamos la desviación media con los valores obtenidos en la tabla:
La desviación media siempre queda expresada en las mismas unidades que los datos
originales, por ejemplo, si los datos originales están expresados en kilogramos, pues la
desviación media también quedará expresada en kilogramos.