Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad I Conceptos Basicos Estad
Unidad I Conceptos Basicos Estad
Concepto de Estadística:
Desde este punto de vista, se puede concluir que la estadística se define como un
conjunto de métodos para manejar la obtención, presentación y análisis de
observaciones numéricas, cuyos fines son describir al conjunto de datos obtenidos y
tomar decisiones o realizar generalizaciones acerca de las características de todas las
observaciones bajo consideración.
Esto se debe a la creciente facilidad con la cual se pueden manejar grandes cantidades
de datos numéricos, debido al uso de …
Muestra:
Es un subconjunto de la población. Este grupo representa una parte de los sujetos que
forman la población, los cuales se pueden escoger de manera aleatoria o intencional,
solo el primero de ellos será estudiado en este curso. Ejemplos: Número de alumnos
en el salón de clases que estudian Licenciatura en Educación, profesores del Núcleo de
Sucre de la Universidad de Oriente, etc.
Tipos de datos y escalas de medida
Tipos de variables:
Variables Cualitativa:
Las variables categóricas resultan de registrar la presencia de un atributo.
Las categorías de una variable cualitativa deben ser definidas claramente durante la
etapa de diseño de la investigación y deben ser mutuamente excluyentes y
exhaustivas. Esto significa que cada unidad de observación debe ser clasificada sin
ambigüedad en una y solo una de las categorías posibles y que existe una categoría
para clasificar a todo individuo.
Ejemplos:
Sexo: f/m.
Hábito de fumar: Fumador/No fumador
Color de ojos: negro, azul, marrón, …
Religión: católica, evangélica, …
Estado civil: soltero, casado, divorciado,…
Ejemplos:
Peso.
Edad.
Estatura.
Presión.
Humedad.
Intensidad de un sismo.
Cantidad de hermanos.
Las variables Cuantitativas puden clasificarse en:
Variables Discreta: Es aquella cuyos valores pueden ponerse en correspondencia con los números naturales
(N:1,2,3,4,...) o con parte de ellos. Es decir, los valores de la variable pueden contarse. también se puede decir
que en la variable discreta se llega a algunos valores por ejemplo A y B de manera tal que entre esos dos valores no
existe otro valor de la variable. Llega un momento en la que se producen saltos entre los valores de la variable.
Este tipo de variable sólo puede tomar un cierto conjunto de valores posibles. En general,
aparecen por conteo.
Ejemplo:
cantidad de hermanos.
número de miembros del hogar
número de intervenciones quirúrgicas
número de casos notificados de una cierta patología
Una variable "x" es continua si cumple con la siguiente condición: Valores que puede toar
la variable (A y B). Siempre es posible encontrar un tercer valor C, comprendido entre
A y B, el cual, teóricamente, también puede ser asumido por la variable. Como este
procedimiento puede repetirse reiterada y consecutivamente de manera indefinida,
entonces la condición anterior equivale a la siguiente premisa. Dado dos valores A y B
de la variable, siempre es posible que la variable "x" tome cualquier valor comprendido
entre A y B. Es decir, podemos ir desde A hasta B y tener la seguridad que a cada
punto le corresponde un valor de la misma variable.
Ejemplo:
La distinción entre datos discretos y continuos es importante para decidir qué método de
análisis estadístico utilizar, ya que hay métodos que suponen que los datos son
continuos.
Del mismo modo, la variable número de pulsaciones/min. es una variable discreta, pero se
la trata como continua debido al gran número de valores posibles.
Nota:
N°1)
Una variable que teóricamente puede tomar cualquier valor entre dos valores dados se
le llama variable continua. si no es así se le llama discreta.
N°2)
Los datos que vienen definidos por una variable discreta o continua se llaman datos
discretos o continuos respectivamente. El número de hijos en cada una de 1.000
familias es un ejemplo de datos discretos, mientras que las alturas de 100
universitarios es un ejemplo de datos continuos.
SENSIBILIDAD (ESTADÍSTICA):
Xi: 12 14 19 21 23 9 17 32 18 22 19 11 18
S=1
nótese que todos los datos son números enteros y por tanto contables, los cuales se
pueden poner en correspondencia con el conjunto de los números naturales (N), cuya
menor unidad de medida es 1. Esto significa que podemos construir todos los números
de la serie Xi sumando de uno en uno hasta obtener cada uno de los valores
reportados. Miremos ahora la siguiente serie de datos:
Yi: 12,4 14,1 19,0 21,7 23,6 9,8 17,2 32,9 18,3
En la serie Yi los valores reportados son medidos de tal manera que los valores no se
obtienen sumando de uno en uno, como en el caso de la serie anterior (Xi), sino que
ha utilizado una unidad de medida mas pequeña, tan pequeña como el número de
decimales que pueda poseer alguno de los valores reportados. En este caso todos los
valores reportados tienen un decimal, por lo que se puede afirmar que la sensibilidad
de la serie de datos Yi es igual a 1 (S=0,1)
NOTA:
La sensibilidad en la escala de medición de una variable continua NO se puede precisar
si el valor medido (valor reportado) de la variable, coincide con el valor real (valor
verdadero) de la variable.
Esto significa que dado el valor reportado siempre queda la duda de la ubicación del
valor verdadero. Por consiguiente, es necesario colocar algunos límites para el valor
verdadero de la variable y esto último tiene que ver con la sensibilidad de la medición
de la variable continua.
Límite Inferior:
Se obtiene restándole la mitad de la sensibilidad (s) al valor reportado (Vr) de la
variable:
Límite Superior:
Se obtiene sumándole la mitad de la sensibilidad (s) al valor reportado (Vr) de la
variable:
Ejemplo:
/ / /
33,5 35 36,5
Lim. inf. Vr Lim. sup.
ESCALAS DE MEDICIÓN
Escala nominal: nos permite identificar sujetos como "iguales" o "diferentes". Usando
una escala nominal podemos decidir si un sujeto es igual o diferente a otro, pero no
podemos establecer relaciones de orden respecto a esa característica, ni relaciones de
cantidad ni de diferencia. Por ejemplo: si medimos el color de los ojos podemos
establecer la siguiente escala: A → azul, V → verde, M → marrón y N → negro. No
podemos ordenar los sujetos de mayor a menor o viceversa, simplemente podemos
asegurar si dos sujetos tienen el mismo o distinto color de ojos. Otros ejemplos:
nacionalidad, sexo, profesión. A este tipo de variables medidas con escala nominal se
les puede asignar a cada categoría cualquier tipo de símbolos. En el ejemplo hemos
asignado letras pero podíamos haber optado por números: 1 → azul, 2 →verde,
3 → marrón y 4 → negro.
DISTRIBUCIÓN DE FRECUENCIAS
En estadística, se le llama distribución de frecuencias a la agrupación de datos en
categorías mutuamente excluyentes que indican el número de observaciones en
cada categoría.1 Esto proporciona un valor añadido a la agrupación de datos. La
distribución de frecuencias presenta las observaciones clasificadas de modo que
se pueda ver el número existente en cada clase. Estas agrupaciones de datos
suelen estar agrupadas en forma de tablas.
Una distribución de frecuencias es un formato tabular en la que se organizan los
datos en clases, es decir, en grupos de valores que describen una característica
de los [datos] y muestra el número de observaciones del conjunto de datos que
caen en cada una de las clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numérico. En
principio, en la tabla de frecuencias se detalla cada uno de los valores diferentes
en el conjunto de datos junto con el número de veces que aparece, es decir, su
Frecuencia. Se puede complementar la frecuencia absoluta con la denominada
frecuencia relativa, que indica la frecuencia en porcentaje sobre el total de datos.
En variables cuantitativas se distinguen por otra parte la frecuencia simple y la
frecuencia acumulada.
La tabla de frecuencias puede representar gráficamente en un histograma
(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias y
en el horizontal los intervalos de valores.
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma
de tabla de los datos estadísticos, asignando a cada dato su frecuencia
correspondiente.
Frecuencia Simple (fi)
La frecuencia simple es el número de veces que aparece un determinado valor
reportado en un estudio estadístico. Se representa por fi. La suma de las
frecuencias simple es igual al número total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma
mayúscula) que se lee suma o sumatoria.
Σ fi = N (número total de datos de la distribución)
Frecuencia Relativa Porcentual (fr%)
La frecuencia relativa porcentua es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos. Se puede expresar en tantos por
ciento y se representa por fi. La suma de las frecuencias relativas es igual a 100.
Frecuencia Acumulada (fac)
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado. Se representa por fac.
Frecuencia Relativa Acumulada Porcentual (frac%)
La frecuencia relativa acumulada porcentual es el cociente entre la frecuencia
acumulada de un determinado valor y el número total de datos expresada en
tantos por ciento.
EJEMPLO ILUSTRATIVO
A 40 estudiantes se les pidió que estimen el número de horas que habrían
dedicado a estudiar la semana pasada (tanto en clase como fuera de ella),
obteniéndose los siguientes resultados
36 30 47 60 32 35 40 50
54 35 45 52 48 58 60 38
32 35 56 48 30 55 49 39
58 50 65 35 56 47 37 56
58 50 47 58 55 39 58 45
Solución:
1 Calculando el Recorrido Verdadero, se obtiene:
Rv = Vmax – Vmin + S = 65 -30 + 1 = 36