Está en la página 1de 7

Estadística

Conceptos Básicos
Estadística:
ciencia que se ocupa de la recogida de datos, su organizació n y aná lisis, así como de
las predicciones que, a partir de estos datos, pueden hacerse.
entonces
¿Qué estudia la Estadística?
Esta es la rama de la matemá tica que se ocupa de recopilar datos en censos,
encuestas, muestras y de organizarla para una mejor comprensió n del fenó meno
que se desea estudiar analizá ndolos con un determinado objetivo.
La Estadística se aplica a todas las ciencias pues facilita el estudio de hechos del
mundo o de la sociedad, teniendo en cuenta la divisió n de la Estadística:

Divisiones de la Estadística
Estadística Inferencial:
Conjunto de técnicas y métodos que son usados para sacar conclusiones generales
acerca de una població n usando datos de una muestra tomada de ella.

 Estadística descriptiva:
conjunto de técnicas y métodos que son usados para recolectar organizar y
presentar en forma de tablas y grá ficos la informació n numérica que nos
pueda resumir el objeto de estudio.
Aquí se incluye el cá lculo de medidas estadísticas de centralidad y de
variabilidad
 Estadística inferencial:
Conjunto de técnicas y métodos que son usados para sacar conclusiones
generales acerca de una població n usando datos de una muestra tomada de la
població n con un grado de fiabilidad de estas conclusiones.
Conceptos Básicos
Población:
Es el conjunto de individuos o elementos sobre el que estamos interesados en
obtener conclusiones es decir hacer inferencias.
Normalmente se dice que la població n es demasiado grande para poder abarcarlo.
Muestra:
Es un subconjunto de la població n al que tenemos acceso y sobre el que realmente
hacemos las observaciones o mediciones el cual debería ser representativo
Está formada por miembros seleccionados de la població n ya sea individuos
unidades experimentales que son representativo de la població n.
Muestreo:
Procedimiento de selecció n de las muestras.
Representatividad de la muestra:
Las muestras son partes de la població n, pero no son la població n completa.
Por ello, sus características no suelen coincidir con las de la població n.
La medida en que la muestra aproxima a la població n se denomina
representatividad.
Sesgo:
Es la discrepancia entre las características de las muestras y las de la població n.
Análisis univariado:
Analiza una sola variable.
Es má s sencillo, má s fá cil de entender y de interpretar.
En cambio, la sencillez puede comportar una simplificació n excesiva de la realidad.
Por ejemplo, un investigador quiere hacer un estudio del rendimiento académico
universitario, para lo cual recoge las calificaciones de los estudiantes en los
exá menes finales. Es claro que una caracterizació n del rendimiento basada
exclusivamente en las calificaciones académicas es incompleta y que, si queremos
conocer los condicionantes del rendimiento deberíamos incluir otros variables
(como actitud, preparació n previa, etc.) y estudiar có mo interactú an para dar
cuenta de las variables de interés.
Análisis multivariado:
Analiza los datos teniendo en cuenta las relaciones entre las variables.
Es má s complejo y de comprensió n má s dificultosa, pero proporciona informació n
má s completa del objeto estudiado.
Individuo:
Cualquier elemento que posea la propiedad o característica que se desea estudia;
es decir cada elemento de la població n.
Variable estadística:
Característica que se desea estudiar de los elementos de una població n.
Las distintas observaciones de la variable constituyen los datos de la investigació n.
Es una Característica que puede presentar distintas modalidades.
Por ejemplo,
la variable "género" solo presenta dos modalidades (mujer y hombre), y
la variable "depresió n" presenta un nú mero infinito de modalidades,
(las magnitudes de gravedad con que puede afectar a las personas).

Clasificación de Variables
Variables: una variable es una característica observable que varía entre los
diferentes individuos de una població n, La informació n que
disponemos de cada individuo es resumida en variables
Variables cualitativas o atributos:
Si sus valores o modalidades no se pueden asociar naturalmente a un nú mero es
decir no se pueden hacer operaciones algebraicas con ellas
Los datos no toman valores numéricos es decir aquellas que no se pueden medir.

Diagrama de sectores.
Consiste en un círculo subdividido en á reas cada una de las cuales es proporcional
a la frecuencia de la modalidad que representa.
Ejemplo con los datos de exhibició n de imá genes en la televisió n:

Diagrama de barras:
Consiste en un conjunto de barras (tantas como modalidades de la variable) cuya
altura es proporcional al nú mero de frecuencias de la modalidad.
Ejemplo con los mismos datos:

Variables cuantitativas Atendiendo la naturaleza:


Cuantitativas o Numéricas Si sus valores son numéricos. Tiene sentido hacer
operaciones algebraicas con ellos
Los datos toman valores numéricos.
• Discretas: Los datos só lo pueden tomar un nú mero finito de valores 
toman nú meros enteros.
Diagrama de barras.

• Continuas: Los datos pueden tomar cualquier valor real.


Histograma:
Semejante al diagrama de barras, la diferencia consiste en que las barras son
adyacentes, lo cual indica que el nivel de medició n es de intervalo, cuando menos.
Polígono de frecuencias:
Se obtiene uniendo con líneas rectas los puntos medios de los rectá ngulos del
histograma.
Curva suavizada:
Aproxima mediante la línea curva los vértices del histograma: La curva suavizada
tiene por finalidad visualizar la forma de la distribució n eliminando la variació n
ocasionada por los datos particulares con que se trabaja.
Ejemplo de histograma con curva suavizada:

Perfil ortogonal: Se obtiene uniendo mediante líneas rectas los puntos que se
corresponden con las magnitudes de las variables. El eje vertical contiene la escala
de la variable y el eje horizontal las modalidades de la variable o, a veces, la escala
temporal.

Atendiendo a la Escala
Escala nominal: Modalidades sin ningú n orden ni jerarquía entre ellas.
Si sus valores no pueden ordenar sexo, grupo sanguíneo religió n
nacionalidad fuma(si/no)
Escala ordinal: Modalidades con algú n tipo de orden entre ellas.
Escala de intervalos: Se puede cuantificar numéricamente la distancia entre 2
observaciones.
Escala de proporción: Se puede cuantificar numéricamente la distancia entre 2
observaciones y fijar un punto de origen como cero
absoluto.
Atendiendo la Referencia Temporal
Serie temporal: Las observaciones se toman secuencialmente en el tiempo.
Corte transversal o cross-section: Las observaciones hacen referencia a distintos
individuos o unidades en un mismo periodo
temporal.
Datos: es un valor particular de la variable
Son nú meros que representan las modalidades de las variables.
Por ejemplo,
El 1 puede representar la modalidad "Mujer",
El 6.3 representa una de las magnitudes que podemos registrar en la variable
"grado de conocimiento de las técnicas estadísticas".
Los datos pueden ser clasificados segú n diferentes criterios, uno de los cuales se
basa en las modalidades que presentan:
Se dirá que son datos dicotó micos los que provienen de variables que solo admiten
dos modalidades (por ejemplo, la variable "género"),
son datos dicotomizados aquellos que presentan dos categorías, pero provienen de
variables con má s de dos modalidades (por ejemplo datos con valores 1 y 0 que
representan aprobado y suspenso).

Datos de panel: Combinan referencias temporales y transversales.


Parámetros: Es una cantidad numérica calculada sobre una població n
La altura media de los individuos de un país
La idea es resumir toda la informació n que hay en la població n en unos pocos
nú meros (pará metros)
La estadística es la ciencia de:
Descriptiva: Sistematizació n, recogida, ordenació n y presentació n de los datos
referentes a un fenó meno que presenta variabilidad o incertidumbre
para su estudio metó dico con objeto de
Probabilidad: deducir las leyes que rigen esos fenó menos
Inferencial: y poder hacer previsiones sobre los mismos, tomar decisiones u
obtener conclusiones.

Distribución de frecuencias
son tablas en que se dispone las modalidades de la variable por filas.
En las columnas se dispone el nú mero de ocurrencias por cada valor, porcentajes, e
La finalidad de las agrupaciones en frecuencias es facilitar la obtenció n de la
informació n que contienen los datos.
Ejemplo:
Quieren conocer si un grupo de individuos está a favor o en contra de la exhibició n
de imá genes violentas por televisió n, para lo cual han recogido los siguientes
datos:

La inspecció n de los datos originales no permite responder fá cilmente a cuestiones


como cuá l es la actitud mayoritaria del grupo, y resulta bastante má s difícil
determinar la magnitud de la diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable
acompañ ados del nú mero de veces (la frecuencia) que aparece cada valor:
X: Símbolo genérico de la variable.
f: Frecuencia (también se simboliza como ni).
La distribució n de frecuencias de los datos del ejemplo muestra que la actitud
mayoritaria de los individuos del grupo estudiado es indiferente.
La interpretació n de los datos ha sido facilitada porque se ha reducido el nú mero
de nú meros a examinar, en vez de los 20 datos originales, la tabla contiene 5
valores de la variable y 5 frecuencias.
Generalmente las tablas incluyen varías columnas con las frecuencias relativas son
el nú mero de ocurrencias dividido por el total de datos, y se simbolizan "fr" o "pi",
frecuencias acumuladas es el total de frecuencias de los valores iguales o inferiores
al de referencia, y se simbolizan "fa" o "na".
No obstante, la frecuencia acumulada también es definida incluyendo al valor de
referencia,
frecuencias acumuladas relativas es el total de frecuencias relativas de los valores
iguales o inferiores al de referencia, y se simbolizan "fr" o "pa")
Ejemplo:
Consideremos el siguiente grupo de datos:

La distribució n de frecuencias es:


La reducció n de datos mediante el agrupamiento en frecuencias no facilita su
interpretació n: La tabla es demasiado grande. Para reducir el tamañ o de la tabla
agrupamos los valores en intervalos, y las frecuencias son las de los conjuntos de
valores incluidos en los intervalos:

Ahora es má s sencillo interpretar los datos.


Por ejemplo, podemos apreciar inmediatamente que el intervalo con mayor
nú mero de datos es el 34-39, o que el 75% de los datos tiene valor inferior a 46.
Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".
Elementos bá sicos de las tablas de intervalos:
Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en
una distribució n de frecuencias
Límites aparentes: Valores mayor y menor del intervalo que son observados en la
tabla. Dependen de la precisió n del instrumento de medida.
En el ejemplo, los límites aparentes del intervalo con mayor nú mero de frecuencias
son 34 y 39.
Límites exactos: Valores má ximo y mínimo del intervalo que podrían medirse si se
contara con un instrumento de precisió n perfecta.
En el intervalo 34-39, estos límites son 33.5 y 39.5
Punto medio del intervalo Marca de clase: Suma de los límites dividido por dos. Mc
del intervalo del ejemplo= 36.5
Amplitud del intervalo:
Diferencia entre el límite exacto superior y el límite exacto inferior.
En el ejemplo es igual a 6.

También podría gustarte