Está en la página 1de 50

Estadstica Descriptiva:

1. Muestreo y Presentacin de los Datos.


Ricardo anculef Alegra Universidad Tcnica Federico Santa Mara

Estadstica:
Dos conceptos fundamentales: muestra y poblacin
Poblacin o Poblacin Objetivo: conjunto de elementos sobre los que queremos hacer afirmaciones Muestra: subconjunto de la poblacin que se extrae para ser estudiado

Estadstica:
Porqu una muestra?
Imposibilidad o costo excesivo de realizar un censo en que se mide toda la poblacin

Estadstica:
Herramientas con dos Objetivos Bsicos
Describir la muestra: Estadstica Descriptiva: Obtener conclusiones de la poblacin a partir de la muestra: Inferencia Estadstica.

Qu es la Estadstica?
Dos conceptos fundamentales: muestra y poblacin
Marco Muestral: conjunto de elementos de la poblacin suceptible de ser muestreada. Ejemplo: Domingo 24 Agosto en La Tercera

Qu es la Estadstica?
Dos conceptos fundamentales: muestra y poblacin
Porqu candidato votara usted?

Qu es la Estadstica?
Dos conceptos fundamentales: muestra y poblacin
Si la eleccin tuviera que definir entre ellos dos Por cul votara usted?

Qu es la Estadstica?
Dos conceptos fundamentales: muestra y poblacin
Poblacin Objetivo? Marco Muestral? Muestra?

Tcnicas de Muestreo Cmo recolectar los datos?


Muestreo No-Aleatorizado (o No-Probabilista) Se basa en el juicio personal del investigador.
Puede generar buenas muestras pero no permite una evaluacin estadstica de confianza.

Muestreo Aleatorizado (o Probabilista)


Se controla la probabilidad de seleccionar un determinado individuo del marco muestral. Permite estudiar objetivamente la confianza de las generalizaciones hacia la poblacin objetivo.

Tcnicas de Muestreo Cmo recolectar los datos?


Muestreo Aleatorizado o Probabilista:
Muestreo aleatorio simple Muestreo sistemtico Muestreo estratificado Muestreo clusterizado

Muestreo no-Aleatorizado o no-Probabilista


Muestreo por convenciencia Muestreo por juicio Muestreo por cuota Muestreo tipo bola de nieve (snowball)

Tcnicas de Muestreo Muestreo por Conveniencia


Los elementos de la muestra se eligen por estar en el lugar o en el momento adecuado para la investigacin. El criterio de seleccin (lugar, tiempo y demases) es completamente dependiente del investigador, sin reglas predeterminadas.

Tcnicas de Muestreo Muestreo por Conveniencia


Ejemplos: encuestas en la calle, encuestas a estudiantes, encuestas web

Tcnicas de Muestreo Muestreo por Juicio


Un tipo de muestreo por conveniencia Se selecciona de acuerdo a alguna caracterstica especifica del encuestado juzgada por el encuestador Clientes/Consumidores de un cierto tipo Expertos en un tema o aspecto de la organizacin Personajes lderes de opinin

Tcnicas de Muestreo Muestreo por Juicio

Tcnicas de Muestreo Muestreo por Cuota


Intenta mejorar la representatividad de la muestra separando a la poblacin de acuerdo a variables de control: edad, sexo, raza, nivel socio-econmico A casa subgrupo o estrato se le asigna una cuota o proporcin de muestreo, tpicamente % de la poblacin Otros criterios: varianza. Dentro del grupo se muestrea por conveniencia

Tcnicas de Muestreo Muestreo tipo bola de nieve


Se selecciona un grupo inicial (usualmente de forma probabilista aunque el resultado final no lo sea) Los nuevos encuestados se seleccionan en base a las referencias de los encuestados anteriores, explotando sus redes sociales Muy utilizado en ciencias sociales, cuando la caracterstica a estudiar es rara o escasa y cuando es difcil conseguir encuestados.

Tcnicas de Muestreo Muestreo tipo bola de nieve (ejemplo)

Tcnicas de Muestreo Muestreo Aleatorio Simple


Cada elemento del marco muestral tiene la misma probabilidad de ser seleccionado y cada elemento se selecciona de manera independiente de los otros con reemplazo: se pueden repetir elementos sin reemplazo: no se pueden repetir elementos Procedimiento: se indexa a la poblacin y luego se elige un ndice de manera aleatoria hasta completar el tamao deseado de la muestra.

Tcnicas de Muestreo Muestreo Aleatorio Simple


Para muchos estudios se siguen utilizando tablas de nmeros aleatorios aunque existen muchos algoritmos generadores de los mismos. cmo usar una tabla de nmeros aleatorios?

Tcnicas de Muestreo Muestreo Aleatorio Simple

Tcnicas de Muestreo Muestreo Aleatorio Sistemtico


Se elige un elemento de partida aleatoriamente y el resto se elige en sucesin hasta completar la muestra Regla de sucesin: Si n es el tamao de la muestra y N el de la poblacin muestral se determina s = floor(N/n) El genera un nmero aleatorio x. El k-simo seleccionado es (x+ks) mod N
Se elige el x-simo Luego el (x+s)-simo Luego el (x+2s)-simo etc

Tcnicas de Muestreo Muestreo Aleatorio Sistemtico


Tiene cada elemento la misma probabilidad de ser seleccionado? tiene cada subconjunto la misma probabilidad de ser seleccionado? Importante: el registro de donde se selecciona no debe presentar sesgo peridico, sino se reduce la representatividad de la muestra. Si el registro est ordenado de acuerdo a lo que se estudia se puede aumentar la representatividad. Se puede prescindir de identificar exactamente el tamao del marco muestral

Tcnicas de Muestreo Muestreo Aleatorio Estratificado


Antes de seleccionar los elementos, se agrupa la poblacin muestral en estratos de acuerdo a una variable importante: edad, sexo, Objetivo: reducir la variabilidad que se puede observar dentro de cada estrato Dentro de cada estrato se puede proceder con muestreo simple o sistemtico El nmero de elementos a elegir puede ser proporcional al tamao o inversamente proporcional a la variabilidad del estrato

Tcnicas de Muestreo Muestreo Aleatorio r Grupos


Se divide a la poblacin en grupos lo ms homogneos entre ellos y lo ms heterogneos internamente Se seleccionan aleatoriamente los grupos a encuestar ya sea de manera simple o sistemtica Cada grupo seleccionado se muestrea completamente: se toman todos sus elementos. En ocasiones slo se conocen los grupos y no los elementos que componen cada grupo.

Tcnicas de Muestreo Muestreo Aleatorio por Grupos


Ejemplo: Encuesta a los espectadores de una pelcula: se muestrean los horarios a encuestar.

En el muestreo aleatorizado se elige controlando la probabilidad de seleccin de los elementos. Mejorable segmentando.

En el muestreo no aleatorizado se elige de acuerdo al criterio del investigador: por conveniencia o juicio. Mejorable segmentando.

Tcnicas de Muestreo
Tcnica Fortalezas Debilidades Tendencias en la seleccin, muestra no representativa, *no se recomienda para la investigacin descriptiva o causal. No permite la generalizacin, es subjetivo. Puede generar una muestra para avalar pre-juicios del investigador. Menos costoso, toma menos tiempo, ms Muestreo por conveniente. conveniencia Costo bajo, conveniente, no toma mucho tiempo. Muestreo por Muestreo Puede a aumentar la juicio NO representatividad del probabilstico muestreo por conveniencia

La muestra puede Muestreo por controlarse para ciertas cuota caractersticas.


Puede estimar Muestreo de caractersticas poco bola de nieve comunes.

Tendencias en la seleccin, no asegura la representatividad.


Toma mucho tiempo.

Tcnicas de Muestreo
Tcnica Fortalezas Se entiende con facilidad, resultados proyectables. Debilidades Es difcil construir el marco de la muestra, costoso, menor precisin, no asegura la representatividad. Puede reducir la representatividad.

Muestreo aleatorio simple

Muestreo probabilstico

Muestreo sistemtico

Puede aumentar la representatividad, ms fcil de poner en prctica que el MAS, no es necesario el marco exacto de la muestra. Incluye todas las subpoblaciones importantes, precisin.

Muestreo estratificado
Muestreo de grupo

Es difcil seleccionar las variables de estratificacin relevantes, no es factible estratificar conforme a muchas variables, costoso. Inexacto, es difcil calcular e interpretar los resultados.

Fcil de poner en prctica, costo efectivo.

Tcnicas de Muestreo
Tamao de la Muestra (n) Problema duro de la Estadstica Inferencial Criterios Generales Qu se va a medir Qu se quiere determinar Nivel mximo de error admisible Nivel de confianza con qu se quiere obtener la estimacin del tamao muestral Variabilidad de las caractersticas a medir

Estadstica Descriptiva
Cmo organizar y presentar los datos?

Estadstica Descriptiva
Experimento, Medicin y Tipos de Datos El muestreo se realiza con el objetivo de llevar a cabo un experimento: observacin, medicin o registro de caractersticas o atributos de la poblacin de las cules se tiene incertidumbre. Lo ltimo es lo que define un experimento Se conocen los posibles valores, pero No se sabe a-priori cules van a ser los resultados Es repetible bajo condiciones esencialmente equivalentes

Estadstica Descriptiva
Experimento, Medicin y Tipos de Datos Producto del muestreo y la medicin obtenemos datos Para propsitos estadsticos es til distinguir entre los siguientes tipos de datos:

Numricos o Cuantitativos Cualitativos Estructurados: formados por conjuntos de los anteriores, pero correspondientes a una misma medicin (ejemplo: grafos, matrices)

Estadstica Descriptiva
Experimento, Medicin y Tipos de Datos Numricos o Cuantitativos: operables aritmticamente Escala Intervalar: Tienen sentido las diferencias. Escala de Razn: Tienen sentido los cuocientes. Discretos/Continuos. Cualitativos: Categricos: Son slo nombres de referencia. Ordinales: Se pueden jerarquizar u ordenar.

Estadstica Descriptiva
Experimento, Medicin y Tipos de Datos Ejercicio: Deseamos estudiar los hbitos de estudio de un conjunto de sansanos y su impacto sobre el rendimiento acadmico

Sugiera variables a medir en cada una de las categoras definidas anteriormente

Estadstica Descriptiva
Concepto Fundamental: Frecuencia La frecuencia de un suceso en la muestra es el nmero de veces que ste se repite en la muestra (valor de una caracterstica o de un subconjunto de valores).

Llamaremos frecuencia relativa a la fraccin de veces que ste aparece en la muestra. Si la frecuencia del suceso es k y la muestra es de tamao n llamaremos: k/n

Estadstica Descriptiva
Presentacin de los Datos Datos Categricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles Diagramas de sectores (de torta) Diagramas de barras

Estadstica Descriptiva
Presentacin de los Datos Datos Categricos: Usualmente se presenta la frecuencia con la que ocurre cada uno de los valores posibles Diagramas de Pareto: diagrama de barras ordenado descendentemente por frecuencia. Se suele incluir la frecuencia acumulada hasta cada elemento.

Estadstica Descriptiva
Presentacin de los Datos

Estadstica Descriptiva
Presentacin de los Datos Datos Ordinales: Los diagramas de barras se suelen ordenar de acuerdo a la jerarqua natural de los valores posibles. Ejemplo: estratos econmicos:

Estadstica Descriptiva
Presentacin de los Datos Datos Cualitativos: Cuando son muchos es posible agruparlos en subconjuntos, pero generados en gral. por criterios no-estadsticos.

Estadstica Descriptiva
Presentacin de los Datos Datos Cuantitativos: En universo de posibles valores es infinito o muy grande. En la muestra puede no repetirse ningn valor. Cmo presentarlos?

Estadstica Descriptiva
Presentacin de los Datos Datos Cuantitativos. Tabligrama: El ltimo dgito se expresa separado de los ms significativos. Consideremos los siguientes datos

Estadstica Descriptiva
Presentacin de los Datos Datos Cuantitativos: Tabligrama
15 16 17 18 455677888888 000000122333345556677799 001233344456788 05

Estadstica Descriptiva
Presentacin de los Datos Datos Cuantitativos. Tablas de frecuencias: Agrupar los valores en intervalos y registrar la frecuencia (relativa o absoluta) de ese grupo de valores en la muestra

Estadstica Descriptiva
Presentacin de los Datos Tablas de frecuencias. Cuntos intervalos K considerar? Cmo deben estar estos distribuidos? Histograma: Los intervalos son todos del mismo tamao y cubren uniformemente el rango de los datos. Rango = mximo mnimo Amplitud de cada clase: A = (Rango+1)/K 1er Intervalo: [a1,b1]=[(min 0.5), (min 0.5)+A] 2do Intervalo: [a2,b2]=[b1, b1 + A] k-simo: [ak,bk]=[bk-1, bk-1 + A]

Estadstica Descriptiva
Presentacin de los Datos
K := N Clases R := Rango = mx { xi } - mn { xi } = 162 - 107 = 55 A := Amplitud = ( R + 1 ) / K = ( 55 + 1 ) / 7 = 8

Lmites

Marca 110,5 118,5 126,5 134,5 142,5 150,5 158,5 5 3 5 8 6 7 6

Frecuencias
ABS - REL - REL. AC.

106,5-114,5 114,5-122,5 122,5-130,5 130,5-138,5 138,5-146,5 146,5-154,5 154,5-162,5

0,125 0,075 0,125 0,2 0,15 0,175 0,15

0,125 0,2 0,325 0,525 0,675 0,85 1

Estadstica Descriptiva
Presentacin de los Datos
9 8 7 6 5 4 3 2 1 0 110,5 118,5 126,5 134,5 142,5 150,5 158,5

Histograma

Estadstica Descriptiva
Presentacin de los Datos
9 8 7 6 5 4 3 2 1 0 102,5 110.5 118,5 126,5 134,5 142,5 150,5 158,5 166,5

Polgono de Frecuencias

Estadstica Descriptiva
Presentacin de los Datos
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 102,5 110,5 118,5 126,5 134,5 142,5 150,5 158,5

OJIVA

166,5