Está en la página 1de 42

CONCEPTOS BÁSICOS

ESTADÍSTICA SOCIAL I
Programa de Sociología
Universidad de Nariño

Arsenio Hidalgo Troya - Docente

1
Estadística Social I
I. CONCEPTOS BÁSICOS

TEMATICA:

1. Estadística, Método Científico y Análisis de Datos


2. Variables,
3. Métodos de Análisis de datos,
4. El rol de las Probabilidades,
5. El Procesamiento de Datos

2 Arsenio Hidalgo Troya


1. La Estadística, Método Científico,
Análisis de Datos

En análisis de datos, la construcción y validación de


instrumentos de medición (test, escalas, pruebas, inventarios
o cuestionarios) aplicados a las Ciencias Sociales, de la Salud,
del Comportamiento y otras áreas del conocimiento, la
Estadística cobra bastante importancia en la fase cuantitativa
de estos procesos, ya que es la ciencia que respalda los
resultados numéricos para la toma de decisiones.

3 Arsenio Hidalgo Troya


1. La Estadística, Método Científico,
Análisis de Datos
La Estadística es la ciencia de la interpretación de los datos y
de la toma de decisiones en entornos de variabilidad e
incertidumbre.

Los conceptos y métodos de la estadística permiten al


investigador describir la variabilidad y planificar sus
investigaciones teniendo en cuenta dicha variabilidad es decir,
establecer si la «señal» es más fuerte que el «ruido» de los
datos obtenidos.

Los métodos estadísticos se utilizan para analizar los datos y


extraer la máxima información, identificando además la
fiabilidad de dicha información.

4 Arsenio Hidalgo Troya


1. La Estadística, Método Científico,
Análisis de Datos
Qué Estudia la Estadística?:

La Estadística se ocupa de los métodos y procedimientos


para recoger, clasificar, resumir, hallar regularidades y
analizar los datos, siempre y cuando la variabilidad e
incertidumbre sea una causa intrínseca de los mismos;
así como de realizar inferencias a partir de ellos, con la
finalidad de ayudar a la toma de decisiones y en su
caso obtener explicaciones o formular predicciones.

5 Arsenio Hidalgo Troya


1. La Estadística, Método Científico,
Análisis de Datos
La Estadística como Ciencia

Podemos establecer dos grupos de ciencias atendiendo a si su


objeto de conocimiento guarda o no alguna relación con la
realidad (física o social).
De allí surge la dicotomía entre Ciencias Factuales (o
Empíricas), cuyo objeto de conocimiento es algún
segmento de la realidad, y las Ciencias Formales, cuyo
campo de actividad son entes formales, ideas, pero en
ningún caso cosas o procesos reales.

Estadística Ciencia Factual


Estadística Ciencia Formal

6 Arsenio Hidalgo Troya


1. La Estadística, Método Científico,
Análisis de Datos
El concepto de Estadística
“Rama del método científico que se ocupa de los datos obtenidos
contando o midiendo las propiedades de las poblaciones de los
fenómenos naturales”, Kendall y Stuart (1977)

Un aspecto importante de discusión es, como plantea M.G.


Kendall, distinguir la Matemática de la Estadística, como
ciencias de la certeza y de la incertidumbre, caracterizando a la
Estadística como una ciencia que busca establecer los límites de
la incertidumbre, y no como una rama de las matemáticas

7 Arsenio Hidalgo Troya


1. La Estadística, Método Científico,
Análisis de Datos
El concepto de Estadística

“La estadística estudia el comportamiento de los fenómenos llamados de


colectivo. Esta caracterizada por una información acerca de un
colectivo o universo, lo que constituye su objeto material; un modo
propio de razonamiento, el método estadístico, lo que constituye su
objeto formal y unas generalizaciones al colectivo o previsiones de
cara al futuro, lo que implica un ambiente de incertidumbre, que
constituyen su objeto o causa final”, Cabri (1994).

En síntesis, podemos señalar que la Estadística es una ciencia,


fundamentada en la Teoría Matemática de la Probabilidad, que se
ocupa de elaborar teorías y técnicas destinadas a la recogida,
transformación y clasificación de datos para convertirlos en
información, y a la toma de decisiones en situaciones de
desconocimiento o incertidumbre.

8 Arsenio Hidalgo Troya


1. La Estadística, Método Científico,
Análisis de Datos
Notas Históricas

Statistik término alemán Gottfried Achenwall (1749)

Se estructura en 3 momentos:

- Ciencia del Estado: Estadística descriptiva, escuela alemana;


Aritmética política, escuela inglesa.
- El Cálculo de Probabilidades
- Estadística Matemática: como integración de las dos
disciplinas, originando la Estadística Inferencial

9 Arsenio Hidalgo Troya


1. La Estadística, Método Científico,
Análisis de Datos
Metodología Estadística

La Estadística desarrolla un papel central en investigación


científica (producción de datos, descripción, diseño de
experimentos y muestras, estimación, verificación, predicción,
análisis de series, teoría de la decisión, etc.) cada vez mas
importante y extenso, lo que ha dado lugar al nacimiento de
ramas que tienen terminología especializada:

Econometría, Geoestadística, Bioestadística, Física Estadística,


Diseño de Experimentos, Biometría, Psicometría, Sociometría,
Quimiometría, etc., de forma que sus límites se vuelven difusos,
como señala Neter (1986).

10 Arsenio Hidalgo Troya


2. Variables
Variables
Como se estableció en la conceptualización de la Estadística, su
objeto material lo constituyen los datos de las variables de una
población objeto de estudio, por lo cual es necesario tener el
concepto de variable:

Una Variable es una característica o atributo que se observa en las


unidades de una población objeto de análisis, que es susceptible
de medición o clasificación y que presenta diferentes estados o
valores.
Peso, Talla, Sexo, Producción, Ventas, Ingresos, Calidad de un
producto, Precios, Esperanza de vida, Nivel educativo, etc.

11 Arsenio Hidalgo Troya


2. Variables
Clasificación de las variables
Las variables se pueden clasificar según:

 Naturaleza: Cualitativas y cuantitativas


 Nivel o escala de medición: nominal, ordinal,
intervalo y de razón
 Rol en la asociación de variables: dependientes,
independientes e intervinientes
 Certidumbre de sus resultados: aleatorias y
sistemáticas

12 Arsenio Hidalgo Troya


2. Variables
Según su naturaleza:

 Cualitativas (categóricas o no métricas):

Expresan una modalidad o característica en la unidad


observada en termino de una cualidad.

Su medición consiste en una clasificación de dichas


modalidades, denominados atributos o categorías.

Son variables categóricas, sexo, nivel de satisfacción


cliente, nivel educativo, sector de vivienda, localidad, etc.

13 Arsenio Hidalgo Troya


2. Variables
Las variables cualitativas pueden ser dicotómicas o
politómicas:

 Dicotómica (o Binaria): toma dos valores posibles. Presencia


/ausencia de un evento, estado salud de un individuo.

 Politómica (o Multinomial): más de dos valores. Estación de


año, nivel educativo

Aunque para propósitos de análisis se pueden asignar números a


las categorías de la variable, estos en sí mismo no tienen ningún
significado, no tienen sentido las operaciones aritméticas, al menos
que se utilice variables dummy (Presencia=1; Ausencia=0).

14 Arsenio Hidalgo Troya


2. Variables
 Cuantitativas (numéricas o métricas):

Describe una característica en términos de una cantidad.

Estas pueden ser:

 Discreta: los valores que puede asumir la variable es finito o infinito


contable. Se genera por un proceso de conteo, como número de
clientes, número de habitaciones en una vivienda

 Continua: los valores que puede tomar la variable esta dentro de un


rango infinito de puntos. Se genera mediante un proceso de medición,
como PIB, la deuda pública en un país, precio de un producto

15 Arsenio Hidalgo Troya


2. Variables
Escala de medición de las Variables

 Nominal: cuando los valores de la variable denotan presencia o ausencia


de una cualidad, ejemplo el estado civil.
 Ordinal: cuando los valores de la variable denotan un orden , jerarquía o
nivel, ejemplo el nivel de escolaridad.
 Intervalo: de naturaleza cuantitativa, cero es relativo, ejemplo la
temperatura medida en grados centígrados, puntaje en una prueba de
conocimientos.
 Razón (o proporción): de naturaleza cuantitativa, cero es absoluto,
ejemplo el ingreso mensual de un trabajador.

16 Arsenio Hidalgo Troya


2. Variables
Rol en la Asociación de Variables
Según la relación que guardan las variables en un estudio una variable puede
ser:

 Dependiente: Si sus variaciones dependen de las variaciones de otra(s)


variable(s). Variable explicada, endógena, respuesta, o efecto en un
experimento
 Independiente: Si sus valores en un estudio específico no están influidos
por los cambios de otra(s) variable(s) relacionada(s) en el mismo. Variable
explicativa, exógena, factor o control en un experimento.
 Interviniente: Variable que afecta a la variable dependiente de manera
indirecta, no se manipula en un experimento.

Demanda de un producto (Y) vs precio (X1), gastos de publicidad (X2) y


Zona (X3)

17 Arsenio Hidalgo Troya


2. Variables
Variables Aleatorias y Determinísticas

 Aleatoria o probabilística: si sus valores son diferentes


cuando se mide u observa bajo las mismas condiciones,
(casualidad).

 Determinística o no probabilística: si sus valores son


similares cuando se mide u observa bajo las mismas
condiciones, (causalidad).

18 Arsenio Hidalgo Troya


2. Variables
Clasificación de las Variables:

NIVEL
NATURALEZA ROL CERTIDUMBRE
MEDICIÓN

Discretas Razón
Cuantitativas
Continuas Intervalo
Dependiente
Determinística
Independiente
Probabilística
Interviniente
Dicotómicas Ordinal
Cualitativa
Politómicas Nominal

19 Arsenio Hidalgo Troya


2. Variables
Transformación de las Variables
Para describir o analizar una variable en ocasiones es
necesario transformar su naturaleza, Cuantitativa a
Categórica o Categórica a Cuantitativa, así:

 Categorización de una variable cuantitativa:

Una variable cuantitativa se puede categorizar por rangos


o intervalos. Ej: la edad se puede categorizar por grupos
de edad (0 a 4, 5 a 9, 10 a 14, 15 a 19, etc.).

Reglas: Exaustiva y Excluyente.


20 Arsenio Hidalgo Troya
2. Variables

 Cuantificación de una variable categórica:

Una variable categórica se puede cuantificar


utilizando las llamadas variables Indicadoras o
Dummy (en ingles).

Para ello son necesarias k-1 variables que indican


presencia (1) o ausencia (0) de una categoría,
siendo k el numero de categorías de la variable
transformada.
21 Arsenio Hidalgo Troya
3. Los Métodos de Análisis de datos

Existen varias maneras de abordar el análisis estadístico


de datos teniendo en cuenta el objetivo del estudio, la
naturaleza y el numero de variables analizadas.

Para el efecto se han desarrollado diferentes técnicas o


métodos de análisis.

Según el objeto de análisis podemos diferenciar los


métodos estadísticos en descriptivos e inferenciales.

22 Arsenio Hidalgo Troya


3. Los Métodos de Análisis de datos

- Los métodos descriptivos: su objeto es la presentación,


organización y resumen de los datos. Se tienen dos técnicas:

 Gráficas: resumen los datos a través de tablas y gráficos


estadísticos (distribuciones de frecuencias, barras,
diagramas circulares, gráficos de líneas, etc.).

 Numéricas: resumen los datos con medidas estadísticas,


tales como medidas de localización (media, mediana,
moda, cuantiles), de variabilidad ( rango, desviación típica,
coeficiente de variación, etc.), de forma o distribución
(asimetría y curtósis), porcentajes, tasas, medidas de
asociación y de bondad de ajuste.

23 Arsenio Hidalgo Troya


3. Los Métodos de Análisis de datos

- Los métodos inferenciales: conclusiones generales en una


población a partir de los datos de una muestra aleatoria, apoyado
en la teoría de probabilidades. Incluyen:

 La estimación: determina el valor aproximado de una característica


de la población (parámetro), con un nivel de precisión fijado en
términos de probabilidad, a través de un valor puntual (estadístico)
o un intervalo de valores (intervalo de confianza), obtenidos con los
datos de una muestra aleatoria.

Muestra Población
(Estadístico, IC) (Parámetro)
Probabilidades

24 Arsenio Hidalgo Troya


3. Los Métodos de Análisis de datos

 La prueba de hipótesis estadística: establecen la probabilidad


de que el resultado que se observa en la muestra o uno aún mas
extremo, es atribuible al azar (nivel de significación) y si esta
probabilidad es tan pequeña (inferior al 5 %) para considerar
como válida la extrapolación de los datos de la muestra a la
población estudiada, es decir reportar un resultado
estadísticamente significativo.

25 Arsenio Hidalgo Troya


3. Los Métodos de Análisis de datos

Según el número de variables que simultáneamente se incluyen en


el análisis de los datos, los métodos pueden ser:

 Univariados se utilizan para caracterizar las variables que son


objeto de análisis, interpretándolas de manera individual.

 Bivariados están encaminados a establecer la asociación entre


dos variables a partir de las técnicas descriptivas e inferenciales.

 Multivariados son apropiados para establecer la dependencia o


interdependencia entre mas de dos variables, a través de modelos
estadísticos.

26 Arsenio Hidalgo Troya


3. Los Métodos de Análisis de datos

Según las propiedades (o características) de los datos existen dos tipos de


pruebas estadísticas:

 Paramétricas: solo aplicables a variables cuantitativas siempre y


cuando los datos analizados cumplan ciertas propiedades
(independencia, normalidad, homocedasticidad).

 No paramétricas: aplicables a variables cualitativas y a cuantitativas


cuyos datos no cumplan con alguna de las propiedades de normalidad u
homocedasticidad.

Pruebas paramétricas: Z, t de Student, F de Snedecor (ANOVA)


Pruebas no paramétricas: Chi cuadrado, Mann Whitney, Wilcoxon,
Kruskall Wallis

27 Arsenio Hidalgo Troya


3. Los Métodos de Análisis de datos

PROPIEDAD DE
OBJETIVO DIMENSIÓN
DATOS
* Descriptivos
Gráficos
Numéricos
* Univariados
* Paramétricos
* Bivariados
* Inferenciales * No paramétricos
* Multivariados
Estimación
Pruebas de Hipótesis

28 Arsenio Hidalgo Troya


4. Rol de las Probabilidades

El Método científico se utiliza para decidir sobre las


hipótesis con base a las observaciones (Gotelli y Ellison
2004).

Cualquier sistema en las Ciencias Sociales es estocástico

Estos Sistemas no son completamente predecibles,


incluyen procesos aleatorios que añaden algún grado de
variabilidad y, en consecuencia, de incertidumbre en sus
resultados.

29 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
La Probabilidad proporciona las bases para la Inferencia

La inferencia estadística tiene como objetivo la estimación de las


propiedades o características de un sistema (por ejemplo, una población) a
partir del análisis de una muestra.

Por inferencia podemos entender lo siguiente (Royle y Dorazio 2008):

 Contrastar hipótesis, seleccionar modelos o evaluar modelos.


 Confrontar modelos con datos para estimar parámetros (ajustar un
modelo).
 Realizar predicciones.

30 Arsenio Hidalgo Troya


4. Rol de las Probabilidades

Probabilidad: Es la frecuencia (relativa) esperada con la que ocurre


un evento

Midiendo la probabilidad

P(A) = # resultados favorables a A / # total de resultados

Si no hubiese incertidumbre en el resultado no haría falta ni la


probabilidad ni la Inferencia Estadística

31 Arsenio Hidalgo Troya


4. Rol de las Probabilidades

Hipótesis:

Una hipótesis en el contexto de la estadística inferencial es


una proposición respecto a uno o varios parámetros.

Mediante una prueba de hipótesis el investigador determina si


la hipótesis poblacional es congruente con los datos obtenidos
en una muestra (Wiersma y Jurs, 2008; Gordon, 2010).

32 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
Hipótesis Estadísticas:

Hipótesis Nula (Ho): se formula en términos de que no existen


diferencias o asociación (independencia) entre variables. La variación en
los datos o el efecto del factor(es) estudiado(s), es debida al azar

Hipótesis Alterna (H1): se formula en términos de diferencias o


asociación (dependencia) entre variables. La variación en los datos o el
efecto del factor(es) estudiado(s), es sistemática.

Generalmente H1 es la hipótesis de trabajo o de investigación

Ho es la hipótesis que se somete a prueba con la pretensión de rechazarla


para que se cumpla H1

33 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
Errores en el contraste de hipótesis:

Decisión
Realidad
No rechazar H0 Rechazar H0
Decisión correcta Error Tipo I
H0 cierta Probabilidad = 1 – α Probabilidad = α (<0.05)
CONFIABILIDAD (Verdadero Negativo) SIGNIFICANCIA (Falso Positivo)

Error Tipo II Decisión correcta


H0 falsa Probabilidad = β Probabilidad = 1 – β (>0.80)
NIVEL β (Falso Negativo) POTENCIA (Verdadero Positivo)

34 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
El contraste de hipótesis se realiza mediante un estadístico de prueba. Cada
prueba produce un resultado numérico (un estadístico) y unos valores de
probabilidad asociados

P(Rechazar Ho / Ho verdadero) = P(error tipo I) = Nivel significación = α

P(Rechazar Ho / Ho falsa) = P(No cometer error tipo II) = Potencia de la


prueba = 1 – β

El rechazo de H0 NO implica H1 sea verdadero (sugiere que H1 puede ser


verdadero con un grado de certeza).

Nivel de significación p valor ≤ 0,05 (Nivel de confianza 95%)


Poder o potencia estadística: 1 – β ≥ 0,80

35 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
Potencia estadística 1- β aumenta si seleccionamos un nivel de
significación α mayor: Pero elegir un α mayor implica un mayor riesgo de
cometer error Tipo I.

Cuatro métricas son importantes en la inferencia estadística:

 Significancia (α)
 Potencia (1 - β)
 Tamaño de la muestra (n)
 Tamaño del efecto (f)

36 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
Tamaño del efecto (f)

Es una cuantificación de lo importante que es una diferencia o un


coeficiente, luego de haber obtenido un resultado significativo en la
prueba de hipótesis. Conocer el tamaño del efecto es absolutamente
necesario para interpretar los resultados de una investigación.

Es la magnitud mínima de la diferencia o asociación que se considera


relevante. Es una medida del “grado de diferencia” o del “grado de
relación” que queremos detectar. Es una medida estandarizada, de cálculo
no tan sencillo.

Las pruebas de hipótesis no son sino el punto de partida y se requiere


informar elementos adicionales tales como tamaños del efecto, intervalos
de confianza y descripciones extensivas. Normas APA (2010)

37 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
Modelos
Para interpretar formalmente cualquier observación necesitamos de
un modelo.

Los modelos son herramientas para evaluar las hipótesis (Hilborn


y Mangel 1997).

Un modelo es una definición abstracta de cómo creemos que


nuestras observaciones son el resultado de cantidades observables
(datos) e inobservables (parámetros).

Los resultados de un sistema estocástico (la respuesta) pueden


expresarse, en forma de modelo estadístico.

38 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
Modelo Estadístico:

Parte Parte
Respuesta Sistemática Aleatoria
"SEÑAL" "RUIDO"

 Un modelo es una abstracción y, por tanto, siempre es incorrecto


(Kéry 2010).

 En esencia, todos los Modelos están equivocados pero algunos


son útiles (Box, 1978)

39 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
Hablando en la Conferencia O’Reilly de Tecnologías Emergentes, Peter
Norving (2013), director de investigación de Google, aportó una
actualización de la máxima de George Box:

“Todos los modelos son erróneos y se puede, cada vez más, triunfar con
ellos”.

El método científico está construido sobre hipótesis comprobables.

Los modelos, son sistemas visualizados en la mente de los científicos, son


probados y los experimentos los confirman o los falsean

Esta es la manera en que la ciencia ha trabajado durante cientos de años.

40 Arsenio Hidalgo Troya


4. Rol de las Probabilidades
Los científicos deben reconocer que la correlación no implica
causalidad, que ninguna conclusión debería apoyarse sólo en la
base de la correlación entre X e Y (podría ser sólo una
coincidencia).

En su lugar, se deben comprender los mecanismos subyacentes que


conectan a las dos.

Una vez que se tiene un modelo, se puede unificar el conjunto de


datos con seguridad.

Los datos sin un modelo son sólo ruido.

41 Arsenio Hidalgo Troya


5. El Software Estadístico
Paquetes Estadísticos
Existen en el mercado informático una gran cantidad de
paquetes estadísticos, tales como:

SPSS, SAS, Statistical, Minitab, Systat y StatGraphics, entre


los comerciales

R, Python y jamovi entre los software de uso libre.

En este curso utilizaremos el paquete jamovi, para los


diferentes procesos del análisis estadístico de datos.
42 Arsenio Hidalgo Troya

También podría gustarte