Está en la página 1de 12

CONTENIDO

Pág.

CAPITULO 1 3

INTRODUCCIÓN A LA ESTADÍSTICA 3

DEFINICIÓN DE ESTADÍSTICA 3

CLASIFICACIÓN DE LA ESTADÍSTICA 3

ESTADÍSTICA DESCRIPTIVA 4
Definición 4
Propósitos de la estadística descriptiva 4
Etapas de la estadística descriptiva 4
ESTADÍSTICA INFERENCIAL 4
Definición 4
Propósito de la estadística inferencial 4
Etapas de la estadística inferencial 4

TIPOS DE DATOS SEGÚN EL PERÍODO DE TIEMPO INVOLUCRADO 4

DATOS DE CORTE TRANSVERSAL 4


DATOS DE CORTE LONGITUDINAL 4
DATOS DE PANEL 4

TIPOS DE ANÁLISIS SEGÚN EL NÚMERO DE VARIABLES ESTUDIADAS 5

ANÁLISIS UNIVARIADO 5
ANÁLISIS MULTIVARIADO 5

TIPOS DE INVESTIGACIÓN SEGÚN SU COBERTURA 5

CENSO 5
UNIDAD DE INVESTIGACIÓN ESTADÍSTICA O UNIDAD DE OBSERVACIÓN 5
UNIVERSO 5
POBLACIÓN 5
PARÁMETROS 5
Notación de los parámetros 5
VALOR DEL PARÁMETRO 6
MUESTREO 7
MUESTRA 7
MUESTRA ALEATORIA 7
ESTADÍSTICA O ESTADÍSTICO 7
Notación de los Estadísticos 7
VALOR DEL ESTADÍSTICO 9
ESTIMADOR 9
Notación de los Estimadores 9

ALFABETO GRIEGO 10
CAPITULO 1
INTRODUCCIÓN A LA ESTADÍSTICA

Definición de Estadística
La estadística es la ciencia que mediante la recolección, crítica e imputación, codificación, clasificación, conteo y
análisis de datos1, nos permite realizar inferencias y pronósticos que faciliten los procesos de toma de decisiones en
condiciones de riesgo e incertidumbre.
 Antes de comenzar a trabajar con los datos recolectados debemos verificar si estos son consistentes, es decir,
detectar si no hay errores, datos extraños, outliers, datos faltantes, missing, o incoherencias en los datos. Esto
es lo que se conoce como la crítica de la información.
 La imputación es el proceso mediante el cual se llenan las respuestas no proporcionadas en la investigación,
también conocida como datos faltantes, no respuesta o valores missing.
 La codificación consiste en asignar números artificiales, llamados códigos, a las respuestas no numéricas.
 La clasificación es el procedimiento mediante el cual se establecen las clases distintas de respuestas que se dan
a una pregunta.
 Una vez clasificadas las respuestas a las preguntas procedemos a contar en términos: absolutos, relativos,
absolutos acumulados y relativos acumulados, las respuestas en cada clase.
 En este curso llamaremos análisis a la interpretación de una frecuencia de cada tipo, (absoluta, relativa,
absoluta acumulada y relativa acumulada) y a la interpretación del valor de todas las medidas calculadas en la
investigación.
 Dato un dato en este curso se refiere a cada una de las respuestas dadas a la preguntas de la investigación. Esas
respuestas se pueden representar mediante números, códigos, letras, palabras, oraciones, ensayos, algoritmos,
etc.).
 La inferencia se refiere al conjunto de métodos y técnicas que permiten inducir, a partir de la información
empírica proporcionada por una muestra aleatoria, cual es el comportamiento de una determinada población
con un riesgo de error medible en términos de probabilidad. Los métodos paramétricos de inferencia estadística
se pueden dividir, básicamente, en dos: métodos de estimación de parámetros y métodos de prueba de
hipótesis. Ambos métodos se basan en el conocimiento teórico de la distribución de probabilidad del
estadístico muestral que se utiliza como estimador de un parámetro.
 El riesgo es la probabilidad de que una amenaza se convierta en un desastre. Una amenaza es un fenómeno o
proceso natural o causado por el ser humano que puede poner en peligro a un grupo de personas, sus cosas y su
ambiente, cuando no son precavidos. Existen diferentes tipos de amenazas. Algunas son naturales, otras son
provocadas por el ser humano, como las llamadas industriales o tecnológicas (explosiones, incendios y
derrames de sustancias tóxicas). Las guerras y el terrorismo también son amenazas creadas por el ser humano.
 Incertidumbre es una expresión que manifiesta el grado de desconocimiento acerca de una condición futura,
pudiendo implicar una previsibilidad imperfecta de los hechos, es decir, un evento en el que no se conoce la
probabilidad de que ocurra determina situación. La incertidumbre puede ser derivada de la ausencia de
información, o bien por desacuerdo acerca de la información con que se cuenta, implicando la incertidumbre
cierto grado de desconocimiento. Por ejemplo no se puede conocer de antemano el retorno que tendrá una

1
Un dato es una representación simbólica (numérica, alfabética, algorítmica, espacial, etc.) de un atributo o variable cuantitativa o cualitativa. https://es.wikipedia.org/wiki/Dato.
inversión. Etimológicamente está conformada por el prefijo in (negación) y certus (cierto), por lo que se define
como la carencia de un conocimiento certero, la duda o falta de certeza sobre algo que nos inquieta.
Clasificación de la Estadística
De la anterior definición se desprende que la labor estadística se divide en dos partes:
Estadística Descriptiva
Definición
Es aquella rama de la estadística que nos permite presentar y resumir un grupo de datos por medio de tablas, gráficas y
el cálculo del valor de los parámetros o estadísticos para analizar la información contenida en ellos. 2
Propósitos de la estadística descriptiva
1. Garantizar un adecuado conocimiento del problema bajo estudio
2. Detectar valores faltantes “missing”
3. Detectar valores extraños “outliers”
4. Verificar si los supuestos en los que se basan las inferencias y los pronósticos se cumplen.
Los principales supuestos en los que se basan las inferencias estadísticas son:
 Normalidad
 Homocedasticidad
 No autocorrelación (supuesto de independencia)
 No multicolinealidad
 Linealidad
 El futuro se parece razonablemente al pasado.
Etapas de la estadística descriptiva
La estadística descriptiva cubre las siguientes etapas:
1. Construir tablas (distribución de frecuencias)
2. Construir gráficas
3. Calcular medidas descriptivas
4. Analizar la información, apoyados en las tablas gráficas y las medidas
Nota 1
En este curso siempre que se diga, en un ejercicio, taller, quiz, parcial, etc., realice un análisis descriptivo, debemos
entender que nos solicitan que realicemos las cuatro actividades anteriores, esto es, debemos construir una tabla,
construir unas gráficas, calcular algunas medidas y realizar un análisis de los datos.
Nota 2
Cuando la variable aleatoria sea cualitativa
La tabla debe contener: las frecuencias absolutas y los porcentajes.
Se construye una gráfica: el diagrama de barras o el diagrama circular, no ambos.
En general, se omite la etapa de cálculo de medidas dado que las medidas que se utilizan en el caso de variables
cualitativas, los porcentajes y la moda están incluidas en la tabla de distribución de frecuencias , etapa 1.
En la etapa de análisis se debe interpretar: la frecuencia absoluta de la primera fila y el porcentaje de la segunda fila.
Nota 3
Cuando la variable aleatoria sea cuantitativa
La tabla debe contener: las frecuencias absolutas, las frecuencias relativas, las frecuencias absolutas acumuladas y las
frecuencias relativas acumuladas.
Si las respuestas de la variable aleatoria cuantitativa se clasifican en:
2.1. Quince o menos filas se construye el diagrama de líneas y el diagrama de líneas acumuladas.

2
https://www.academia.edu/37805634/Libro_bioestadistica_Francisco_Javier_Bar%C3%B3n_Lopez
2.2. Más de quince filas se construye el histograma, el polígono de frecuencias y la ojiva de frecuencias.
3. En la etapa de cálculo de medidas, se calculan todas las medidas que se verán en el capítulo 3 de este curso.
4. En la etapa 4., Analizar la información, debemos hacer lo siguiente:
Interpretar la frecuencia absoluta de la primera fila
Interpretar la frecuencia relativa de la segunda fila
Interpretar la frecuencia absoluta acumulada de la tercera fila
Interpretar la frecuencia relativa acumulada de la cuarta fila
Interpretar todas las medidas calculadas en la etapa 3 que indique el docente.
Si el docente no especifica ¿cuáles de las medidas calculadas en la etapa 3 se deben interpretar? se entiende que el
alumno debe interpretar todas las medidas calculadas en la etapa 3.
o Estadísticas de tendencia
 Media
o Estadísticas de dispersión
 Varianza
 Desviación estándar
o Estadísticas de asociación
 Autocovarianza
 Autocorrelación
 Autocorrelación Parcial
Estadística Inferencial
Definición
Es aquella que apoyándose en el cálculo de probabilidades y a partir de los datos de una muestra aleatoria, efectúa
estimaciones, predicciones y toma de decisiones, u otras generalizaciones sobre un conjunto mayor de datos 3.
Propósito de la estadística inferencial
La estadística inferencial tiene como propósito hacer válidas las conclusiones obtenidas en la muestra a todos los
individuos del universo objeto de estudio.
Etapas de la estadística inferencial
La estadística inferencial cubre las siguientes etapas:
1. Estimación puntual de parámetros
2. Estimación por intervalos de parámetros
3. Realización de pruebas de hipótesis y
4. Elaboración de pronósticos
Tipos de datos según el período de tiempo involucrado
Podemos hablar de tres tipos de datos según la dimensión tiempo:
Datos de corte Transversal
Estudio de corte estático en el cual se analiza los datos en un instante determinado del tiempo
Datos de corte Longitudinal
Estudio de corte dinámico en el cual se analiza los datos a través del tiempo.
Datos de Panel
Es el término que usamos para referirnos a datos que contienen observaciones de ambos tipos (corte transversal) y corte
longitudinal (series de tiempo).
Tipos de análisis según el número de variables estudiadas
Según el número de variables involucradas en el análisis, podemos hablar de:
3
https://www.academia.edu/37805634/Libro_bioestadistica_Francisco_Javier_Bar%C3%B3n_Lopez
Análisis Univariado
Es aquel en el cual se analiza sólo una variable
Análisis Multivariado
Es aquel en el cual se analizan simultáneamente dos o más variables; en este orden de ideas, los análisis multivariados
pueden incluir R p variables aleatorias.
Dos variables aleatorias, caso en el cual hablamos de análisis bivariado, R2.
Tres variables aleatorias, caso en el cual hablamos de análisis trivariado, R3etc.
Tipos de investigación según su cobertura
Dependiendo del número de unidades de investigación estadística que cubre la investigación, los estudios estadísticos
se clasifican en:
Censo
Investigación que cubre, investiga, a todas las unidades de investigación estadística que conforman el universo objeto
de estudio.
Unidad de investigación estadística o unidad de observación
Cada individuos del cual se obtiene las respuestas a las preguntas, variables aleatorias, de la investigación.
Universo
El conjunto cuyos elementos son todas las unidades de investigación estadística.
Población
Es el conjunto de respuestas dadas a la(s) pregunta(s) de interés por todos los individuos que conforman el universo
objeto de estudio.
Parámetros
Un parámetro es una fórmula que nos indica cómo obtener un número, valor, utilizando todos los datos de la población.
Notación de los parámetros
Los parámetros se denotan con letras minúsculas del alfabeto griego, tal como se ilustra a continuación:

TABLA DE PARÁMETROS PARA DATOS ORIGINALES

Notación del
Nombre del parámetro Parámetro Valor del parámetro
parámetro

Tamaño de la población N Conteo de los datos 15

Mínimo de la población ξ (1 ) ξ (1 )

Máximo de la población ξ(N ) ξ(N )

N
Total de la población τ ∑ ξi 2.389,15
i=1
TABLA DE PARÁMETROS PARA DATOS ORIGINALES

Notación del
Nombre del parámetro Parámetro Valor del parámetro
parámetro

τ
Media de la población μ 159,28
N
N
Media geométrica de la población μγ

N
∏ ξi
i=1
159,22

Moda de la población μo x i que más se repite

Cuartil 1 de la población χ (0,25) ξ ( N +1) (0,25) 157,82

Mediana de la población με ξ ( N +1) (0,50 ) 160,38

Cuartil 3 de la población χ (0,75) ξ ( N +1) (0,75) 162,25

Rango de la población ρα ξ ( N )−ξ (1) 16,82

N
1
Varianza de la población σ2
N
∑ ( ξ i−μ )2 17,54
i=1

Desviación estándar de la población σ +√ σ 2 4,19

σ
Coeficiente de variación de la población χϖ 100 2,63%
|μ|

Rango intercuartilico ρι χ (0,75)− χ (0,25)

N
1
Coeficiente de asimetría de la población α3
N
∑ z 3i -1,87
i=1
N
1
Coeficiente de curtosis de la población α4
N
∑ z 4i 6,05
i=1

Valor del parámetro


El resultado de aplicar la fórmula se denomina valor del parámetro o realización del parámetro
Muestreo
El muestreo es una investigación que se basa en una muestra aleatoria, cuyo propósito es estimar el valor de los
parámetros de una población y medir el margen de error de la estimación de los parámetros.
Es una investigación de cobertura parcial.
Muestra
Una muestra es un subconjunto de la población.

Muestra aleatoria
Una muestra aleatoria es una sucesión de variables aleatorias independientes con la misma distribución de probabilidad.
Definición formal: Sean X 1 , X 2 , ⋯ , X n variables aleatorias. Se dice que X 1 , X 2 , ⋯ , X n es una muestra aleatoria de
tamaño n , si cumple las dos condiciones siguientes:
1. Las variables X 1 , X 2 , ⋯ , X n son independientes.
2. Cada una de las variables aleatorias X 1 , X 2 , ⋯ , X n tienen la misma distribución de probabilidad f ( x ).
Una definición más sencilla de muestra aleatoria nos dice que es aquella que es seleccionada mediante un procedimiento
aleatorio, por ejemplo mediante el uso de la calculadora o del computador.
Estadística o Estadístico
Es una fórmula que nos indica cómo obtener un número, valor, a partir de los datos de la muestra y no incluye
parámetros desconocidos.
Notación de los Estadísticos
Los estadísticos se denotan con letras minúsculas del alfabeto latino (romano), con el fin de diferenciarlas de los
parámetros, tal como se muestra en la siguiente tabla:

TABLA DE ESTADÍSTICOS PARA DATOS ORIGINALES

Notación del
Nombre del estadístico Estadístico Valor del estadístico
estadístico

Tamaño de la muestra n Conteo de los datos 15

Mínimo de la muestra x ( 1) x ( 1)

Máximo de la muestra x (n ) x (n )

n
Total de la muestra t ∑ xi 2.389,15
i=1
n
1
Media de la muestra m=x́ ∑x 159,28
n i=1 i
n
Media geométrica de la muestra mg
√∏
n

i=1
xi 159,22

Moda de la muestra mo x i que más se repite

Cuartil 1 de la muestra c (0,25 ) x (n +1) (0,25) 157,82


TABLA DE ESTADÍSTICOS PARA DATOS ORIGINALES

Notación del
Nombre del estadístico Estadístico Valor del estadístico
estadístico

x (n +1) (0,50)
Mediana de la muestra me 160,38

x (n +1) (0,75)
Cuartil 3 de la muestra c (0,75 ) 162,25

Rango de la muestra ra x (n )−x (1) 16,82

n
1
Varianza de la muestra s2
∑ ( x − x́ )2
n i=1 i
17,54

Desviación estándar de la muestra s + √ s2 4,19

s
Coeficiente de variación de la muestra cv 100 2,63%
|x́|
n
1 2
Varianza corregida de la muestra s2n−1 ∑ ( x i−x́ )
n−1 i=1

Desviación estándar corregida de la muestra sn−1 + √ s2n−1

s n−1
Coeficiente de variación corregido de la muestra cv n−1 100
| x́|
Rango intercuartilico ri c (0,75 )−c (0,25 )

n
1
Coeficiente de asimetría de la muestra a3 ∑ t 3i -1,87
n i=1
n
1
Coeficiente de curtosis de la muestra a4 ∑ t 4i 6,05
n i=1
Valor del estadístico
Es el número obtenidos al aplicar el estadístico (la fórmula) a los datos de una muestra. También se le conoce con el
nombre de realización del estadístico.

Estimador
Es un estadístico que se utilizan para estimar un parámetro y se simbolizan con la misma letra del parámetro y encima se
escribe el símbolo tilde o virgulilla, ^.
Estimación
Es el número obtenidos al aplicar el estimador (la fórmula) a los datos de una muestra. También se le conoce con el
nombre de realización del estimador.
Notación de los Estimadores
Se denotan con la misma letra griega minúscula asignada al parámetro y encima el símbolo tilde o virgulilla, ^.

Estimador puntual

Notación:
Nombre Estimador Estimación
θ^

Tamaño de la población estimado ^


N=n Conteo de los datos

Total poblacional estimado τ^ N x́

n
Media poblacional estimada 1
^μ ∑x
n i=1 i
n
Proporción poblacional estimada 1
^π ∑x
n i=1 i
n
Varianza poblacional estimada 2 1 2
σ^ ∑ ( x i−x )
n−1 i=1
Desviación estándar poblacional n

estimada σ^
√ 1

n−1 i=1
n
( xi −x )
2

Covarianza poblacional estimada σ^ xy 1


∑ ( x −x ) ( y i− y )
n i=1 i
Coeficiente de correlación σ^ xy
^ρ xy
poblacional estimado σ^ x σ^ y
ALFABETO GRIEGO
Minúsculas Mayúsculas Minúsculas Mayúsculas
Latino o Latino o Nombre
Griego Griego
romano romano
a A   Alpha
b B   Vita
c C   ji
d D   Delta
e E   Épsilon
f F   Fi
g G   Gama
h H   Ita
i I   Iota
k K   Kapa
l L   Lambda
m M   Mi
n N   Ni
o O   Omicrón
p P   Pi
q Q   Thita
r R   Ro
s S   Sigma
t T   Taf
u U   Ípsilon
w W   Omega
x X   Xi
y Y   Psi
z Z   Zita
Dios y patria, yo no sé a qué dios o a que patria se referirán los que ahora en el pueblo se les
conoce como asesinos, a los miles de hombres y mujeres que un día juraron proteger la vida,
inspirando confianza, respeto y rectitud, ahora solo derraman sangre de los mismos que una vez
estuvieron de su lado. ¡Dios ayuda! Gritaba ella en el frio suelo de un triste CAI, el cual con la
misma rabia iracunda de las victimas ardió en una noche gloriosa del “”. ¡Patria!, “respeta a tu
patria y a los bienes públicos que en ella se encuentra”, fueron los llantos de algunos a los cuales
parecía poco importarles la vida de los verdaderos patriotas que, se hacían oír en las calles con el
propósito de un futuro más brillante para todos los grandes y chicos que habitan en las una vez se
llamaron las enriquecidas tierras de Colombia. Dios y patria, Dios y patria, las últimas palabras
que pudo leer en el chaleco de su homicida un joven de 26 años el cual se había convencido de
que no quería que alguno de sus familiares viviera el mismo destino de otros a los que les fueron
arrebatados todo a manos del gobierno corrupto . Por esto pregunto una vez mas ¿de cuál Dios y
de cuál patria habla usted cuando menciona a la policía nacional de Colombia?

También podría gustarte