Está en la página 1de 36

Estadística

Conceptos
Básicos
SESIÓN 2
Agenda de clase
• Entrega de las respuestas guía de lectura
Capítulo1
• Conceptos básicos de estadística
• Introducción software R y R Commander
¿Qué es la estadística?
• ESTADÍSTICA es el arte de realizar
inferencias y sacar conclusiones a partir de
datos imperfectos, en el sentido que aún
cuando posean información útil no nos cuentan
la historia completa
• Los métodos estadísticos cuyo propósito es
ayudarnos a poner de manifiesto las
características sobresalientes e interesantes de
los datos, tienen aplicabilidad en casi todas las
áreas del conocimiento
Áreas de la estadística
• Describiremos brevemente cada una de las
áreas en que puede dividirse la estadística:
• I. Descripción: Resumen y exploración de datos.
• II. Inferencia: Hacer predicciones o
generalizaciones acerca de características de una
población en base a la información de una muestra
de la población.
• III. Diseño: Planeamiento y desarrollo de
investigaciones.
Descripción
• Ayuda a presentar los datos de modo tal que
sobresalga su estructura
• La parte de la Estadística que se ocupa de la
descripción de los datos se llama Estadística
Descriptiva y se ocupa de explorar, organizar
y presentar los datos en forma de tablas,
graficos y valores númericos de tal forma que
se genere la menor distorsión de la
información contenida en ellos
Inferencia
• Hace referencia a un conjunto de métodos que permiten hacer
predicciones acerca de características de un fenómeno sobre la
base de información parcial acerca del mismo.
• Esta parte de la Estadística recibe el nombre de Inferencia
Estadística y se ocupa de:
• Proponer el valor de una cantidad desconocida
(estimación)
• Decidir entre dos teorías contrapuestas cuál de ellas explica
mejor los datos observados (prueba de hipótesis)
• El fin último de cualquier estudio es aprender sobre las
poblaciones. Pero es usualmente necesario, y más práctico,
estudiar solo una muestra de cada una de las poblaciones
Diseño
• Consiste en definir como se desarrollará la
investigación para dar respuesta a las
preguntas que motivaron la misma
• La parte de la Estadística que se ocupa del
diseño recibe el nombre de Diseño de
Experimentos y se enfoca en aspectos como:
• Formas de recolectar los datos
• Modelación apropiada de los datos
Definiciones Básicas
• POBLACIÓN
En estadística, población es el conjunto de cosas, personas, animales o
situaciones que tiene una o varias características o atributos comunes, por
ejemplo: los habitantes de El Salvador en el presente año, las personas
menores de edad en el año 2017; los estudiantes de la Universidad del Valle
sede Buga, las reacciones a un nuevo medicamento, las diferencias entre
los tratamientos de diferentes formulaciones de insecticidas, entre otras.

Clases de Población
Población Finita: es el conjunto compuesto por una cantidad limitada de
elementos, como el número de especies, el número de estudiantes, el
número de obreros.
Población Infinita: es la que tiene un número extremadamente grande de
componentes, como el conjunto de especies que tiene el reino animal.
Definiciones
• POBLACIÓN
Lo ideal seria hacer los estudios estadísticos sobre
poblaciones pero la mayoría de las veces no es
posible por:
• Lo grande de la población
• Por que los datos sobre la variable de interés se obtienen
mediante pruebas destructivas
Ejemplo:
Prueba de Resistencia Presión Interna de Botellas de PET
Prueba de flexión viga de concreto reforzado
Definiciones
• MUESTRA: cualquier subconjunto de los sujetos o
unidades de análisis de la población, en el cual se
recolectarán los datos. Usamos una muestra para
conocer o estimar características de la población
• La muestra es una parte, generalmente pequeña,
que se toma del conjunto total para analizarla y
hacer estudios que le permitan al investigador inferir
o estimar las características de un problema.
Definiciones
• El industrial que desea saber si en alambre que
produce tiene la resistencia necesaria a la tensión
deseada, toma solamente una muestra de su
producción, debido a que el alambre se destruye con
la prueba, de otra manera tendría que destruir toda
la producción
• La muestra es representativa cuando se obtiene por
un método que garantiza obtener inferencias fiables
y validas para la población de donde es extraída
• Debe protegerse del riesgo de que resulten sesgadas,
manipuladas u orientadas durante el proceso de
selección
Muestras

• Clases de muestras
– Muestra aleatoria es aquella en la que se
escogen los elementos que la componen con la
certeza de que cada uno en la población tiene
la misma probabilidad de ser seleccionado
• Muestra aleatoria simple
• Muestra aleatoria estratificada
• Muestra por agrupamiento
– Muestra no aleatoria cuando los elementos
seleccionados son elegidos deliberadamente,
consciente o inconscientemente Ej: efecto
Rosenthal
Muestreo
• El muestreo es la reunión de datos que se
desean estudiar, obtenidos de una
proporción reducida y representativa de la
población.
• Procedimiento empleado para obtener una
o más muestras de una población;
• Para que la muestra sea representativa
tanto el procedimiento de selección
(muestreo) como el tamaño de la muestra
deben ser correctos
• El tamaño de la muestra depende de la
precisión que se quiera obtener en la
estimación que se realice a partir de ella
Clases de muestreo

• Muestreo aleatorio simple


– Con reemplazamiento
– Sin reemplazamiento
• Muestreo estratificado
– Muestreo aleatorio estratificado con asignación
proporcional
– Muestreo aleatorio estratificado con asignación
óptima
• Las inferencias realizadas mediante muestras
aleatorias están sujetas a errores, llamados
errores de muestreo y se pueden controlar
seleccionando los procedimientos de muestreo
Definiciones
• Valor: Un valor es cada uno de los distintos
resultados que se pueden obtener en un estudio
estadístico. Si lanzamos una moneda al aire 5 veces
obtenemos dos valores: cara y cruz.
• Dato u observación: Un dato es cada uno de los
valores que se ha obtenido al realizar un estudio
estadístico. Si lanzamos una moneda al aire 5 veces
obtenemos 5 datos: cara, cara, cruz, cara, cruz.
Definiciones
•Espacio muestral son todos los resultados posibles de un
experimento
•Experimento es cualquier proceso que proporciona datos
•Un experimento que tiene las siguientes características es
llamado experimento aleatorio o estadístico.
– Todos los posibles resultados del experimento son
conocidos antes de hacer una realización del
experimento.
– El resultado exacto en cualquier ejecución del
experimento no es predecible (aleatoriedad)
– El experimento puede ser repetido bajo (más o
menos) idénticas condiciones.
– Existe un patrón predictible a lo largo de muchas
ejecuciones (regularidad estadística)
Definiciones
Espacio muestral
• En estadística frecuentemente las poblaciones y muestras son
el resultado de experimentos estadísticos
• Ejemplos: datos de resistencias de materiales, número de
defectos de un producto
Definiciones
PARÁMETRO: una medida resumen calculada sobre la
población
Parámetros Poblacionales: Se llama parámetros
poblacionales a cantidades que se obtienen a partir de
las observaciones de la variable y sus probabilidades y
que determinan perfectamente la distribución de esta,
así como las características de la población, por
ejemplo: La media, μ, la varianza σ2, la proporción de
determinados sucesos p.
Los Parámetros poblacionales son números reales,
constantes y únicos
Definiciones
Parámetros muestrales (o Estadísticos)
Son resúmenes de la información de la muestra que
nos "determinan" la estructura de la muestra.

Los Parámetros muestrales no son constantes sino


variables aleatorias pues sus valores dependen de la
estructura de la muestra que no es siempre la misma
como consecuencia del muestreo aleatorio. A estas
variables se les suele llamar estadísticos. Sirven como
estimaciones de los parámetros poblacionales
Definiciones
• UNIDAD DE ANÁLISIS O DE OBSERVACIÓN: es
el objeto bajo estudio. El mismo puede ser una
persona, una familia, un país, una región, una
institución, un lote de producción o en general,
cualquier objeto

• VARIABLE a cualquier característica de la unidad de


observación que interese registrar, la que en el
momento de ser registrada puede ser transformada en
un número
Definiciones
• CASO o REGISTRO conjunto de mediciones
realizadas sobre una unidad de observación.
• Ejemplo
Ejemplo
Ejercicio
1. Los datos de la
tabla
¿corresponden a
una población o
una muestra?
2. ¿Cuál es la unidad
de análisis?
3. ¿Cuáles son los
registros?
4. ¿Cuáles son las
variables?
5. ¿Cuáles son los
valores?
6. ¿Cuántas
observaciones
hay?
TIPOS DE DATOS
• DATOS CATEGÓRICOS O CUALITATIVOS:
resultan de registrar la presencia de un atributo
• Los datos categóricos o cualitativos se
clasifican en:
• Dicotómicos
• Nominales
• Ordinales
Datos cualitativos dicotómicos
• El individuo o la unidad de observación puede
ser asignada a solo una de dos categorías. En
general, se trata de presencia - ausencia del
atributo
• Ejemplos:
• varón – mujer
• embarazada - no embarazada
• fumador - no fumador
• Defectuoso – no defectuoso
Datos cualitativos nominales
• No existe orden obvio entre las categorías.
• Ejemplos:
• país de origen
• estado civil
• diagnóstico.
Datos cualitativos ordinales
• Existe un orden natural entre las categorías.
• Ejemplos:
• Tabaquismo: No fuma / ex-fumador / fuma  10
cigarrillos diarios / fuma > 10 cigarrillos diarios
• Severidad de la patología: Ausente / leve /
moderado / severo.
TIPOS DE DATOS
• DATOS NUMÉRICOS: cuando el resultado de
la observación o medición es un número

• Los datos numéricos se clasifican en:


• Discretos
• Continuos
Datos cuantitativos discretos
• La variable sólo puede tomar un cierto
conjunto de valores posibles. En general,
aparecen por conteo.
• Ejemplo:
• número de miembros del hogar
• número de intervenciones quirúrgicas
• número de casos notificados de una cierta
patología.
• Numero de defectos en una unidad de producto
Datos cuantitativos continuos
• Generalmente son el resultado de una medición que
se expresa en unidades. Las mediciones pueden tomar
teóricamente un conjunto infinito de valores posibles
dentro de un rango. En la práctica los valores posibles
de la variable están limitados por la precisión del
método de medición o por el modo de registro.
• Ejemplos:
• Altura
• Peso
• pH
• nivel de colesterol en sangre.
• Resistencia a la corriente eléctrica
Ejercicio
• Determine de qué tipo son las siguientes
variables. Cualitativas (nominal u ordinal) o
cuantitativas (discreta o continua)
• Marque de automóvil
• Duración de un CD (segundos)
• Número de temas de un CD
• Nivel educacional (básica, media, superior)
• Temperatura al medio día en Bogotá (grados Celsius)
• Estado civil (soltero, casado, divorciado, viudo)
• Cantidad de lluvia al año en Bogotá (mm3)
Software Estadístico R

 Es una implementación de software libre del


lenguaje S
 Se trata de uno de los lenguajes más utilizados en
investigación por la comunidad estadística
 R proporciona un amplio abanico de
herramientas estadísticas
 modelos lineales y no lineales,
 tests estadísticos,
 análisis de series temporales,
 algoritmos de clasificación y agrupamiento,
 Gráficas, etc.
Software Estadístico R

 Tiene posibilidad de cargar diferentes bibliotecas


o paquetes con muy diversas funcionalidades.
 Tambien es muy popular en el campo como:
 minería de datos
 la investigación biomédica
 la bioinformática
 las matemáticas financieras.
 Puede integrarse con distintas bases de datos
 También puede usarse como herramienta de
cálculo numérico, tan eficazmente como Matlab
Software Estadístico R

 El paquete R Commander le permite a los


usuarios utilizar la funcionalidades estadísticas de
R desde menus
 Se puede descargar libremente desde la página
web del proyecto: https://www.r-project.org/
Tareas
• Estudiar las paginas 31 hasta la página 55 del texto pdf
“Estadística Descriptiva e Inferencial” y realizar las
actividades de regulación para entregarlos cuando sea
solicitado.
• Presentación de investigación de temas asignados para el
trabajo final
• Lenguaje R: Revise los videos dejados en el campus como
preparación para la práctica de la próxima clase:
• Introducción a R
• El Programa R
• Importación de ficheros
Gracias

También podría gustarte