Está en la página 1de 77

Asignatura:

ESTADÍSTICA
(220137-4)

Carrera:
INGENIERÍA CIVIL ELÉCTRICA

Profesor:
JOSÉ ANTONIO PASCAL

Segundo Semestre
Agosto 2019
UNIDAD I:

I.- Técnicas de estadística descriptiva en el ámbito de la ingeniería para el


análisis e interpretación de datos.
INTRODUCCIÓN

La estadística, en términos amplios y generales, puede como la colección de


métodos científicos que permiten la recolección, el análisis e interpretación de
la información numérica.

Aplicaciones: El campo de la estadística tiene aplicaciones cada vez más


amplias en una diversidad de disciplinas, desde la ingeniería a la biología,
desde la sociología a la economía de la empresa, desde las leyes, la educación
y la medicina.

“Vivimos inmersos en un mar de cifras, sobre los temas más diversos: paro,
divorcio, natalidad, enfermedades, gasto público, salario mínimo, inflación,
puntajes PSU, prueba Simce, datos experimentales de una investigación
científica, etc.”.
INTRODUCCIÓN

Notas Históricas sobre los Métodos Estadísticos

- Laplace y Gauss descubrieron la más importante de las distribuciones: la


distribución normal.

Pierre-Simon Laplace Johann Carl Friedrich Gauss

- Otro paso importante lo dieron Quetelet y otros cuando introdujeron desde


finales del siglo XIX comienzan a descubrirse regularidades en disciplinas tan
diversas como la genética, biología, meteorología, economía, psicología,
sociología e incluso en las artes. Los conceptos de distribución de
frecuencias y de distribución de probabilidades se utilizan ya
intercambiablemente, al confluir definitivamente la teoría clásica de la
probabilidad y la estadística como teoría de la información numérica.
INTRODUCCIÓN

Notas Históricas sobre los Métodos Estadísticos

- Por otro lado, conviene señalar el papel tan fundamental que han jugado la
demografía y las compañías de seguros en el desarrollo de la estadística. En
la segunda mitad del siglo XVIII comienzan a recogerse en algunos países
los primeros censos de población. En España, el primer censo de población
se refiere al año 1860.
INTRODUCCIÓN

¿Qué se entiende por Estadísticas y Estadística?

Si uno ve fútbol en televisión por la noche, o escucha noticias por la radio, o lee
alguna de las revistas deportivas o de negocios más conocidas, se verá
sometido a (y algunas veces abrumado por) una gran cantidad de cifras a las
que comúnmente se denomina “estadísticas”. Estas cifras pueden referirse a
los deportes, al mercado de valores, al desempleo, a la producción industrial o a
la esperanza de vida.

Por ejemplo: A un dato numérico o valor aislado se le denomina dato


estadístico. El precio al cierre de acciones comunes de una empresa es un
dato estadístico. Un promedio de calificaciones (6.3) también es un valor
estadístico. Las ventas totales al detalle en un cierto mes, 130 millones de
dólares, etc.. <<Todas las cifras que se mencionaron antes, tomadas
colectivamente para un enfoque dado, por lo general se designan como
estadísticas.>>
El estudio general de las estadísticas se define como la ciencia estadística o
Estadística.

Estadística: Ciencia que trata de la recopilación, organización, presentación,


análisis e interpretación de datos numéricos (estadísticas) con el fin de realizar
una toma de decisiones más efectiva.

Así como los abogados tienen “reglas de evidencia” y los contadores “prácticas
de uso común”, las personas que trabajan con datos numéricos siguen ciertos
lineamientos estándares. En los capítulos que siguen se presentan algunas de
las técnicas estadísticas básicas que se aplican en los problemas de decisión.

Muchas personas se enfrentan por primera vez con cierto temor a la aplicación
de datos numéricos para resolver un problema. Esto se debe a que han
escuchado con frecuencia frases como “las estadísticas mienten”.

<<Las estadísticas “mienten” sólo si no se interpretan en forma correcta>>


Como ejemplo, considérese que las ventas de ciertos productos de precisión
durante los últimos 20 años se representan como se ve en el gráfico de más
abajo. En primer lugar se podría llegar a la conclusión de que las ventas
aumentaron con mucha rapidez desde 1972 (ésta es la mentira).

Sin embargo, en un estudio más minucioso se observa que las ventas


aumentaron aproximadamente 1%; de $100 millones a $101 millones (de
dólares) (ésta es la verdad). El que creó la gráfica, con intención o sin ella,
aplicó una escala incorrecta al eje vertical (ventas), dando una impresión
errónea respecto a la tendencia de las ventas desde 1972.
Los objetivos de este curso son varios. Desde luego, uno de ellos es poner
sobre aviso acerca del posible uso incorrecto de gráficas, promedios, técnicas
de correlación y regresión, y de otros medios estadísticos. Otro consiste en
presentar la utilidad de dichas técnicas en investigación educacional o
investigación científica de forma específica.
¿Quién utiliza la Estadística?

Funciones de la Estadística

La estadística ofrece métodos generales para encontrar pautas recurrentes y


construir modelos que faciliten su estudio. Podemos enumerar las siguientes
funciones generales que realizan los métodos estadísticos:

a)Resumen de los datos y extracción de información relevante de los mismos,


esto es, de las mediciones observadas, sean éstas numéricas, clasificatorias,
ordinales, o de otro tipo;

b)Búsqueda y evaluación de los modelos y pautas que ofrecen los datos, pero
que se encuentran ocultos por la inherente variabilidad aleatoria de los mismos;

c) Contribuir al diseño eficiente de los experimentos y encuestas;

d)Facilitar la comunicación entre los científicos, ya que siempre será más fácil
comprender la referencia a un procedimiento estándar, sin necesidad de mayor
detalle.
Métodos Estadísticos

Métodos Estadísticos

Estadística Descriptiva Estadística Inferencial

Procedimientos estadísticos
Procedimientos estadísticos que sirven para deducir o inferir
que sirven para organizar y algo acerca de un conjunto de
resumir conjuntos de datos datos numéricos (población),
numéricos. seleccionando un grupo menor
de ellos (muestra).
Métodos Estadísticos

Consideraciones.-

El significado especial de la palabra “población” en la estadística inferencial.

 Suele hablarse de la población solamente como la cantidad de


habitantes de una ciudad o un país (en términos demográficos).

 Sin embargo, en Estadística el término población tiene un significado


más amplio. Una población puede estar formada por personas como
todos los estudiantes inscritos en el Pos-título en Ciencias Naturales y
Exactas en la UBB, todos los alumnos de una clase de matemática en
un colegio, o todos los habitantes de Concepción.

 Una población también puede estar formada por un grupo de medidas,


como podrían ser los pesos de los alumnos de un curso, o los puntajes
de la PSU del 2003.

 Observe que una población en sentido estadístico no necesariamente


se refiere a personas (ya sea objetos, animales o cosas).
Métodos Estadísticos

Definiciones Importantes.-

Población: Conjunto de todos los posibles individuos, personas, objetos o


mediciones de interés estadístico.

Para deducir algo acerca de una población, por lo general se toma una muestra
“representativa” de dicha población.

Muestra: Una porción, o parte de una población de interés.

En resumen,

Muestra de la
Inferencia Población “X”
Población “X”
<< N >>
<< n >>
Métodos Estadísticos

¿Por qué tomar una muestra en vez de estudiar cada integrante o


elemento de una población?

 TIEMPO (tiempo de duración del proceso)

 COSTO (es mas económico)

 INFRAESTRUCTURA (menor cantidad de recursos involuc.)

 RAPIDEZ (se obtienen conclusiones inmediata)

Con frecuencia se toma una muestra para determinar algo referente a una
población en particular o de interés del investigador, en los siguientes campos
de:
 Administración
 Agricultura
 Política
 Gobierno e
 Investigación científica
Métodos Estadísticos
¿Quiénes utilizan la estadística? ¿Y para qué hay que estudiarla?

- En pocas palabras, en que los conceptos y las técnicas de la estadística


se utilizan actualmente en un gran número de ocupaciones. Las ideas
estadísticas constituyen una parte integral de las actividades
investigativas, de las encuestas para recopilar datos y del análisis de los
datos que se originan en las actividades que desarrollan las instituciones
y/o organizaciones.

- Es posible que un trabajador no necesite conocer de la estadística sino


aquello que lo faculte para saber cuándo se requieren los servicios de un
experto y para poderse comunicar eficazmente con él cuando trabajan
juntos en la planeación, dirección e interpretación de los resultados
de una actividad que requiere la metodología de esta ciencia.

- La persona que comprenda los conceptos estadísticos y su


metodología sacará mejor provecho de ellos. Esta persona estará
mejor preparada para evaluar los resultados de una investigación y
demás informaciones que se obtengan. El profesional que entienda de
estadística podrá leer con mayor comprensión la literatura que, sobre su
campo de acción, va día a día apareciendo.
Métodos Estadísticos
Áreas de aplicación de la metodología estadística

Ya hemos mencionado que los conceptos y la metodología de la estadística se


emplean en muchos campos. A continuación, mencionaremos algunas áreas
solamente donde ella se utiliza.

 Biología. En biología se emplean los métodos estadísticos para estudiar las


reacciones de las plantas y los animales ante diferentes condiciones
ambientales y para investigar la herencia.

 Agricultura. Las técnicas estadísticas se emplean en actividades tales como


experimentos sobre la reproducción de plantas y animales, estudios de la
bondad relativa de diversos fertilizantes, insecticidas, etc. Y estudios de
métodos para aumentar el rendimiento de las cosechas.

 Educación. En educación los métodos estadísticos se emplean para analizar


rendimientos, comparar diferentes metodologías de enseñanza, caracterizar
perfiles de estudiantes.

 Industria. La mayor parte de los industriales utilizan algún control de calidad


y los conceptos y técnicas estadísticas constituyen la base de casi todos
estos programas.
Métodos Estadísticos
Áreas de aplicación de la metodología estadística

 Negocios. Utilizando la estadística, los hombres de negocios pueden


predecir los volúmenes de ventas, medir las reacciones de los consumidores
ante los nuevos productos, tomar decisiones en cuanto a la forma de invertir
el presupuesto para publicidad y determinar el mejor método para utilizar las
habilidades y aptitudes de sus empleados.

 Salud y medicina. Los resultados que se obtienen en las investigaciones


sobre fármacos se analizan por medio de los métodos estadísticos. Los
técnicos de la salud la utilizan para planear la localización y el tamaño de los
hospitales y de otras dependencias de salud. Los médicos investigadores se
ayudan del análisis estadístico para evaluar la efectividad de diversos
tratamientos.

 Psicología. Los psicológos se valen de los conceptos y técnicas de la


estadística para medir y comparar la conducta, las actitudes, la inteligencia y
las aptitudes del hombre.

 Sociología. En la sociología, las técnicas estadísticas se emplean en los


estudios comparativos de diferentes grupos socioeconómicos y culturales y
en el estudio del comportamiento y las actitudes de grupo.
Métodos Estadísticos
Terminología Estadística

A continuación, definiremos algunos términos fundamentales que se utilizarán


en este curso. Daremos solamente el vocabulario estadístico básico de esta
sección pues los demás términos se definirán a medida que se vayan
presentando.

Elemento: Es la unidad acerca de la cual se solicita información. Este


suministra la base del análisis que se llevaría a cabo. Los elementos más
comunes del muestreo en general, son los individuos. En otros casos, los
elementos podrían ser productos, almacenes, empresas, colegios, familias,
mezclas, animales, objetos, etc. Los elementos de cualquier muestra específica
dependerán de los objetivos del estudio.

Variable: Es el conjunto de las características de los elementos de muestreo


que interesan en una investigación científica.
Métodos Estadísticos
Terminología Estadística

A continuación, presentaremos algunos ejemplos de Variable y Elemento.

 Al educador le puede interesar el rendimiento en la lectura de los estudiantes


que han aprendido a leer con un determinado método. (Elemento: estudiantes)

 El médico puede querer investigar el nivel de colesterol en ciertos pacientes.


(Elemento: pacientes)

 El investigador agrícola puede estar interesado en conocer la resistencia de


una variedad de trigo a determinada enfermedad. (Elemento: variedad trigo)

 Al meteorólogo le puede llamar la atención la nieve como una proporción de


la precipitación total. (Elemento: nieve)

Otros ejemplos de variables: Estaturas de los estudiantes de cuarto año medio,


vida útil de los neumáticos de automóviles, el color de la piel de los perros, la
opinión de los adultos mayores con respecto a un determinado proyecto de ley, el
tiempo de atención a los clientes en las cajas de un supermercado, el tiempo de
atención que dedica un profesor a sus estudiantes.
Métodos Estadísticos
Antecedentes Generales

La parte de la Estadística que se ocupa de describir y analizar un grupo dado de


datos, sin sacar conclusiones sobre un grupo mayor, se llama estadística
descriptiva o deductiva.

Población: es el conjunto completo de individuos o elementos de interés.

Existen momentos en los que se puede medir o examinar cada elemento de la


población.
Por ejemplo:
- Todos los estudiantes de su clase contestarán un cuestionario.
-Si hay 35 estudiantes en la clase y si sólo se desea la información sobre esta
clase, los estudiantes constituyen la población, y se puede medir a cada uno por
sus respuestas al cuestionario.
-Cuando se hace el intento de medir a todos los miembros de una población de
interés, el resultado es un censo.
Métodos Estadísticos
Antecedentes Generales

Censo: es medir todos los elementos de una población de interés.

En la mayor parte de las investigaciones estadísticas, los censos son costosos y


difíciles, o incluso imposibles. Así es necesario seleccionar una muestra, que es
un subconjunto de la población elegido para el análisis.

Muestra: es un subconjunto representativo seleccionado de la población.

La palabra representativo es la clave de esta idea. Una buena muestra es


aquella que refleja las características esenciales de la población de la cual se
obtuvo.

Parámetro: es cualquier característica medible de la población.

Estadístico o estadígrafo: es cualquier característica medible de una muestra.


Métodos Estadísticos

Terminología Estadística

Variable aleatoria: Si los valores numéricos que toma una variable provienen
de factores fortuitos y si un determinado valor no se puede predecir
exactamente con anticipación, esa variable se denomina variable aleatoria.

Notación:
- Las variables aleatorias se denotarán con letras mayúsculas X, Y, Z, etc..
- Los valores individuales de una variable aleatoria se representan con letras
minúsculas x, y, z, etc..

A modo de ejemplo, supongamos que un profesor ha enseñado a leer a un


grupo de 30 niños con una nueva técnica de lectura. Entonces, la variable
aleatoria es
X : Rendimiento en la lectura, en palabras por segundo.

x , x
1 x ,..., x30 denota los valores de X correspondientes a cada uno de los
2, 3
niños, donde por ejemplo, x1  2 , x2  1 ;etc..
Métodos Estadísticos

Terminología Estadística

Población: Es el conjunto de elementos del cual se saca la muestra.


Anteriormente se definió población como el conjunto de todos los posibles
individuos, personas, objetos o mediciones de interés estadístico.

 El concepto de población lo utilizaremos con más frecuencia para hacer


referencia a un conjunto de valores de alguna variable aleatoria.

 Podemos entonces definir población como el conjunto más grande de


valores (de una variable), por el cual existe algún grado de interés. Esta
definición indica que las poblaciones son definidas por el investigador y no
están predeterminadas por algún proceso que exceda el control que éste
tenga.
Métodos Estadísticos
Variables y Atributos: Tipos de Datos

Por lo general, los datos estadísticos se obtienen contando o midiendo objetos. Algunos
ejemplos de medidas son el promedio de notas, la tasa de desempleo, las ventas
mensuales de un supermercado, el número de alumnos que asisten a cada clase de
estadística, etc.. Estas medidas se llaman variables, porque pueden tomar muchos
valores diferentes.

 Una variable es un elemento de interés que puede tomar muchos valores numéricos
diferentes.

 Una constante tiene un valor numérico fijo.

 Las variables se pueden clasificar en cuantitativas o en cualitativas.


 Una variable cuantitativa es aquella cuyos valores se pueden expresar como
cantidades numéricas. El peso (una medida) y el número de clientes (un recuento)
son ejemplos de variables cuantitativas.
 Una variable cualitativa no es cuantitativa y sólo puede clasificarse, pero no
medirse. La clasificación de artículos en una cadena de montaje en defectuosos y no
defectuosos es un ejemplo de variable cualitativa.
Métodos Estadísticos
Escalas o niveles de medición

Las variables se pueden clasificar según su escala de medición. La clasificación


que se haga tiene gran influencia en la manera de utilizarlas en el análisis.

 Las escalas de medición pueden ser: nominales, ordinales, de intervalos y de


razón

 Escala nominal: Una escala nominal es aquella en la cual los números sirven
sólo como etiquetas para identificar o clasificar por categorías objetos o
eventos. Por ejemplo, el uso de números para identificar a los jugadores de
fútbol.

- La identificación a nivel nominal es necesaria para medir marcas, tipos de


almacenes, territorios de ventas, ubicaciones geográficas, usuarios grandes
versus pequeños, mujeres que trabajan versus mujeres que no trabajan, y
conocimiento de marca versus desconocimiento de marca.
Métodos Estadísticos
Escalas o niveles de medición

 Escala ordinal: Una escala ordinal define la relación ordenada entre objetos o
acontecimientos. Comprende la característica del sistema numérico del orden
de los numerales.
- Por ejemplo, la medición de actitudes, opiniones, preferencias y percepciones
con frecuencia comprende un criterio “mayor que” o “menor que”. Además,
muchas características de los compradores o de unidades de compra pueden
abarcar una característica clasificada (por ejemplo, ocupación, clase social o
imagen).

 Escala de intervalos: Una escala de intervalos comprende el uso de números


para clasificar objetos o eventos de manera que las distancias entre los
numerales corresponda a las distancias entre los objetos o eventos, con
relación a las características que se están midiendo.
− Los ejemplos más comunes de escalas de intervalos son las escalas Fahrenheit
y Celsius que se utilizan para medir la temperatura. Al punto de congelación del
agua se le asigna un valor numérico diferente en cada escala, 32 en Fahrenheit
y 0 en Celsius. La unidad de medición y el origen o punto cero se han
determinado arbitrariamente para ambas escalas.
Métodos Estadísticos
Escalas o niveles de medición

 Escala de razón: Una escala de razón tiene todas las propiedades de una
escala de intervalos más un punto cero absoluto. En la medición de razón, sólo
es posible asignar arbitrariamente un número, es decir, la unidad de medición o
distancia. Una vez determinado este número, las asignaciones numéricas
restantes están por completo determinadas.
- El punto cero absoluto o natural se refiere a la asignación del número cero a la
ausencia de la característica que se está midiendo. Por ejemplo, en nuestro
análisis sobre las escalas de temperaturas Fahrenheit y Celsius, se estableció
que los puntos cero se asignaban arbitrariamente en ambas escalas.
Métodos Estadísticos
Escalas o niveles de medición

La tabla siguiente resume las características de las escalas de medición:


Métodos Estadísticos
Escalas o niveles de medición
Ejercicios.-
Métodos Estadísticos
Escalas o niveles de medición
Ejercicios.-
Variables de estudio: Unidad de Tipo de Variable Escala de medición
Medida
Volumen Litros
Temperatura Grados Kelvin
Presión Atmósferas
Número de moles Moles de gas
Peso de Mg Gramos
Nivel de agua destilada mL
Cantidad de HCl mL
Concentración del HCl Moles/L

Variables Adicionales: -
Número de Alumnos que -
trabajaron correctamente
Nivel de Aprendizaje -
alcanzado por el alumno
Año de Ingreso del -
alumno al colegio
Género -
Métodos Estadísticos
Escalas o niveles de medición
Ejercicios.-
Variables de estudio: Unidad de Tipo de Variable Escala de medición
Medida
Volumen Litros Cuantitativa Continua Razón
Temperatura Grados Kelvin Cuantitativa Continua Razón
Presión Atmósferas Cuantitativa Continua Razón
Número de moles Moles de gas Cuantitativa Continua Razón
Peso de Mg Gramos Cuantitativa Continua Razón
Nivel de agua destilada mL Cuantitativa Continua Razón
Cantidad de HCl mL Cuantitativa Continua Razón
Concentración del HCl Moles/L Cuantitativa Continua Razón

Variables Adicionales: -
Número de Alumnos que - Cuantitativa Discreta Razón
trabajaron correctamente
Nivel de Aprendizaje - Cualitativa Ordinal
alcanzado por el alumno
Año de Ingreso del - Cualitativa Ordinal
alumno al colegio
Género - Cualitativa Nominal
Métodos Estadísticos
Escalas o niveles de medición
Ejercicios.-
Ejemplo 2: (Rendimiento académico de los estudiantes de enseñanza media
de la ciudad de Concepción)

Variable respuesta:
Nota final
Variables explicativas Tipo de Variable Escala de
Medición
 Sexo
 Edad
 Curso
 Número de alumnos por curso
 Tipo de establecimiento
 Tipo de enseñanza
 Número de hermanos
 Nivel socioeconómico (Ingreso
mensual)
 Nivel educacional del padre
 Nivel educacional de la madre
 Actividad del padre
 Actividad de la madre
Métodos Estadísticos
Escalas o niveles de medición
Ejercicios.-
Ejemplo 2: (Rendimiento académico de los estudiantes de enseñanza media
de la ciudad de Concepción)

Variable respuesta:
Nota final
Variables explicativas Tipo de Variable Escala de
Medición
 Sexo Cualitativa Nominal
 Edad Cuantitativa De Razón
 Curso Cualitativa Ordinal
 Número de alumnos por curso Cuantitativa De Razón
 Tipo de establecimiento Cualitativa Nominal
 Tipo de enseñanza Cualitativa Nominal
 Número de hermanos Cuantitativa De Razón
 Nivel socioeconómico (Ingreso Cualitativa Ordinal
mensual)
 Nivel educacional del padre Cualitativa Ordinal
 Nivel educacional de la madre Cualitativa Ordinal
 Actividad del padre Cualitativa Nominal
 Actividad de la madre Cualitativa Nominal
Métodos Estadísticos

Visión general de los procedimientos de análisis de datos

La pregunta fundamental del análisis de datos que afronta una persona que está
llevando a cabo una investigación científica es: ¿Qué técnica de análisis de datos
debe emplearse?. La respuesta se obtiene mediante una descripción de los datos
específicos sobre la situación que enfrenta el investigador. Hay tres preguntas
generales que ayudan al investigador para que empiece a identificar la técnica
apropiada:

1) ¿Cuántas variables van a analizarse simultáneamente?

2) ¿Queremos contestar preguntas descriptivas o de inferencias?

3) ¿Cuál es el nivel de medición (nominal, ordinal, de intervalos o de razón?)


disponible en la variable o variables de interés?.
Métodos Estadísticos
Visión general de los procedimientos de análisis de datos

 Número de variables a analizar


El primer aspecto específico de la situación que se debe aclarar se relaciona con
los objetivos del análisis. Este aspecto se refiere al número de variables que se
desea analizar simultáneamente.
Si se desea examinar el análisis de una variable, éste recibe el nombre de análisis
univariado de datos. La relación de dos variables simultáneas se examina por
medio del análisis bivariado de datos. Las relaciones de más de dos variables
simultáneas requieren el análisis multivariado de datos.
La siguiente figura, resume lo descrito anteriormente:
Métodos Estadísticos
Visión general de los procedimientos de análisis de datos

 Descripción versus Inferencia


La segunda pregunta que debemos responder es, si estamos interesados o no en
la descripción de la muestra o en hacer inferencias acerca de la población de la
cual se tomó la muestra. La estadística descriptiva es una rama de la estadística
que proporciona a los investigadores medidas resumidas de los datos en sus
muestras.
Suministra respuestas a preguntas tales como:
 ¿Cuál es la edad promedio en la muestra?
 ¿Cuál es la dispersión de las edades en la muestra?, y
 ¿Cuál es el nivel de asociación entre edad e ingreso en la muestra?.

La estadística inferencial es una rama de la estadística que permite que los


investigadores hagan juicios acerca de la población total, basados en los
resultados generados por las muestras. Tal tipo de extensión de lo particular a lo
general se denomina inferencia inductiva, y es un procedimiento para hallar nuevo
conocimiento científico.
Métodos Estadísticos
Visión general de los procedimientos de análisis de datos

 Descripción versus Inferencia


Una de las misiones de la estadística consiste en conseguir técnicas para efectuar
inferencias inductivas y para medir el grado de incertidumbre de tales inferencias.
Se basa en la teoría de las probabilidades.

Suministra respuestas a preguntas tales como:

 ¿La edad promedio de la población es 15 años?


 ¿El nivel de asociación entre edad e ingreso de la población es mayor que
cero?
 ¿Las medias de tratamiento de la población en un experimento son iguales
entre sí?
Métodos Estadísticos
Visión general de los procedimientos de análisis de datos

 Nivel de medición

La tercera pregunta que debemos responder es si la variable o las variables se han


medido a un nivel de escala nominal, ordinal, de intervalos o de razón. Tanto las
técnicas descriptivas como las inferenciales varían según el nivel de la escala
inherente a la variable o a las variables que se están analizando. Si los
investigadores conocen el número de variables que van a analizarse
simultáneamente, ya sea que el interés esté en la descripción o inferencia, y
conocen el nivel de escala de la variable o las variables, entonces se encuentran
en posición de seleccionar el procedimiento estadístico apropiado.
Estadística Descriptiva
DISTRIBUCIÓN DE FRECUENCIAS

Una vez que se han reunido los datos, deben procesarse de tal manera que pueda
observarse cualquier patrón significativo. Debemos entonces estudiar algunas
técnicas que permitan convertir los datos brutos en el tipo de información que
necesitan quienes toman decisiones.

Esta sección y la siguiente, contiene algunas de las técnicas básicas más usadas
para presentar conjuntos de datos en forma resumida.

Estas técnicas son importantes tanto para datos cuantitativos como para datos
cualitativos. Una forma común y muy útil para resumir conjuntos de datos es la
distribución de frecuencias o tabla de frecuencias. Este método de
presentación de datos muestra la frecuencia (número de ocurrencias) para cada
una de las categorías.
Estadística Descriptiva
DISTRIBUCIÓN DE FRECUENCIAS

Ejemplo 1.1: (Variable cualitativa o atributo). Los resultados obtenidos al


observar el estado de 80 artículos que componen un lote, dió origen a los
siguientes datos: A A D R A A R R A A A D A AA R A A A A R R A A D A A A A R A A A R A
AAA R A R AAAAAAAA R AAA D AA AAAAAAA R R AAAAAAAAAA A R A R D.

Clases Frecuencia absoluta (ni ) Frecuencia relativa ( fi )

Piezas aceptadas 60 60/80 = 0.75 = 75%

Piezas rechazadas 15 15/80 =

Piezas dudosas 5 5/80 =

Total n = 80 80/80 =

Nota: Esta misma idea se aplica para presentar datos cuantitativos cuando el
número de valores posibles de la variable X es pequeño.
Estadística Descriptiva
DISTRIBUCIÓN DE FRECUENCIAS

Ejemplo 1.1: (Variable cualitativa o atributo). Los resultados obtenidos al


observar el estado de 80 artículos que componen un lote, dió origen a los
siguientes datos: A A D R A A R R A A A D A AA R A A A A R R A A D A A A A R A A A R A
AAA R A R AAAAAAAA R AAA D AA AAAAAAA R R AAAAAAAAAA A R A R D.

Clases Frecuencia absoluta (ni ) Frecuencia relativa ( fi )

Piezas aceptadas 60 60/80 = 0.75 = 75%

Piezas rechazadas 15 15/80 = 0.19 = 19%

Piezas dudosas 5 5/80 = 0.06 = 6%

Total n = 80 80/80 = 1.00 = 100%

Nota: Esta misma idea se aplica para presentar datos cuantitativos cuando el
número de valores posibles de la variable X es pequeño.
Estadística Descriptiva
DISTRIBUCIÓN DE FRECUENCIAS

Ejemplo 1.2: (Variable cuantitativa discreta) Para estimar el número de alumnos


Ausentes en las clases de Estadística, un profesor decide seleccionar 25 clases al
azar y contar el número de alumnos que faltan por clase. Los datos son los
siguientes: 7 10 8 6 8 9 9 9 8 6 3 9 8 7 9 10 4 5 10 2 7 8 7 8 6.
La distribución de frecuencias correspondiente es,
Clases
(x )
i ni fi Ni Fi
2 1 1/25=0.04 1 1/25 = 0.04
3 1 1/25= 2 2/25 = 0.08
4 1 1/25= 3/25 =
5 1 1/25= 4/25 =
6 3 3/25=0.12 7/25=
7 4 4/25=0.16 11/25=
8 6 6/25=0.24 17/25=
9 5 5/25=0.20 22/25=
10 3 3/25= 25/25=
Total = 25 25/25= - -
ni
Donde f i  n se llama frecuencia relativa de la i-ésima clase o categoría. (Se
acostumbra, para la interpretación, expresarla en porcentaje).
Así, por ejemplo f5 = 0.12 indica que el 12% de las veces faltaron 6 alumnos a
clases.
Estadística Descriptiva
DISTRIBUCIÓN DE FRECUENCIAS

Ejemplo 1.2: (Variable cuantitativa discreta) Para estimar el número de alumnos


Ausentes en las clases de Estadística, un profesor decide seleccionar 25 clases al
azar y contar el número de alumnos que faltan por clase. Los datos son los
siguientes: 7 10 8 6 8 9 9 9 8 6 3 9 8 7 9 10 4 5 10 2 7 8 7 8 6.
La distribución de frecuencias correspondiente es,
Clases
(x )
i ni fi Ni Fi
2 1 1/25=0.04 1 1/25 = 0.04
3 1 1/25=0.04 1+1=2 2/25 = 0.08
4 1 1/25=0.04 2+1=3 3/25 = 0.12
5 1 1/25=0.04 3+1=4 4/25 = 0.16
6 3 3/25=0.12 4+3=7 7/25= 0,28
7 4 4/25=0.16 7+4=11 11/25= 0,44
8 6 6/25=0.24 11+6=17 17/25= 0,68
9 5 5/25=0.20 17+5=22 22/25= 0,88
10 3 3/25=0.12 22+3=25 25/25= 1,00
Total = 25 25/25=1.00 - -
ni
Donde f i  n se llama frecuencia relativa de la i-ésima clase o categoría. (Se
acostumbra, para la interpretación, expresarla en porcentaje).
Así, por ejemplo f5 = 0.12 indica que el 12% de las veces faltaron 6 alumnos a
clases.
Estadística Descriptiva
DISTRIBUCIÓN DE FRECUENCIAS

Además de las frecuencias relativas es conveniente indicar las frecuencias


absolutas acumuladas N i y las frecuencias relativas acumuladas Fi , donde
por ejemplo: N 3  n1  n2  n3  3 y F5  N 5  7  0.28 o lo que es lo mismo
n 25

F5 = f1 + f2 + f3 + f4 + f5 = 0.28 (Interprete este valor).

Cuando el número de valores posibles de una variable discreta o continua sea


grande, conviene agrupar en intervalos de clase.

Los intervalos pueden ser de amplitud variable o constante. La selección del


número de intervalos o clases (k), depende de caso en particular. Es aconsejable
que haya menos de 15 clases (para un fácil manejo y con el fin de asegurar una
compactación suficiente de información) y por lo menos 5 (para evitar la pérdida de
información que se produciría al reunir en un grupo datos muy diferentes).

Por lo general, las clases se eligen de modo que la amplitud de cada una de ellas
sea igual para todas las categorías o intervalos de clase.
Métodos Estadísticos
DISTRIBUCIÓN DE FRECUENCIAS

 Pasos para la construcción de una distribución de frecuencias


1. Determinar k, el número de clases. (Si existe un número grande de elementos u
observaciones, digamos más de 1000, en el conjunto de datos, por lo general
se usa un número relativamente grande de clases (11 o más); si el conjunto de
datos es pequeño, por ejemplo, menos de 60 observaciones, se usa un número
pequeño de clases (5 ó 6)).
2. Determinar A, el tamaño o amplitud de cada clase. Para ello se determina la
diferencia entre el valor más grande del conjunto de datos y el más pequeño, y
se divide por el número de clases decidido en punto 1.
3. Determinar el punto inicial de la primera clase.
4. Contar el número de valores que ocurren en cada clase.
5. Preparar una tabla de frecuencias utilizando las frecuencias absolutas y/o las
relativas.

Observación: Estos pasos deben considerarse sólo como normas empíricas y no


como un proceso riguroso para construir una tabla de frecuencias.
Métodos Estadísticos
REPRESENTACIONES GRÁFICAS

Si bien es útil clasificar los datos en categorías (o en intervalos de clase) y


determinar las frecuencias, muchos analistas prefieren una representación gráfica.
La gráfica más común es aquella en que las clases o categorías se representan en
el eje horizontal y las frecuencias en el eje vertical.

 Gráfico circular o diagrama de torta: El diagrama de torta es una forma


efectiva de desplegar las frecuencias absolutas (ni) o relativas (fi) en que se
dividen los datos. Este tipo de diagrama es particularmente útil si se quiere
hacer hincapié en los tamaños de las componentes de los datos. Un círculo
completo, 360º, representa el número total de observaciones. El tamaño de las
porciones es proporcional a la frecuencia de cada categoría.
Métodos Estadísticos
REPRESENTACIONES GRÁFICAS

 Diagrama de barras: Un diagrama de barras es otro método habitual de


presentar en forma gráfica datos cualitativos. Cada barra representa la
frecuencia de una categoría. La altura de la barra es proporcional al número de
elementos en esa categoría. En general las barras se ponen en posición vertical
con la base en el eje horizontal de la gráfica. Las barras pueden ir separadas,
donde la separación deja de manifiesto que se están dibujando frecuencias de
categorías distintas.
Métodos Estadísticos
REPRESENTACIONES GRÁFICAS

 Diagrama de barras: Histograma: La representación gráfica más usada para


datos agrupados en intervalos es el histograma. Un histograma es un conjunto
de rectángulos, cada uno de los cuales representa un intervalo de agrupación o
clase. Sus bases son iguales a la amplitud del intervalo, y las alturas se
determinan de manera que su área sea proporcional a la frecuencia de cada
clase.
Métodos Estadísticos
REPRESENTACIONES GRÁFICAS

 Polígono de frecuencias: El polígono de frecuencias es otro método usual de


presentar gráficamente datos agrupados en intervalos. Para construir el
polígono de frecuencias se marcan las frecuencias sobre el eje vertical y los
valores de la variable sobre el eje horizontal. Después se representa la
frecuencia de cada clase dibujando un punto sobre el punto medio m, de la
clase y se conectan los puntos sucesivos con líneas rectas para formar un
polígono. En los extremos de la escala horizontal se agregan dos nuevas clases
con frecuencia cero. Esto permite que el polígono llegue al eje horizontal en los
extremos de la distribución.
Métodos Estadísticos
REPRESENTACIONES GRÁFICAS

 Ojiva o polígono de frecuencias acumuladas: La gráfica de una distribución


de frecuencias acumuladas se llama ojiva y se usa para determinar cuántas
observaciones o datos hay menores que un valor determinado en una
distribución.
Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE TENDENCIA CENTRAL

Hasta aquí nos hemos preocupado de la descripción de un conjunto de


observaciones, ya sea gráficamente o por medio de una distribución de
frecuencias.

Sin embargo, en muchos casos, en vez de trabajar con todas las observaciones es
preferible disponer de una o más medidas descriptivas que resuman los datos en
forma cuantitativa. Tales medidas reciben el nombre de Estadísticas o
Estadígrafos.

 Al calcular valores descriptivos que resumen un conjunto de datos, la primera


consideración es encontrar un valor central o representativo de los datos.

 El término ‘valor central’ puede referirse a la moda, a la mediana o a la media


aritmética, entre otras.

 Cada una de estas medidas es apropiada para ciertos propósitos descriptivos,


pero puede resultar completamente inadecuada para otros.
Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE TENDENCIA CENTRAL

 Moda (Mo)

A veces es importante conocer cuál es el valor que más prevalece en un conjunto


de datos. La moda de un conjunto de datos es el valor que ocurre con más
frecuencia.

Características de la moda:

1. Algunos conjuntos de datos no tienen moda.


2. Algunos conjuntos de datos tienen más de una moda.
3. La moda no tiene propiedades matemática valiosas para usarlas en otros
cálculos.

Si un conjunto de datos consiste en los valores 2, 3, 3, 5, 6, 7, 9, 3, 2 y 6, la moda


es 3 puesto que es el número que aparece más veces. Para el siguiente conjunto
de datos: 12, 14, 15, 16, 15, 18, 19, 20 y 14; los valores 14 y 15 ocurren con una
frecuencia de dos. Por tanto, se puede decir que es un conjunto binomial, con
modas 14 y 15. Si ningún valor hubiera aparecido más de una vez, los datos no
tendrían moda.
Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE TENDENCIA CENTRAL

 Mediana (Me)
En los casos en los que se quiere un valor central normal que no sufra los efectos
de distorsión por los valores extremos, se usa la mediana para resumir los datos.
La mediana de un conjunto de datos es el elemento central en un conjunto de
observaciones dispuestas en orden de magnitud.

Características de la mediana:

1. Todo conjunto de datos cuantitativo o cualitativo a nivel ordinal tiene una


mediana.
2. La mediana no es sensible a los valores extremos.
3. La mediana no tiene propiedades matemáticas valiosas para usarlas en otros
cálculos.

La mediana del número de personas atendidas al día en una sala de emergencia


de un hospital a de los siguientes datos de los siete días anteriores: 25, 35, 26, 52,
78, 30 y 45 es 35. (¿Porqué?).
Respuesta: Ordenando de < a >, se tiene: 25 ; 26 ; 30 ; 35 ; 45 ; 52 ; 78.
(Donde la media aritmética o promedio: es 42)
Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE DISPERSIÓN

Se llama dispersión o variación de los datos, al grado en que éstos tienden a


extenderse alrededor de un valor medio. Las medidas de posición central no
proporcionan suficiente información para una adecuada descripción de los datos,
porque no toman en cuenta la variabilidad o dispersión.

Luego, para completar la interpretación que pueda deducirse, por ejemplo, de la


media aritmética y para evitar falsas interpretaciones es necesario acampanar el
valor medio con un coeficiente que mida el grado de dispersión de la distribución
de la variable.

Las medidas de dispersión más usadas son el Rango o Recorrido, la Varianza, la


Desviación Estándar y el Coeficiente de Variación.
Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE DISPERSIÓN

 Rango

El Rango o Recorrido se define como el valor absoluto de la diferencia entre los


valores máximo y mínimo de un conjunto de observaciones.

El recorrido tiene las ventajas de su independencia respecto a la medida de


posición central y de la facilidad de su cálculo. Tiene la desventaja de que para su
cálculo se consideran sólo dos valores del conjunto.
Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE DISPERSIÓN

 Varianza y Desviación Estándar


Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE DISPERSIÓN

 Varianza y Desviación Estándar


Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE DISPERSIÓN
 Varianza y Desviación Estándar
Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE DISPERSIÓN
 Varianza y Desviación Estándar
Métodos Estadísticos
ESTADÍSTICAS O ESTADÍGRAFOS DE DISPERSIÓN

 Coeficiente de Variación (CV)

Para comparar el grado de dispersión entre dos o más distribuciones expresadas


en distintas unidades de medida, no podemos comparar simplemente las varianzas
o las desviaciones estándar respectivas.

En este caso se define un nuevo estadígrafo de dispersión llamado Coeficiente de


Variación o Coeficiente de Dispersión Relativa que está dado por:

El coeficiente de variación es independiente de las unidades de medida utilizadas y


está generalmente expresado en porcentaje. Un inconveniente de este coeficiente
es que deja de ser útil cuando la media aritmética es próxima a cero.
Métodos Estadísticos
OTRAS MEDIDAS DESCRIPTIVAS

Cada una de las medidas descritas hasta aquí, consiste en un número que
describe ciertas características de una variable X.

Otras medidas descriptivas, como los percentiles, deciles y cuartiles son útiles
cuando se necesita dividir un conjunto de datos en determinado número de grupos,
de modo que cada uno de ellos contenga el mismo número de valores.

Tarea: Averiguar!!!
Definir y dar ejemplos de cada uno.
Métodos Estadísticos
FORMAS DE LAS DISTRIBUCIONES: CURTOSIS Y SESGO

El hecho de tener un método para describir la forma de una distribución de


frecuencias es a menudo más útil que la sola capacidad de describir la posición
central o la dispersión de un conjunto de valores. La mayor parte de las
distribuciones que representan problemas del mundo real son del tipo de las
llamadas unimodales, lo que implica que tienen una sola cumbre, o moda. Una
distribución con dos cumbres se denomina bimodal.

 Una distribución es simétrica si tiene la misma forma a los dos lados de su


mediana. En todas las distribuciones simétricas la mediana es igual a la media.
También ocurrirá que la moda es igual a la mediana si la distribución es
unimodal.
Métodos Estadísticos
FORMAS DE LAS DISTRIBUCIONES: CURTOSIS Y SESGO

 Se dice que una distribución es sesgada (o asimétrica) si no es simétrica.


Sesgada a la derecha (sesgo positivo) significa que la mayor parte de los
valores están a la derecha de la moda, en caso contrario se dirá que es
sesgada a la izquierda.
Métodos Estadísticos
FORMAS DE LAS DISTRIBUCIONES: CURTOSIS Y SESGO

 Otra medida descriptiva de la forma de una distribución es la que se refiere al


aplanamiento o apuntamiento de la misma. El término que se aplica a esta
característica de la forma es el de curtosis. A una distribución plana con colas
cortas y anchas se le llama platicúrtica. A una distribución muy apuntada con
colas largas y delgadas se le denomina leptocúrtica.
Métodos Estadísticos
ANÁLISIS EXPLORATORIO DE DATOS (AED)

Desde el punto de vista del análisis de datos, todo estudio estadístico debe
comenzar por una revisión de la información. Así, el primer análisis estadístico
debe ser siempre visual.

El punto de partida deberá ser revisar, precisamente mediante este estudio gráfico
inicial, los supuestos referentes a la distribución de las variables a considerar. En
este sentido, el análisis exploratorio de datos proporciona una variedad de
herramientas que permiten "ver" los datos antes empezar a manejarlos
matemáticamente.
Métodos Estadísticos
ANÁLISIS EXPLORATORIO DE DATOS (AED)

 Detección de puntos atípicos (outliers)

La inclusión en el estudio de puntos atípicos, sean éstos reales (observaciones


válidas de situaciones anómalas) o producto de errores en el registro o lectura de
los datos, puede conducir a conclusiones erróneas. Dos técnicas del AED nos
permiten detectar la presencia de estos puntos, y corregir la información si es
necesario, éstas son el diagrama de tallo y hoja y el diagrama de caja y
bigotes.
Métodos Estadísticos
ANÁLISIS EXPLORATORIO DE DATOS (AED)

 Diagrama de tallo y hojas (steam and leaf)


Un procedimiento semi-gráfico de presentar la información para variables
cuantitativas, que es especialmente útil cuando el número total de datos es
pequeño (menor que 50), es el diagrama de tallo y hojas de Tukey.
Este diagrama consiste básicamente en desplegar toda la información muestras en
la forma de un histograma. Este procedimiento, además de damos una idea acerca
de las desviaciones distribucionales de los datos, tiene la ventaja, por sobre un
histograma tradicional, el no considerar los datos agrupados, sino que tal como
éstos han sido generados y pueden ser recuperados más tarde sin pérdida de
información.
Métodos Estadísticos
ANÁLISIS EXPLORATORIO DE DATOS (AED)

 Diagrama de tallo y hojas (steam and leaf)

Los principios para construirlos son:

a) Redondear los datos a dos o tres cifras significativas, expresándoles en


unidades convenientes.

b) Disponerlos en una tabla con dos columnas separadas con una línea como
sigue:
1)Para datos con dos dígitos, escribir a la izquierda de la línea los dígitos de las
decenas - que forman el tallo- y a la derecha las unidades, que serán las ramas.
Por ejemplo, 87 se escribe 8|7.
2)Para datos con tres dígitos el tallo estará formado por los dígitos de las
centenas y decenas, que se escribirán a la izquierda, separados de las unidades.
Por ejemplo, 127 será 12|7.

a) Cada tallo define una clase, y se escribe sólo una vez. El número de ‘hojas’
representa la frecuencia de dicha clase.
Métodos Estadísticos
ANÁLISIS EXPLORATORIO DE DATOS (AED)

 Diagrama de tallo y hojas (steam and leaf)

Ejercicio: Construya un diagrama de tallo y hojas para los siguientes datos


recogidos en centímetros: 11.357, 12.542, 11.384, 12.431, 14.212, 15.213, 13.300,
11.300, 17.206, 12.710, 13.455, 16.143, 12.162, 12.721, 13.420, 14.698.
Métodos Estadísticos
ANÁLISIS EXPLORATORIO DE DATOS (AED)

 Diagrama de tallo y hojas (steam and leaf)

Ejercicio: Construya un diagrama de tallo y hojas para los siguientes datos


recogidos en centímetros: 11.357, 12.542, 11.384, 12.431, 14.212, 15.213, 13.300,
11.300, 17.206, 12.710, 13.455, 16.143, 12.162, 12.721, 13.420, 14.698.
Desarrollo:

a) Datos redondeados expresados en milímetros: 114, 125, 114, 124, 142, 152,
133, 113, 172, 127, 135, 161, 122, 127, 134, 147.

b) Diagrama de tallo y hojas, datos en milímetros.

11 4 4 3
12 5 4 7 2 7
13 3 5 4
14 2 7
15 2
16 1
17 2
Métodos Estadísticos
ANÁLISIS EXPLORATORIO DE DATOS (AED)

 Diagrama de caja y bigotes (box and whiskers)

o Los diagramas de caja y bigotes son una de las herramientas más usadas en la
detección de puntos atípicos. Estos diagramas están basados en algunos
estadígrafos de orden, como son la mediana y los cuartiles.

o La idea básica de estos diagramas es usar la distancia intercuartílica como una


medida de la atípica de la observación.

o Este diagrama también permite detectar conductas asimétricas, ya que divide


los datos en cuatro áreas de igual frecuencia.

o El diagrama de caja y bigotes, ofrece una representación gráfica de los datos a


través de la mediana, el rango intercuartílico, q3 – q1, y los valores máximo y
mínimo.

Tarea: A realizar!!! Construya un diagrama de caja y bigotes para los datos de un


ejemplo en particular cualquiera e indique si existen puntos atípicos.

También podría gustarte