Está en la página 1de 37

ESTADÍSTICA CON EXCEL

ALVARO VALENCIA CALLE


INGENIERO INDUSTRIAL

MAGISTER EN CIENCIAS COMPUTACIONALES


¿QUÉ ES LA ESTADÍSTICA? (DEFINICION)
ESTADÍSTICA Es la Ciencia que recoge,
organiza, presenta, analiza e interpreta datos
con el fin de propiciar una toma de
decisiones más eficaz.
La estadística es la rama de las matemáticas que se dedica al análisis e
interpretación de series de datos, generando unos resultados que se utilizan
básicamente en dos contextos: la toma de decisiones y la proyección de
situaciones futuras.
Tradicionalmente la estadística se ha dividido en dos ramas diferentes:
 la estadística descriptiva
 la inferencia estadística.
las dividen en dos grandes categorías:
ESTADÍSTICA DESCRIPTIVA Y

 ESTADÍSTICA DESCRIPTIVA
Métodos para organizar, resumir y presentar datos de manera informativa.

 ESTADÍSTICA INFERENCIAL
Métodos que se emplean para determinar una propiedad de una población con base en la
información de una muestra de ella.

Teoría de decisiones:
Los métodos y las técnicas de la inferencia estadística se pueden utilizar también en una rama de
la estadística conocida como teoría de decisiones. El conocimiento de la teoría de decisiones es
muy útil para los administradores, ya que se le usa para tomar decisiones en condiciones de
incertidumbre
Estadística: conceptos básicos y
definiciones.
TIPOS DE VARIABLES
Ejemplos:
•Es buena idea codificarlas variables como números para poder procesar las con
facilidad en un computador.
•Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué
significan los códigos numéricos.

–Género(Cualitativa : Códigos arbitrarios)


1 : Hombre
2 : Mujer
–Raza(Cualitativa: Códigos arbitrarios)
1 : Blanca
2 : Negra, ...
–Felicidad Ordinal: Respetar un orden al codificar.
1 : Muy feliz
2 : Bastante feliz
3 : No demasiado feliz

•Se pueden asignar códigos a respuestas especiales como:


0 : No sabe
99 : No contesta...
NIVELES DE MEDICIÓN
 Los datos se clasifican por niveles de medición.
 El nivel de medición de los datos rige los cálculos que se
llevan a cabo con el fin de resumir y presentar los datos.
 Determina las pruebas estadísticas que se deben realizar.
 Existen cuatro niveles de medición:
 NOMINAL
Nivel nominal de medición, las observaciones acerca de una variable cualitativa sólo
se clasifican y se cuentan. No existe una forma particular para ordenar las etiquetas.
La clasificación de los seis colores de las lunetas de chocolate de leche M&M
constituye un ejemplo del nivel nominal de medición. Simplemente se clasifican
las lunetas por color. No existe un orden natural.
 ORDINAL
El nivel inmediato superior de datos es el nivel ordinal
 1. Las clasificaciones de los datos se encuentran representadas por conjuntos
de etiquetas o nombres (alto, medio, bajo), las cuales tienen valores
relativos.
 2. En consecuencia, los valores relativos de los datos se pueden clasificar u
ordenar.
 DE INTERVALO
 DE RAZÓN
 Existen cuatro niveles de medición (continuación):
 DE INTERVALO
El nivel de intervalo de medición es el nivel inmediato superior. Incluye todas las
características del nivel ordinal, pero, además, la diferencia entre valores constituye una
magnitud constante.
Las propiedades de los datos de nivel de intervalo son las siguientes:
1. Las clasificaciones de datos se ordenan de acuerdo con el grado que posea de la
característica en cuestión.
2. 2. Diferencias iguales en la característica representan diferencias iguales en las
mediciones.
 DE RAZÓN
Todos los datos cuantitativos son registrados en el nivel de razón de la medición. El nivel de
razón es el más alto.
En resumen, las propiedades de los datos de nivel de intervalo son las siguientes:
1. Las clasificaciones de datos se ordenan de acuerdo con la cantidad de características
que poseen.
2. Diferencias iguales en la característica representan diferencias iguales en los números
asignados a las clasificaciones.
3. El punto cero representa la ausencia de características y la razón entre dos números es
significativa.
Resumen del capítulo
I. La estadística es la ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de facilitar la toma de decisiones más
eficaces.

II. Existen dos clases de estadística.


A. La estadística descriptiva que consiste en un conjunto de procedimientos para organizar y resumir datos.
B. La estadística inferencial implica tomar una muestra de una población y llevar a cabo cálculos relativos a ésta sobre la base de los
resultados de la muestra.
1. Una población es un conjunto de individuos u objetos de interés o las medidas que se obtienen de todos los individuos u
objetos de interés.
2. Una muestra es una parte de la población.

III. Existen dos tipos de variables.


A. Una variable cualitativa es de naturaleza no numérica.
1. Por lo común, lo que interesa es el número o porcentaje de observaciones en cada categoría.
2. Los datos cualitativos se reúnen en gráficas y diagramas de barras.
B. Existen dos tipos de variables cuantitativas, que se presentan de forma numérica.
1. Las variables discretas toman ciertos valores, y existen vacíos entre éstos.
2. Una variable continua adopta cualquier valor dentro de un intervalo específico.

IV. Existen cuatro niveles de medición.


A. En el caso del nivel nominal, los datos se distribuyen en categorías sin un orden particular.
B. El nivel ordinal de medición supone que una clasificación se encuentra en un nivel superior otra.
C. El nivel de medición de intervalo posee la característica de clasificación correspondiente al nivel ordinal de medición, además de
que la distancia entre valores es constante.
D. El nivel de medición de razón cuenta con todas las características del nivel de intervalo, además de que existe un punto 0 y que la
razón entre dos valores resulta significativa.
ARREGLO DE DATOS EN
DISTRIBUCIONES DE
FRECUENCIAS
CAPITULO 3
ARREGLO DE DATOS EN DISTRIBUCIONES DE FRECUENCIAS

TABLA DE FRECUENCIAS
Agrupación de datos cualitativos en clases mutuamente excluyentes que muestra
el número de observaciones en cada clase.
El primer procedimiento que se emplea para organizar y resumir un conjunto de
datos es una tabla de frecuencias.

 Arreglo de datos para variable continua aplicando las funciones estadísticas


de Excel
 Arreglo de datos para variable discreta
 Arreglo de datos para variables cualitativas
 Arreglo de datos para variable discreta en clases de amplitud cero.
ARREGLO DE DATOS PARA VARIABLE CONTINUA
APLICANDO LAS FUNCIONES ESTADÍSTICAS DE EXCEL
 La frecuencia absoluta 𝒇𝒊 , de un valor 𝒙𝒊 es el número de veces que se repite dicho valor.
 La frecuencia relativa 𝒉𝒊 del valor 𝑥𝑖 es el cociente entre la frecuencia absoluta del 𝑥𝑖 y el
número total de valores, N.
𝐟𝐢
𝐡𝐢 =
𝐍
 La frecuencia absoluta acumulada 𝐹𝑖 , del valor 𝑥𝑖 , es la suma de todas las frecuencias
absolutas de todos los valores anteriores a 𝑥𝑖 , más la frecuencia absoluta de 𝑥𝑖 .

𝐹𝑖 = 𝑓1 + 𝑓2 + 𝑓3 + ⋯ . . +𝑓𝑖

 La frecuencia relativa acumulada 𝑯𝒊 del valor 𝑥𝑖 es la suma de todas las frecuencias relativas
de todos los valores anteriores a 𝑥𝑖 , más la frecuencia relativa de 𝑥𝑖

𝐻𝑖 = ℎ1 + ℎ2 + ℎ3 + ⋯ . . +ℎ𝑖

 El porcentaje 𝒑𝒊 de un valor 𝑥𝑖 se obtiene multiplicando por 100 la frecuencia relativa del


valor 𝑥𝑖 .
 Así es como se construye con Excel una tabla de frecuencias:
 Introducimos en la primera columna (A) las distintas modalidades si el
carácter es cualitativo (Figura 2), o bien, los valores de la variable estadística
discreta. (Figura 3)
 En la segunda columna (B) introducimos los valores de la frecuencia absoluta
fi.
 En la tercera columna (C) vamos a colocar la frecuencia absoluta acumulada
(Fi), pero en lugar de hacer nosotros los cálculos, será el programa el que se
encargue de hacerlos.
 ¿Cómo?
 En la celda C3 escribimos = B3 y en la celda C4 escribimos =C3 + B4. A
continuación copiamos la fórmula, situando el puntero del ratón en la esquina
inferior derecha de esta celda y cuando el puntero del ratón se convierta en +
y arrastramos hasta la casilla última casilla.
 Para completar la columna de la frecuencia relativa (hi), basta con escribir
en la celda D3
 =B3/$B$8. (Con el símbolo $, lo que hacemos el fijar el valor de la celda que
no varía).

 En la columna de la frecuencia relativa acumulada (Hi), en E3, escribimos


=D3; en E4, =E3 + D4 y copiamos la fórmula.

 Para el porcentaje, en F3, se escribe =D3 y pulsamos el botón . El paso


siguiente es copiar la expresión de la celda anterior.
Paso 2 Determinar el Rango que esta dado por la diferencia entre el valor
Maximo (M) y el valor minimo (m) que toma la variable en la
muestra , es decir:

También podría gustarte