Módulo 1

UNIVERSIDAD TECNOLOGICA NACIONAL
FACULTAD REGIONAL AVELLANEDA
UNIDAD 1
ESTADÍSTICA DESCRIPTIVA
Autores:
Mg. María Cristina Kanobel
Lic. Andrea Álvarez
Lic. Luis Alberto Garaventa
1
UNIDAD 1: Estadística descriptiva 2
Como toda disciplina científica la Estadística tiene un lenguaje que le es propio. En el texto que
sigue encontrarán los conceptos básicos de estadística que necesitan para afrontar el estudio
de la materia.
Esperamos que al finalizar la lectura del siguiente texto puedan diferenciar los conceptos
población de muestra, variable cualitativa de variable cuantitativa y censo de muestreo
¿QUÉ ES LA ESTADÍSTICA?
La Estadística es una ciencia que se ocupa de recolectar, organizar, y analizar

información sobre un grupo de datos de forma tal que podamos obtener
conclusiones válidas sobre ellos.
Podemos clasificar la Estadística en dos ramas:
La ESTADÍSTICA DESCRIPTIVA trata sobre el procesamiento de los datos sin intenciones de

formular inferencias sobre ellos. Se ocupa de recolectar, organizar y procesar los datos sin
intenciones de formular inferencias sobre ellos. Presenta datos por medio de gráficos y tablas
que describen una determinada situación particular. Esta es la noción de estadística que tiene
asociada la mayoría de la gente.
La INFERENCIA ESTADÍSTICA es la disciplina científica que se ocupa de sacar conclusiones

sobre determinado grupo de estudio para poder realizar inferencias a partir de los datos
obtenidos. En este rol de generar procedimientos válidos para el análisis de los datos, la
estadística complace las necesidades de la investigación científica en sus diversas disciplinas.
La Teoría de la Probabilidad es la base del desarrollo y los fundamentos de la

inferencia estadística
POBLACIÓN y MUESTRA
Uno de los objetivos de la investigación estadística es explorar las características

de una población de utilizando sólo unas pocas observaciones. Por ejemplo: frente
a una elección, si queremos pronosticar sus resultados, encuestamos a un grupo
reducido de votantes (ya que encuestar a todos sería un proceso engorroso y muy caro). Es
decir que, mediante el grupo que encuestamos estamos analizando el comportamiento de
todos los votantes en las urnas.
Se denomina POBLACIÓN al conjunto de elementos de un grupo en estudio

Una población puede ser finita o infinita. Si podemos listar a los miembros de una población,
entonces la población es finita. En caso contrario decimos que es infinita.
Una MUESTRA es el conjunto de elementos que componen una parte

representativa de la población de estudio
Los términos población y muestra son relativos. Por ejemplo, todos los habitantes de
Córdoba constituyen una población respecto de Córdoba. En cambio, son una muestra cuando
la población en estudio son los habitantes de la Argentina.
Para obtener conclusiones sobre una población infinita o cuando el estudio de una población
finita es costoso, es conveniente trabajar con muestras.
VARIABLES ESTADÍSTICAS
La característica que estudiamos de una población es lo que denominamos

VARIABLE.
Las variables pueden clasificarse en dos grandes grupos:

• cuantitativa o numérica: son aquellas variables que toman valores numéricos.
• cualitativa o categórica: son aquellas definidas por clases o categorías
Cuando los valores que toma una variable cuantitativa pertenecen a un conjunto finito o infinito
numerable decimos que la variable es discreta. En caso contrario, decimos que es continua.
Cuando en una variable cualitativa podemos ordenar los datos, decimos que la variable es
ordenable. En caso contrario decimos que es no ordenable.
Las variables generadas por la ausencia o presencia de una categoría se denominan
dicotómicas o binarias.
PARÁMETRO Y ESTADÍSTICO
Se denomina parámetro a toda medida que describe una característica de una

población.
Un estadístico es toda medida que describe una característica de una muestra
Un parámetro es un número fijo que resume información sobre la población en cambio, el

estadístico depende de la muestra seleccionada.
MATRICES DE DATOS
Cuando se relevan varias características de una población, los datos se

organizan en una matriz llamada matriz de datos.
En una matriz de datos consignamos las unidades de observación en las filas y
las variables en las columnas como en el ejemplo que sigue:
En esta tabla encontramos 5 observaciones de variables vinculadas con una investigación en

empresas constructoras acerca de los salarios de los empleados del área específica de la
construcción.
Edad Sexo Categoría Antigüedad Titulo Salario

25 F J 1 E $8000
35 M SS 10 I $25000
28 F SS 5 A $20000
30 M J 5 M $9000
55 M S 25 I $5000
Por categoría se consigna: J (Junior) SS (Semi – Senior) S (Senior)

Por Antigüedad entendemos el tiempo que lleva trabajando en este empleo o en otras
empresas pero con funciones similares
Por Título categorizamos I: (Ingeniero), A (Arquitecto) E (Estudiante de Ingeniería o
Arquitectura) M (Maestro Mayor de Obras, que no continúa sus estudios superiores)
TABLAS DE FRECUENCIAS
Las tablas de frecuencias permiten ordenar los datos de una muestra para que
se pueda leer la información en forma más clara. Se definen distintos tipos de
frecuencias:
Se denomina frecuencia absoluta parámetro al número de veces que se

observa un dato
Se simboliza f
Se denomina frecuencia relativa a la razón entre la frecuencia relativa y el

número total de datos
Se calcula como:
f
fr =
n
Se denomina frecuencia porcentual a la frecuencia relativa multiplicada

por 100
Determina en términos de porcentajes qué parte del total de los datos corresponde
al dato determinado. Esto es:
f % = fr . 100
Se denomina frecuencia acumulada a la cantidad de datos observados

menores o iguales que el dato determinado.
Es decir:
F1 = f1
Fi = Fi −1 + f i i  1
En resumen, es posible organizar la información:
Siempre que sea posible, agrupamos los datos en tablas simples, que son aquellas que toman
un solo valor por categoría, en caso contrario, debemos utilizar tablas agrupadas por intervalos,
en las cuales cada categoría se representa con un intervalo numérico.
Por ejemplo
a) Cantidad de hijos por familia. (Tabla simple)
X 0 1 2 3 4 5
Frecuencia 8 12 20 5 4 1
b) Concentración de alcohol en una muestra de 40 botellas de vino de mesa (tabla de

datos agrupados)
Concentración [10; 11) [11; 12) [12; 13) [13; 14)

Frecuencia 15 18 5 2
LABORATORIO DE INFORMÁTICA
Analizaremos con un ejemplo cómo construir tablas de frecuencias.
Tabla de frecuencias para variable discreta
Para construir la tabla iremos siguiendo el procedimiento frente a la computadora, a partir del
siguiente ejemplo:
Una revista de la construcción realizó un relevamiento por encuesta para observar los hábitos de
las familias que construyeron una casa nueva en el último año. Al grupo de encuestados se les
consultó cuántos presupuestos, además del de el estudio contratado, solicitaron antes de cerrar el
contrato.
Las respuestas se volcaron en una matriz de datos
1 2 5 0 3 2 6 3 2 5
4 2 3 5 6 6 7 3 5 2
2 3 5 0 0 1 3 5 3 4
Es posible resumir la información anterior en una tabla de frecuencias. Para ello sigan los pasos
detallados en la siguiente imagen:
• Cargamos los datos en un rango de celdas (lo llamaremos matriz)

• En una columna escribimos los posibles valores que toma la variable.
• Nos posicionamos en la celda contigua al primer valor de la tabla
• Aplicamos la función estadística FRECUENCIA oprimiendo el asistente de fórmulas (marcado con
un círculo en el gráfico)
En DATOS, seleccionamos el rango de celdas que contienen la matriz
En GRUPOS, seleccionamos el rango de celdas que contienen los valores de la variable.
• Aceptamos.
Luego de aceptar necesitamos copiar la fórmula en toda la tabla de frecuencias. Para ello:
• seleccionamos la celda donde pegamos la fórmula

• Llevamos el puntero hasta el extremo inferior derecho de la celda (el puntero cambiará de
una cruz blanca a una cruz más delgada y negra). En ese punto oprimimos el botón y
arrastramos la fórmula hasta la última celda de la tabla.
• Los datos que van a observar no se corresponden con la respuesta que esperaban. Ahora
deben proceder como se indica en la siguiente pantalla.
Agregar el signo $ para fijar

los datos de la matriz (en la
imagen debe ser A$1:C$10)
Hacer click en este punto.

La pantalla se seleccionará
recuadrando los rangos del
mismo color que las letras
que los referencias. Luego
oprimir
CTL+SHIFT+ENTER
Tablas de frecuencias para datos agrupados
Para realizar en Excel una tabla de frecuencias con datos agrupados, procedemos de igual
forma que en la anterior sólo que los datos de la variable los separamos en dos columnas: en
una anotamos los extremos inferiores de los intervalos y en la otra los extremos superiores.
Cuando asignamos la función frecuencia para armar la tabla, seleccionamos como grupo
sólo la columna de los extremos superiores
GRÁFICOS ESTADÍSTICOS
Una forma de describir la información recolectada es mediante gráficos

estadísticos. Entre los más usuales encontramos los siguientes:
Gráfico circular:
DITRIBUCIÓN DE LOS EMPLEADOS
SEGÚN SEXO
Se puede aplicar para todo tipo de
30% variables y permite ver la distribución de
los datos en relación proporcional al área
que ocupa cada sector. Una restricción
fem enino para el uso de este tipo de gráfico es
m asculino
que las categorías de la variable deben
ser excluyentes.
70%
Fuente: Registros de la oficina de personal

Unidades vendidas según tipo

Gráficos de columnas
80
58
Se utilizan para diversos tipos de presentaciones.
Cantidad de
60 50
unidades
43
40 Cuando la variable representada es cualitativa, se
23
20
20
pueden utilizar barras horizontales (esto permite una
mejor lectura de las categorías), cuando los datos
0
2 am b 3 am b 4 am b duplex otros están agrupados en intervalos se suelen utilizar
Años
histogramas que son gráficos de columnas una a
Fuente: Departamento de ventas continuación de la otra
Unidades vendidas por año

Gráficos de líneas
400
Son adecuados cuando la variable
Cantidad de
325 350 350

unidades
300
analizada es temporal.
225
200 198 En este caso no deben confundirse con
100 gráficos de funciones continuas, dado que
0 los valores de la variable son discretos y se
2000 2001 2002 2003 2004 unen los puntos solo para facilitar la
Años lectura.
Fuente: Departamento de ventas
Existen otras formas de gráficos que se pueden encontrar en informes o en el menú de la

planilla de cálculo y que son, en cierta forma, variaciones respecto de estos tres modelos.
Algunos aspectos que no deben dejar de tomar en cuenta al construir un gráfico es consignar
en el mismo:
• Un título que es la descripción de la variable que se releva
• El tipo de dato que se representó en cada eje horizontal y, en el eje vertical de las
frecuencias, si los valores son absolutos, relativos o porcentuales.
• Aclarar, cuando no sea absolutamente claro, la fuente de donde se extrajeron los datos
(esto se omite cuando los datos son producidos por el responsable del informe y en ese caso
solamente se aclara en el caso que los datos sean obtenidos de fuentes externas
MEDIDAS DE POSICIÓN Y DISPERSIÓN
Las medidas de posición y dispersión nos facilitan información sobre la serie de

datos que estamos analizando. Son medidas que sintetizan características de una
muestra o de una población.
Las medidas de posición se clasifican en:
a) Medidas de posición central o tendencia central: que informan sobre los valores medios
de la serie de datos.
b) Medidas de posición no centrales: que describen cómo se distribuye el resto de los

valores de la serie.
Describiremos a continuación las siguientes medidas de posición:

centradas
deciles
No centradas
cuartiles
Llamamos moda al valor que tiene mayor frecuencia en un grupo de datos

(muestra o población)
Si f k es la mayor de las frecuencias absolutas, entonces:
mo = xk
Veamos los siguientes ejemplos:
a) En la muestra
25 36 25 36 29 25 15
la moda es 25 porque tiene mayor frecuencia (3)
b) En la siguiente tabla de frecuencias
x f
1 5
2 10
3 15
4 15
Las modas son 3 y 4 porque corresponden a los valores de la variable que tienen mayor
frecuencia.
En ese caso decimos que la muestra es bimodal (tiene dos modas)
Usando el asistente de fórmulas, seleccionaremos la función estadística

MODA, en el cuadro de diálogo se propone ingresar Número1.
Allí deben ingresar el rango de celdas que contienen los datos, o ingresar uno
por uno los datos llevando el cursor al renglón siguiente.
En la siguiente imagen se explica el procedimiento:
Llamamos mediana al valor que divide a la muestra (ordenada de menor a

mayor) en dos subconjuntos que tienen la misma cantidad de datos
Para calcular la mediana de un conjunto de datos, se ordenan y luego se determina como

mediana el valor central considerando:
• Si el total n de datos es impar, entonces la mediana es el valor central. Esto es,el dato
 n −1 
 + 1 − ésimo
 2 
Por ejemplo:
Para los datos de la muestra
2 2 4 4 4 7 7 7 9 10 10
n = 11
n −1
+1 = 6 → la mediana es el 6°dato →
2
me = 7
2 2 4 4 4 7 7 7 9 10 10
50% 50%
me
Significa que los datos que forman la primera mitad (50% de los más chicos), no superan 7 y
los datos que forman la segunda mitad (50% de los más grandes) no son superados por 7.
n
• Si el total n es par, entonces la mediana es el promedio de los datos   − ésimo y
2
n 
 +1 − ésimo
2 
Por ejemplo, si los datos de la muestra son: 2 2 4 4 4 7 7 9 10 10
Entonces será:
n = 10
n n
=5y + 1 = 6 → la mediana es el promedio entre el 5° dato y el 6°dato →
2 2
4+7
me = = 5,5
2
2 2 4 4 4 7 7 9 10 10
50% 50%
Me =5,5
Esto significa que los datos que forman la primera mitad (50% de los más chicos), no superan
5,5 y los datos que forman la segunda mitad (50% de los más grandes) no son superados por
5,5.
En el asistente de fórmulas, usaremos la función estadística es MEDIANA, en

el cuadro de diálogo se propone ingresar Número1. Allí deben Ingresar el
rango de celdas que contienen los datos, o ingresar uno por uno los datos
llevando el cursor al renglón siguiente
Llamamos media al promedio aritmético de los valores de la muestra.
Si los datos estuvieran organizados según una tabla de frecuencias, la media es el

promedio ponderado de los valores de la variable, siendo la frecuencia absoluta
( f ) la que proporciona el peso a cada valor.
n
x i siendo x i un dato
x= i =1
n
x i . fi siendo x i un valor de la variable X

x= i =1
Por ejemplo
7 + 9 + 12 + 16
a) el promedio de los siguientes números: 7, 9, 12, 16 es x =
4
b) En la tabla con datos agrupados
x f
0;10 ) 20
10;20 ) 15
20;30 ) 10
30;40 ) 25
40;50 ) 5
En este caso decimos que el intervalo modal es 30;40 ) o bien, que aproximamos la moda
en 35.
En distribuciones representadas mediante histogramas la mediana es el valor que divide al
gráfico en dos partes de igual área
60
50
40
30
20
10
Me
Los percentiles de una distribución (ordenada de menor a mayor) son los

valores que la dividen en cien partes iguales.
Pk es el número que supera al k% de los datos más chicos y es superado por el

(100-k)% de los datos más grandes. En particular, P15 es el número que supera al
15% de los datos más chicos y es superado por el 85% de los datos más grandes.
Observación: la mediana es el percentil 50 (me= P50 )
Entre los percentiles se destacan los deciles y los cuartiles:

Los deciles de una distribución (ordenada de menor a mayor) son los

valores que la dividen en diez partes iguales.
D1 = P10
D2 = P20
.......... .........
D9 = P90
Los cuartiles de una distribución (ordenada de menor a mayor) son los

valores que la dividen en cuatro partes iguales.
Q1 = P25
Q2 = P50 = me
Q3 = P75
Veamos los siguientes ejemplos:
a) En la siguiente tabla de frecuencias, X representa la cantidad de hijos de un grupo de

personas.
x f F
0 4 4
1 7 11
2 4 15
3 3 18
4 2 20
La matriz de datos es la siguiente:
0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4
Buscamos los Cuartiles:

n
n = 20 → = 5 → cada una de las cuatro partes tendrá 5 datos
4
0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4
Q4 = 4
Q1 = 1 Q2 = 1 Q3 = 2,5
El promedio entre el último dato de la primera parte y el primero de la segunda parte es el

cuartil 1: Q1 = 1
El promedio entre el último dato de la segunda parte y el primero de la tercera parte es el

cuartil 2: Q2 = 1
El promedio entre el último dato de la tercera parte y el primero de la cuarta parte es el

cuartil 3: Q3 = 2,5
El último dato es el cuartil 4: Q4 = 4
b) Observen la siguiente muestra de 25 datos

            75
 %          
1 1 2 3 3 4 4 5 5 5 5 6 7 7 8 8 8 8 8 9 9 9 10 11 12
            P40 Q3
40%
El percentil 40 ( P40 ) es el valor que deja a la izquierda el 40% de los valores. El 40% de 25 es
10 por lo tanto el Percentil es 5.
El tercer cuartil Q 3 es equivalente al Percentil 75, por lo tanto, el 75% de 25 es 18,75. Por lo
que aproximaremos como Q 3 al valor que se encuentra en la posición 19 que es 8.
Simbólicamente escribiremos P40 = 5 y Q 3 = 8
Las técnicas para calcular percentiles y cuartiles son varias, y las diversas bibliografías proponen
fórmulas distintas de cálculo para aproximarlos.
Nosotros trabajaremos con el concepto y aplicando la proporcionalidad directa aproximaremos
los percentiles o, en la mayoría de los casos, recurriremos a la planilla de cálculo.
Usando el asistente de fórmulas, la función estadística es PERCENTIL, en el

cuadro de diálogo se propone ingresar Número1. Allí deben Ingresar el rango
de celdas que contienen los datos, o ingresar uno por uno los datos llevando el
cursor al renglón siguiente.
P40
¿Es suficiente el promedio para representar una muestra?
Los locales A y B tienen 3 empleados cada una que ganan en promedio $8000 por
semana. Ambos negocios están uno al lado del otro en un shopping center y
venden el mismo tipo de ropa. A simple vista pareciera que ambas tiendas tienen la misma
política salarial, pero veamos el detalle:
Local A Local B
Laura gana $90000.- (es la encargada) Diego gana $12000.- (es el encargado)
Inés gana $8000.- (es vendedora) Susana gana $8000.- (es la vendedora)
Pedro gana $7000.- (es el cadete) Emiliano es el cadete (cuánto gana?)
Veamos los datos en un gráfico:
Dieg o
La ura Inés $
Susa na
$
$ Ped ro $
$
$
Em ilia no
En el caso A los tres sueldos están próximos a la recta promedio. En el caso B no lo están. Con
lo que se hace evidente que la media por sí sola no es una buena síntesis de las características
de la muestra.
Se hace necesario buscar un valor para medir esa dispersión ya que en este caso es muy
evidente que no son iguales pero hay casos en los que se hace muy difícil ver cuál es la
muestra en la que los datos están más dispersos.
Una forma de aproximar a esta medida podría ser promediar las diferencias entre cada valor y
el promedio:
Lo calculamos para el local A

( 9000 − 8000) + (8000 − 8000) + ( 7000 − 8000) = 0 Pero
3
da cero siempre.
Una manera de evitar esto es elevar al cuadrado las diferencias para evitar que al sumar los
opuestos se cancelen y la suma de cero.
2
A la medida que se calcula de esta forma se la llama Varianza muestral y se la simboliza con S
S2 =
(9000 − 8000)2 + (8000 − 8000)2 + (7000 − 8000)2 =6666,67
3
El inconveniente con el uso de la varianza es que queda expresada en unidades cuadradas. Por
ejemplo para el caso del local A la varianza da 6666,67 pesos al cuadrado.
Para evitar esto y trabajar con una medida que esté expresada en la misma unidad de medida
que la media definimos el desvío estándar que es la raíz cuadrada de la varianza.
MEDIDAS DE DISPERSIÓN
Para describir y resumir el comportamiento de un conjunto de datos se hace

necesario, no sólo conocer las medidas de posición que los caracterizan, sino
también otras medidas que sintetizan cómo se distribuyen dichos datos alrededor
del promedio. Para ello recurrimos a las llamadas medidas de variabilidad o dispersión:
Llamamos varianza al promedio de los cuadrados de los desvíos de los

datos respecto de la media aritmética
Para un conjunto de datos se calcula como

n
 (x − x)
2
i
s2 = i =1
Si los datos están organizados según una tabla de frecuencias, la varianza es el promedio
ponderado de los cuadrados de los desvíos de los valores de la variable respecto de la media
aritmética, siendo la frecuencia absoluta ( f ) la que proporciona el peso a cada valor.
Su fórmula es la siguiente:
 (x − x ) fi
2
i
s2 = i =1
Definimos desvío standard como la raíz cuadrada de la varianza
Es decir:
s = s2
Cuando las muestra observada es pequeña, podríamos tener algún error para sacar
conclusiones a partir de los valores obtenidos, por esa razón conviene trabajar con una formula
modificada de la varianza, la llamamos varianza insesgada, o varianza para muestras pequeñas
Llamamos varianza insesgada al promedio de los cuadrados de los

desvíos de n-1 datos respecto de la media aritmética
Para un conjunto de datos se calcula como

n
 (x − x)
2
i
s* = i =1
2
n −1
Si los datos están organizados según una tabla de frecuencias, su fórmula es la siguiente:
 (x − x ) fi
2
i
s* = i =1
2
n −1
Definimos desvío standard como la raíz cuadrada de la varianza
Es decir:
s* = s 2
Es una especie de “desvío promedio”; representa de alguna forma a todos los
desvíos sin contemplar su signo.
Usando el asistente de fórmulas, la función estadística para el desvío

estándar es DESVEST en el cuadro de diálogo se propone ingresar Número1.
Allí deben Ingresar el rango de celdas que contienen los datos, o ingresar uno
por uno los datos llevando el cursor al renglón siguiente
Coeficiente de variación es la relación entre el desvío estándar y la

media aritmética.
Se expresa en porcentaje y expresa qué parte de la media representa el desvío. Esto es:
s
c.v.% = . 100
x
El coeficiente de variación es una medida que relaciona la media y el desvío de una muestra y
permite comparar muestras en función de la homogeneidad. Dadas dos muestras será más
homogénea aquella que tenga el menor coeficiente de variación.
Media acotada
Respecto del coeficiente de variación hay una cuestión que se hace muy importante
para tener en cuenta: cuando una muestra tiene una gran dispersión, la media no
es una medida adecuada como síntesis de información de la muestra y se deben
recurrir a otras medidas como la mediana o la moda para representarla.
Otra estrategia cuando las muestras no son pequeñas cuando se observa una gran dispersión
relativa, es trabajar con los valores centrales y para ello se usa la MEDIA ACOTADA.
Media acotada es el promedio de los datos centrales sin considerar

valores extremos.
Por ejemplo una media acotada al 80% se calcula despreciando el 10% de los valores menores
y el 10% de los valores superiores para evitar que los extremos modifiquen el valor de la media
En la muestra:
15 158 170 195 165 172 185 192 195 1500
Observamos que el 15 y el 1500 son valores extremos. Si calculamos el promedio,

obtenemos x = 294,7 que es un valor muy poco representativo de los valores de la muestra. Si
excluimos los valores extremos 15 y 1500 estamos tomando el 80% de los valores centrales y
el promedio nos da x 80% =179 que es un valor comprendido en el rango que determina la
mayor cantidad de datos de la muestra
Usando el asistente de fórmulas, la función estadística para la media acotada

es MEDIA.ACOTADA. En el cuadro de diálogo se propone ingresar matriz. Allí
se ingresa el rango de celdas que contienen los datos, y en otro renglón se les
solicitará el porcentaje. En este punto deben consignar el porcentaje de datos que, en total,
quitarán de la muestra para recalcular. Por ejemplo para tomar un 80% de los datos centrales
(en el ejemplo que se ve en la pantalla para excluir al 1 y al 150) se debe poner 0,20 que
representa el porcentaje que se excluye de la muestra.
Cálculo de medidas de posición y dispersión en el caso de variables

continuas
Cuando la variable es continua, los datos se agrupan en intervalos de clase

(intervalos de números reales).
Se llama marca de clase al punto medio del intervalo de clase. A este valor
se lo designa como xi
Para hallar la media aritmética, la varianza, el desvío estándar y el coeficiente de variación, se

utilizan las mismas definiciones dadas para variables discretas, tomando como xi a la marca de
clase del intervalo.
Para el cálculo de la moda, sólo indicamos el “intervalo modal” (intervalo que contiene la
moda) el cual es el que tiene la mayor frecuencia absoluta. Es decir, es el intervalo al cual
pertenecen la mayoría de los datos. Un valor estimativo de la moda es x i .
Análogamente se procede con el cálculo de la mediana y los percentiles.

Módulo 1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Módulo 1

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD TECNOLOGICA NACIONAL

FACULTAD REGIONAL AVELLANEDA

La Estadística es una ciencia que se ocupa de recolectar, organizar, y analizar

Podemos clasificar la Estadística en dos ramas:

La ESTADÍSTICA DESCRIPTIVA trata sobre el procesamiento de los datos sin intenciones de

La INFERENCIA ESTADÍSTICA es la disciplina científica que se ocupa de sacar conclusiones

La Teoría de la Probabilidad es la base del desarrollo y los fundamentos de la

Uno de los objetivos de la investigación estadística es explorar las características

Se denomina POBLACIÓN al conjunto de elementos de un grupo en estudio

Una MUESTRA es el conjunto de elementos que componen una parte

La característica que estudiamos de una población es lo que denominamos

Las variables pueden clasificarse en dos grandes grupos:

Se denomina parámetro a toda medida que describe una característica de una

Un parámetro es un número fijo que resume información sobre la población en cambio, el

Cuando se relevan varias características de una población, los datos se

En esta tabla encontramos 5 observaciones de variables vinculadas con una investigación en

Edad Sexo Categoría Antigüedad Titulo Salario

Por categoría se consigna: J (Junior) SS (Semi – Senior) S (Senior)

Se denomina frecuencia absoluta parámetro al número de veces que se

Se denomina frecuencia relativa a la razón entre la frecuencia relativa y el

Se denomina frecuencia porcentual a la frecuencia relativa multiplicada

Se denomina frecuencia acumulada a la cantidad de datos observados

En resumen, es posible organizar la información:

a) Cantidad de hijos por familia. (Tabla simple)

b) Concentración de alcohol en una muestra de 40 botellas de vino de mesa (tabla de

Concentración [10; 11) [11; 12) [12; 13) [13; 14)

Analizaremos con un ejemplo cómo construir tablas de frecuencias.

Tabla de frecuencias para variable discreta

Las respuestas se volcaron en una matriz de datos

• Cargamos los datos en un rango de celdas (lo llamaremos matriz)

• seleccionamos la celda donde pegamos la fórmula

Agregar el signo $ para fijar

Hacer click en este punto.

Tablas de frecuencias para datos agrupados

Una forma de describir la información recolectada es mediante gráficos

Fuente: Registros de la oficina de personal

Unidades vendidas según tipo

Unidades vendidas por año

325 350 350

Existen otras formas de gráficos que se pueden encontrar en informes o en el menú de la

MEDIDAS DE POSICIÓN Y DISPERSIÓN

Las medidas de posición y dispersión nos facilitan información sobre la serie de

Las medidas de posición se clasifican en:

b) Medidas de posición no centrales: que describen cómo se distribuye el resto de los

Describiremos a continuación las siguientes medidas de posición:

Llamamos moda al valor que tiene mayor frecuencia en un grupo de datos

Si f k es la mayor de las frecuencias absolutas, entonces:

Veamos los siguientes ejemplos:

la moda es 25 porque tiene mayor frecuencia (3)

b) En la siguiente tabla de frecuencias

Usando el asistente de fórmulas, seleccionaremos la función estadística

Llamamos mediana al valor que divide a la muestra (ordenada de menor a

Para calcular la mediana de un conjunto de datos, se ordenan y luego se determina como

En el asistente de fórmulas, usaremos la función estadística es MEDIANA, en

Llamamos media al promedio aritmético de los valores de la muestra.

Si los datos estuvieran organizados según una tabla de frecuencias, la media es el

x i . fi siendo x i un valor de la variable X

b) En la tabla con datos agrupados

Los percentiles de una distribución (ordenada de menor a mayor) son los

Pk es el número que supera al k% de los datos más chicos y es superado por el

Observación: la mediana es el percentil 50 (me= P50 )

Entre los percentiles se destacan los deciles y los cuartiles:

Los deciles de una distribución (ordenada de menor a mayor) son los