Está en la página 1de 19

UNIVERSIDAD TECNOLOGICA NACIONAL

FACULTAD REGIONAL AVELLANEDA

UNIDAD 1
ESTADÍSTICA DESCRIPTIVA

Autores:
Mg. María Cristina Kanobel
Lic. Andrea Álvarez
Lic. Luis Alberto Garaventa

1
UNIDAD 1: Estadística descriptiva 2

Como toda disciplina científica la Estadística tiene un lenguaje que le es propio. En el texto que
sigue encontrarán los conceptos básicos de estadística que necesitan para afrontar el estudio
de la materia.

Esperamos que al finalizar la lectura del siguiente texto puedan diferenciar los conceptos
población de muestra, variable cualitativa de variable cuantitativa y censo de muestreo

¿QUÉ ES LA ESTADÍSTICA?

La Estadística es una ciencia que se ocupa de recolectar, organizar, y analizar


información sobre un grupo de datos de forma tal que podamos obtener
conclusiones válidas sobre ellos.

Podemos clasificar la Estadística en dos ramas:

La ESTADÍSTICA DESCRIPTIVA trata sobre el procesamiento de los datos sin intenciones de


formular inferencias sobre ellos. Se ocupa de recolectar, organizar y procesar los datos sin
intenciones de formular inferencias sobre ellos. Presenta datos por medio de gráficos y tablas
que describen una determinada situación particular. Esta es la noción de estadística que tiene
asociada la mayoría de la gente.

La INFERENCIA ESTADÍSTICA es la disciplina científica que se ocupa de sacar conclusiones


sobre determinado grupo de estudio para poder realizar inferencias a partir de los datos
obtenidos. En este rol de generar procedimientos válidos para el análisis de los datos, la
estadística complace las necesidades de la investigación científica en sus diversas disciplinas.

La Teoría de la Probabilidad es la base del desarrollo y los fundamentos de la


inferencia estadística

POBLACIÓN y MUESTRA

Uno de los objetivos de la investigación estadística es explorar las características


de una población de utilizando sólo unas pocas observaciones. Por ejemplo: frente
a una elección, si queremos pronosticar sus resultados, encuestamos a un grupo
reducido de votantes (ya que encuestar a todos sería un proceso engorroso y muy caro). Es
decir que, mediante el grupo que encuestamos estamos analizando el comportamiento de
todos los votantes en las urnas.

Se denomina POBLACIÓN al conjunto de elementos de un grupo en estudio


UNIDAD 1: Estadística descriptiva 3

Una población puede ser finita o infinita. Si podemos listar a los miembros de una población,
entonces la población es finita. En caso contrario decimos que es infinita.

Una MUESTRA es el conjunto de elementos que componen una parte


representativa de la población de estudio

Los términos población y muestra son relativos. Por ejemplo, todos los habitantes de
Córdoba constituyen una población respecto de Córdoba. En cambio, son una muestra cuando
la población en estudio son los habitantes de la Argentina.
Para obtener conclusiones sobre una población infinita o cuando el estudio de una población
finita es costoso, es conveniente trabajar con muestras.

VARIABLES ESTADÍSTICAS

La característica que estudiamos de una población es lo que denominamos


VARIABLE.

Las variables pueden clasificarse en dos grandes grupos:


• cuantitativa o numérica: son aquellas variables que toman valores numéricos.
• cualitativa o categórica: son aquellas definidas por clases o categorías

Cuando los valores que toma una variable cuantitativa pertenecen a un conjunto finito o infinito
numerable decimos que la variable es discreta. En caso contrario, decimos que es continua.
Cuando en una variable cualitativa podemos ordenar los datos, decimos que la variable es
ordenable. En caso contrario decimos que es no ordenable.
Las variables generadas por la ausencia o presencia de una categoría se denominan
dicotómicas o binarias.
UNIDAD 1: Estadística descriptiva 4

PARÁMETRO Y ESTADÍSTICO

Se denomina parámetro a toda medida que describe una característica de una


población.
Un estadístico es toda medida que describe una característica de una muestra

Un parámetro es un número fijo que resume información sobre la población en cambio, el


estadístico depende de la muestra seleccionada.

MATRICES DE DATOS

Cuando se relevan varias características de una población, los datos se


organizan en una matriz llamada matriz de datos.
En una matriz de datos consignamos las unidades de observación en las filas y
las variables en las columnas como en el ejemplo que sigue:

En esta tabla encontramos 5 observaciones de variables vinculadas con una investigación en


empresas constructoras acerca de los salarios de los empleados del área específica de la
construcción.

Edad Sexo Categoría Antigüedad Titulo Salario


25 F J 1 E $8000
35 M SS 10 I $25000
28 F SS 5 A $20000
30 M J 5 M $9000
55 M S 25 I $5000

Por categoría se consigna: J (Junior) SS (Semi – Senior) S (Senior)


Por Antigüedad entendemos el tiempo que lleva trabajando en este empleo o en otras
empresas pero con funciones similares
Por Título categorizamos I: (Ingeniero), A (Arquitecto) E (Estudiante de Ingeniería o
Arquitectura) M (Maestro Mayor de Obras, que no continúa sus estudios superiores)

TABLAS DE FRECUENCIAS

Las tablas de frecuencias permiten ordenar los datos de una muestra para que
se pueda leer la información en forma más clara. Se definen distintos tipos de
frecuencias:

Se denomina frecuencia absoluta parámetro al número de veces que se


observa un dato

Se simboliza f
UNIDAD 1: Estadística descriptiva 5

Se denomina frecuencia relativa a la razón entre la frecuencia relativa y el


número total de datos

Se calcula como:

f
fr =
n

Se denomina frecuencia porcentual a la frecuencia relativa multiplicada


por 100

Determina en términos de porcentajes qué parte del total de los datos corresponde
al dato determinado. Esto es:
f % = fr . 100

Se denomina frecuencia acumulada a la cantidad de datos observados


menores o iguales que el dato determinado.

Es decir:
F1 = f1
Fi = Fi −1 + f i i  1

En resumen, es posible organizar la información:

Siempre que sea posible, agrupamos los datos en tablas simples, que son aquellas que toman
un solo valor por categoría, en caso contrario, debemos utilizar tablas agrupadas por intervalos,
en las cuales cada categoría se representa con un intervalo numérico.

Por ejemplo

a) Cantidad de hijos por familia. (Tabla simple)

X 0 1 2 3 4 5
Frecuencia 8 12 20 5 4 1
UNIDAD 1: Estadística descriptiva 6

b) Concentración de alcohol en una muestra de 40 botellas de vino de mesa (tabla de


datos agrupados)

Concentración [10; 11) [11; 12) [12; 13) [13; 14)


Frecuencia 15 18 5 2

LABORATORIO DE INFORMÁTICA

Analizaremos con un ejemplo cómo construir tablas de frecuencias.

Tabla de frecuencias para variable discreta

Para construir la tabla iremos siguiendo el procedimiento frente a la computadora, a partir del
siguiente ejemplo:

Una revista de la construcción realizó un relevamiento por encuesta para observar los hábitos de
las familias que construyeron una casa nueva en el último año. Al grupo de encuestados se les
consultó cuántos presupuestos, además del de el estudio contratado, solicitaron antes de cerrar el
contrato.

Las respuestas se volcaron en una matriz de datos

1 2 5 0 3 2 6 3 2 5
4 2 3 5 6 6 7 3 5 2
2 3 5 0 0 1 3 5 3 4

Es posible resumir la información anterior en una tabla de frecuencias. Para ello sigan los pasos
detallados en la siguiente imagen:

• Cargamos los datos en un rango de celdas (lo llamaremos matriz)


• En una columna escribimos los posibles valores que toma la variable.
• Nos posicionamos en la celda contigua al primer valor de la tabla
• Aplicamos la función estadística FRECUENCIA oprimiendo el asistente de fórmulas (marcado con
un círculo en el gráfico)
En DATOS, seleccionamos el rango de celdas que contienen la matriz
En GRUPOS, seleccionamos el rango de celdas que contienen los valores de la variable.
• Aceptamos.

Luego de aceptar necesitamos copiar la fórmula en toda la tabla de frecuencias. Para ello:
UNIDAD 1: Estadística descriptiva 7

• seleccionamos la celda donde pegamos la fórmula


• Llevamos el puntero hasta el extremo inferior derecho de la celda (el puntero cambiará de
una cruz blanca a una cruz más delgada y negra). En ese punto oprimimos el botón y
arrastramos la fórmula hasta la última celda de la tabla.
• Los datos que van a observar no se corresponden con la respuesta que esperaban. Ahora
deben proceder como se indica en la siguiente pantalla.

Agregar el signo $ para fijar


los datos de la matriz (en la
imagen debe ser A$1:C$10)

Hacer click en este punto.


La pantalla se seleccionará
recuadrando los rangos del
mismo color que las letras
que los referencias. Luego
oprimir
CTL+SHIFT+ENTER

Tablas de frecuencias para datos agrupados

Para realizar en Excel una tabla de frecuencias con datos agrupados, procedemos de igual
forma que en la anterior sólo que los datos de la variable los separamos en dos columnas: en
una anotamos los extremos inferiores de los intervalos y en la otra los extremos superiores.
Cuando asignamos la función frecuencia para armar la tabla, seleccionamos como grupo
sólo la columna de los extremos superiores

GRÁFICOS ESTADÍSTICOS

Una forma de describir la información recolectada es mediante gráficos


estadísticos. Entre los más usuales encontramos los siguientes:

Gráfico circular:
DITRIBUCIÓN DE LOS EMPLEADOS
SEGÚN SEXO
Se puede aplicar para todo tipo de
30% variables y permite ver la distribución de
los datos en relación proporcional al área
que ocupa cada sector. Una restricción
fem enino para el uso de este tipo de gráfico es
m asculino
que las categorías de la variable deben
ser excluyentes.
70%

Fuente: Registros de la oficina de personal


UNIDAD 1: Estadística descriptiva 8

Unidades vendidas según tipo


Gráficos de columnas
80
58
Se utilizan para diversos tipos de presentaciones.
Cantidad de

60 50
unidades

43
40 Cuando la variable representada es cualitativa, se
23
20
20
pueden utilizar barras horizontales (esto permite una
mejor lectura de las categorías), cuando los datos
0
2 am b 3 am b 4 am b duplex otros están agrupados en intervalos se suelen utilizar
Años
histogramas que son gráficos de columnas una a
Fuente: Departamento de ventas continuación de la otra

Unidades vendidas por año


Gráficos de líneas
400
Son adecuados cuando la variable
Cantidad de

325 350 350


unidades

300
analizada es temporal.
225
200 198 En este caso no deben confundirse con
100 gráficos de funciones continuas, dado que
0 los valores de la variable son discretos y se
2000 2001 2002 2003 2004 unen los puntos solo para facilitar la
Años lectura.
Fuente: Departamento de ventas

Existen otras formas de gráficos que se pueden encontrar en informes o en el menú de la


planilla de cálculo y que son, en cierta forma, variaciones respecto de estos tres modelos.
Algunos aspectos que no deben dejar de tomar en cuenta al construir un gráfico es consignar
en el mismo:
• Un título que es la descripción de la variable que se releva
• El tipo de dato que se representó en cada eje horizontal y, en el eje vertical de las
frecuencias, si los valores son absolutos, relativos o porcentuales.
• Aclarar, cuando no sea absolutamente claro, la fuente de donde se extrajeron los datos
(esto se omite cuando los datos son producidos por el responsable del informe y en ese caso
solamente se aclara en el caso que los datos sean obtenidos de fuentes externas

MEDIDAS DE POSICIÓN Y DISPERSIÓN

Las medidas de posición y dispersión nos facilitan información sobre la serie de


datos que estamos analizando. Son medidas que sintetizan características de una
muestra o de una población.

Las medidas de posición se clasifican en:

a) Medidas de posición central o tendencia central: que informan sobre los valores medios
de la serie de datos.

b) Medidas de posición no centrales: que describen cómo se distribuye el resto de los


valores de la serie.

Describiremos a continuación las siguientes medidas de posición:


UNIDAD 1: Estadística descriptiva 9

centradas

deciles
No centradas
cuartiles

Llamamos moda al valor que tiene mayor frecuencia en un grupo de datos


(muestra o población)

Si f k es la mayor de las frecuencias absolutas, entonces:

mo = xk

Veamos los siguientes ejemplos:

a) En la muestra

25 36 25 36 29 25 15

la moda es 25 porque tiene mayor frecuencia (3)

b) En la siguiente tabla de frecuencias

x f
1 5
2 10
3 15
4 15

Las modas son 3 y 4 porque corresponden a los valores de la variable que tienen mayor
frecuencia.
En ese caso decimos que la muestra es bimodal (tiene dos modas)

LABORATORIO DE INFORMÁTICA

Usando el asistente de fórmulas, seleccionaremos la función estadística


MODA, en el cuadro de diálogo se propone ingresar Número1.
Allí deben ingresar el rango de celdas que contienen los datos, o ingresar uno
por uno los datos llevando el cursor al renglón siguiente.
En la siguiente imagen se explica el procedimiento:
UNIDAD 1: Estadística descriptiva 10

Llamamos mediana al valor que divide a la muestra (ordenada de menor a


mayor) en dos subconjuntos que tienen la misma cantidad de datos

Para calcular la mediana de un conjunto de datos, se ordenan y luego se determina como


mediana el valor central considerando:

• Si el total n de datos es impar, entonces la mediana es el valor central. Esto es,el dato
 n −1 
 + 1 − ésimo
 2 
Por ejemplo:
Para los datos de la muestra
2 2 4 4 4 7 7 7 9 10 10

n = 11

n −1
+1 = 6 → la mediana es el 6°dato →
2
me = 7

2 2 4 4 4 7 7 7 9 10 10
50% 50%

me

Significa que los datos que forman la primera mitad (50% de los más chicos), no superan 7 y
los datos que forman la segunda mitad (50% de los más grandes) no son superados por 7.
n
• Si el total n es par, entonces la mediana es el promedio de los datos   − ésimo y
2
n 
 +1 − ésimo
2 
Por ejemplo, si los datos de la muestra son: 2 2 4 4 4 7 7 9 10 10

Entonces será:
n = 10
UNIDAD 1: Estadística descriptiva 11

n n
=5y + 1 = 6 → la mediana es el promedio entre el 5° dato y el 6°dato →
2 2
4+7
me = = 5,5
2
2 2 4 4 4 7 7 9 10 10
50% 50%

Me =5,5

Esto significa que los datos que forman la primera mitad (50% de los más chicos), no superan
5,5 y los datos que forman la segunda mitad (50% de los más grandes) no son superados por
5,5.

LABORATORIO DE INFORMÁTICA

En el asistente de fórmulas, usaremos la función estadística es MEDIANA, en


el cuadro de diálogo se propone ingresar Número1. Allí deben Ingresar el
rango de celdas que contienen los datos, o ingresar uno por uno los datos
llevando el cursor al renglón siguiente

Llamamos media al promedio aritmético de los valores de la muestra.

Si los datos estuvieran organizados según una tabla de frecuencias, la media es el


promedio ponderado de los valores de la variable, siendo la frecuencia absoluta
( f ) la que proporciona el peso a cada valor.
n

x i siendo x i un dato
x= i =1
n
UNIDAD 1: Estadística descriptiva 12

x i . fi siendo x i un valor de la variable X


x= i =1

Por ejemplo
7 + 9 + 12 + 16
a) el promedio de los siguientes números: 7, 9, 12, 16 es x =
4

b) En la tabla con datos agrupados

x f
0;10 ) 20
10;20 ) 15
20;30 ) 10
30;40 ) 25
40;50 ) 5

En este caso decimos que el intervalo modal es 30;40 ) o bien, que aproximamos la moda
en 35.
En distribuciones representadas mediante histogramas la mediana es el valor que divide al
gráfico en dos partes de igual área

60

50

40

30

20

10

Me

Los percentiles de una distribución (ordenada de menor a mayor) son los


valores que la dividen en cien partes iguales.

Pk es el número que supera al k% de los datos más chicos y es superado por el


(100-k)% de los datos más grandes. En particular, P15 es el número que supera al
15% de los datos más chicos y es superado por el 85% de los datos más grandes.

Observación: la mediana es el percentil 50 (me= P50 )

Entre los percentiles se destacan los deciles y los cuartiles:


UNIDAD 1: Estadística descriptiva 13

Los deciles de una distribución (ordenada de menor a mayor) son los


valores que la dividen en diez partes iguales.

D1 = P10
D2 = P20
.......... .........
D9 = P90

Los cuartiles de una distribución (ordenada de menor a mayor) son los


valores que la dividen en cuatro partes iguales.

Q1 = P25
Q2 = P50 = me
Q3 = P75

Veamos los siguientes ejemplos:

a) En la siguiente tabla de frecuencias, X representa la cantidad de hijos de un grupo de


personas.

x f F
0 4 4
1 7 11
2 4 15
3 3 18
4 2 20

La matriz de datos es la siguiente:

0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4

Buscamos los Cuartiles:


n
n = 20 → = 5 → cada una de las cuatro partes tendrá 5 datos
4

0 0 0 0 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4

Q4 = 4
Q1 = 1 Q2 = 1 Q3 = 2,5

El promedio entre el último dato de la primera parte y el primero de la segunda parte es el


cuartil 1: Q1 = 1
UNIDAD 1: Estadística descriptiva 14

El promedio entre el último dato de la segunda parte y el primero de la tercera parte es el


cuartil 2: Q2 = 1

El promedio entre el último dato de la tercera parte y el primero de la cuarta parte es el


cuartil 3: Q3 = 2,5

El último dato es el cuartil 4: Q4 = 4

b) Observen la siguiente muestra de 25 datos


            75
 %          

1 1 2 3 3 4 4 5 5 5 5 6 7 7 8 8 8 8 8 9 9 9 10 11 12
            P40 Q3
40%

El percentil 40 ( P40 ) es el valor que deja a la izquierda el 40% de los valores. El 40% de 25 es
10 por lo tanto el Percentil es 5.
El tercer cuartil Q 3 es equivalente al Percentil 75, por lo tanto, el 75% de 25 es 18,75. Por lo
que aproximaremos como Q 3 al valor que se encuentra en la posición 19 que es 8.
Simbólicamente escribiremos P40 = 5 y Q 3 = 8
Las técnicas para calcular percentiles y cuartiles son varias, y las diversas bibliografías proponen
fórmulas distintas de cálculo para aproximarlos.
Nosotros trabajaremos con el concepto y aplicando la proporcionalidad directa aproximaremos
los percentiles o, en la mayoría de los casos, recurriremos a la planilla de cálculo.

LABORATORIO DE INFORMÁTICA

Usando el asistente de fórmulas, la función estadística es PERCENTIL, en el


cuadro de diálogo se propone ingresar Número1. Allí deben Ingresar el rango
de celdas que contienen los datos, o ingresar uno por uno los datos llevando el
cursor al renglón siguiente.

P40

¿Es suficiente el promedio para representar una muestra?

Los locales A y B tienen 3 empleados cada una que ganan en promedio $8000 por
semana. Ambos negocios están uno al lado del otro en un shopping center y
UNIDAD 1: Estadística descriptiva 15

venden el mismo tipo de ropa. A simple vista pareciera que ambas tiendas tienen la misma
política salarial, pero veamos el detalle:

Local A Local B

Laura gana $90000.- (es la encargada) Diego gana $12000.- (es el encargado)
Inés gana $8000.- (es vendedora) Susana gana $8000.- (es la vendedora)
Pedro gana $7000.- (es el cadete) Emiliano es el cadete (cuánto gana?)

Veamos los datos en un gráfico:

Dieg o

La ura Inés $
Susa na

$
$ Ped ro $
$
$
Em ilia no

En el caso A los tres sueldos están próximos a la recta promedio. En el caso B no lo están. Con
lo que se hace evidente que la media por sí sola no es una buena síntesis de las características
de la muestra.
Se hace necesario buscar un valor para medir esa dispersión ya que en este caso es muy
evidente que no son iguales pero hay casos en los que se hace muy difícil ver cuál es la
muestra en la que los datos están más dispersos.
Una forma de aproximar a esta medida podría ser promediar las diferencias entre cada valor y
el promedio:

Lo calculamos para el local A


( 9000 − 8000) + (8000 − 8000) + ( 7000 − 8000) = 0 Pero
3
da cero siempre.
Una manera de evitar esto es elevar al cuadrado las diferencias para evitar que al sumar los
opuestos se cancelen y la suma de cero.
2
A la medida que se calcula de esta forma se la llama Varianza muestral y se la simboliza con S

S2 =
(9000 − 8000)2 + (8000 − 8000)2 + (7000 − 8000)2 =6666,67
3

El inconveniente con el uso de la varianza es que queda expresada en unidades cuadradas. Por
ejemplo para el caso del local A la varianza da 6666,67 pesos al cuadrado.
Para evitar esto y trabajar con una medida que esté expresada en la misma unidad de medida
que la media definimos el desvío estándar que es la raíz cuadrada de la varianza.

MEDIDAS DE DISPERSIÓN

Para describir y resumir el comportamiento de un conjunto de datos se hace


necesario, no sólo conocer las medidas de posición que los caracterizan, sino
también otras medidas que sintetizan cómo se distribuyen dichos datos alrededor
del promedio. Para ello recurrimos a las llamadas medidas de variabilidad o dispersión:
UNIDAD 1: Estadística descriptiva 16

Llamamos varianza al promedio de los cuadrados de los desvíos de los


datos respecto de la media aritmética

Para un conjunto de datos se calcula como


n

 (x − x)
2
i
s2 = i =1

Si los datos están organizados según una tabla de frecuencias, la varianza es el promedio
ponderado de los cuadrados de los desvíos de los valores de la variable respecto de la media
aritmética, siendo la frecuencia absoluta ( f ) la que proporciona el peso a cada valor.
Su fórmula es la siguiente:

 (x − x ) fi
2
i
s2 = i =1

Definimos desvío standard como la raíz cuadrada de la varianza

Es decir:

s = s2

Cuando las muestra observada es pequeña, podríamos tener algún error para sacar
conclusiones a partir de los valores obtenidos, por esa razón conviene trabajar con una formula
modificada de la varianza, la llamamos varianza insesgada, o varianza para muestras pequeñas

Llamamos varianza insesgada al promedio de los cuadrados de los


desvíos de n-1 datos respecto de la media aritmética

Para un conjunto de datos se calcula como


n

 (x − x)
2
i
s* = i =1
2

n −1
UNIDAD 1: Estadística descriptiva 17

Si los datos están organizados según una tabla de frecuencias, su fórmula es la siguiente:

 (x − x ) fi
2
i
s* = i =1
2

n −1

Definimos desvío standard como la raíz cuadrada de la varianza

Es decir:

s* = s 2
Es una especie de “desvío promedio”; representa de alguna forma a todos los
desvíos sin contemplar su signo.

LABORATORIO DE INFORMÁTICA

Usando el asistente de fórmulas, la función estadística para el desvío


estándar es DESVEST en el cuadro de diálogo se propone ingresar Número1.
Allí deben Ingresar el rango de celdas que contienen los datos, o ingresar uno
por uno los datos llevando el cursor al renglón siguiente

Coeficiente de variación es la relación entre el desvío estándar y la


media aritmética.

Se expresa en porcentaje y expresa qué parte de la media representa el desvío. Esto es:

s
c.v.% = . 100
x
UNIDAD 1: Estadística descriptiva 18

El coeficiente de variación es una medida que relaciona la media y el desvío de una muestra y
permite comparar muestras en función de la homogeneidad. Dadas dos muestras será más
homogénea aquella que tenga el menor coeficiente de variación.

Media acotada

Respecto del coeficiente de variación hay una cuestión que se hace muy importante
para tener en cuenta: cuando una muestra tiene una gran dispersión, la media no
es una medida adecuada como síntesis de información de la muestra y se deben
recurrir a otras medidas como la mediana o la moda para representarla.
Otra estrategia cuando las muestras no son pequeñas cuando se observa una gran dispersión
relativa, es trabajar con los valores centrales y para ello se usa la MEDIA ACOTADA.

Media acotada es el promedio de los datos centrales sin considerar


valores extremos.

Por ejemplo una media acotada al 80% se calcula despreciando el 10% de los valores menores
y el 10% de los valores superiores para evitar que los extremos modifiquen el valor de la media
En la muestra:

15 158 170 195 165 172 185 192 195 1500

Observamos que el 15 y el 1500 son valores extremos. Si calculamos el promedio,


obtenemos x = 294,7 que es un valor muy poco representativo de los valores de la muestra. Si
excluimos los valores extremos 15 y 1500 estamos tomando el 80% de los valores centrales y
el promedio nos da x 80% =179 que es un valor comprendido en el rango que determina la
mayor cantidad de datos de la muestra

LABORATORIO DE INFORMÁTICA

Usando el asistente de fórmulas, la función estadística para la media acotada


es MEDIA.ACOTADA. En el cuadro de diálogo se propone ingresar matriz. Allí
se ingresa el rango de celdas que contienen los datos, y en otro renglón se les
solicitará el porcentaje. En este punto deben consignar el porcentaje de datos que, en total,
quitarán de la muestra para recalcular. Por ejemplo para tomar un 80% de los datos centrales
(en el ejemplo que se ve en la pantalla para excluir al 1 y al 150) se debe poner 0,20 que
representa el porcentaje que se excluye de la muestra.
UNIDAD 1: Estadística descriptiva 19

Cálculo de medidas de posición y dispersión en el caso de variables


continuas

Cuando la variable es continua, los datos se agrupan en intervalos de clase


(intervalos de números reales).

Se llama marca de clase al punto medio del intervalo de clase. A este valor
se lo designa como xi

Para hallar la media aritmética, la varianza, el desvío estándar y el coeficiente de variación, se


utilizan las mismas definiciones dadas para variables discretas, tomando como xi a la marca de
clase del intervalo.
Para el cálculo de la moda, sólo indicamos el “intervalo modal” (intervalo que contiene la
moda) el cual es el que tiene la mayor frecuencia absoluta. Es decir, es el intervalo al cual
pertenecen la mayoría de los datos. Un valor estimativo de la moda es x i .
Análogamente se procede con el cálculo de la mediana y los percentiles.

También podría gustarte