Simbolos y Medidas Estadisticas

REPÚBLICA BOLIVARIANA DE VENEZUELA
MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN UNIVERSITARIA

UNIVERSIDAD NACIONAL EXPERIMENTAL “SIMÓN RODRÍGUEZ”
NÚCLEO BARCELONA
ADMINISTRACIÓN – MENCIÓN: RECURSOS HUMANOS
CURSO: TERMINOLOGÍA EN ESTADÍSTICAS
SÍMBOLOS Y MEDIDAS ESTADÍSTICAS
FACILITADOR: PARTICIPANTE:
LIC. JOSÉ SAIZ CÉSAR GONZÁLEZ
CI: 24.873.423
SECCIÓN “H”
Barcelona, 10 de Diciembre de 2020

SÍMBOLOS ESTADÍSTICOS
Son símbolos matemáticos que se encargan de describir y de representar

una herramienta o proceso. Permiten abreviar y universalizar la comunicación.
Son necesarios para conocer un concepto y explicar a través de ellos un dato.
Así como las matemáticas son universales, es necesario que se conozca el

concepto que está detrás de cada símbolo, ya que así como la matemática, la
estadística busca hacer una abstracción de la realidad, para comprenderla y luego
explicarla a través de los datos (que en la mayoría de las veces son números).
DIFERENCIACIÓN DE LOS SIMBOLOS ESTADÍSTICOS
Entre los símbolos Estadísticos encontramos: Notación Representativa,

Notación Subíndice y Notación Sigma.
Notación Representativa (Figurativa)
Esta clase de notación nos proporciona un método abreviado de presentar

información y es muy parecida a la notación algebraica.
Si estamos interesados en acumular información sobre él número de niños de 3

años que han sido vacunados contra la viruela, podríamos presentar estos datos
de la siguiente manera.
X = el número de niños de 3 años de edad vacunados contra la viruela. La

selección de la letra x es arbitraria; podríamos haber escogido A, B, C o cualquier
otra letra que sea conveniente. Lo importante no es la preferencia por cierta letra
en particular, sino lo que la letra (símbolo) representa. Por tanto, la primera regla
al representar datos simbólicamente, es especificar lo que el símbolo representa.
Esta es la clave a través de la cual se podrá comprender fácilmente la

representación de los datos.
Por ejemplo, x = 8 no tiene significado si no se sabe de antemano que x = el

número de niños de 3 años vacunados contra la viruela. Con la clave, x = 8
significa que existen 8 niños que recibieron la vacuna contra la viruela y que tienen
3 años de edad. Esto está indudablemente claro.
En la notación figurativa, es necesario atribuir un símbolo distinto a cada

aspecto original de la información. En el ejemplo ya mencionado, si nos interesara
también saber el número de niñas de 3 años de edad vacunadas contra la viruela,
no podemos representar esto con una x. Debería ser evidente que la x representa
niños en general.
Por lo tanto, podríamos atribuirle al símbolo y la figuración de todas las niñas de

tres años de edad vacunadas contra la viruela, y nuestra clave seria, entonces, la
siguiente:
X = el número de niños (en general) de 3 años de edad vacunados contra la

viruela.
Y = el número de niñas de 3 años de edad vacunadas contra la viruela.
Como regla general, se necesita una figuración simbólica nueva cuando una
serie de datos no se puede incluir en otra serie de datos. Está claro que todos los
elementos de y (el número de niñas de 3 años de edad vacunadas contra la
viruela) están contenidos en x (el número de niños de 3 años de edad vacunados
contra la viruela), pero alternativamente, no todos los elementos de x están
contenidos en y (porque no podemos, por tanto, incluir el número de niños bajo el
símbolo y)
Los símbolos x e y se llaman variables. Ellos representan datos que pueden

cambiar o variar y simbolizan las características de personas o cosas. Este año,
por ejemplo, x podrá ser equivalente a 5.000. A medida que se recibe información
nueva, debe ajustarse la representación simbólica. Sin embargo, si queremos
conservar la información dada a un cierto momento, la nueva información
representara una variable distinta y habrá que asignarle un símbolo nuevo.
Notación Subíndice
Es un tipo de notación que permite referirse a un cierto número dentro de un

grupo de números sin tener que especificarlo. Indica el valor que le corresponde a
cierto dato de acuerdo al lugar que ocupa el mismo dentro de un grupo de valores.
El símbolo Xj («X sub j») denota cualquiera de los n valores de X1, X2; X3,...,
Xn que una variable X puede tomar. La letra j en Xj, representa cualquiera de los
números 1, 2, 3,..., n, denominado índice o subíndice. También podemos utilizar
como subíndice cualquier otra letra distinta de j, como i, k, p, q, s.
Ejemplo: Dado el siguiente grupo de números: 5, 8, 2, 5, 9, 6, se puede

especificar cada uno como: X1, X2, X3, X4, X5, X6., Donde X1, es el primer
número en el grupo, X1 = 5; X2 es el segundo número del grupo, X2 = 8, y así
sucesivamente.
Notación Sigma (Sumatoria)
En la estadística tenemos muchas veces que sumar, restar, multiplicar y dividir

una serie de números. La notación sigma (o suma) nos permite representar estas
operaciones algebraicas en una forma abreviada.
Supongamos que se le presente el siguiente grupo de números 8, 9, 5, 3,3.

Este es un grupo de números pequeños, pero, a menudo, nos enfrentamos con un
grupo de cientos, posiblemente miles de números. Como cada uno de los números
puede ser representado simbólicamente, queremos desarrollar un método de
notación que nos permita realizar operaciones algebraicas con los símbolos. Esto
es, en esencia, la función de la notación sigma.
En el ejemplo dado, n = 5, lo cual es simbólicamente
X1, x2, x3, x4, x5 y estos, a su vez, representan 8, 9, 5, 3,3, respectivamente.
Se simboliza así ∑ e indica la suma de una serie de términos de acuerdo a los

límites indicados en la misma
Ejemplo: esto indica que hay que sumar todos los términos de la variable “x”, van
desde i=k, hasta n (desde el primero hasta el enésimo término). Es decir:
∑ni xi= x k + x k+1 + xn, desde i=k hasta n:
∑: Notación Sigma
k: Límite Inferior
n: Límite Superior
i: Índice
Del ejemplo anterior lo podemos indicar así:
∑51 xi= x 1 + x 2+ x 3 + x 4+ x5 desde i=1 hasta n=5
∑51 xi = 8 + 9 +5+3+3
∑51 xi = 28
EXPLICACIÓN DEL USO DE CADA SÍMBOLO ESTADISTICO
Generalmente al observar operaciones o procesos estadísticos podría dar la

impresión de que nos encontramos leyendo el alfabeto griego, y en realidad
muchos de los símbolos estadísticos son, en efecto griegos.
Cada símbolo (letra) significa un proceso en particular y es por esto que se

deben conocer para poder efectuar un análisis de datos eficiente.
Las letras griegas generalmente se usan para denotar parámetros

desconocidos, un parámetro estimado generalmente se denota al colocar un
cursor sobre el símbolo correspondiente, lo que se conoce como “theta sombrero”.
Algunos símbolos estadísticos básicos utilizados comúnmente son:
• X: Media, se refiere a cada uno de los valores que se observa en las variables.
Md: Mediana, representa el valor de la variable de posición central en un conjunto
de datos ordenados.
• Mo: Moda, es el valor con mayor frecuencia en una distribución de datos.
• ∑: Sumatoria, permite representar sumas de muchos sumandos, o incluso de
infinitos sumandos, evitando los usos de puntos suspensivos o de una explícita
notación de paso al límite.
• S2: Se refiere a la varianza simple.
• r: Simboliza la simple correlación de coeficientes.
• kr: Simboliza el cúmulo de las muestras.
Los símbolos utilizados con mayor frecuencia para referirse a los parámetros de
población son:
• μ: Se refiere a la población como tal.
• σ2: Simboliza la varianza de la población.
• ρ: Simboliza la correlación de la población
• κr: Simboliza los cúmulos de población.
• n: Simboliza el número de elementos en una distribución de la muestra.
• α: La letra griega alpha simboliza la intercepción o un error de tipo I.
• β: La letra griega beta simboliza vertiente o un error de tipo II.
• σ: La letra griega sigma simboliza la desviación estándar de la población.
• f: Frecuencia observada.
• C: Simboliza la distribución y también es conocida como la distribución para una
variable independiente.
• SC: Simboliza todos los elementos (generalmente números) en una distribución.
• Pa: Frecuencia relativa acumulada.
• xi: Puntuación directa.
• /: Probabilidad condicional.
• NC: Nivel de confianza.
• Hj: Hipótesis Nula.
• Vi: Variable independiente.
• Oi: Frecuencia Observada.
• Ei: Frecuencia Esperada.
• p: Probabilidad del éxito.
• Ap: Coeficiente de Apuntamiento.
• As: Coeficiente de Asimetría.
• fi: Frecuencia Acumulada.
• ni: Frecuencia Absoluta.
USOS DE LOS SÍMBOLOS ESTADÍSTICOS EN CASOS REQUERIDOS
CASO 1: Si se está interesado en acumular información acerca del número de

participantes del ciclo introductorio de la carrera de Administración–Mención
Recursos Humanos, que son fanáticos del Equipo de Beisbol Navegantes del
Magallanes, se puede presentar estos datos así:
X = Número de participantes del ciclo introductorio de la carrera educación
fanáticos del equipo de Beisbol Navegantes del Magallanes.
X = 10
La selección de la letra X es arbitraria; se podría haber escogido A, B, C o
cualquier otra letra que sea conveniente. Lo importante no es la preferencia por
cierta letra en particular, sino lo que la letra (símbolo) representa. Por tanto, la
primera regla al representar datos simbólicamente, es especificar lo que el símbolo
representa. Esta es la clave a través de la cual se podrá comprender fácilmente la
representación de los datos.
X= 10 no tiene significado si no se conoce de antemano que X= el número
de participantes del ciclo introductorio de la carrera educación fanáticos del equipo
de Beisbol Navegantes del Magallanes. Con la clave, X = 10 significa que existen
10 participantes que son fanáticos del equipo y que pertenecen del ciclo
introductorio de la carrera educación
En la notación representativa, es necesario atribuir un símbolo distinto a
cada aspecto original de la información. Si en este caso, se quiere conocer el
número de estudiantes fanáticos del Equipo de Beisbol Leones del Caracas, no se
puede representar esto con la letra X, por lo tanto, se puede atribuir el símbolo Y a
la figuración de todos los participantes fanáticos de los Leones del Caracas, y la
clave sería:
Y = Número de participantes del ciclo introductorio de la carrera Administración-
Mención Recursos Humanos, fanáticos del equipo de Beisbol Leones del Caracas.
CASO 2: Los 40 alumnos de una clase han obtenido las siguientes puntuaciones
sobre 50, en un examen de Física.
3, 35, 30, 37, 27, 31, 41, 20, 16, 26, 45, 37, 9, 41, 28, 21, 31, 35, 10, 26, 11,\\ &
34, 36, 12, 22, 17, 33, 43, 19, 48, 38, 25, 36, 32, 38, 28, 30, 36, 39, 40.
xi fi Fi ni Ni
[0, 5) 2.5 1 1 0.025 0.025
[5, 10) 7.5 1 2 0.025 0.050
[10, 15) 12.5 3 5 0.075 0.125
[15, 20) 17.5 3 8 0.075 0.200
[20, 25) 22.5 3 11 0.075 0.275
[25, 30) 27.5 6 17 0.150 0.425
[30, 35) 32.5 7 24 0.175 0.600
[35, 40) 37.5 10 34 0.250 0.850
[40, 45) 47.5 4 38 0.100 0.950
[45, 50) 47.5 2 40 0.050 1.000
40 1
 En la cuarta columna disponemos la frecuencia acumulada Fi.

 En la primera casilla colocamos la primera frecuencia absoluta.
 En la segunda casilla sumamos el valor de la frecuencia acumulada
anterior más la frecuencia absoluta correspondiente y así sucesivamente
hasta la última, que tiene que ser igual a N = 40.
 En la quinta columna disponemos las frecuencias relativas (ni) que son el
resultado de dividir cada frecuencia absoluta por N.
 En la sexta columna disponemos la frecuencia relativa acumulada Ni.
 En la primera casilla colocamos la primera frecuencia relativa.
 En la segunda casilla sumamos el valor de la frecuencia relativa
acumulada anterior más la frecuencia relativa acumulada correspondiente
y así sucesivamente hasta la última, que tiene que ser igual a 1.
CASO 3: La moda en estadística representa el valor con mayor frecuencia dentro

de una distribución.
Ejemplo: Manteniendo nuestro conjunto de 5 datos: [1, 2, 2, 5, 10], la moda sería

el valor más repetido en nuestro conjunto, es decir, el valor 2.
MO
CASO 4: Número de veces que han ido al cine en el último mes, los alumnos de
una clase.
2 3 0 1 5
3 2 3 0 0
2 1 2 1 0
2 1 1 1 3
4 0 0 2 1
Xi Datos Xi Fi Fr % F
FI # de veces 0 6 0,24 24 6
Fri= Fi 1 7 0,28 28 13
N
%i= Frix100 2 6 0,24 24 19
3 4 0,16 16 23
4 1 0,04 4 24
5 1 0,04 4 25
25 1 100
Frecuencia observada
CASO 5: Los datos corresponden a las ventas (en miles de dólares) que
realizaron una muestra de 9 vendedores de una empresa de un país
centroamericano A y una muestra de 6 vendedores en otro país B del área.
Se desea saber a nivel de significación del 5% si la diferencia de las ventas

promedio de los 2 grupos es significativa.
PAIS 1 2 3 4 5 6 7 8 9
A 59 68 44 71 63 46 69 54 48
B 50 36 62 52 70 41
Solución:
Datos:
n1= 9 n2 = 6
X1 = 58,00 X2 = 51,83
S1 = 10,44 S2 = 12,69
Además α = 0,05.
Como no se especifica el valor de la diferencia, puede suponerse que va a ser
cero, por lo que σ es igual a cero.

Además como la media A que la de B se plantea las hipótesis como:
Нo: µ1 - µ2 = 0 Нo : µ1 = µ2
H1: µ1 - µ2 > 0 H1: µ1 > µ2
Debido a las desviaciones estándar poblaciones son desconocidas y se tienen

muestras pequeñas ( n > 30 ) se usa t. Para esto se supone que las poblaciones
de las ventas son normales y que σ1 = σ2.
Desviación estándar de la Población
IDENTIFICACIÓN DE LOS DIFERENTES TIPOS DE MEDIDAS ESTADÍSTICAS
MEDIDAS DE CENTRALIZACIÓN: Sirven para determinar los valores centrales o

medios de la distribución.
MEDIA: Vamos a estudiar en este apartado los distintos tipos de media que
hemos detallado en el apartado anterior
1. Media aritmética:
La media aritmética de una variable se define como la suma ponderada de los

valores de la variable por sus frecuencias relativas y lo denotaremos por y se
calcula mediante la expresión:
xi representa el valor de la variable o en su caso la marca de clase.

Propiedades:
1. Si multiplicamos o dividimos todas las observaciones por un mismo número,

la media queda multiplicada o dividida por dicho numero.
2. Si le sumamos a todas las observaciones un mismo número, la media
aumentará en dicha cantidad.
3. Además de la media aritmética existen otros conceptos de media, como son
la media geométrica y la media armónica.
2. Media geométrica:
La media geométrica de N observaciones es la raíz de índice N del producto de

todas las observaciones. La representaremos por G.
Solo se puede calcular si no hay observaciones negativas. Es

una medida estadística poco o nada usual.
3. Media armónica:
La media armónica de N observaciones es la inversa de la media de las

inversas de las observaciones y la denotaremos por H.
Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente .

MEDIANA: La mediana es el valor central de la variable, es decir, supuesta la
muestra ordenada en orden creciente o decreciente, el valor que divide en dos
partes la muestra.
Para calcular la mediana debemos tener en cuenta si la variable es discreta o

continua.
Cálculo de la mediana en el caso discreto:
Tendremos en cuenta el tamaño de la muestra.
Si N es Impar, hay un término central, el término que será el valor de la

mediana.
Si N es Par, hay dos términos centrales, la mediana será la media de

esos dos valores.
Veamos un ejemplo.
N Impar
N par
1,4,6,7,8,9,12,16,20, 24,25,27 N=12 1,4,6,7,8,9,12,16,20, 24,25,27,30
N=13
Términos Centrales el 6º y 7º 9 y 12 Término Central el 7º , 12
Me=12
Me=
Cálculo de la mediana en el caso continúo:
Si la variable es continua, la tabla vendrá en intervalos, por lo que se calcula de

la siguiente forma:
Nos vamos a apoyar en un gráfico de un histograma de frecuencias

acumuladas.
De donde la mediana vale: donde ai es la amplitud del
intervalo
Veámoslo por medio de un ejemplo.
Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente

forma:
Li-1 Li ni NI
45 55 6 6
55 65 10 16
65 75 19 35
75 85 11 46
85 95 4 50
Como el tamaño de la muestra es N=50, buscamos el intervalo en el que la Frecuencia

acumulada es mayor que 50/2=25, que en este caso es el 3º y aplicamos la fórmula
anterior. Luego la Mediana será
Me=
MODA: La moda es el valor de la variable que tenga mayor frecuencia absoluta, la
que más se repite, es la única medida de centralización que tiene sentido estudiar
en una variable cualitativa, pues no precisa la realización de ningún cálculo.
Por su propia definición, la moda no es única, pues puede haber dos o más
valores de la variable que tengan la misma frecuencia siendo esta máxima. En
cuyo caso tendremos una distribución bimodal o polimodal según el caso.
Por lo tanto el cálculo de la moda en distribuciones discretas o cualitativas no

precisa de una explicación mayor; sin embargo, debemos detenernos un poco en
el cálculo de la moda para distribuciones cuantitativas continuas.
Apoyándonos en el gráfico podemos llegar a la determinación de la expresión

para la Moda que es:
Otros autores dan una expresión aproximada para la moda que viene dada por
la siguiente expresión:
Veamos su cálculo mediante un ejemplo, para ello usaremos los datos del
apartado anterior
Li-1 Li ni Ni
45 55 6 6
55 65 10 16
65 75 19 35
75 85 11 46
85 95 4 50
MEDIDAS DE DISPERCIÓN: Nos van a dar una idea sobre la representatividad

de las medidas centrales, a mayor dispersión menor representatividad.
RANGO:
Es la primera medida que vamos a estudiar, se define como la diferencia
existente entre el valor mayor y el menor de la distribución,. Lo notaremos como R.
Realmente no es una medida muy significativa e la mayoría de los casos, pero
indudablemente es muy fácil de calcular.
Hemos estudiado varias medidas de centralización, por lo que podemos hablar

de desviación con respecto a cualquiera de ellas, sin embargo, la más utilizada es
con respecto a la media.
DESVIACIÓN:
Es la diferencia que se observa entre el valor de la variable y la media
aritmética. La denotaremos por di. No es una medida, son muchas medidas, pues
cada valor de la variable lleva asociada su correspondiente desviación, por lo que
precisaremos una medida que resuma dicha información.
No es una medida, son muchas medidas, pues cada valor de la variable lleva
asociada su correspondiente desviación, por lo que precisaremos una medida que
resuma dicha información.
MEDIDAS DE LOCALIZACIÓN: Útiles para encontrar determinados valores

importantes, para una "clasificación" de los elementos de la muestra o población.
Las medidas de localización dividen la distribución en partes iguales, sirven

para clasificar a un individuo o elemento dentro de una determinada población o
muestra. Así en psicología los resultados de los test o pruebas que realizan a un
determinado individuo, sirve para clasificar a dicho sujeto en una determinada
categoría en función de la 53-1-u-puntuacióMn obtenida.
CUARTILES
Medida de localización que divide la población o muestra en cuatro partes iguales.
 Q1= Valor de la variable que deja a la izquierda el 25% de la distribución.

 Q2= Valor de la variable que deja a la izquierda el 50% de la distribución =
mediana.
 Q3= Valor de la variable que deja a la izquierda el 75% de la distribución.
Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadísticos,

depende del tipo de variable.
Caso I: Variable cuantitativa discreta:
En este caso tendremos que observar el tamaño de la muestra: N y para
calcular Q1 o Q3 procederemos como si tuviésemos que calcular la mediana
de la correspondiente mitad de la muestra.
Caso II: Variable cuantitativa continúa:
En este caso el cálculo es más simple: sea la distribución que sigue:
[Li-2 -- Li-1) ni-1 Ni-1

[Li-1 -- Li) ni Ni
Siendo el intervalo coloreado donde se encuentra el Cuartil correspondiente:
DECILES
Medida de localización que divide la población o muestra en 10 partes iguales
No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo

que lo vamos a ver sólo para las variables continuas.
dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k·10 % de

la distribución.
[Li-2 -- Li-1) ni-1 Ni-1

[Li-1 -- Li) ni Ni
Intervalo donde se encuentra el Decil correspondiente:

PERCENTILES:
Medida de localización que divide la población o muestra en 100 partes iguales
No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que
lo vamos a ver sólo para las variables continuas.
pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de

la distribución.
[Li-2 -- Li-1) ni-1 Ni-1
[Li-1 -- Li) ni Ni
Intervalo donde se encuentra el percentil correspondiente.
MEDIDAS DE LA SIMETRÍA: Sirven para ver si la distribución tiene el mismo

comportamiento por encima y por debajo de los valores centrales.
Las medidas de la asimetría, al igual que la curtosis, van a ser medidas de la

forma de la distribución, es frecuente que los valores de una distribución tiendan a
ser similares a ambos lados de las medidas de centralización. La simetría es
importante para saber si los valores de la variable se concentran en una
determinada zona del recorrido de la variable.
Para medir la asimetría se puede realizar atendiendo básicamente a dos criterios:
 Comparando la Media y la Moda.

 Comparando los valores de la variable con la media.
Comparando la Media y la Moda:
Si la diferencia es positiva, diremos que hay asimetría positiva o a la

derecha, en el caso de que sea negativa diremos que hay asimetría negativa o a
la izquierda. No obstante, esta medida es poco operativa al no ser una medida
relativa, ya que está influida por la unidad en que se mida la variable, por lo que se
define el coeficiente de Asimetría como:
Esta medida es muy fácil de calcular, pero menos precisa que el coeficiente
de asimetría de Pearson.
El coeficiente de asimetría de Pearson, se basa en la comparación con la

media de todos los valores de la variable, así que es una medida que se basará en
las diferencias , como vimos en el caso de la dispersión si medimos la
media de esas desviaciones sería nulas, si las elevamos al cuadrado, serían
siempre positivas por lo que tampoco servirían, por lo tanto precisamos elevar
esas diferencias al cubo.
Para evitar el problema de la unidad, y hacer que sea una medida escalar y
por lo tanto relativa, dividimos por el cubo de su desviación típica. Con lo que
resulta la siguiente expresión:
SIGNIFICADO DE CADA UNA DE LAS DIFERENTES ESCALAS DE MEDIDAS
Hay cuatro tipos de escalas de medición, que ordenadas en orden creciente de

potencia, según la proporción de información que contienen, son:
ESCALA NOMINAL
Consta de dos o más categorías mutuamente excluyentes. Si solo hay dos, se

llama escala nominal dicotómica. A cada categoría se le suele asignar un número
de código sin significado cuantitativo, lo que facilita su introducción en bases de
datos. En cualquier situación, si se usa una codificación propia, debe tenerse claro
lo que significa cada código para cada variable.
Veamos algunos ejemplos:
 Sexo: 1) masculino; 2) femenino.

 Fumar: 0) no; 1) sí.
 Estado civil: 1, casado; 2, soltero; 3, viudo; 4, divorciado,
 Procedencia del ingreso: 1, urgencias; 2, consultas; 3, otro hospital.
Dependiendo del programa que va a ser utilizado para el análisis, se prefiere

codificar las variables nominales dicotómicas de forma que la presencia de
enfermedad o del factor de exposición se suele codificar como uno (1), mientras
que la ausencia de enfermedad o de exposición a algún factor como cero (0) o dos
(2). Por ejemplo, el antecedente de hábito tabáquico puede codificarse como 1 y 0
(1: fumador; 0: no fumador) o como 1 y 2 (1: fumador; 2: no fumador). Aunque
matemáticamente la presencia/ausencia de una característica se corresponde con
la codificación 1-0, es frecuente usar la codificación 1-2, para evitar que variables
vacías sean asignadas al 0 por error.
ESCALA ORDINAL
Las variables ordinales tienen la cualidad adicional, respecto a la escala

nominal, de que sus categorías están ordenadas por rango; cada clase posee una
misma relación posicional con la siguiente; es decir, la escala muestra situaciones
escalonadas. Si se usan números, su única significación está en indicar la posición
de las distintas categorías en la serie; sin embargo, no asumen que la distancia
del primer escalón al segundo sea la misma que la del segundo al tercero.
Veamos algunos ejemplos:
 Clase social: 1) baja, 2) media, 3) alta.

 Grados de reflujo vesicoureteral: grados 1, 2, 3, 4.
 Conformidad con una afirmación: 0) completo desacuerdo, 1) acuerdo
parcial, 2) acuerdo total.
 Fumar: 0) no fumador, 1) fumador leve, <10/día; 2) fumador moderado, 10-
20/día, y 3) gran fumador, >20/día).
Existen escalas que serán mezcla de nominal y ordinal, porque solo algunas
categorías estén ordenadas por rango; esto ocurre en las escalas en las que un
valor representa a una categoría inclasificable (ejemplo: no sabe no contesta o
resultado indeterminado).
ESCALAS DE INTERVALOS
Las escalas de intervalos poseen la cualidad adicional de que los intervalos

entre sus clases son iguales. Diferencias iguales entre cualquier par de números
de la escala indican diferencias también iguales en el atributo sometido a
medición. Veamos un ejemplo: la diferencia de temperatura entre una habitación a
22 grados centígrados y otra a 26 es la misma que la existente entre dos a 33 y 37
grados centígrados, respectivamente.
Sin embargo, la razón entre los números de la escala no es necesariamente la

misma que la existente entre las cantidades del atributo. Ejemplo: una habitación a
20 grados no está el doble caliente que otra a 10. Ello se debe a que el cero de la
escala no expresa el valor nulo o ausencia de atributo.
ESCALAS DE RAZONES
Su cualidad adicional es que el cero sí indica ausencia de atributo. En

consecuencia, la razón entre dos números de la escala es igual a la existente
entre las cantidades del atributo medido. Ejemplos:
 Peso: medido en kilogramos.

 Concentración de glucosa en una muestra: medida en mg/dl.
 Tasa de mortalidad: muertes por 1000 personas en riesgo.
 Ingresos: medidos en euros.
Las escalas de intervalos y razones se llaman también métricas o

dimensionales. Las variables continuas van a medirse con escalas de razones o
intervalos, por lo que es habitual que nos refiramos a ellas englobándolas
como escalas continuas, ya que comparten estrategias de análisis, como la
elección del test estadístico. Algunos paquetes estadísticos, como SPSS, las
denominan simplemente “escalas”.
Cuando en la recogida de una variable continua (escala de razones o

intervalos) no podemos recoger valores a partir de un límite (por ejemplo: cargas
virales superiores a 100 000), si optamos por mantener esas observaciones en el
análisis, la variable se comporta en ese rango como una variable ordinal.
DIFERENCIAS Y SIMILITUDES ENTRE LAS DIFERENTES ESCALAS DE
MEDIDAS.
ESCALAS DIFERENCIAS SIMILITUDES
.- Los números se usan como

.-Asignación de nombres o
identificadores o nombres.
etiquetas.
.- Se asignan categorías
NOMINAL .- Se establecen relaciones de
cualitativas.
igualdad o diferencia.
.- Capacidad de ser ordenado
. Su organización es arbitraria.
de forma empírica.
.- Clasifican a las unidades .- Se asignan categorías

con un orden jerárquico. cualitativas.
.- Observa diferentes grados .- Capacidad de ser ordenado

ORDINAL
característicos en su orden. de forma empírica.
.- Se establecen relaciones de .- Los números se usan como

>mayor que o <menor que. identificadores o nombres.
.- Se puede hacer .-Corresponde a medidas

operaciones aritméticas. cuantitativas.
.- Las medidas corresponden .- Se conoce la distancia

INTERVALO
a cantidades. exacta entre cada categoría.
.- Se basan en una unidad de .- Capacidad de ser ordenado

medida. de forma empírica.
.-Contabilizan cantidades,
.-Corresponde a medidas
valor absoluto.
cuantitativas.
.- El cero expresa la ausencia
.- Capacidad de ser ordenado
RAZÓN de variable.
de forma empírica.
.- No existen valores
.- Se conoce la distancia
negativos o ceros
exacta entre cada categoría.
procedimientos.
REPRESENTACIÓN GRÁFICA DE CADA ESCALA
ESCALA NOMINAL:
GÉNERO
GÉNERO FRECUENCIA %
F 43 43%
M 57 57%
Total General 100 100%
100%
43%
M
F
57%
ESCALA ORDINAL:
Enfermedad Leve / Moderada / Severa.
Frecuencia Alta / Regular / Baja.
TASAS DE LIMITACIONES PERMANENTES POR GRUPOS ETARIOS SANTANDER 2005.
35
29.8
30 28
25
20
15 MUJERES
12.4
11.2
HOMBRES
10
4.6
5 2.7 3.1 3.5
1.9 2.1
0
0 a 4 Años 5 a 14 Años 15 a 44 Años 45 a 64 Años 65 y más
MUJERES 1.9 2.7 3.5 11.2 28
HOMBRES 2.1 3.1 4.6 12.4 29.8
ESCALA DE INTERVALO:
CASOS DE MUERTE POR LEUCEMIAS SEGÚN AMB VS RESTO DEL

DEPARTAMENTO SANTANDER 2005
16
14
12
10
ZONA
8
LLA
6 LMA
0
2009 2010 2011 2012
ESCALA DE LA RAZÓN:
Razón es sinónimo de cociente. La razón entre dos segmentos, a y b, es igual
a la longitud de a dividida por la de b.
Determinar Cuántos kilómetros existe entre el talón y el cuerpo.

Simbolos y Medidas Estadisticas

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Simbolos y Medidas Estadisticas

Cargado por

Copyright:

Formatos disponibles

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN UNIVERSITARIA

SÍMBOLOS Y MEDIDAS ESTADÍSTICAS

LIC. JOSÉ SAIZ CÉSAR GONZÁLEZ

Barcelona, 10 de Diciembre de 2020

Son símbolos matemáticos que se encargan de describir y de representar

Así como las matemáticas son universales, es necesario que se conozca el

DIFERENCIACIÓN DE LOS SIMBOLOS ESTADÍSTICOS

Entre los símbolos Estadísticos encontramos: Notación Representativa,

Notación Representativa (Figurativa)

Esta clase de notación nos proporciona un método abreviado de presentar

Si estamos interesados en acumular información sobre él número de niños de 3

X = el número de niños de 3 años de edad vacunados contra la viruela. La

Esta es la clave a través de la cual se podrá comprender fácilmente la

Por ejemplo, x = 8 no tiene significado si no se sabe de antemano que x = el

En la notación figurativa, es necesario atribuir un símbolo distinto a cada

Por lo tanto, podríamos atribuirle al símbolo y la figuración de todas las niñas de

X = el número de niños (en general) de 3 años de edad vacunados contra la

Y = el número de niñas de 3 años de edad vacunadas contra la viruela.

Los símbolos x e y se llaman variables. Ellos representan datos que pueden

Es un tipo de notación que permite referirse a un cierto número dentro de un

Ejemplo: Dado el siguiente grupo de números: 5, 8, 2, 5, 9, 6, se puede

Notación Sigma (Sumatoria)

En la estadística tenemos muchas veces que sumar, restar, multiplicar y dividir

Supongamos que se le presente el siguiente grupo de números 8, 9, 5, 3,3.

En el ejemplo dado, n = 5, lo cual es simbólicamente

X1, x2, x3, x4, x5 y estos, a su vez, representan 8, 9, 5, 3,3, respectivamente.

Se simboliza así ∑ e indica la suma de una serie de términos de acuerdo a los

∑ni xi= x k + x k+1 + xn, desde i=k hasta n:

Del ejemplo anterior lo podemos indicar así:

∑51 xi= x 1 + x 2+ x 3 + x 4+ x5 desde i=1 hasta n=5

Generalmente al observar operaciones o procesos estadísticos podría dar la

Cada símbolo (letra) significa un proceso en particular y es por esto que se

Las letras griegas generalmente se usan para denotar parámetros

CASO 1: Si se está interesado en acumular información acerca del número de

 En la cuarta columna disponemos la frecuencia acumulada Fi.

CASO 3: La moda en estadística representa el valor con mayor frecuencia dentro

Ejemplo: Manteniendo nuestro conjunto de 5 datos: [1, 2, 2, 5, 10], la moda sería

Se desea saber a nivel de significación del 5% si la diferencia de las ventas

cero, por lo que σ es igual a cero.

Debido a las desviaciones estándar poblaciones son desconocidas y se tienen

de las ventas son normales y que σ1 = σ2.

Desviación estándar de la Población

IDENTIFICACIÓN DE LOS DIFERENTES TIPOS DE MEDIDAS ESTADÍSTICAS

MEDIDAS DE CENTRALIZACIÓN: Sirven para determinar los valores centrales o

La media aritmética de una variable se define como la suma ponderada de los

xi representa el valor de la variable o en su caso la marca de clase.

1. Si multiplicamos o dividimos todas las observaciones por un mismo número,

La media geométrica de N observaciones es la raíz de índice N del producto de

Solo se puede calcular si no hay observaciones negativas. Es

La media armónica de N observaciones es la inversa de la media de las

Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente .

Para calcular la mediana debemos tener en cuenta si la variable es discreta o

Cálculo de la mediana en el caso discreto:

Tendremos en cuenta el tamaño de la muestra.

Si N es Impar, hay un término central, el término que será el valor de la

Si N es Par, hay dos términos centrales, la mediana será la media de

Cálculo de la mediana en el caso continúo:

Si la variable es continua, la tabla vendrá en intervalos, por lo que se calcula de

Nos vamos a apoyar en un gráfico de un histograma de frecuencias

Veámoslo por medio de un ejemplo.

Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente

Como el tamaño de la muestra es N=50, buscamos el intervalo en el que la Frecuencia