Está en la página 1de 12

1) Símbolos estadísticos:

La estadística como toda ciencia tiene su forma particular de expresarse, a


través de símbolos o palabras que denotan un determinado concepto, y es común
que se vuelva un leguaje o una jerga y hasta parece que fuera otro idioma.
Los símbolos utilizados, permiten abreviar y universalizar la comunicación y
por tanto se vuelve un elemento esencial y poderoso en la ciencia estadística, por
ejemplo si se desea mencionar que en una población una variable “X” se
distribuye como una distribución normal con media µ = 50 y variancia s2 = 6,
bastara expresarlo de la siguiente manera: X ~ N(50,6).Sin embargo, algunas
abreviaturas utilizadas dependen del idioma en que se usa, por ejemplo si en
castellano se quiere dar a entender “grados de libertad”, se utilizará “g.l.”, pero en
inglés se le designará “d.f.” por “degrees of freedom”; detalles que hay que tener
en cuenta cuando se revisa bibliografía en otro idioma diferente al español.
En realidad, la notación estadística utiliza de manera combinada la notación
algebraica, aritmética y matricial, en resumen notación matemática y que por esta
razón se necesita conocer los símbolos matemáticos, los cuales en forma
particular van adquiriendo una denominación específica según el tema estadístico
que se trate.Así como las matemáticas son universales y todo estudiante de pre-
grado, de cualquier lugar del mundo, puede comprender la expresión aj ≥ 4 ó E(X)
= n x p, es necesario, que se conozca el concepto que está detrás de cada
símbolo, ya que así como la matemáticas, la estadística busca hacer una
abstracción de la realidad, para comprenderla y luego explicarla a través de los
datos (que en la mayoría de las veces son números).

2) Medidas y escala:

Nivel de medida
El nivel de medida de una variable en matemáticas y estadísticas, también
llamado escala de medición, es una clasificación acordada con el fin de describir
la naturaleza de la información contenida dentro de los números asignados a los
objetos y, por lo tanto, dentro de una variable. Según la teoría de las escalas de
medida, varias operaciones matemáticas diferentes son posibles dependiendo del
nivel en el cual la variable se mide.

Escalas de medición discreta continua y nominal


Escalas de medición son una sucesión de medidas que permiten organizar
datos en orden jerárquico. Las escalas de medición, pueden ser clasificadas de
acuerdo a una degradación de las características de las variables. Estas escalas
son: nominales, ordinales, intervalares o racionales. Según pasa de una escala a
otra el atributo o la cualidad aumenta. Las escalas de medición ofrecen
información sobre la clasificación de variables discretas o continuas, también más
conocidas como escalas grandes o pequeñas. Toda vez que dicha clasificación
determina la selección de la gráfica adecuada.
Niveles de clasificación
En la estadística descriptiva y con el fin de realizar pruebas de significancia, las
variables se clasifican de la siguiente manera de acuerdo con su nivel de medida:

 nominal (también categórica o discreta)


 ordinal
 de intervalo o intervalar (continua)
 de razón o racional (continua)
Las variables de intervalo y de razón también están agrupadas como variables
continuas.

Medida nominal
El nivel nominal de medición, de la palabra latina común (nombre) describe
variables de naturaleza categórica que difieren en cualidad más que en cantidad.
Ante las observaciones que se realizan de la realidad, es posible asignar cada una
de ellas exclusivamente a una categoría o grupo. Cada grupo o categoría se
denomina con un nombre o número de forma arbitraria, es decir, que se etiqueta
en función de los deseos o conveniencia del investigador. Este nivel de medición
es exclusivamente cualitativo y sus variables son por lo tanto cualitativas.

Medida ordinal
El nivel ordinal describe las variables a lo largo de un continuo sobre el que se
pueden ordenar los valores. En este caso las variables no sólo se asignan a
grupos sino que además pueden establecerse relaciones de mayor que, menor
que o igual que, entre los elementos.
Las variables de este tipo, además de nombrar, se considera el asignar un orden a
los datos. Esto implica que un número de mayor cantidad tiene un más alto grado
de atributo medido en comparación con un número menor, pero las diferencias
entre rangos pueden no ser iguales.
Las operaciones matemáticas posibles son: contabilizar los elementos, igualdad y
desigualdad, además de ser mayor o menor que.

Medida de intervalo o intervalar


El nivel de intervalo procede del latín interval lun (espacio entre dos paredes). Este
nivel integra las variables que pueden establecer intervalos iguales entre sus
valores. Las variables del nivel de intervalos permiten determinar la diferencia
entre puntos a lo largo del mismo continuo. Las operaciones posibles son todas
las de escalas anteriores, más la suma y la resta.
En este tipo de medida, los números asignados a los objetos tienen todas las
características de las medidas ordinales, y además las diferencias entre medidas
representan intervalos equivalentes. Esto es, las diferencias entre un par arbitrario
de medidas puede compararse de manera significativa. Estas variables nombran,
ordenan y presentan igualdad de magnitud. Por lo tanto, operaciones tales como
la adición, la sustracción tienen significado. En estas variables el punto cero de la
escala es arbitrario y no significa ausencia de valor. Se pueden usar valores
negativos. Las razones entre valores no tienen sentido pues dependen de la
posición del cero, no puede decirse que una temperatura es el doble que la otra,
pues usando grados celsius dará un resultado y usando grados Fahrenheit dará
otro. Las medidas de tendencia central pueden representarse mediante la moda,
la mediana al promedio aritmético. El promedio proporciona más información.

Medida de razón o racional


El nivel de razón, cuya denominación procede del latín ratio (cálculo), integra
aquellas variables con intervalos iguales que pueden situar un cero absoluto.
Estas variables nombran orden, presentan intervalos iguales y el cero significa
ausencia de la característica. El cero absoluto supone identificar una posición de
ausencia total del rasgo o fenómeno. Tiene características importantes:

 El valor cero no es arbitrario. Un ejemplo claro es la temperatura. La existencia


de un cero en la escala Celsius no supone la ausencia de temperatura, puesto
que el cero grados centígrados está situado por arbitrio de los creadores de la
escala. Por el contrario, la escala Kelvin sí tiene un cero absoluto,
precisamente allí donde las moléculas cesan su actividad y no se produce por
lo tanto roce entre los componentes moleculares. El cero absoluto de la escala
Kelvin se sitúa a unos -273 grados centígrados.
 La presencia de un cero absoluto permite utilizar operaciones matemáticas
más complejas a las otras escalas. Hasta ahora se podía asignar, establecer la
igualdad (nominal), mayor o menor que (ordinal), sumar y restar (intervalo) a
las que se añade multiplicar, dividir, etc.
Los números asignados a los objetos tienen todas las características de las
medidas de intervalo y además tienen razones significativas entre pares arbitrarios
de números. Operaciones tales como la multiplicación y la división tienen
significado.

3) Distribución de frecuencias
En estadística, se le llama distribución de frecuencias a la agrupación de datos
en categorías mutuamente excluyentes que indican el número de observaciones
en cada categoría.1 Esto proporciona un valor añadido a la agrupación de datos.
La distribución de frecuencias presenta las observaciones clasificadas de modo
que se pueda ver el número existente en cada clase.

Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor
estadístico. Se representa por fila. Se suele representar con "n_i"
Frecuencia relativa
La frecuencia relativa es igual al números de veces que se repite un evento o sea
la frecuencia multiplicado por el 100% y dividida entre el total de la frecuencia.
Ejemplo:
Frecuencia* % = % Total de frecuencia 15* 100% = 1,500 = 60%
Es el total de la frecuencia relativa del 100% o 99% dependiendo de los decimales
que uses, si no te da tu ejercicio tiene algún error.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los
valores inferiores o iguales al valor considerado.
La frecuencia acumulada es la frecuencia estadística F(XXr) con que el valor de
una variable aleatoria (X) es menor que o igual a un valor de referencia (Xr).
La frecuencia acumulada relativa se deja escribir como Fc(X≤Xr), o en breve(Xr), y
se calcula de:

Fc (Hr) =HXr / N

dondeMXr es el número de datos X con un valor menor que o igual a Xr, y N es


número total de los datos. En breve se escribe:

Fc = M / N

Cuando Xr=Xmin, donde Xmin es el valor mínimo observado, se ve que Fc=1/N,


porque M=1. Por otro lado, cuando Xr=Xmax, donde Xmax es el valor máximo
observado, se ve que Fc=1, porque M=N.
En porcentaje la ecuación es:

Fc(%) = 100 M / N

Frecuencia relativa acumulada


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de
un determinado valor y el número total de datos. Se puede expresar en tantos por
ciento. Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes
temperaturas máximas:
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 44
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea
si las variables toman un número grande de valores o la variable es continua. Se
agrupan los valores en intervalos que tengan la misma amplitud denominados
clases. A cada clase se le asigna su frecuencia correspondiente. Límites de la
clase. Cada clase está delimitada por el límite inferior de la clase y el límite
superior de la clase.
La amplitud de la clase es la diferencia entre el límite superior e inferior de la
clase. La marca de clase es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el cálculo de algunos parámetros. En caso de
que el primer intervalo sea de la forma (-∞,k], o bien [k,+∞) donde k es un número
cualquiera, en el caso de (-∞,k], para calcular la marca de clase se tomará la
amplitud del intervalo adyacente a el (ai+1), y la marca de clase será ((k-ai+1)
+k)/2. En el caso del intervalo [k,+∞) también se tomará la amplitud del intervalo
adyacente a el (ai-1) siendo la marca de clase ((k+ai-1)+k)/2.
Construcción de una tabla de datos agrupados:
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26,
20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1. Se localizan los valores menor y mayor de la distribución. En este caso son


3 y 48.
2. Se restan y se busca un número entero un poco mayor que la diferencia y
que sea divisible por el número de intervalos que queramos establecer.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, incrementamos el número hasta 50 : 5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece al intervalo, se cuenta
en el siguiente intervalo.

Intervalo ci ni Ni fi Fi

[0, 5) 2.5 1 1 0.025 0.025

[5, 10) 7.5 1 2 0.025 0.050

[10, 15) 12.5 3 5 0.075 0.125


[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.275

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850

[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

Total: 40 1

4) Representación Gráfica
Una gráfica o representación gráfica o gráfico es un tipo de representación
de datos, generalmente numéricos, mediante recursos
visuales (líneas, vectores, superficies o símbolos), para que se manifieste
visualmente la relación matemática o correlación estadística que guardan entre sí.
También es el nombre de un conjunto de puntos que se plasman en coordenadas
cartesianas y sirven para analizar el comportamiento de un proceso o un conjunto
de elementos o signos que permiten la interpretación de un fenómeno.

Gráficas en estadística

 La estadística gráfica es la descripción e interpretación de datos e inferencias


sobre estas. Forma parte de los programas estadísticos usados con los
ordenadores. Existen diferentes tipos de gráficas:

 Gráfico lineal: los valores se dividen en dos ejes cartesianos perpendiculares


entre sí. Las gráficas lineales se recomiendan para representar series en el
tiempo, y es donde se muestran valores máximos y mínimos; también se
utilizan para varias muestras en un diagrama.
 Gráfico de barras: se usa cuando se pretende resaltar la representación de
porcentajes de datos que componen un total. Una gráfica de barras contiene
barras verticales que representan valores numéricos, generalmente usando
una hoja de cálculo. Las gráficas de barras son una manera de representar
frecuencias; las frecuencias están asociadas con categorías. Una gráfica de
barras se presenta de dos maneras: horizontal o vertical. El objetivo es poner
una barra de largo (alto si es horizontal) igual a la frecuencia. La gráfica de
barras sirve para comparar y tener una representación gráfica de la diferencia
de frecuencias o de intensidad de la característica numérica de interés.
 Histograma: se emplea para ilustrar muestras agrupadas en intervalos. Está
formado por rectángulos unidos a otros, cuyos vértices de la base coinciden
con los límites de los intervalos y el centro de cada intervalo es la marca de
clase que representamos en el eje de las abscisas. La altura de cada
rectángulo es proporcional a la frecuencia del intervalo respectivo.
 Gráfico circular: permite ver la distribución interna de los datos que
representan un hecho, en forma de porcentajes sobre un total.
 Pictograma: Son imágenes que sirven para representar el comportamiento o la
distribución de los datos cuantitativos de una población, utilizando símbolos de
tamaño proporcional al dato representado. Una posibilidad es que el gráfico
sea analógico por ejemplo, la representación de los resultados de las
elecciones con colores sobre un hemiciclo.

Eje numérico
Un gráfico de eje numérico es un diagrama de barras, de líneas o de área que
utiliza un campo numérico o un campo de fecha/hora como campo “A cambio de”.
Los gráficos de eje numérico proporcionan un medio para aplicar una escala a los
valores del eje X, creándose de este modo un eje 'X'numérico verdadero o un
ejemplo X de fecha/hora verdadero.

Gráfico de burbujas
Este tipo de gráfico presenta los datos como una serie de burbujas, el tamaño de
las cuales es proporcional a la cantidad de datos. Un gráfico de este tipo resulta
muy efectivo para mostrar el número de productos vendidos en cierta
región.[cita requerida]

3) Construcción de un histograma de frecuencias

 Paso 1
Determinar el rango de los datos. Rango es igual al mayor valor menos el
menor valor.
 Paso 2
Obtener todos los números de grupos, existen 4 criterios para determinar el
número de clases (o barras).

 Paso 3
Establecer la anchura de clase. Si queremos intervalos iguales tomaremos el
rango dividido por el número de clases y comparar con los resultados obtenidos
de la dispersión.

 Paso 4
Construir los intervalos de clases: Los intervalos resultan de dividir el rango de
los datos en segmentos iguales usando la anchura de clase obtenida en el
PASO 3.

 Paso 5
Graficar el histograma: Como todas las clases tienen la misma amplitud las
bases de las barras son los intervalos de clases y la altura es la frecuencia de
las clases.

Fotografía con su histograma


El histograma de una imagen representa la frecuencia relativa de los niveles
de gris de la imagen. Las técnicas de modificación del histograma de una imagen
son útiles para aumentar el contraste de imágenes con histogramas muy
concentrados. Sea una imagen de tamaño N×N, la función de distribución del
histograma es:

5) ejemplos

Ejemplo 1 :

Medimos la estatura de 67 alumnos elegidos al azar y obtenemos los


siguientes datos en cm :

Estatura 156 158 161 162 164 165 166 168 169 170 172 174

Nº de
2 2 5 7 9 8 8 6 7 7 3 3
estudiantes

Agrupar los datos en intevalos de amplitud 5 cm y representarlos mediante


un histograma.

Estatura fi

[ 155, 160 ) 4

[ 160, 165 ) 21

[ 165, 170 ) 29

[ 170, 175 ) 13
6) Polígono de frecuencia

Es el nombre que recibe una clase de gráfico que se crea a partir de


un histograma de frecuencia. Estos histogramas emplean columnas verticales
para reflejar frecuencias): el polígono de frecuencia es realizado uniendo los
puntos de mayor altura de estas columnas.
Es decir, por tanto, podríamos establecer que un polígono de frecuencia es aquel
que se forma a partir de la unión de los distintos puntos medios de las cimas de
las columnas que configuran lo que es un histograma de frecuencia. Este se
caracteriza porque utiliza siempre lo que son columnas de tipo vertical y porque
nunca debe haber espacios entre lo que son unas y otras.

7) ejemplo

Ejemplo: Realizar la gráfica de un polígono de frecuencias para datos no


agrupados según la siguiente tabla.

Frecuencia
Calificaciones
Absoluta (ni)
1 1
2 2
3 1
4 2
5 3
6 4
7 3
8 5
9 2
10 1
TOTAL 24
Bibliografía

https://es.wikipedia.org/wiki/Nivel_de_medida
http://histogramacalidatotal.blogspot.com/2015/05/tipos-de-histogramas_27.html
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_frecuencias
https://es.wikipedia.org/wiki/Gr%C3%A1fica
https://ivanorozco.jimdo.com/estad%C3%ADstica-
1/s%C3%A9ptimo/pol%C3%ADgono-de-frecuencias/

También podría gustarte