Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Campus Tapachula.
Probabilidad y estadística.
Clave grupal: AEF1052-ISC2D.
Alumno:
Sanchez Hernandez Owen Emmanuel.
Numero de control: 21510440.
Catedrático:
Renato Gilberto De León Pascacio.
1
Índice:
Introducción………………………………………………………………………4,5
Capitulo (2): Distribución de frecuencias……………………………………6
Fila de datos…………………………………………………………………………6
Ordenaciones……………………………………………………………………7,8
Distribuciones de frecuencias………………………………………………………8,9
Intervalos de clase y límites de clase……………………………………………10
Tamaño o anchura de un intervalo de clase………………………………………11
Marca de clase…………………………………………………………………………11
Reglas generales para formar distribuciones de frecuencia………………………12
Histogramas y polígonos de frecuencias…………………………………………12,13
Distribuciones de frecuencias relativas……………………………………………13,14
Distribuciones de frecuencias acumuladas y ojivas……………………………14,15
Distribuciones de frecuencias relativas acumuladas y ojivas de porcentajes……
15,16,17.
Curvas de frecuencia y ojivas suavizadas …………………………………………17
Tipos de curvas frecuencias…………………………………………………………17
Capitulo (3): Media, mediana, moda y otras medidas de tendencia central……
18
Notación de índices………………………………………………………………18,19
Notación de suma…………………………………………………………………19
Promedios o medidas de tendencia……………………………………………20,21
Media aritmética…………………………………………………………………21,22
Media aritmética ponderada…………………………………………………22,23,24
Propiedades de la media aritmética……………………………………………24,25,26
Calculo de la media aritmética para datos agrupados………………………26,27,28
Mediana……………………………………………………………………………29,30
La moda………………………………………………………………………………30,31
Relación empírica entre media, mediana y moda……………………………31,32
2
La media geométrica G………………………………………………………32,33
La media armónica H………………………………………………………33,34,35
Relación entre las medidas aritmética, geométrica y armónica……………35,36
Media cuadrática…………………………………………………………………36,37
Cuartiles, deciles y percentiles……………………………………………37,38,39,40
Capitulo (4): La desviación típica y otras medidas de dispersión……………40
Dispersión o variación…………………………………………………………40,41
Rango……………………………………………………………………41,42,43
Desviación media…………………………………………………………………44,45
Rango semi-intercuartil……………………………………………………………46
Rango percentil…………………………………………………………………46,47
La desviación típica en estadística……………………………………………47,48
La varianza……………………………………………………………………………48,49
Métodos cortos para calcular la desviación típica…………………………49,50,51
Comprobación de charlier…………………………………………………………51
Corrección de shepoard para la varianza………………………………………51,52
Relaciones empíricas entre las medidas de dispersión …………………………52
Dispersion absoluta y relativa: Coeficiente de variación………………………52,53
Variables tipificadas: Unidades estándar……………………………………………53
Bibliografías……………………………………………………………………………53
Paráfrasis………………………………………………………………54,55,56
3
Introducción:
Filas de datos:
Una fila de datos consiste en datos recogidos que no han sido organizados
numéricamente, por ejemplo, las alturas de 100 estudiantes por letra alfabética.
es un conjunto de datos usualmente presentado en forma tabular. Cada columna
representa un variable en particular. Cada fila corresponde a un miembro dado del
conjunto de datos en cuestión. Alista valores para cada variable, tal como la altura
o el peso de un objeto. Cada valor se conoce como un dato. Cada conjunto de
datos puede incluir datos para uno o más miembros, correspondiendo al número
de filas.
Intervalos de Clase:
Son los intervalos en los que se agrupan y ordenan los valores observados. Cada
uno de estos intervalos está delimitado (acotado) por dos valores extremos que les
llamamos límites. Dónde: K=Número de intervalos el cual siempre debe ser un
número entero.
Polígonos de frecuencias
Son diagramas de línea que se obtienen al unir los puntos medios del lado
superior de cada rectángulo del histograma correspondiente. ... Recuerda que el
histograma y el polígono de frecuencias son gráficos que se utilizan para
representar distribuciones de frecuencias para datos agrupados.
En estadística, una ojiva es un gráfico que muestra la curva de una función de
distribución acumulativa dibujada a mano o en software de computadora. ... Este
4
es un tipo de gráfico de frecuencia y también se denomina polígono de frecuencia
acumulada.
5
Capítulo 2)
Distribuciones de frecuencias.
Filas de datos:
Una fila de datos consiste en datos recogidos que no han sido organizados
numéricamente, por ejemplo, las alturas de 100 estudiantes por letra alfabética.
es un conjunto de datos usualmente presentado en forma tabular. Cada columna
representa un variable en particular. Cada fila corresponde a un miembro dado del
conjunto de datos en cuestión. Alista valores para cada variable, tal como la altura
o el peso de un objeto. Cada valor se conoce como un dato. Cada conjunto de
datos puede incluir datos para uno o más miembros, correspondiendo al número
de filas.
En el caso más sencillo, existe tan solo un variable, y luego el conjunto de datos
consiste de una columna singular de variables, frecuentemente representado
como una lista. A pesar de su nombre, un conjunto de datos uní variado no es un
conjunto matemático en el sentido matemático común, dado que un valor dado
puede repetir múltiples veces. Normalmente la orden no es importante, y luego la
colección de los valores puede ser considerado como un multiconjunto en lugar de
una lista ordenada.
Los valores pueden ser números, tales como números reales o números enteros,
por ejemplo, representando la altura de una persona en centímetros, pero también
puede ser datos nominales (i.e., no consistiendo de valores numéricos), por
ejemplo, representando el grupo étnico de una persona. Mas generalmente, los
valores pueden ser de todos los tipos descritos como una medición. Para cada
6
variable, los valores normalmente serán todos del mismo tipo. Sin embargo,
pueden existir "valores perdidos", que deben ser indicados de alguna manera.
Ordenaciones:
Ordenación de listas
7
Puede ordenar los elementos de un informe de lista en orden ascendente o
descendente en función de un valor alfabético o numérico como, por ejemplo,
nombre de empleado o ingresos.
Ordenación de tablas de referencias cruzadas
Puede ordenar los elementos de una tabla de referencias cruzadas en orden
ascendente o descendente basándose en una etiqueta o en un valor numérico.
Ordenación de gráficos
Puede ordenar los elementos de un gráfico en orden ascendente o descendente
en función de un valor numérico o una etiqueta, como ingresos o nombre de
empleado.
Eliminar ordenaciones con el botón Ordenar
Puede utilizar el botón Ordenar de la barra de herramientas o del menú contextual
para eliminar ordenaciones de listas, tablas de referencias cruzadas y gráficos.
Eliminar ordenaciones mediante la barra de información
Puede utilizar la barra de información para eliminar ordenaciones de listas, tablas
de referencias cruzadas y gráficos.
Distribución de frecuencias:
8
La inspección de los datos originales no permite responder fácilmente a
cuestiones como cuál es la actitud mayoritaria del grupo, y resulta bastante más
difícil determinar la magnitud de la diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la
variable acompañados del número de veces (la frecuencia) que aparece cada
valor:
60-62 5
63-65 18
66-68 42
69-71 27
72-74 8
Total 100
9
Intervalos de clase y límites de clase:
El símbolo que define una clase, como el 60–62 se llama intervalo de clase. A los
números 60 y 62 se les conoce como límites de clase; el número más pequeño
(60) es el límite inferior de clase, mientras que el número más grande (62) es el
límite superior de clase. ... TAMAÑO O AMPLITUD DE UN INTERVALO DE
CLASE.
Intervalos de Clase: Son los intervalos en los que se agrupan y ordenan los
valores observados. Cada uno de estos intervalos está delimitado (acotado) por
dos valores extremos que les llamamos límites. Dónde: K=Número
de intervalos el cual siempre debe ser un número entero.
La marca de clase es el punto medio de cada intervalo (en este caso: 2; 5,5; 7,5 y
9,5). ... El intervalo se suele utilizar cuando el número de valores distintos que
puede adoptar una variable es muy elevado, de modo que se recurre a la
agrupación de esos valores para simplificar los cálculos.
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la
clase. En una distribución de frecuencias agrupadas el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en
el siguiente intervalo.
Los límites de clase superior o inferior establecidos en una distribución o tabla de
frecuencias, nos indican las cotas o fronteras de cada clase en la distribución y
pueden ser reales u ordinarias.
Fronteras de clase:
En la práctica, las fronteras de clase se obtienen promediando los límites superior
e inferior de un intervalo de clase. ... El tamaño o la amplitud de un intervalo de
clase es la diferencia entre las fronteras de clase inferior y superior y se le conoce
como amplitud, tamaño o longitud de clase. A veces se usan las fronteras de clase
como símbolos para la clase.
Si se miden estaturas con exactitud de 1 pulg., en teoría el intervalo de clase 60–
62 incluye todas las medidas desde 59.5000 hasta 62.5000 pulg. Estos números,
10
indicados brevemente por los números exactos 59.5 y 62.5 se llaman fronteras de
clase o limites verdaderos de clase; el número menor (59.5) es la frontera inferior
de clase y el número mayor (62.5), la frontera superior de clase.
Marca de clase.
11
La marca de clase, es el punto medio del intervalo de la clase, se denota por Su
valor es obtenido al promediar los extremos del intervalo. La marca de clase es el
valor central que representa una clase. Se obtiene al sumar los límites del
intervalo y dividir este valor entre dos.
¿Cuáles son las marcas de clase?
La marca de clase es el punto medio de cada intervalo.
La marca de clase es el valor que representa a todo el intervalo para
el cálculo de algunos parámetros como la media aritmética o la desviación típica.
Polígonos de frecuencias
Son diagramas de línea que se obtienen al unir los puntos medios del lado
superior de cada rectángulo del histograma correspondiente. ... Recuerda que el
12
histograma y el polígono de frecuencias son gráficos que se utilizan para
representar distribuciones de frecuencias para datos agrupados.
Para completar el polígono, se tiene en cuenta un punto en la marca de clase del
intervalo que esta al inicio y otro punto en la marca de clase del intervalo final del
histograma, ambos con frecuencia 000.
El gráfico generado es un polígono, ya que está formado por segmentos rectos
consecutivos.
Recuerda que el histograma y el polígono de frecuencias son gráficos que se
utilizan para representar distribuciones de frecuencias para datos agrupados.
3.Dibujamos las barras de cada clase, teniendo en cuenta que la altura de cada
barra es igual a la frecuencia.
Una distribución de frecuencia relativa describe los porcentajes del número total
de observaciones correspondiente a cada categoría. Una distribución de
frecuencia relativa no nos indica cuál es el número de observaciones en cada
categoría, sino cuál es el porcentaje de observaciones en cada categoría.
13
¿Cómo se hace una distribución de frecuencia relativa?
Para construir la tabla de frecuencias, sigue los siguientes pasos:
1. Halla el número total de elementos en el estudio (n).
2. Establece las categorías (Xi). ...
3. Halla las frecuencias absolutas (ni).
4. Halla las frecuencias absolutas acumuladas (Ni).
5. Halla las frecuencias relativas (fi).
14
Para calcular la frecuencia acumulada hay que ordenar los datos de menor a
mayor. Para un cálculo más sencillo y una imagen más visual, estos se colocan en
una tabla.
La frecuencia acumulada es el resultado de sumar sucesivamente las frecuencias
absolutas o relativas, desde el menor al mayor de sus valores.
Para calcular la frecuencia acumulada hay que ordenar los datos de menor a
mayor. Para un cálculo más sencillo y una imagen más visual, estos se colocan en
una tabla. Tras tener los datos ordenados y tabulados, la frecuencia acumulada se
obtiene simplemente de ir sumando una clase o grupo de la muestra con la
anterior (primer grupo + segundo grupo, primer grupo + segundo grupo + tercer
grupo y así sucesivamente hasta llegar a acumular del primer grupo al último).
15
Si las frecuencias en la anterior tabla de frecuencias se sustituyen por las
correspondientes frecuencias relativas, la tabla resultante se llama distribución de
frecuencias relativas, distribución porcentual o tabla de frecuencias relativas.
16
éste. Las distribuciones se pueden convertir fácilmente a distribuciones
acumuladas mediante sumas sucesivas de frecuencias de clase, es decir la
frecuencia total de todos los valores menores que el límite real superior de clase.
Curva suavizada: Aproxima mediante la línea curva los vértices del histograma:
La curva suavizada tiene por finalidad visualizar la forma de la distribución
eliminando la variación ocasionada por los datos particulares con que se trabaja.
17
Las curvas de frecuencias de simétricas o en forma de campana, se
caracterizan porque las observaciones equidistantes del máximo central
tienen la misma frecuencia. Ejemplo importante es la curva normal.
En las curvas de frecuencia poco asimétricas, o sesgadas, la cola de la
curva a un lado del máximo central es más larga que al otro lado. Si la cola
mayor está a la derecha, la curva se dice asimétrica a la derecha o de
asimetría positiva. En caso contrario, se dice asimétrica a la izquierda o de
asimetría negativa.
En una curva en forma de J o de J invertida, hay un máximo en un extremo.
Una curva de frecuencia en forma de U tiene máximos en ambos extremos.
Una curva de frecuencia bimodal tiene dos máximos.
Una curva de frecuencia multimodal tiene más de dos máximos.
Capítulo 3)
NOTACIÓN DE ÍNDICES:
18
determinada como punto de referencia inicial, para remitir a ella todas las demás
observaciones, esta situación se denomina situación base y las comparaciones
que se realizan vienen establecidas a través de un número índice. Los números
índices, o simplemente índices, proporcionan comparaciones entre datos
correspondientes a diferentes situaciones, escalonadas con arreglo a algún criterio
conocido (por ejemplo, por el transcurso del tiempo).
Propiedades:
Notación de suma:
El sumatorio (también conocido como operación de suma, notación sigma o
símbolo suma) es una notación matemática que permite representar sumas de
19
varios sumandos, n o incluso infinitos sumandos, evitando el empleo de los puntos
suspensivos o de una explícita notación de paso al límite. La notación se expresa
con la letra griega sigma mayúscula Σ.
La notación de Einstein simplemente omite la escritura del símbolo de suma, ya
que, si un índice aparece sin definición, se sobreentiende que lo que se representa
es la suma de los elementos al variar el índice. Se debe notar que, aunque el
término sumatorio se refiere a un operador matemático útil para expresar cierto
tipo de suma, no sustituye este término a la palabra suma.
Los operadores de suma son útiles para expresar sumas de forma analítica; esto
es, representar todos y cada uno de los sumandos
en forma general mediante el «i-ésimo» sumando. Así, para representar la fórmula
para hallar la media aritmética de n números
Una serie puede ser representada en una forma compacta, llamada sumatoria o
notación sigma. La letra griega mayúscula, es usada para representar la suma. La
serie 4 + 8 + 12 + 16 + 20 + 24 puede expresarse como. La expresión se lee como
la suma de 4 n como n va desde 1 a 6.
Las medidas de tendencia central son medidas estadísticas que pretenden resumir
en un solo valor a un conjunto de valores. Representan un centro en torno al cual
se encuentra ubicado el conjunto de los datos. Las medidas de tendencia central
más utilizadas son: media, mediana y moda.
Un promedio es un valor típico o representativo de un conjunto de datos. Como
tales valores suelen situarse hacia el centro del conjunto de datos ordenados por
magnitud, los promedios se conocen como medidas de tendencia central.
20
Se definen varios tipos, siendo los más comunes la media aritmética, la mediana,
la moda, la media geométrica y la media armónica. Cada una tiene ventajas y
desventajas, según los datos y el objetivo perseguido.
¿Qué es una media central?
La medida de tendencia central (moda, media y mediana), parámetro de tendencia
central o medida de centralización es un número ubicado hacia el centro de la
distribución de los valores de una serie de observaciones (medidas), en la que se
encuentra ubicado el conjunto de los datos.
media aritmética:
21
Lo hacemos cada día constantemente y sin ser conscientes de ello. Otro
ejemplo, tengo 2 horas para realizar tres ejercicios de estadística. Así pues,
dado que en total tengo disponibles 120 minutos, dedicaré en promedio 40
minutos a cada ejercicio. Puede que le dediquemos 60 minutos a uno y 30
minutos a cada uno de los otros dos, sin embargo, nuestra cabeza lo suele
calcular de este modo.
22
La media ponderada es un tipo de media que otorga diferentes pesos a los
distintos valores sobre los que se calcula.
La media ponderada se hace muy útil, por ejemplo, para calcular notas de
una asignatura. Queremos tener en cuenta para valorar la nota final que un
alumno haya realizado los ejercicios, los trabajos y haya participado en
clase. Claro que, no podemos darle la misma importancia que al examen
final. En el examen final debe mostrar que, efectivamente, ha adquirido los
conocimientos. Un profesor de matemáticas podría, por ejemplo, indicar
que la nota del examen tiene una ponderación del 70%, la realización de
ejercicios un 20% y la participación en clase un 10%.
Para cada uno de los casos anteriores, tendremos una nota distinta. Por
ejemplo, en el examen un 8,5, en los ejercicios un 7,3 y en la participación
en clase un 9,3. ¿Cómo calculamos la media si tenemos valores diferentes,
con diferentes porcentajes? Para ello se utiliza la media ponderada.
La segunda parte de la fórmula se lee tal que así: Sumatorio desde 1 hasta
N de x sub i por el peso de x sub i. Vamos a desarrollar todo esto de forma
mucho más sencilla:
23
participación un 3. De manera que x1 es la nota del examen, x2 la nota de
los ejercicios y x3 la nota de la participación en clase.
Por último, a diferencia de la media aritmética aparece el valor P. La P es
de porcentaje, peso o ponderación. Cualquiera de las tres palabras es
equivalente en estos casos. Será el peso otorgado a cada una de las
partes, examen 70%, ejercicios 20% y participación un 10%. Hemos de
recordar, no obstante que debemos expresar los porcentajes en tanto por
uno.
65 kg, 69kg, 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg. La media es
igual a 74 kg, que es una medida de centralización poco
representativa de la distribución.
24
La media aritmética se define como la suma de todos los datos
dividida entre el número total de los mismos. Como habitualmente
dispondremos de una tabla de datos con sus correspondientes
frecuencias absolutas, aplicaremos:
25
más bajo y calcular después la media aritmética del resto de datos o
de los nuevos datos actualizados.
26
Salario medio de los 70 trabajadores de la empresa
P&R.
X F F*X
$ 255.00 8 $ 2040.00
265.00 10 2650.00
275.00 16 4400.00
285.00 15 4275.00
295.00 10 2950.00
310.00 8 2480.00
350.00 3 1050.00
N=70 ∑ fx = $19,845.00
X=
∑ fx = $ 19,845.00 = $283.50
N 70
27
Salario medio de los 65 trabajadores de la empresa P&R.
X F*X
F
$ 255.00 8 $ 2040.00
265.00 10 2650.00
275.00 16 4400.00
285.00 14 3990.00
295.00 10 2950.00
310.00 5 1525.00
350.00 2 630.00
N= 65
∑ fx = $18,185.00
X = ∑N
fx $ 18,185.00
= =$ 27,976.92
65
28
Mediana:
La mediana de un conjunto de números ordenados en magnitud es o el valor
central o la media de los dos valores centrales.
La mediana es un estadístico de posición central que parte la distribución en dos,
es decir, deja la misma cantidad de valores a un lado que a otro.
Para calcular la mediana es importante que los datos estén ordenados de mayor a
menor, o al contrario de menor a mayor. Esto es, que tengan un orden.
1,2,2,4,6,8,9,9.
29
2,4,6,8,10,12,14,16,18.
Pues bien, el valor de la mediana, como indica la fórmula, es aquel que deje la
misma cantidad de valores tanto a un lado como a otro. ¿Cuántas observaciones
tenemos? 9 observaciones. Calculamos la posición con la fórmula de la mediana
correspondiente.
Mediana = 9+1 / 2 = 5
¿Qué quiere decir este 5? Nos dice que el valor de la mediana, se encuentra en la
observación cuya posición es la quinta.
Por lo tanto, la mediana de esta sería de datos sería el número 10, ya que está en
la posición quinta. Además, podemos comprobar cómo tanto a la izquierda del 5
hay 4 valores (2, 4, 6 y 8) y a la derecha del 10 hay otros 4 valores (12, 14, 16 y
18).
La moda:
30
o La moda del conjunto es 5 porque se repite en dos ocasiones,
mientras que el resto de números se repiten únicamente una vez.
31
¿Para qué nos sirve? Por ejemplo, si en una habitación hay tres personas,
La media de dinero que tienen en sus bolsillos sería el resultado de tomar todo el
dinero de los
tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una
forma de
resumir la...
La media geométrica G:
32
La media geométrica se calcula como un producto conjunto. Es decir, que todos
los valores se multiplican entre sí. De modo que, si uno de ellos fuera cero, el
producto total sería cero. Por ello, debemos siempre tener en cuenta que a la hora
de calcular la media geométrica necesitamos números que sean únicamente
positivos.
Uno de sus principales usos es para calcular medias sobre porcentajes, pues su
cálculo ofrece unos resultados más adaptados a la realidad.
Donde:
Como ya hemos indicado este tipo de media es adecuada para calcular variables
en porcentaje o índices. Una de sus principales ventajas es que es menos
sensible a valores extremos (muy grandes o muy pequeños) que podrían alterar la
media de una muestra estadística. Por el contrario, su principal desventaja es
que no puede utilizarse con números negativos.
La media armónica H:
La media armónica (designada usualmente mediante H) de una cantidad finita de
números es igual al recíproco, o inverso, de la media aritmética de los recíprocos
de dichos valores y es recomendada para promediar velocidades.
33
En otras palabras, la media armónica es una medida estadística recíproca a la
media aritmética, que es la suma de un conjunto de valores entre el número de
observaciones.
34
El caso de la estimación de los costos que implica la generación de una señal de
televisión especial
con pauta federal, la media armónica resulta idónea para establecer un costo
promedio en virtud de:
mostrar un rango muy amplio entre las ofertas (diferencia entre los precios más
bajos y más altos);
el reducido número de propuestas de cotización para el trabajo solicitado; y la
variabilidad y asimetría entre los montos que presentan las ofertas.
MEDIA ARITMÉTICA:
También denominada promedio, es la que se utiliza principalmente y se define
como la suma de los valores de todas las observaciones divididas por el número
total de datos. La expresión para calcular la media aritmética es:
MEDIA GEOMÉTRICA:
La media geométrica de un conjunto de observaciones es la raíz enésima de su
producto. El cálculo de la media geométrica exige que todas las observaciones
sean positivas:
35
MEDIA ARMÓNICA
La media armónica se define como el recíproco de la media aritmética. Esto es:
La media cuadrática es muy útil para calcular la media de variables que toman
valores negativos y positivos. Se suele utilizar cuando el símbolo de la variable no
es importante y lo que interesa es el valor absoluto del elemento. Por ejemplo,
para calcular la media de errores de medida.
36
Una aplicación clásica de la media cuadrática es la determinación del valor
eficaz de un parámetro sinusoidal en electricidad, en corriente alterna (tensión en
voltios o intensidad en amperios).
Cuartil
¿Qué es el cuartil?
El cuartil es cada uno de los tres valores que pueden dividir un grupo de números,
ordenados de menor a mayor, en cuatro partes iguales. En otras palabras,
cada cuartil determina la separación entre uno y otro subgrupo, dentro de un
conjunto de valores.
El cuartil es cada uno de los tres valores que pueden dividir un grupo de números,
ordenados de menor a mayor, en cuatro partes iguales.
Aquellos datos menores a Q1 representan el 25% de los datos, los que están
debajo de Q2 son el 50%, mientras que aquellos menores a Q3 son el 75%.
Conviene señalar que Q2 coincide con la mediana, que es un dato estadístico que
divide el conjunto de valores en dos partes iguales o simétricas.
Otro punto a tener en cuenta es que el cuartil es un tipo de cuantil. Este es un
punto o valor que permite distribuir un grupo de datos en intervalos idénticos.
37
Deciles
¿Qué son los deciles?
Los Deciles (D) son puntuaciones que dividen la distribución en diez partes.
El Decil 9 (D9), por ejemplo, es la puntuación que deja por bajo las nueve décimas
partes de la distribución.
¿Cuántos deciles existen?
Los deciles son los nueve valores que dividen una serie de datos ordenados en
diez partes iguales.
Un decil, en estadística descriptiva, es uno de los nueve valores que dividen, en
diez partes iguales, un grupo de datos ordenados.
El decil, por tanto, no es más que un tipo de cuantil, o una serie de particiones que
se llevan a cabo en los datos de una muestra o población.
Además, estos deben ir ordenados de menor a mayor. De esta forma, el decil
también irá en ese mismo orden.
¿Cómo se calcula el decil?
El decil, como cualquier otro cuantil, puede calcularse para datos agrupados o no
agrupados. Para los primeros, existen ciertas fórmulas que podemos encontrar en
manuales de estadística básica. Para los segundos, el proceso es relativamente
más sencillo, sobre todo si disponemos de una hoja de cálculo. En el ejemplo
veremos esto con algo más de detalle.
Debemos decir que, en el caso de datos no agrupados, se utiliza una expresión
matemática para situar el valor de dicho decil. Esta es relativamente sencilla, ya
que se basa en que las nueve partes de la distribución tienen el mismo tamaño.
Por tanto, lo que se hace es utilizar el valor concreto si obtenemos un número
entero, o un promedio, si el número tiene decimales.
Características del decil
Los deciles tienen una serie de características, como las que mostramos a
continuación:
Como estadísticos de posición, son útiles para conocer qué lugar ocupan
los datos en una distribución. Así, el decil 8 es el límite superior de los datos
que representan el 80% del total.
Por otro lado, permiten conocer cuáles de ellos se sitúan en los niveles más
altos (>90%) y en los más bajos (<10%).
38
Son muy frecuentes en comparaciones económicas, como niveles de
renta, salarios o ingresos.
Además, junto a los cuartiles, quintiles o percentiles, son los cuantiles más
utilizados en estadística descriptiva.
Percentiles
¿Qué son los percentiles y cuál es su utilidad?
Un percentil es una medida estadística para comparar resultados, nos permite
saber cómo está situado un valor en función de una muestra. Si hablamos de
bebés, nos permitiría comparar los datos de nuestro bebé con otros de sus
mismas características. Estas características son la edad y el sexo.
El percentil es una medida estadística de posición, que divide la distribución
ordenada de los datos en cien partes iguales.
Esta medida de posición no central aporta información sobre el porcentaje de
observaciones de una variable, ordenados de menor a mayor, que se sitúan por
debajo del valor de este.
De esta forma, el percentil 20 (P20) sería el valor de la variable, situado este en el
límite de los 20 primeros.
39
Sin embargo, tiene un inconveniente relacionado con lo anterior. No es útil
para muestras con pocos casos, ya que los grupos serían demasiado
pequeños. Por eso, en estas circunstancias se recomiendan otros como el
cuartil o el decil.
Capitulo 4)
dispersión o variación:
40
Medidas de dispersión estadística
Existen diversas medidas de dispersión que permiten su medición. Veamos
un resumen de las más relevantes. Las hemos analizado con mas detalle
aquí.
Rango:
41
Cómo calcular el rango: su fórmula y ejemplo
R es el rango.
Máx es el valor máximo, el dato más alto, de la muestra concreta.
Mín es el valor mínimo, el dato más bajo, de la muestra concreta.
X es la variable sobre la que se pretende calcular el rango.
R = Máxx – Mínx
R = 1,93 – 1,67 = 0,26 m
R = 0,26 metros
42
Ventajas y desventajas del rango:
Cuenta con las mismas unidades que los datos con los que se trabaja.
Esto es: si queremos calcular el rango de alturas en una clase, el rango
tendría el metro o el centímetro como unidad de medidas. Sin embargo, si
quisiéramos calcular el rango de los microchips que fabrica al mes una
empresa, el rango adquiere como unidad de medida la propia unidad.
43
Desviación media:
Di = x - x
Ejemplo
44
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Ejemplo
Calcular la desviación media de la distribución:
datos agrupados.
X U F FU
61 -2 5 -10
64 -1 18 -18
67 0 42 0
70 1 27 27
73 2 8 16
N = 100 ∑ fu=15
15
X = A+¿ ¿) c = 67 + ( 100 )(3) = 45
67.45 in
Rango semi-Intercuartil:
El rango percentil:
46
El estudiante ha quedado muy bien en Matemáticas, y mal en Historia en relación
a los resultados obtenidos por el resto del grupo, pero la puntuación directa (el 5)
es la misma en ambos exámenes. En conclusión, las puntuaciones directas NO
miden de manera adecuada de la posición de los datos en relación al grupo. Por
tanto, es preciso considerar un procedimiento que sí lo haga.
Si en lugar de operar con las puntuaciones directas obtenemos el porcentaje de
puntuaciones con valores inferiores vemos que el estudiante ha obtenido una
puntuación en Matemática que deja por bajo el 80% de las puntuaciones de
Matemáticas, y en Historia el 10% de Historia. De esta forma sí podemos
comparar el rendimiento del estudiante en los dos exámenes, y se
denomina Rango Percentil de una puntuación x el porcentaje de datos con
valores inferiores a x.
Cálculo
Fórmula de cálculo:
47
Existen dos fórmulas para calcular la desviación típica. Son las
siguientes:
La varianza
48
mismo. Así, se calcula como la suma de los residuos elevados al cuadrado
y divididos entre el total de observaciones.
49
Sin embargo, esta fórmula no es una alternativa de la desviación típica pues arroja
diferentes resultados. En realidad, la fórmula anterior es la desviación respecto de
la media. La desviación estándar o típica y la desviación respecto de la media
tienen similitudes, pero no son lo mismo. A esta última forma se le conoce como
desviación media.
50
Así, una vez analizados ambos conceptos, la desviación típica se calcula de
forma muy parecida a la media, si bien es cierto que en el cálculo de la
desviación típica se toman como valores las desviaciones. Aunque el
razonamiento resulta bastante lógico, lo cierto es que existe un fallo que se
solucionan a través de los diferentes cálculos de la desviación típica.
Comprobacion de Charlier:
51
2
c
Varianza corregida = varianza de los datos agrupados --
12
Donde c es la anchura del intervalo de clase. La corrección c 2/12 (que se resta) se
llama corrección de sheppard.
Se usa para distribuciones de variables continuas donde las (colas) van hacia cero
en ambas direcciones.
dispersión absoluta .
Dispersión relativa =
promedio .
s
Coeficiente de variación (V) = X
52
Y se expresa en general en forma de porcentaje. Nótese el coeficiente de
variación es independiente de las unidades usadas. Por esa razón es útil al
comparar distribuciones con unidades diferentes. Una desventaja del coeficiente
de variación es que pierde su utilidad cuando X es próxima a cero.
Variables tipificadas:
Unidades estándar.
Bibliografías:
Bibliografía
economipedia. (s.f.). economipedia.com. Obtenido de https://economipedia.com/:
https://economipedia.com/definiciones/desviacion-tipica.html
53
Paráfrasis:
La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las
observaciones, para poder hacer comparaciones y sacar conclusiones.
Conceptos de Estadística
Población:
Una población es el conjunto de todos los elementos a los que se somete a un estudio
estadístico.
Individuo:
Un individuo o unidad estadística es cada uno de los elementos que componen la
población.
Muestra:
Una muestra es un conjunto representativo de la población de referencia, el número de
individuos de una muestra es menor que el de la población.
Muestreo
El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción
reducida y representativa de la población.
Valor:
Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.
Dato:
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si
lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
La Probabilidad y la Estadística Descriptiva proveen las herramientas y
modelos necesarios para organizar, describir y representar matemática y
gráficamente la información disponible, dimensionar la incertidumbre de esta
información y convertirla en predicciones o pronósticos.
54
En otras palabras; la Probabilidad y la Estadística Descriptiva constituyen el marco
matemático para predecir el futuro modelando la experiencia y son la base
fundamental del Análisis de Riesgo y la Administración de la Incertidumbre.
Para dictar las afirmaciones anteriores, sobre mucho, poco, alto, bajo, muy
variable o poco variable necesitamos variables de medidas. Esto es, necesitamos
cuantificarlas, ofrecer un número. Con esto en mente, podríamos utilizar los
gramos o los kilogramos como unidad de medida para saber el peso de tantas
cajas de tomates como consideremos. Una vez pesemos treinta cajas, sabremos
cuales pesan más, cuales pesan menos, que cuantía es la que más se repite o si
existe mucha disparidad entre los pesos de las diferentes cajas.
55
encuentra el punto medio? En el centro, en la mitad aproximadamente. Otro
ejemplo de medida de tendencia central es la mediana.
Medidas de dispersión: También son conocidas como medidas de
variabilidad. Por ejemplo, la desviación típica es una medida de variabilidad
ya que nos dice si los valores de un conjunto de datos son muy dispares o
no. Dos ejemplos más sobre medidas de dispersión podrían ser la varianza
y el rango estadístico.
Medidas de posición: No son las más conocidas, pero se utilizan
frecuentemente. Un ejemplo de ello, se encuentra en los percentiles o los
deciles. Cuando un dato en concreto se encuentra en el percentil 90, quiere
decir que por debajo de ese dato se encuentran el 90% de datos. Existen
otras medidas de posición como los cuartiles o algunas variantes como el
primer cuartil.
Distribución de frecuencias
También es interesante ver cómo se distribuyen las frecuencias. Para
ello, existen ciertos conceptos que debemos conocer:
Frecuencia absoluta: Es el número total de veces que se repite una
observación. En ocasiones las observaciones se pueden presentar en
intervalos.
Frecuencia relativa: Es el número en porcentaje que se repite una
observación o un conjunto de ellas.
Frecuencia acumulada: Puede ser relativa acumulada o absoluta
acumulada. Indica la cantidad acumulada hasta cierta observación.
JESÚS le dijo: Amarás al señor tu DIOS con todo tú corazón, con toda tú
alma, y con toda tú mente.
Este es el primero y grande mandamiento.
Y el segundo es semejante: Amarás a tu prójimo como a ti mismo.
San mateo 22:37 BENDICIONES Y DIOS TE AMA UN MONTON.
AMÉN.
56