Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INTRODUCCIÓN
La estadística es el estudio de los modos de recolectar y analizar datos con el fin de
establecer conclusiones acerca del medio del cual se han obtenido los datos. a es la ciencia
que trata sobre la toma, organización recopilación, presentación y análisis de datos para
deducir conclusiones sobre ellos y para tomar decisiones que estén de acuerdo con los
análisis efectuados.
Definición de Estadística
La estadística es la ciencia que se encarga de la recopilación, representación y el uso de
datos sobre una o varias características de interés para, a partir de ellos, tomar decisiones o
extraer conclusiones generales.
Estas dos ramas no son independientes; por el contrario, son complementarias y entre
ambas dan la suficiente ilustración sobre una posible realidad futura, con el fin de que quien
tenga el poder de decisión, tome las medidas necesarias para transformar ese futuro o para
mantener las condiciones existentes.
Conceptos de Básicos
3
Clasificación de la estadística
Tipos de variables
El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y
viudo.
Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un
orden. Por ejemplo:
Variable discreta. Una variable discreta es aquella que solo puede tomar un número finito
de valores entre dos valores cualesquiera de una característica.
Variable continúa. Una variable continua es aquella que puede tomar un número infinito de
valores entre dos valores cualesquiera de una característica.
En la práctica medimos la altura con dos decimales, pero también se podría dar con tres
decimales.
Variable aleatoria. Se llama variable aleatoria a toda función que asocia a cada elemento
del espacio maestral E un número real.
Se utilizan letras mayúsculas X, Y, ... para designar variables aleatorias, y las respectivas
minúsculas (x, y, ...) para designar valores concretos de las mismas.
Variable aleatoria discreta. Una variable aleatoria discreta es aquella que sólo puede
tomar valores enteros.
Variable aleatoria continúa. Una variable aleatoria continua es aquella que puede tomar
todos los valores posibles dentro de un cierto intervalo de la recta real.
Ejemplos: la altura de los alumnos de una clase, las horas de duración de una pila.
La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2,
3, 4,..., n suponiendo que se han realizado n pruebas.
Variable aleatoria normal. Una variable aleatoria continua, X, sigue una distribución
normal de media μ y desviación típica σ, y se designa por N(μ, σ), si se cumplen las
siguientes condiciones:
Estos dos caracteres son a su vez variables estadísticas en las que sí existe relación entre
ellas, una de las dos variables es la variable independiente y la otra variable dependiente.
Nivel de medición
Puede especificar el nivel de medición como Escala (datos numéricos de una escala de
intervalo o de razón), Ordinal o Nominal. Los datos nominales y ordinales pueden ser de
cadena (alfanuméricos) o numéricos.
Nominal. Una variable puede ser tratada como nominal cuando sus valores representan
categorías que no obedecen a una clasificación intrínseca. Por ejemplo, el departamento de
la compañía en el que trabaja un empleado. Algunos ejemplos de variables nominales son:
región, código postal o confesión religiosa.
Ordinal. Una variable puede ser tratada como ordinal cuando sus valores representan
categorías con alguna clasificación intrínseca. Por ejemplo, los niveles de satisfacción con
un servicio, que abarquen desde muy insatisfecho hasta muy satisfecho. Entre los ejemplos
de variables ordinales se incluyen escalas de actitud que representan el grado de
satisfacción o confianza y las puntuaciones de evaluación de las preferencias.
Escalas. Una variable puede tratarse como escala (continua) cuando sus valores representan
categorías ordenadas con una métrica con significado, por lo que son adecuadas las
comparaciones de distancia entre valores. Son ejemplos de variables de escala: la edad en
años y los ingresos en dólares.
Distribución de frecuencias
Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable
acompañados del número de veces (la frecuencia) que aparece cada valor:
La distribución de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria
de los individuos del grupo estudiado es indiferente.
Generalmente las tablas incluyen varías columnas con las frecuencias relativas (son el
número de ocurrencias dividido por el total de datos, y se simbolizan "fr" o "pi"),
frecuencias acumuladas (la frecuencia acumulada es el total de frecuencias de los valores
iguales o inferiores al de referencia, y se simbolizan "fa" o "na". No obstante la frecuencia
acumulada también es definida incluyendo al valor de referencia), frecuencias acumuladas
relativas (la frecuencia acumulada relativa es el total de frecuencias relativas de los valores
iguales o inferiores al de referencia, y se simbolizan "fr" o "pa")
Ahora es más sencillo interpretar los datos. Por ejemplo, podemos apreciar inmediatamente
que el intervalo con mayor número de datos es el 34-39, o que el 75% de los datos tiene
valor inferior a 46.
Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila en una
distribución de frecuencias
Límites aparentes: Valores mayor y menor del intervalo que son observados en la tabla.
Dependen de la precisión del instrumento de medida. En el ejemplo, los límites aparentes
del intervalo con mayor número de frecuencias son 34 y 39.
Límites exactos: Valores máximo y mínimo del intervalo que podrían medirse si se contara
con un instrumento de precisión perfecta. En el intervalo 34-39, estos límites son 33.5 y
39.5
Punto medio del intervalo (Mco Marca de clase): Suma de los límites divididos por dos. Mc
del intervalo del ejemplo= 36.5
Amplitud del intervalo: Diferencia entre el límite exacto superior y el límite exacto inferior.
En el ejemplo es igual a 6.
8
Los gráficos estadísticos son muy útiles para comparar distintas tablas de frecuencia.
POLÍGONO DE FRECUENCIAS.
Para una variable discreta, el polígono de frecuencias se obtiene uniendo por una poligonal,
los extremos superiores de las barras.
Para una variable continua, el polígono de frecuencias se obtiene uniendo por una poligonal
los puntos medios de la base superior de los polígonos del histograma.
Las escalas utilizadas para representar los polígonos de frecuencias influyen mucho por el
impacto visual de los mismos.
La ojiva apropiada para información que presente frecuencias mayores que el dato que se
está comparando tendrá una pendiente negativa (hacia abajo y a la derecha) y en cambio la
que se asigna a valores menores, tendrá una pendiente positiva. Una gráfica similar al
polígono de frecuencias es la ojiva, pero ésta se obtiene de aplicar parcialmente la misma
técnica a una distribución acumulativa y de igual manera que éstas, existen las ojivas mayor
que y las ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y los polígonos de frecuencias (y por
esto la aplicación de la técnica es parcial):
Un extremo de la ojiva no se toca al eje horizontal, para la ojiva "mayor que" sucede con el
extremo izquierdo; para la ojiva "menor que", con el derecho.
En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de
clase. Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la
mayor.
rango:54.
k: 7.
ic: R+1 = 54+1= 55= 8
K 7 7
LI: 63
LS: 63 + 8 - 1= 7o
Tabla
Grafica
11
GRÁFICAS DE LINEALES
Se ilustra mediante segmentos de línea los cambios en cantidades con respecto al tiempo.
Son especialmente útiles en el comercio y en los negocios.
Por ejemplo, el siguiente gráfico representa una alumna de cuarto medio cuya altura es 162
cm.
Si hubiese que representar otra alumna con esta misma estatura, el gráfico se vería de la
siguiente forma:
Las medidas más utilizadas en el análisis de datos son: la media aritmética, la mediana y la
moda.
Sólo es relevante la media geométrica si todos los números son positivos. Si uno de ellos es
0, entonces el resultado es 0. Si hay un número negativo (o una cantidad impar de ellos)
entonces la media geométrica es, o bien negativa o bien inexistente en los números reales.
tampoco queda determinada debido al problema de las raíces de índice par de números
negativos.
La mediana de una variable X, representada por Md, se define como el valor de la variable
que divide la distribución de frecuencias en dos partes iguales, conteniendo cada una el
50% de las observaciones.
Cuando los datos están en intervalos se denomina intervalo crítico y se corresponde con el
que la frecuencia absoluta acumulada na es igual o superior a n/2.
La mediana se puede calcular en cualquier distribución excepto cuando los datos están
agrupados y existe uno abierto en el que se encuentra la mediana.
La moda. La moda es otro índice de tendencia central que se puede obtener tanto en
variables cualitativas como en cuantitativas. Se representa por Mo, y se define como el
valor o categoría de la variable con mayor frecuencia absoluta.
14
Una frecuencia es un modal cuando existe un único valor con la frecuencia máxima. Si
presenta varios valores con la frecuencia más alta, ésta será bimodal, trimodal,...
Estas medidas descriptivas permiten ubicar la posición que ocupa un valor dentro de un
conjunto de datos, se calcula para variables de tipo cualitativo ordinal y de tipo cuantitativo
(discreta y continua), cabe agregar que los resultados se expresan en las mismas unidades
de los datos en estudio.
Percentiles: son aquellos valores que dividen los datos ordenados en cien partes iguales.
Existen noventa y nueve percentiles, dicha medida hace referencia a un porcentaje de casos
por debajo del percentil y otros porcentaje por encima. Entre dos percentiles consecutivos
cualesquiera se encuentra un 1% o 1/100 partes de los datos.
Deciles: son valores que dividen los datos ordenados en diez partes iguales. Existen nueve
deciles, dicha medida deja un porcentaje de datos por debajo del decil y otro porcentaje por
encima. Entre dos deciles consecutivos cualesquiera se encuentra un 10% o 1/10 partes de
los elementos.
15
CUARTILES: son valores que dividen los datos ordenados en cuatro partes iguales.
Existen tres cuartiles, por lo tanto dicha medida hace referencia a un porcentaje de casos
por debajo del cuartil y otro porcentaje por encima Entre dos percentiles consecutivos
cualesquiera se encuentra un 25% o 1/4 partes de los datos.
DECILES. Los deciles son ciertos números que dividen la sucesión de datos ordenados en
diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales, son también un caso particular de los percentiles. Los
deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
CUARTILES. Los cuartiles son los tres valores que dividen al conjunto de datos
ordenados en cuatro partes porcentualmente iguales.
Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la
mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto
(25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual
o por debajo del cual quedan las tres cuartas partes (75%) de los datos.
PERCENTILES. Los percentiles son, tal vez, las medidas más utilizadas para propósitos
de ubicación o clasificación de las personas cuando atienden características tales como
peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien
partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales
el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,...,
percentil 99.
Medidas de dispersión. Parámetros estadísticos que indican cómo se alejan los datos
respecto de la media aritmética. Sirven como indicador de la variabilidad de los datos. Las
medidas de dispersión más utilizadas son el rango, la desviación estándar y la varianza.
Cuando mayor sea el valor de la desviación media, mayor es la dispersión de los datos. Sin
embargo, no proporciona una relación matemática precisa entre su magnitud y la posición
de un dato dentro de una distribución.
La desviación media al tomar los valores absolutos mide una observación sin mostrar si la
misma está por encima o por debajo de la media aritmética.
Las medidas de forma son necesarias para determinar el comportamiento de los datos y así,
poder adaptar herramientas para el análisis probabilístico.
Un sesgo es un error que aparece en los resultados de un estudio debido a factores que
dependen de la recolección, análisis, interpretación, publicación o revisión de los datos que
pueden conducir a conclusiones que son sistemáticamente diferentes de la verdad o
incorrectas.
La curtosis (o apuntamiento) es una medida de forma que mide cuán escarpada o achatada
está una curva o distribución.
Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera que a
mayor grado de curtosis, más escarpada (o apuntada) será la forma de la curva.
La curtosis se mide promediando la cuarta potencia de la diferencia entre cada elemento del
conjunto y la media, dividido entre la desviación típica elevado también a la cuarta
potencia.
17
INTRODUCCION A LA PROBABILIDAD
Definiciones
Sucesos
A continuación se presentan tales conceptos. (Como siempre, cualquier duda debe ser
consultada con el instructor respectivo, de manera que puedan ser aclaradas antes de
continuar)
Suceso elemental. Es cada una de las posibles soluciones que se pueden obtener al realizar
un experimento aleatorio.
Fórmula
DIAGRAMAS DE ÁRBOL
Los diagramas de árbol son ordenaciones empleadas para enumerar todas las posibilidades
lógicas de una secuencia de eventos, donde cada evento puede ocurrir en un número finito.
Proporcionan un método sistemático de enumeración objetiva de los resultados.
Tenemos dos opciones posibles para cada pregunta, V o F el árbol presenta dos ramas en
cada pregunta.
a) V b) F
a) V b) F
a) V b) F
20
Las diferentes formas en que se puede contestar son ocho y forman el espacio muestral.
TECNICAS DE CONTEO
Si un evento A puede ocurrir de n1 maneras y una vez que este ha ocurrido, otro evento B
puede n2 maneras diferentes entonces, el número total de formas diferentes en que ambos
eventos pueden ocurrir en el orden indicado, es igual a n1 x n2.
Aplicando el principio fundamental del conteo, tenemos 10 personas que pueden recibir el
primer premio. Una vez que éste ha sido entregado, restan 9 personas para recibir el
segundo, y posteriormente quedarán 8 personas para el tercer premio. De ahí que el número
de maneras distintas de repartir los tres premios.
10 x 9 x 8 = 720
¿Cuántas placas de automóvil se pueden hacer utilizando dos letras seguidas de tres cifras?
No se
admiten repeticiones.
26 x 25 x 10 x 9 x 8 = 468000
5! = 5 x 4 x 3 x 2 x 1 = 120
Por definición 0! = 1
Si, sin embargo, hay un gran número de posibles resultados tales como el número de niños
y niñas por familias con cinco hijos, sería tedioso listar y contar todas las posibilidades. Las
posibilidades serían, 5 niños, 4 niños y 1 niña, 3 niños y 2 niñas, 2 niños y 3 niñas, etc.
* La técnica de la multiplicación
* La tecnica aditiva
* La técnica de la permutación
* La técnica de la combinación.
PRINCIPIO ADITIVO. Si se desea llevar a efecto una actividad, la cual tiene formas
alternativas para ser realizada, donde la primera de esas alternativas puede ser realizada de
M maneras o formas, la segunda alternativa puede realizarse de N maneras o formas ..... y
la última de las alternativas puede ser realizada de W maneras o formas, entonces esa
actividad puede ser llevada a cabo de,
Ejemplos:
Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que puede
seleccionar de entre las marcas Whirlpool, Elsy y General Electric, cuando acude a hacer la
compra se encuentra que la lavadora de la marca W se presenta en dos tipos de carga ( 8 u
11 kilogramos), en cuatro colores diferentes y puede ser automática o semiautomática,
mientras que la lavadora de la marca E, se presenta en tres tipos de carga (8, 11 o 15
kilogramos), en dos colores diferentes y puede ser automática o semiautomática y la
lavadora de la marca GE, se presenta en solo un tipo de carga, que es de 11 kilogramos, dos
colores diferentes y solo hay semiautomática. ¿Cuántas maneras tiene esta persona de
comprar una lavadora?
Solución:
M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras
m+n maneras.
Ejemplo. Una pareja que se tiene que casar, junta dinero para el enganche de su casa, en el
fraccionamiento lomas de la presa le ofrecen un modelo económico ó un condominio, en el
fraccionamiento Playas le ofrecen un modelo económico como modelos un residencial, un
23
PRESA PLAYAS
Económico Residencial
Condominio Californiano
Provenzal
m=2 n=3
2+3= 5 maneras
FÓRMULA: n P r = n! (n - r)
Ejemplo: ¿Cómo se puede designar los cuatro primeros lugares de un concurso, donde
existen 15 participantes?
NOTA: se puede cancelar números cuando se tiene las mismas cifras en numerador y
denominador. !
N C r = n! R! (n – r)!
Ejemplo: En una compañía se quiere establecer un código de colores para identificar cada
una de las 42 partes de un producto. Se quiere marcar con 3 colores de un total de 7 cada
una de las partes, de tal suerte que cada una tenga una combinación de 3 colores diferentes.
¿Será adecuado este código de colores para identificar las 42 partes del producto?
N C r = n! = 7! = 7! = 35
R! (n – r )! 3! (7 – 3)! 3! 4!
El tomar tres colores de 7 posibles no es suficiente para identificar las 42 partes del
producto.
25
Conclusión
Los conceptos antes mencionados han sido analizados e investigados de tal manera de
hacer más fácil su comprensión y entendimientos ya que la estadística es la ciencia que
trata de entender, organizar y tomar decisiones que estén de acuerdo con los análisis
efectuados. La estadística juega un papel muy importante en nuestras vidas, ya que
actualmente ésta se ha convertido en un método muy efectivo para describir con mucha
precisión los valores de datos económicos, políticos, sociales, psicológicos, biológicos y
físicos, además, sirve como herramienta para relacionar y analizar dichos datos. El
trabajo del experto estadístico ha evolucionado mucho, ya no consiste sólo en reunir y
tabular los datos, sino sobre todo en el proceso de interpretación de esa información, ahora
tiene un papel mucho más importante del que tenía en años pasados.
26
BIBLIOGRAFIA
http://probabilidadestadistic.blogspot.com/2010/09/tecnicas-de-conteo.html
https://phels18.wordpress.com/2013/04/23/tecnicas-de-conteo/
http://aprendoestadistic.blogspot.com/2013/04/eventos-mutuamente-excluyentes.html
http://www.profesorenlinea.cl/matematica/Estadistica1(VF).htm
https://estadisticageneral.wordpress.com/relaciones-entre-sucesos/
http://www.mat.uda.cl/hgomez/Apuntes/lect3.pdf
https://upload.wikimedia.org/wikipedia/commons/3/3a/
MODELOS_ALEATORIOS_Y_DETERMINISTAS.pdf
http://metodosunoydos.galeon.com/enlaces2221651.html
http://www.universoformulas.com/estadistica/descriptiva/curtosis/
http://weslintorres.blogspot.com/2009/05/medidas-de-forma.html
http://www.hiru.eus/matematicas/medidas-de-dispersion
https://www.ecured.cu/Medidas_de_dispersi%C3%B3n
http://bioestadisticaula.blogspot.com/2012/08/medidas-de-tendencia-no-central.html
27
http://jaimeprobabilidadyestadistica.blogspot.com/2011/04/la-media-geometrica.html
https://es.plusmaths.com/la-media-aritmetica-ponderada.html
https://psikipedia.com/libro/analisis-de-datos/2476-medidas-de-tendencia-central
http://ww2.educarchile.cl/portal.herramientas/sitios_educativos/estadistica/
gr_graf_ptos.htm
http://elzhifestadistica.blogspot.com/2012/05/graficas-estadisticas.html
http://poligonosyojivas.blogspot.com/
http://calculo.cc/temas/temas_e.s.o/estadistica/teoria/poligono-frec.html
http://recursostic.educacion.es/descartes/web/materiales_didacticos/Estadistica_3eso/
graficos_estadisticos_mgc.html
https://www.uv.es/webgid/Descriptiva/3_distribucin_de_frecuencias.html
https://www.ibm.com/support/knowledgecenter/es/SSLVMB_23.0.0/spss/base/
dataedit_define_variable_measurement.html
https://www.ditutor.com/estadistica/variables_tipos.html
http://www.eumed.net/libros-gratis/2007a/239/1b.htm
http://tsu-estadistica.blogspot.com/2012/12/estadistica-conceptos-basicos.html