Documentos de Académico
Documentos de Profesional
Documentos de Cultura
a la Investigació n
Psicoló gica
María Antonieta Villarreal
OBJETIVO DE LA MATERIA: Conocer los elementos
básicos que componen a la Estadística y su utilidad
en la educación
UNIVERSIDAD INDÍGENA
CALLI TLAMATILIZTLI
TEHUACÁN
2019
TEMARIO
I. LA ESTADISTICA
1. Antecedentes, importancia y aplicación de la Estadística.
a). Antecedentes: Evolución de la Estadística, función e importancia, generalidades, aplicaciones.
III. PROBABILIDAD
1. Definición: a priori, frecuencista, axiomática.
2. Teoría de Conjuntos: propiedades, operaciones, axiomas.
3. Espacios, experimentos y eventos: experimentos determinísticos y aleatorios, espacio muestral,
eventos mutuamente excluyentes y complementarios, Álgebra de eventos, Espacio de probabilidad.
4. Técnicas de Conteo: Principios de multiplicación y adición, factorial de un número, ordenación
con repetición, permutaciones y Combinaciones, Teorema del Binomio.
5. Probabilidad condicional e independencia: Probabilidad condicional y de eventos
independientes.
6. Teorema de Bayes: importancia, componente, aplicación.
La estadística se ocupa de los métodos científicos que se utilizan para recolectar, organizar, resumir,
presentar y analizar datos así como para obtener conclusiones válidas y tomar decisiones razonables
con base en este análisis. El término estadística también se usa para denotar los datos o los números
que se obtienen de esos datos; por ejemplo, los promedios. Así, se habla de estadísticas de empleo,
estadísticas de accidentes, etcétera.
Uno de los antecedentes de la estadística de los que se puede hacer constancia son los escritos sobre
el historiador Tácito, al que el emperador Augusto le ordenó crear una encuesta y una especie de
inventario de todos sus bienes, ya fuesen soldados, armamento, barcos….etc.
La ciencia de la estadística aparece poco a poco mediante una evolución histórica y que se puede
constatar en los distintos escritos históricos de la humanidad. Siempre ha existido la necesidad de
realizar recuentos, antes y después de las guerras, de modo que se pueda visualizar de forma fácil la
evolución de un reino o la evolución de un imperio.
Otro antecedente de la estadística surge en la isla italiana de Cerdeña donde los primeros pobladores
de esta isla, los llamados “Nuragas” levantaron bloques de piedra en los cuales realizaban escritos
donde anotaban con mucha escrupulosidad los números de ganado o de piezas cazadas de la época.
En los grabados egipcios, es posible visualizar los antecedentes de la estadística mediante los censos
que realizaban de sus poblaciones y los libros de cuentas de los faraones, nos estamos refiriendo al
año 3000 antes de cristo.
El rey de Asiria Sargón II llegó a fundar una biblioteca cuyos textos se ordenaban y se agrupaban en
tablillas de arcilla cocida y en donde era posible encontrar una recopilación de datos estadísticos y
libros de cuentas de la época.
Ya en la Biblia, en el libro de los Números, uno de los primeros libros de la Biblia del antiguo
testamento, le pide Yahvé a Moisés que haga un censo de las tribus, por familias y linajes.
También en la biblia, se puede leer como tras atacar a una tribu enemiga, el pueblo de Israel, como si
de piratas se tratase, volvían de la guerra y se repartían las mujeres, los niños, y el ganado en 12
partes iguales, una parte para cada una de las 12 tribus de Israel.
En China se conoce que unos 500 años antes de Cristo el Rey Yao mandó hacer un estudio estadístico
de todo su reino, a nivel agricola, industrial o comercial.
Durante la época de esplendor de Grecia, aparecen los verdaderos impulsores del antecedente de la
estadística, en escritores como Sócrates, Herodoto o Aristóteles.
De igual modo en la época del imperio Romano, la aparición de un gobierno bien estructurado y un
alto desarrollo político, impulsó la creación de censos de habitantes, estudios demográficos, registro
de nacimientos, contabilidad de la cantidad de bienes de cada familia etc…
La estadística es la base del conocimiento práctico y real. La estadística es una de las ramas de la
ciencia matemática que se centra en el trabajo con datos e informaciones que son ya de por sí
numéricos o que ella misma se encarga de transformar en números. La estadística, si bien es una
ciencia de extracción exacta, tiene una injerencia directa en cuestiones sociales por lo cual su utilidad
práctica es mucho más comprensible que lo que sucede normalmente con otras ciencias exactas
como la matemática.
A diferencia de otras ramas de la matemática que poseen una parte importante de abstracción, la
estadística tiene aplicaciones directas y concretas en la vida real ya que toma los números y cifras de
diferentes fenómenos sociales como por ejemplo la desocupación, la tasa de mortalidad, la de
natalidad y muchos otros datos incluso más complejos.
En algunos casos, aunque no directamente, la estadística también nos permite inferir (no conocer) la
calidad de vida de una población ya que si encontramos altas tasas de desempleo, pobreza y
marginalidad podremos suponer que la calidad de vida es muy baja.
La estadística tiene una utilidad no sólo en aspectos sociales sino que también sirve para todo tipo de
investigación científica si se tiene en cuenta que los datos estadísticos son el resultado de varios
casos de entre los cuales se toma un promedio. Así, una estadística puede servir para una
investigación científica al demostrar que un porcentaje determinado de los casos observados
representó un resultado particular y no otro. También se utiliza por ejemplo para conocer el planeta
en el que vivimos y darnos datos sobre las proporciones de recursos renovables, sobre las superficies
de los países, la presencia de determinados biomas o no, etc.
Generalidades de la Estadística
Conclusiones a partir
del análisis
Análisis de datos
Recoger datos
División de la Estadística
Se basa en la recolección de datos y su clasificación, elaboración de
tablas y gráficos que resumen esos datos; además, como la
determinación de ciertos parámetros estadísticos o números que
a) Estadística indican un rápido comportamiento general del grupo de datos
descriptiva o recolectados, sin pretender llegar a formulaciones de carácter
deductiva: general.
La finalidad y aplicación es inferir y estimar el modo de comportamiento del total de la población a partir
del estudio de un grupo seleccionado de la misma.
Aplicaciones de la Estadística
Economía: en este campo, los
métodos estadísticos son
indispensables, la formulación de las
leyes económicas, investigación del
mercado, etc.
Cuando se recolectan datos sobre las características de un grupo de individuos o de objetos, por
ejemplo, estatura y peso de los estudiantes de una universidad o cantidad de pernos defectuosos y
no defectuosos producidos en determinado día en una fábrica, suele ser imposible o poco práctico
observar todo el grupo, en especial si se trata de un grupo grande. En vez de examinar todo el grupo,
al que se le conoce como población o universo, se examina sólo una pequeña parte del grupo, al que
se le llama muestra. Las poblaciones pueden ser finitas o infinitas. Por ejemplo, la población que
consta de todos los pernos producidos determinado día en una fábrica es finita, en tanto que la
población que consta de todos los resultados (cara o cruz) que se pueden obtener lanzando una y
otra vez una moneda es infinita. Si la muestra es representativa de la población, el análisis de la
muestra permite inferir conclusiones válidas acerca de la población. A la parte de la estadística que
se ocupa de las condiciones bajo la cuales tales inferencias son válidas se le llama estadística
inductiva o inferencial. Como estas inferencias no pueden ser absolutamente ciertas, para presentar
estas conclusiones se emplea el lenguaje de la probabilidad. A la parte de la estadística que
únicamente trata de describir y analizar un grupo dado, sin sacar ninguna conclusión ni hacer
inferencia alguna acerca de un grupo más grande, se le conoce como estadística descriptiva o
deductiva. Antes de proceder al estudio de la estadística, se analizarán algunos conceptos
matemáticos importantes.
Una variable es un símbolo; por ejemplo, X, Y, H, x o B, que puede tomar cualquiera de los valores de
determinado conjunto al que se le conoce como dominio de la variable. A una variable que sólo
puede tomar un valor se le llama constante. Una variable que puede tomar cualquiera de los valores
entre dos números dados es una variable continua; de lo contrario es una variable discreta.
EJEMPLO 1 La cantidad N de hijos que tiene una familia puede tomar los valores 0, 1, 2, 3, . . . , pero
no puede tomar valores como 2.5 o 3.842; ésta es una variable discreta.
EJEMPLO 2 La estatura H de una persona que puede ser 62 pulgadas (in), 63.8 in o 65.8341 in,
dependiendo de la exactitud con que se mida, es una variable continua.
Los datos descritos mediante una variable discreta son datos discretos y los datos descritos mediante
una variable continua son datos continuos. Un ejemplo de datos discretos es la cantidad de hijos que
tiene cada una de 1 000 familias, en tanto que un ejemplo de datos continuos son las estaturas de
100 estudiantes universitarios. En general, una medición proporciona datos continuos; en cambio,
una enumeración o un conteo proporciona datos discretos. Es útil ampliar el concepto de variable a
entidades no numéricas; por ejemplo, en el arco iris, color C es una variable que puede tomar los
“valores” rojo, anaranjado, amarillo, verde, azul, índigo o violeta. Estas variables se pueden
reemplazar por números; por ejemplo, se puede denotar rojo con 1, anaranjado con 2, etcétera.
Al símbolo que representa una clase, como 60-62 en la tabla 2.1, se le conoce como intervalo de
clase. A los números de los extremos, 60 y 62, se les conoce como límites de clase; el número menor
(60) es el límite inferior de clase, y el número mayor (62) es el límite superior de clase. Los términos
clase e intervalo de clase se suelen usar indistintamente, aunque el intervalo de clase en realidad es
un símbolo para la clase. Un intervalo de clase que, por lo menos teóricamente, no tenga indicado el
límite de clase superior o el límite de clase inferior, se conoce como intervalo de clase abierto. Por
ejemplo, al considerar grupos de edades de personas, un intervalo que sea “65 años o mayores” es
un intervalo de clase abierto.
La frecuencia relativa de una clase es la frecuencia de la clase dividida entre la suma de las
frecuencias de todas las clases y generalmente se expresa como porcentaje. Por ejemplo, en la tabla
2.1, la frecuencia relativa de la clase 66-68 es 42/100 = 42%. Por supuesto, la suma de las frecuencias
relativas de todas las clases es 1, o 100%. Si en la tabla 2.1 las frecuencias se sustituyen por
frecuencias relativas, la tabla que se obtiene es una distribución de frecuencias relativas, distribución
porcentual o tabla de frecuencias relativas. Las representaciones gráficas de las distribuciones de
frecuencias relativas se obtienen a partir de los histogramas o polígonos de frecuencias, cambiando
únicamente, en la escala vertical, las frecuencias por las frecuencias relativas y conservando la gráfica
exactamente igual. A las gráficas que se obtienen se les llama histogramas de frecuencias relativas (o
histogramas porcentuales) y polígonos de frecuencias relativas (o polígonos porcentuales),
respectivamente.
A la suma de todas las frecuencias menores que la frontera superior de un intervalo de clase dado se
le llama frecuencia acumulada hasta ese intervalo de clase inclusive. Por ejemplo, en la tabla 2.1, la
frecuencia acumulada hasta el intervalo de clase 66-68 inclusive es 5 + 18 + 42 = 65, lo que significa
que 65 estudiantes tienen una estatura menor a 68.5 in.
A una tabla en la que se
presentan las frecuencias
acumuladas se le llama
distribución de frecuencias
acumuladas, tabla de
frecuencias acumuladas o
simplemente distribución
acumulada, y se presenta
en la tabla 2.2 para la
distribución de las
estaturas de los estudiantes
de la tabla 2.1.
5. Gráficas
Una gráfica es una representación visual de la relación entre las variables. En estadística,
dependiendo de la naturaleza de los datos y del propósito que se persiga, se emplean distintos tipos
de gráficas: gráficas de barras, de pastel, pictogramas, etc. A las gráficas también se les suele llamar
cartas o diagramas. Así, se habla de cartas de barras, diagramas de pastel, etc.
Ejemplos de grafícas
6. Medidas de Tendencia Central: sumatoria, media aritmética, mediana,
moda
SUMATORIA
N
El símbolo ∑ ¿1 Xj se emplea para denotar la suma de todas las Xj desde j = 1 hasta j = N; por
j
definición,
N
∑ Xj=X 1+ X 2+ X 3+… XN
j=1
Cuando no puede haber confusión, esta suma se denota simplemente como ∑ X , ∑ Xj O jXj El
símbolo ∑ es la letra griega mayúscula sigma y denota suma.
LA MEDIA ARITMÉTICA
LA MEDIANA
donde
L1 = frontera inferior de la clase mediana (es decir, de la clase que contiene la mediana)
N = número de datos (es decir, la frecuencia total)
(∑f)1 = suma de las frecuencias de todas las clases anteriores a la clase mediana
fmediana = frecuencia de la clase mediana
c = amplitud del intervalo de la clase mediana
Geométricamente, la mediana es el valor de X (abscisa) que corresponde a una recta vertical que
divide al histograma en dos partes que tienen la misma área. A este valor de X se le suele denotar X
LA MODA
La moda de un conjunto de números es el valor que se presenta con más frecuencia; es decir, es el
valor más frecuente. Puede no haber moda y cuando la hay, puede no ser única.
A una distribución que sólo tiene una moda se le llama unimodal. En el caso de datos agrupados,
para los que se ha construido una curva de frecuencia que se ajuste a los datos, la moda es el valor (o
los valores) de X que corresponden al punto (o puntos) máximos de la curva. A este valor de X se le
suele denotar ^ X. En una distribución de frecuencia o en un histograma la moda se puede obtener
mediante la fórmula siguiente:
donde L1 = frontera inferior de la clase modal (es decir, de la clase que contiene la moda)
Δ1 = exceso de frecuencia modal sobre la frecuencia en la clase inferior inmediata
Δ2 = exceso de frecuencia modal sobre la frecuencia en la clase superior inmediata
c = amplitud del intervalo de la clase modal
El grado de dispersión de los datos numéricos respecto a un valor promedio se llama dispersión o
variación de los datos. Existen varias medidas de dispersión (o variación); las más usadas son el
rango, la desviación media, el rango semiintercuartil, el rango percentil 10-90 y la desviación
estándar.
RANGO
El rango de un conjunto de números es la diferencia entre el número mayor y el número menor del
conjunto.
Desviación media
VARIANZA
Las ecuaciones (5) y (6) se pueden expresar, respectivamente, mediante las fórmulas siguientes:
donde X2 representa la media de los cuadrados de los diversos valores de X, en tanto que X2 denota
el cuadrado de la media de los diversos valores de X (ver problemas 4.12 a 4.14). Si las dj = Xj − A son
las desviaciones de Xj respecto a una constante arbitraria A, las fórmulas (7) y (8) se transforman,
respectivamente, en
Cuando en una distribución de frecuencia se tienen datos agrupados y los intervalos de clase son de
un mismo tamaño c, se tiene dj = cuj, o Xj = A + cuj y la fórmula (10) se trasforma en
Esta última fórmula proporciona un método muy sencillo para el cálculo de la desviación estándar y
se recomienda su uso para datos agrupados, siempre que los intervalos de clase sean de un mismo
tamaño. A este método se le llama método de compilación y es exactamente análogo al empleado en
el capítulo 3 para calcular la media aritmética de datos agrupados.
DESVIACIÓN STANDARD.
a) 6 8.27% de los casos está comprendido entre X − s y X + s (es decir, una desviación estándar a
cada lado de la media).
b) 9 5.45% de los casos está comprendido entre X − 2s y X + 2s (es decir, dos desviaciones estándar a
cada lado de la media).
c) 9 9.73% de los casos está comprendido entre X − 3s y X + 3s (es decir, tres desviaciones estándar a
cada lado de la media).
III. PROBABILIDAD
1. Definición: a priori, frecuencista,
axiomática.
Esta definición es de uso limitado puesto que
descansa sobre la base de las siguientes dos
condiciones:
La definición clásica se ve limitada a situaciones en las que hay un número finito de resultados
igualmente probables. Por desgracia, hay situaciones prácticas que no son de este tipo y la definición
de Laplace no se puede aplicar. Por ejemplo, si se pregunta por la probabilidad de que un paciente se
cure mediante cierto tratamiento médico, o la probabilidad de que una determinada máquina
produzca artículos defectuosos, entonces no hay forma de introducir resultados igualmente
probables. Por ello se necesita un concepto más general de probabilidad. Una forma de dar
respuesta a estas preguntas es obtener algunos datos empíricos en un intento por estimar las
probabilidades.
Supongamos que efectuamos un experimento n veces y que en esta serie de n ensayos el evento A
ocurre exactamente r veces, entonces la frecuencia relativa del evento es ,o sea,
Si continuamos calculando
esta frecuencia relativa cada
cierto número de ensayos, a
medida que aumentamos n,
las frecuencias relativas
correspondientes serán más
estables; es decir; tienden a
ser casi las mismas; en este
caso decimos que el
experimento muestra
regularidad estadística o
estabilidad de las
frecuencias relativas. Esto se
ilustra en la siguiente tabla,
de una moneda lanzada al
aire 1000 veces.
En un total de 1000 lanzamientos ocurrieron 508 caras, es decir la frecuencia relativa es
aproximadamente 0.50.
Las definiciones anteriores son netamente empíricas o experimentales, sin embargo después de
establecer una forma de determinar la probabilidad experimentalmente, se pueden deducir leyes o
propiedades de la probabilidad en forma lógica o computacional bajo ciertas suposiciones llamados
axiomas de la probabilidad.
La probabilidad de un evento A se define como el número P(A), tal que cumple con los siguientes
axiomas:
AXIOMA 1: La probabilidad P(A) de cualquier evento no debe ser menor que cero ni mayor que
uno: 0 < P(A) < 1
AXIOMA 2: P(S) = 1
Toda la teoría elemental de la probabilidad está construida sobre las bases de estos tres simples
axiomas.
AXIOMA 4: Si A1, A2, … son eventos mutuamente exclusivos, entonces tenemos que
2 Axioma del Par. Si y son dos objetos, es decir, objetos primitivos o conjuntos, la colección
5 Axioma del Infinito La colección que tiene por elementos a los números naturales es
un conjunto al que denotamos .
6 Axioma de Reemplazo. Si es un conjunto y para cada elemento de se tiene un
conjunto , la colección que tiene por elementos a los conjuntos para toda en es un
A los conjuntos construidos de esta manera los llamamos familias de conjuntos y al conjunto lo
llamamos el conjunto de índices de la familia.
Observa que dos conjuntos son iguales si y sólo si como colecciones son iguales, es decir, si y sólo si
tienen los mismos elementos.
Definición 1 Si y son dos conjuntos, decimos que está contenido en y
En particular, dos conjuntos y son iguales si y sólo si está contenido en y está
contenido en .
4. Espacios, experimentos y eventos: experimentos determinísticos y aleatorios, espacio
muestral, eventos mutuamente excluyentes y complementarios, Álgebra de eventos,
Espacio de probabilidad.
En general, un evento es un fenómeno aleatorio, es decir, aquel cuyo resultado depende del azar. En
la práctica si bien un evento puede denotar un conjunto total de resultados de experimentos, para
cual se utiliza la notación de conjuntos denominándolo por una letra mayúscula, en ocasiones denota
también un solo resultado de un fenómeno o experimento, es decir, un elemento de un conjunto.
Regla de la suma: si un
evento puede ocurrir de m
formas distintas y otro
puede ocurrir de n formas
distintas, existen entonces
m+n distintas formas en las
que los dos eventos pueden
ocurrir.
Regla del producto: si un
evento puede ocurrir de m formas diferentes y otro puede ocurrir de n formas distintas,
existen entonces m x n distintas formas en las que los dos eventos pueden ocurrir.
Ejemplo. Se dispone de una urna que contiene esferas grabadas con alguna letra de acuerdo a lo
siguiente:
Puede percibirse que en el primer experimento no hay relación alguna entre los alfabetos, ya
que no importa a cuál de ellos pertenece la letra grabada en la esfera; es decir, no hay dependencia
entre el evento A y B.
Por otra parte, en el segundo experimento si hay una relación directa entre los posibles
resultados, ya que deben ser las letras de cada una de las dos esferas de alfabetos diferentes.
COROLARIO: