Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1
Parámetro. Es una medición numérica que describe algunas carac-
terı́sticas de una población.
2
1.3 Escala de medición
3
2 Resumen de datos
2.1 Distribución de Frecuencias
4
3. Punto de partida: Comience por elegir un número para el lı́mte infe-
rior de la primera clase. Elija el valor del dato más bajo o un valor
conveniente que sea un poco más pequeño.
4. Usando el lı́mite inferior de la primera clase y la anchura de clase,
proceda a listar los demás lı́mites de clases inferiores. (Sume la anchura
de clase al punto de partida para obtener el segundo lı́mite de clase
inferior y ası́ sucesivamente). Luego proceda a determinar los lı́mites
superiores.
5. Determine la frecuencia de cada clase.
2.5 Histogramas
5
El procedimiento para construir un polı́gono de frecuencias consiste en
determinar cada punto medio de clase y luego se marca en la base superior
de cada rectángulo.
Ejemplo. Los datos siguientes corresponden a las puntuaciones del coe-
ficiente de inteligencia de 70 personas tomadas al azar. Considerando una
anchura de clase igual 10
102 135 105 82 114 126 93 107 128 123 91 116 133 100
151 51 104 101 118 123 98 90 67 112 107 123 121 115
93 73 116 105 107 118 153 109 78 98 104 140 117 147
121 89 95 98 143 114 118 123 102 89 83 135 101 120
84 76 158 78 136 107 105 100 97 95 102 85 94 89
1. Contruya una distribución de frecuencias.
2. Contruya una distribución de frecuencias relativas.
3. Contruya una distribución de frecuencias porcentual.
4. Contruya una distribución de frecuencias acumuladas.
5. Contruya una distribución de frecuencias acumuladas porcentual.
6. Interprete la frecuencia simple de la 3ra. clase.
7. Interprete la frecuencia acumulada de la 4ta. clase.
8. Interprete la frecuencia acumulada porcentual de la 5ta. clase.
9. Construya un histograma y un polı́gono de frecuencias.
3 Presentación de datos
Existen tres formas diferentes de presentar los datos estadı́sticos, que son
6
1. Escrita
2. Tabular
3. Gráfica
Un cuadro estadı́stico consta de varias partes, las principales son las sigu-
ientes:
1. Tı́tulo
2. Encabezados
3. Cuerpo del cuadro
4. Fuente
5. Notas al pies
Tı́tulo
Es la parte más importante del cuadro y sirve para describir todo el con-
tenido de éste. Un tı́tulo completo y correcto siempre debe responder las
preguntas ¿qué?, ¿cómo?, ¿dónde? y ¿cuándo?.
7
Ejemplo.
Alumnos matriculados del sector público segun nivel, año lectivo 1999-
2000.
Encabezados
Son los diferentes subtı́tulos que se colocan en en parte superior de cada
columna.
Columna matriz
Es la columna principal del cuadro. Se encuentra al lado izquierdo del
cuadro y se coloca en ella la variable principal bajo estudio.
Cuerpo
Contiene todas las informaciones numéricas que aparecen en la tabla.
Fuente
Indica la procedencia de los datos. Si las informaciones fueron recopiladas
y presentadas por la misma persona o intitución no es necesario señalar la
fuente.
Notas al pie
Las notas al pie son usadas para hacer algunas aclaraciones sobre aspectos
que aparecen en la tabla y que no han sido explicados en otra parte.
Una gráfica podemos definirla como una expresión artı́stica usada para
representar un conjunto de datos.
De acuerdo al tipo de variable que vamos a presentar, los gráficos mas
usados son los siguientes:
1. De barra
2. Lineal
8
3. Circular
Gráfico de barras
Es un conjunto de rectángulos o barras separadas una de otra, en razón
de que se usa para representar variables discretas. La altura de cada barra
depende de la frecuencia de clase.
Gráfico lineal
Son usadas principalmente para representar datos clasificados por cantidad
o tiempo, es decir, se usan para representar series de tiempo o cronológica.
Gráfico Circular
Media aritmética
Es la medida de tendencia central o promedio más conocida y más ampli-
amente usada.
Se define como el cociente que se obtiene al dividir la suma de los valores
de la variable entre el total de las observaciones.
Para una variable X, se denota po X̄ en el caso de una muestra y por µ en
el caso de una población y se determina mediante la fórmula
∑
xi
X̄ =
n
Ejemplo. Determine la media en el siguiente conjunto de datos: 67, 45,
52, 67.
9
Media ponderada
la media ponderada para un conjunto de datos se determina mediante la
fórmula ∑
XW
X¯w = ∑
W
Ejemplo. Determine el ı́ndice académico de un estudiante con 78 en una
asignatura de 5 créditos, 80 en una asignatura de 4
créditos y 85 en una asignatura de 3 créditos
datos: 67, 45, 52, 67.
Mediana
La mediana es la observación de la mitad después que se colocan los datos
en una serie ordenada.
10
Percentiles
Un percentil aporta información acerca de la dispersión de los datos en el
intervalo que va del menor a mayor valor de los datos.
11
a) Q1 = primer cuartil o percentil 25.
b) Q2 = segundo cuartil o percentil 50.
c) Q3 = tercer cuartil o percentil 75.
Nos indican qué tan dispersos se encuentra un conjunto de datos . Las más
usadas son:
12
Desviación estándar. se define como la raiz cuadrada positiva de la
varianza. √
Desviación estándar muestral = s = s2
√
Desviación estándar poblacional = σ = σ2
Media aritmética.
la media aritmética a partir de datos agrupados se determina mediante la
fórmula
∑
fi xi
X=
n
donde fi es la frecuencia de clase y xi es la marca de clase.
13
La moda se hallará en la clase que contenga la frecuencia más alta, lla-
mada clase modal. se determina mediante la fórmula:
Da
M oda = Lmo + [ ]C
Db + Da
donde
Lmo es el lı́mite inferior de la clase modal.
Da es la diferencia entre la frecuencia de la clase modal y la frecuencia de
la clase que le antecede.
Db es la diferencia entre la frecuencia de la clase modal y la frecuencia de
la clase que le sigue.
C es la anchura de la clase modal.
Experimento
14
En el sentido usual del término, un experimento es un procedimiento u
operación que puede dar lugar a distintos resultados, todos ellos previa-
mente identificables. Un ejemplo de un experimento puede ser lanzar una
moneda para observar si cae cara o escudo. Otro ejemplo es averiguar cuál
entre varios métodos de aprendizaje es el mas efectivo o aplicar un examen
final a un estudiante y observar la puntuación.
Espacio muestral
S = {1, 2, 3, 4, 5, 6}.
Evento o suceso
15
3. Si A es un evento, Ā es el evento que ocurre si y sólo si A no ocurre.
El evento Ā se llama evento complementario de A.
Definición. Dos eventos A y B, son mutuamente excluyentes si no
pueden ocurrir juntos. Expresamos esto escribiendo A ∩ B = ∅.
NE
P (E) =
N
Probabilidad según el concepto de frecuencia relativa
Consideremos un evento E que se produce en n repeticiones o ensayos de
algún experimento. De acuerdo con el concepto de frecuencia relativa de
ocurrencia, la probabilidad del evento E, P (E), es igual a la frecuencia
relativa de ocurrencia del evento E cuando n es grande. Si nE es el número
de veces que ocurre el evento E en n ensayos de un experimento, podemos
estimar P (E) mediante la expresión
nE
P (E) =
n
Regla de la suma
16
Si A y B son eventos entonces la probabilidad de que ocurra A o B o
ambos es
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
Ejemplo 1. Suponga que hay un grupo de 500 profesionales recién grad-
uados de los cuales 175 se especializaron en educación, 150 en comercio,
100 en derecho y 75 en ciencias de la salud. Suponga también que se elige
alzar una persona de este grupo. ¿Cuál es la probabilidad de que la per-
sona elegida se haya especializado en educación o en comercio?
17
La notacion Rx será utilizada para designar la imagen de una variable
aleatoria X; es decir, Rx es el conjunto de todos aquellos números asig-
nados por X a un espacio muestral S. Se hará referencia a Rx como el
recorrido de X.
Rx = {1, 2, 3, 4, 5, 6}
Ahora supongamos que la variable Y asigna a cada punto (a,b) la suma de
sus números, es decir, Y(a,b) = a + b. Por ejemplo, Y(1,1) = 2, Y(3,4) =
7, Y(6,3) = 9, Y(6,6) = 12. Entonces Y es una variable aleatoria discreta
donde cualquier número entre 2 y 12 puede ocurrir y ningun otro número
puede ocurrir. Por tanto el recorrido de Y es
18
Ry = {2, 3, 4, 5, ..., 12}
Distribución de probabilidad discreta
Cualquier regla o mecanismo que sirva para determinar P (X = x), proba-
bilidad de que la variable aleatoria X tome cada uno de los valores posibles
x, se denomina una distribución de probabilidad. Esta regla o mecanismo
puede ser una tabla, un gráfico o una fórmula.
Una fórmula que se emplee para calcular P (X = x) se denomina función
de probabilidad y generalmente se denota por f(x). Esta función satisface
las siguientes propiedades:
1. f (xk ) ≥ 0
∑
2. nk=1 f (xk ) = 1
19
Teorema. Si X es una variable aleatoria discreta con función de proba-
bilidad P(X) y media E(X) = µ; entonces
Edad Frecuencia
6 40
7 42
8 50
9 35
10 38
11 45
1. Sea X la variable aleatoria que indica la edad de un estudiante. De-
termine la distribución de probabilidad de X.
2. ¿ Cuál es la probabilidad de que un estudiante elegido al azar tenga 9
años?
3. ¿ Cuál es la probabilidad de que un estudiante elegido al azar tenga
más de 10 años?
4. Determine el la edad esperada, la varianza y la desviación estándar.
20
las variables aleatorias discretas la función de probabilidad f(x) da la prob-
abilidad de que la variable aleatoria tome un valor determinado. En las
variables aleatorias continuas, la contraparte de la función de probabili-
dad es la función de densidad de probabilidad, que también se denota por
f(x). La diferencia está en que la función de densidad de probabilidad no
da probabilidades directamente, si no que el área bajo la curva de f(x)
que corresponde a un intervalo determinado proporciona la probabilidad
de que la variable aleatoria tome uno de los valores de este intervalo.
1. El área total comprendida bajo la curva y por encima del eje horizontal
es igual a 1.
21
2. La distribución es simétrica respecto a la media. es decir , el 50% del
área está a la derecha de la media y el 50% restante a la izquierda.
3. la media, la moda y la mediana coinciden.
4. La desviación estándar determina qué tan plana y ancha es la curva
normal.
5. Los porcentajes de los valores que se encuentran en algunos intervalos
comúnmente usados son:
(a) 68.3 % de los valores de una variable aleatoria normal se encuentran
más o menos a una desviación estándar de la media.
(b) 94.5 % de los valores de una variable aleatoria normal se encuentran
más o menos a dos desviaciones estándar de la media.
(c) 99.7 % de los valores de una variable aleatoria normal se encuentran
más o menos a tres desviaciones estándar de la media.
1. P (−1.78 ≤ Z ≤ 1.52)
22
2. P (Z > 1.76)
3. P (Z < 1.5)
Si la variable aleatoria normal no está estandarizada, para calcular prob-
abilidades hay que estandarizar la variable utilizando la siguiente fórmula
de conversion
x−µ
z=
σ
Ejemplo. Los CI de los individuos que componen una determinada
población, tienen aproximadamente una distribución normal, con una me-
dia de 100 y una desviación tı́pica de 10.
1. Hallar la proporción de individuos con CI mayores 125.
2. ¿Cuál es la probabilidad de que un individuo elegido al azar entre los
de esa población tenga un CI entre 105 y 115?
3. Hallar P (X < 80)
10 Distribuciones muestrales
Gran parte de los conocimientos que tenemos sobre las poblaciones se basan
en la información contenida en las muestras que se sacan de dicha pobla-
ciones. Cuando una firma encuestadora desea saber el nivel de simpatı́a
que tiene un partido polı́tico en la población de votantes, no entrevista a
toda la población de votantes, sólo entrevista a una muestra. Una investi-
gación educativa puede estar interesada en el rendimiento académico de la
población estudiantil en un distrito educativo. Dado que la población de
estudiante puede resultar muy grande sólo se investiga una muestra.
23
una muestra se denomian estadı́sticos. Cuando se calculan con datos pobla-
cionales, se denominan parámetros. Una de las principales preocupaciones
de los investigadores y de las personas encargadas de tomar decisiones, con-
siste en ser capaces de tomar decisiones sobre esos parámetros, que general-
mente no se conocen, tomando como fundamento información relacionada
con estadı́sticos calculados sobre muestras sacadas de las poblaciones. Esta
clase de procedimiento recibe el nombre de inferencia estadı́stica.
1.
σ2 N − n
σx2 = ( )
n N −1
24
σ2
σx2 =
n
√ √
p(1 − p) N − n
σpb =
n N −1
Si la población es infinita, entonces
√
p(1 − p)
σpb =
n
Esta fórmula también se usa cuando la población es finita y el tamaño
de la muestra es menor o igual que el 5% de la población.
25
posible de tamaño n tenga la misma probabilidad de ser seleccionada.
Realice lo siguiente:
26
10.2 Teorema del lı́mite central
(a) np ≥ 5
(b) n(1 − p) ≥ 5
27
La estimación es un conjunto de técnicas que permiten dar un valor
aproximado de un parḿetro de una poblacin a partir de los datos pro-
porcionados por una muestra.
Hay por lo menos dos tipos de estimadores que se utilizan más comúnmente:
Un estimador puntual y un estimador por intervalo. Un estimador pun-
tual utiliza un estadı́stico para estimar el parámetro en un sólo valor o
punto. Un estimador por intervalo especifica el rango dentro del cual
está el parámetro desconocido. Tal intervalo va acompañado (general-
mente) de una afirmación sobre el nivel de confianza que se da en su
exactitud. Por tanto se llama intervalo de confianza.
El error de muestreo es el valor absoluto de la diferencia entre un es-
tadı́stico y el parámetro correspondiente.
Hay tres niveles de confianza que se usan con mayor frecuencia: 90%,
95% y 99%.
Las estimaciones por intervalos gozan de ciertas ventajas sobre las es-
timaciones puntuales. Debido al error de muestreo, probablemente X
no será igual a µ, sin embargo, no hay manera de saber qué tan grande
es el error de muestreo, por tanto los intervalos de confianza se utilizan
para explicar esa discrepancia desconocida.
28
11.1 Intervalo de confianza para la media poblacional, muestras grandes
(n ≥ 30)
z2σ2
n=
E2
29
N z 2σ2
n= 2 2
z σ + E 2 (N − 1)
30
donde Z está asociado al nivel de confianza y pb es la proporción mues-
tral.
√ √
pb(1 − pb) N −n
pb ± Z
n N −1
Ejemplo. En un estudio sobre las razones que dan los alumnos sus-
pendidos en la escuela, un investigador tomó una muestra de 200 estu-
diantes suspendidos que fueron entrevistados, 140 dijeron que habı́an
fallado debido a dificultades económicas en su familia. El investigador
querı́a construir un intervalo de confianza del 95% para la verdadera
proporción de jóvenes que habı́an fallado por esta razón.
Z 2 pq
n=
E2
donde Z está asociado al nivel de confianza , E es el margen de error,
p es la proporción de la población que tiene la caracterı́stica de interés
y q es la proporción de la población que no tiene la caracterı́stica de
interés.
31
Cuando el muestreo se realiza en una población finita, entonces la
fórmula para el tamaño de la muestra es
N pqZ 2
n=
(N − 1)E 2 + Z 2 pq
N pqZ 2
n=
(N − 1)E 2 + Z 2 pq
(1000)(0.70)(0.30)(2.58)2
= = 359
(1000 − 1)(0.05)2 + (2.58)2 (0.70)(0.30)
32