Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ANDREA Estadistica 1.2
ANDREA Estadistica 1.2
Código. 66.775.994
TUTORA
ASTRID SEGURA
Grupo
Grupo: 204040_117
Programa Psicología
INTRODUCCIÓN
JUSTIFICACIÓN
OBJETIVOS
CONCLUSIONES
Media:
Utilice la media para describir un conjunto entero de observaciones con un solo
valor que representa el centro de los datos. Muchos análisis estadísticos utilizan la
media como un punto de referencia estándar. La media es la suma de todas las
observaciones dividida entre el número de observaciones.
Mediana:
Utilice la mediana para describir un conjunto entero de observaciones con un solo
valor que representa el centro de los datos. La mitad de las observaciones está
por encima de la mediana y la otra mitad está por debajo de ésta.
Moda:
La moda es el valor que ocurre con más frecuencia en un conjunto de
observaciones. también muestra cuántos puntos de los datos son iguales a la
moda. La moda se puede utilizar con la media y la mediana para proporcionar una
caracterización general de la distribución de los datos.
Variable Continua:
Puede tomar un valor fijo dentro de un intervalo determinado. Y siempre entre dos
valores observables va a existir un tercer valor intermedio que también podría
tomar la variable continua.
CONCLUSIONES
a) Población, o conjunto de todos los elementos cuyo estudio nos interesa. Si se dispone de datos
de una o más variables sobre la población completa, o se puede acceder a ellos, la Estadística
tendrá como misión que la recogida sea adecuada, se ordenen, se estructuren y se resuman dichos
datos para su mejor comprensión, es decir, que se describan. Ello nos llevará a hablar de
Estadística Descriptiva. Por ejemplo, el conjunto de los varones mayores de 65 años y residentes
en una provincia sería una población.
b) Muestra, o conjunto de elementos de los que efectivamente se dispone de datos, y que es una
parte (a menudo pequeña) de la población. Cuando no se puede acceder a los datos de toda la
población, que es lo más frecuente, y se debe trabajar con sólo los de la muestra, a la simple
descripción de los datos se añade el interés por valorar hasta qué punto los resultados de la
muestra son extrapolables o generalizables a la población; en consecuencia, será necesario utilizar
no sólo las técnicas de la Estadística Descriptiva, siempre obligadas en todo caso para la
comprensión de los resultados, sino también otras que permiten inferir afirmaciones sobre la
población a partir de los datos de la muestra y que constituyen la Estadística Inferencial o
Inferencia Estadística. Por ejemplo, el grupo de los varones mayores de 65 años y residentes en
una provincia que son usuarios de bibliotecas públicas sería una muestra de la población citada en
el párrafo anterior (otra cosa es que la muestra fuese o no representativa del conjunto de tal
población.
2. TIPOS DE VARIABLES.
Lo que se estudia en una muestra o población es una serie de variables en cada individuo o
elemento.
a) LAS VARIABLES CUALITATIVAS ORDINALES, que son las que teniendo más de dos modalidades tienen
establecido un orden natural entre las mismas, de forma que sus modalidades se enuncian
siguiendo una cierta ordenación ascendente o descendente y no de otra manera. Por ejemplo, la
variable “gravedad del pronóstico de lesiones traumáticas” podría tener como orden natural entre
sus modalidades “leve”, “moderado”, “grave”, etc., pero nunca diríamos “grave”, “leve”,
“moderado”, etc. en este orden.
* LAS VARIABLES CUALITATIVAS PURAS, que no tienen un orden natural preestablecido entre sus
modalidades, y podemos utilizar cualquier ordenación para ellas, como por ejemplo el grupo
sanguíneo o la nacionalidad de una persona .
* LAS VARIABLES DICOTOMICAS, que tienen sólo dos modalidades posibles, y en las que ni
siquiera tiene sentido plantearse si son o no ordinales; El hecho de tener sólo dos modalidades les
confiere características especiales. Cabe citar como ejemplos el ya citado del sexo, el pertenecer o
no a una asociación, o en general cualquier situación que sólo admita una respuesta “sí o no”.
*VARIABLES CUANTITATIVAS O NUMERICAS, que son aquellas que necesitan números para ser
expresadas, como la edad de alguien o el número de páginas de un libro.
*LAS VARIABLES CUANTITATIVAS DISCRETAS, cuyos valores son aislados (habitualmente números
enteros), de forma que pueden enumerarse y existen valores “consecutivos” entre los que no
puede haber otro; Por ejemplo, un resumen puede tener 349 ó 350.
*las variables cuantitativas CONTINUAS, que pueden tomar cualquier valor numérico, entero o
decimal, de forma que teóricamente entre dos valores posibles siempre se pueden encontrar
otros (entre 65.3 Kg. y 65.4 Kg. de peso siempre está 65.37 Kg., por ejemplo), aunque en la
práctica el número de cifras decimales está limitado y la variable se maneja en cierto modo como
discreta
- Frecuencia absoluta es el número de veces que una modalidad o un valor de una variable
aparece entre los datos de una muestra. Las frecuencias absolutas y relativas son aplicables a
cualquier tipo de variable, y de ahí su importancia; además, pese a su simplicidad, dan lugar a
conceptos muy importantes, como el de proporción, y son la base sobre la que se construye
cualquier resumen de los datos.
LA MODA: es el valor de la variable que tiene mayor frecuencia en la muestra, es decir, el que se
repite más (moda se asocia con lo más frecuente).
La MEDIANA: es el valor que está en el centro de la distribución, es decir, el valor que supera a la
mitad de los de la muestra y se ve superado por la otra mitad (salvo empates en ambos casos); se
calcula buscando el valor de la muestra que ocupa el lugar (n+1)/2, con los datos ordenados.
La VARIANZA: es la media aritmética de los cuadrados de las desviaciones, por lo que se calcula
elevando al cuadrado cada desviación, sumando esos cuadrados y dividiendo entre n; en nuestro
ejemplo resulta 58 la suma de cuadrados de las desviaciones, con lo que la varianza es 58/13 =
4.46 ; el cuadrado es matemáticamente mucho más manejable que el valor absoluto, lo que hace
de la varianza la reina de los parámetros de dispersión desde un punto de vista teórico. Sin
embargo, el hecho de que carezca de interpretación intuitiva y que sus unidades sean cuadradas
(¿hermanos cuadrados?) hace que es la práctica se use mucho más su raíz cuadrada, la
DESVIACION STANDARD o DESVIACION TIPICA, con mucho la más usada de las medidas de
dispersión, y que en nuestro ejemplo valdría 2.11, con lo que el informe más habitual para
nuestros datos daría una media de 2.00 y la desviación típica de 2.11 como parámetros más
informativos. Por motivos difíciles de explicar aquí, relacionados con cuestiones de inferencia
estadística, es más recomendable usar el denominador n-1 en lugar del n al calcular la varianza y
la desviación típica de una muestra, quedándose el n para el caso en que se conoce toda la
población; en nuestro ejemplo, pues, sería mejor calcular como varianza 58/12 = 4.83 y como
desviación standard su raíz cuadrada 2.20 (estos últimos serían la varianza muestral o
quasivarianza y la desviación típica muestral y serían los utilizados en la práctica, aunque la
definición teórica sea con denominador n por ser la varianza una "media"). A efectos
comparativos entre distintas muestras e incluso entre distintas variables, se define:
El COEFICIENTE DE VARIACION, que es el cociente, a menudo expresado en tanto por ciento,
entre la desviación típica y la media de una distribución. Es una especie de desviación típica
“relativa”, y en nuestro ejemplo valdría 2.2011/2.00 = 1.100055 ó bien 11005.05% (nótese que no
es un verdadero porcentaje, porque puede valer más del 100%); este resultado indicaría mucha
dispersión en los datos del ejemplo en relación con la media.
Los cuantiles completan el cuadro de los parámetros de una distribución. En cierto modo
pueden ser considerados como medidas de centralización (de hecho la mediana es uno de ellos) y
también como medidas de dispersión (algunas pueden construirse a partir de ellos) pero en
realidad son medidas de posición. Se define el cuantil p como aquel valor de la variable (que
puede estar o no en la muestra) que supera al p% de los datos de la muestra; resultan útiles sólo
cuando la muestra es numerosa y permiten saber en que “posición” se encuentra un valor dado
con respecto al conjunto de una muestra o población. Se definen entre los más importantes:
Los CUARTILES, que definen las cuartas partes de la muestra mediante tres “cortes”: el primer
cuartil deja por debajo al 25% de la distribución, el segundo coincide con la mediana y el tercero
deja por debajo al 75% de la distribución. No tienen mucho sentido en muestras pequeñas, pero
en nuestro ejemplo valdrían respectivamente 0, 1 y 3.5 (que están situados en las posiciones
“tercera y media”, séptima y “décima y media” de los datos ordenados).
Los DECILES, que dan nueve cortes para definir de diez en diez por ciento los valores de la
distribución; así, el primer decil deja por debajo una décima parte de la distribución, el segundo
dos décimas partes, etc., hasta nueve deciles.
Los PERCENTILES, que son como los deciles pero de uno en uno por ciento, y por tanto son
noventa y nueve; por ejemplo, el percentil 37 deja por debajo al 37% de la distribución, y está
claro que no tienen sentido en muestras tan pequeñas como la de nuestro ejemplo, ya que trece
elementos no se pueden “partir” en cien partes.
Todos los cuantiles son definibles sobre variables cuantitativas o sobre cualitativas
ordinales, porque requieren siempre que los datos estén ordenados.
Los cuantiles más próximos al percentil 50, como la propia mediana o los cercanos a ella, pueden
considerarse como parámetros de centralización y sin embargo los más lejanos al centro ayudan a
medir la dispersión; por ejemplo, si restamos el tercer cuartil menos el primero obtenemos el
RANGO INTERCUARTÍLICO, que es una medida de dispersión. Con el rango intercuartílico estamos
midiendo la extensión que nos cubre la mitad central de nuestros datos; recuérdese que el RANGO
era la extensión cubierta por toda la muestra ordenada (se define como máximo menos mínimo),
mientras que el RANGO INTERCUARTILICO es la extensión cubierta por la mitad central de los
datos ordenados, excluyendo la cuarta parte inicial (los que son inferiores al primer cuartil) y la
cuarta parte final (los que son superiores al tercer cuartil).
2.3. Caracterización de variables: a partir de la base de datos Calidad
en el servicio de urgencias 2018-16-4, la cual se encuentra en el
Entorno de aprendizaje colaborativo, cada estudiante debe elegir como
mínimo, una variable cualitativa distinta y caracterizarla; es decir:
Frecuencia Frecuencia
Frecuencia Frecuenci
Datos Absoluta porcentual
Absoluta a Relativa
Acumulada (%)
TOTAL
1. Asociación de conocimientos
Identifica:
- La Población.
- El tamaño de la muestra.
- Instrumento de Recolección de la información.
-La ubicación espacio temporal del estudio.
- La unidad estadística
2.Si se desea establecer una muestra representativa para estudiar el
problema de “Calidad en el servicio de urgencias” a través del
muestreo aleatorio simple, con un nivel de confianza del 95%, un error
estimado del 5% y una población de 950 pacientes, ¿cuál sería?
CUALITATIVAS CUANTITATIVAS
Nominales Ordinales Discretas Continuas
4. Operacionalización de variables
Portada
Introducción
Justificación
Objetivos
Evaluación Formativa:
Paso 2– organización y presentación, cada estudiante deberá enviar la solución de los tres
2.1 En una encuesta se preguntó a 100 ejecutivos cual creían que era el error más común de los
candidatos durante las entrevistas de trabajo. Los resultados fueron los siguientes:
Razón
Poco o malo conocimiento de la compañía 44
Sin preparación para discutir sus planes profesionales 23
Escaso entusiasmo 16
Falta de contacto visual 5
Sin preparación para discutir sus habilidades
/experiencias 3
Otras razones 9
Otras razones
Escaso entusiasmo
Razón
0 5 10 15 20 25 30 35 40 45
personal
45
40
35
30
25
20
15
10
5
0
Poco o malo Sin preparación Escaso Falta de Sin preparación Otras razones
conocimiento para discutir entusiasmo contacto visual para discutir
de la compañía sus planes sus habilidades
profesionales /experiencias
DIAGRAMA CIRCULAR
23%
La variable es :
Tipo de variable:
Conclusiones
Encuestados 100 ejecutivos: más frecuencia fue poco o mal conocimiento de la
compañía.
La variable más destacada en nuestra encuesta es el poco o malo conocimiento
que tienen los entrevistados sobre la empresa.
La segunda variable más común entre los encuestados es sin preparación para
discutir sus planes profesionales.
2.2 Siguió, como error más común, que los candidatos no estaban
2.2 .La siguiente tabla presenta el porcentaje de algodón en un material utilizado para
la fabricación de camisas para caballeros.
7 HISTOGRAMA DE FRECUENCIAS
6
4
HISTOGRAMA DE FRECUENCIAS
3
0
POLIGONO DE FRECUENCIAS
7
4
POLIGONO DE FRECUENCIAS
3
0
,1 ,7 ,1 ,6 ,1 ,5 ,9 ,2 ,5 ,8 ,3 ,8 ,6
32 32 33 33 34 34 34 35 35 35 36 36 37
VARIABLE FI FR FA MC
32,1 1 0,015625 1
32,5 1 0,015625 2
32.1-32.9
32,6 1 0,015625 3
32,5
32,7 1 0,015625 4
32,8 1 0,015625 5
32,9 1 0,015625 6
33,1 2 0,03125 8
33,4 1 9
33.1-33.8
0,015625
33,4
33,5 1 0,015625 10
33,6 5 0,078125 15
33,8 2 0,03125 17
34,0 1 0,015625 18
34,1 3 0,046875 21
34,2 2 0,03125 23
34,4
34.0-34.9
34,3 1 0,015625 24
34,5 2 0,03125 26
34,6 5 0,078125 31
34,7 6 0,09375 37
34,9 1 0,015625 38
35,0 2 40 35,4
35.0-
0,03125
35.9
35,1 3 0,046875 43
35,2 1 0,015625 44
35,3 1 0,015625 45
35,4 2 0,03125 47
35,5 1 0,015625 48
35,6 1 0,015625 49
35,7 1 0,015625 50
35,8 1 0,015625 51
35,9 1 0,015625 52
36,2 1 0,015625 53
36,3 1 54
36.2-36.8
0,015625
36,5
36,4 1 0,015625 55
36,6 1 0,015625 56
36,8 3 0,046875 59
37,1 1 0,015625 60
37,3 61
37.1-37.9
1 0,015625
37,5
37,6 1 0,015625 62
37,8 1 0,015625 63
37,9 1 0,015625 64
CONCLUSIONES
0 – 24 60
25 – 49 33
50 – 74 20
75 – 99 6
100 – 124 4
125 – 149 2
150 – 174 1
175 – 199 1
Total 127
poligono de frecuencia
140
120
100
80
60
Axis Title 40
20
0
l
4 9 4 9 4 9 4 9 ta
–2 –4 –7 –9 –1
2
–1
4
–1
7
–1
9 To
0 25 50 75 0 5 0 5
10 12 15 17
Axis Title
4
algodón camisetas
0
,1 ,7 ,1 ,5 ,8 ,1 ,3 ,6 ,9 ,1 ,3 ,5 ,7 ,9 ,3 ,6 ,1 ,6 ,9
3 2 3 2 3 3 3 3 3 3 34 34 34 34 3 5 3 5 3 5 3 5 3 5 3 6 3 6 3 7 37 37