Está en la página 1de 4

Resumen 1er parcial estadística clase 1 a 4

La estadística no debe estudiarse aislada sino ligada a los procesos científicos en


constante investigación, ella establece vínculos interdisciplinarios, es 1 forma de tratar y
pensar cierta problemática q la realidad plantea de una forma más elaborada y exacta, su
aplicación se basa en la posibilidad de observaciones repetidas. La estadística no es 1
ciencia, son los métodos científicos q usamos para recolectar, org, representar, resumir y
analizar datos numéricos relativos a un conjunto de S y dejan extraer conclusiones validas
y efectuar decisiones lógicas en base a ello. Son datos cuantitativos influidos x 1 multitud
de causas. Es todo lo q desarrollamos, son técnicas q se aplican de igual forma en
todo el mundo, 1 conjunto de técnicas probadas destinadas a investigar grandes
grupos. La investigación es lo q motiva el uso de técnicas. Tengo q saber q quiero saber
y sobre quien para usar las herramientas adecuadas.

Dato se conforma x 3 elementos, unidad; variable; valor, en conjunto con las relaciones
que mantienen entre sí. Sea cual sea el O de estudio, si queremos sostener cualq
proposición empírica acerca de él, se lo debe concebir en términos de esa estructura. Un
dato es el producto de un procedimiento de medición, y medir supone predicar una prop
Una unidad de análisis es un sist definido x presentar determinadas prop, constantes (las
que definen su pertenencia a un universo compuesto por todos los sist q presentan esas
mismas prop) o variables (las q son materia de investigación dentro de ese universo). Una
variable es un conjunto estructurado de valores.

Las técnicas estadísticas solo se usan si la investigación se dirige a 1 n° grande de S


(unidad de análisis, UA) q conforman 1 muestra (n° conocido de casos), la crac q
queremos analizar sobre ella se llama variable (recogen un dato q puede ser 1 n°;
cuantitativa (si el n° es acotado se llama discreto, n° de hijos; años de educación
completos; goles; n° redondos no con coma hay separación total entre un valor y otro,
pero siempre están ordenados y puedo contar sus elementos. Pero si es intermedio
continua, edad; talla; peso, estas variables no se cuentan se miden, alguien q tiene 0 años
no esta muerto, tiene tantos meses, pueden tener cualq valor en un ámbito infinito de
valores continuos) o palabras/atributos; (cualitativa, estas clasifican), se representa con
una “X”, el dato es su valor y determina su tipo. Todas las UA juntas hacen la población
(puede ser finita o infinita) (todas son pasibles a tener esta carac), mientras q la muestra
es + chica (es de 30 como mínimo pero puede ser -) pero debe ser representativa del
total. La est resume de forma adecuada lo q pasa en 1 muestra. Si estudiamos las carac
de un grupo peso talla etc es estadística descriptiva, pero si inferimos a partir de los
resultados y sacamos conclusiones es una estadística inductiva o inferencial.

La medición no es asignar n° a 1 O, es la asignación de n° para representar las prop de


los sist materiales en virtud de leyes q gobiernan estas prop x ej 1 arbol no es medible, se
mide su altura, peso, etc, implica una relación de isomorfismo; equivalencia de formas,
relación entre la estructura lógica del sist numérico y la estructura de la nat q se
manifiesta en las prop q se miden, pero para poder aplicar un modelo matematico a las
prop de la nat hay q seguir 3 requisitos, orden (menor a mayor); distancia (dif entre los n°
están ordenadas caulq dif entre un par de n° es igual menor o mayor q la dif entre otro

1
par); origen (serie tiene 1 origen llamado 0 lo imp es la dif con respecto a el). “Cuando
medimos algo, bien sea en el campo de la física, de la biología o de las ciencias sociales,
esa medición contiene una cierta cantidad de error aleatorio”.

La est. tiene 2 tareas describir e inferir (comprobar hipótesis o estimar parámetros). Lo


q se quiere analizar pasa x azar y dsp se repite. Las medidas de la muestra son datos
estadísticos y los de la pob parámetro. La probabilidad (P) es 1 valor n° q indica la
posibilidad de q pase algo va de 0 a 1 y dsp se cambia a %. La fuente del texto va al final
del cuadro y se pone los datos fueron obtenidos… al final se pone entre () el n° de casos.

No puede elegirse cualq grafico esta determinado x la variable para las cualitativas y las
cuantitavas discretas se usa: sectorial (torta), pictograma (grafico de barras pero con
dibujo q representa el dato ej arboles), o barras separadas. En cambio para las variables
cuantitativas continuas (tiempo, edad, etc) se usa: polígono de frecuencia (puntos
unidos con 1 línea x e y, toma los puntos medios y los une) o histograma de pearson
(barras juntas) pero los 2 son 2 formas de representar la misma realidad.

Hay 4 niveles de medición: intervalar (ej test, siempre es continuo nota de examen 4 5 6,
requiere q se establezca algún tipo de unidad de medida q pueda ser considerado x todos
como 1 norma común y q se repita, q se aplique a los mismos O dando los mismos
resultados), racional/cocientes (aprobar o no), ordinal (cualidades, notas de examen
insuficiente regular bien, diagnostico; cualidades de la realidad q deja 1 ordenamiento,
posible afirmar si una unidad de análisis posee en mayor, igual o menor grado q otra la
prop q se mide), nominal (clasificación, agrupamiento de unidades basándose en sus
similitudes y diferencias, nivel + bajo de medición, y q es 1 condición nec q debe
satisfacer los niveles + altos, sexo, estado civil, nacionalidad, religión, etc). Las medidas
estadísticas se usan para describir, son 4 tendencia central, variabilidad, curtosis y
asimetría. 1 razón siempre es división pone en relación un valor de la variable con otro es
un cociente entre 2 valores de la variable. Intervalar y racional clasifican la realidad.

El índice es 1 indicador q toma todas las dimensiones de 1 misma variable. Toma


distintas subvariables, incorpora muchas mediciones de 1 misma variable. No hay q
redondear, usar los 2 decimales, hay q poner titulo, grafico y nota de pie (info del grafico).
La frecuencia es la cantidad de veces que cada valor de la variable aparece. Se
denomina razón a todo índice obtenido al dividir dos cant, ninguno o algunos elementos
del numerador están incluidos en el denominador. El objetivo principal de cualquier grafico
es la comunicación. La tasa es una medida que también expresa el número de eventos
ocurridos en una población determinada. Pero son medidas de frecuencia en las que una
medida de tiempo es parte intrínseca del denominador.

Las medidas son decir q pasa con un n° representativo, hay 4 tipos: tendencia central (la
mayoría tiende a concentrarse en el centro, c/u de las variables con q frecuencia se
presenta, MTC, están vinculadas con el tipo y el nivel de medición de la variable y la
asimetría de la distribución de la variable. Sirven para describir los gráficos. Dan info de q
pasa con los datos recogidos), medidas de variación (los valores se separan del centro, la
variación es mayor), asimetría (variables continuas, forma q adquiere el grafico todo se

2
concentra en el medio, en cambio en la simetría es una escalera de izq a derecha es
positiva valores altos y de derecha a izq neg valores bajos) curtosis (altura o aplanamiento
del polígono de frecuencia curva puntiaguda o chata da la forma de la curva).

El modo (MO) es el valor de la variable q se repite, aparece con + frecuencia. Su


interpretación es lo q aparece con mas frecuencia es… se mira un solo valor de la
variable y con ello obtenemos su valor, se usa en variables cualitativas de nivel nominal,
en ellas es lo único q puedo hacer y se puede usar en todas las demás pero es una info
restringida, es la única medida de tendencia central q se puede aplicar en el nivel
nominal., es el valor q mas se repite (parte de la MTC)

El promedio/media (M) aritmética es el valor de la X q resulta de promediar todas las


variables. Solo se hace con variables continuas, tiene 2 niveles de medición: intervalar y
racional. La distribución debe ser simétrica y hay q conocer todos los valores de la X. Se
los suma y se los divide x la cant de casos. (parte de la MTC)

La mediana (MD) (es apropiada en casos en q la media falla) es para todo tipo de
variable cualti o cuanti; no imp si es continua o discreta, pero el nivel de medición no
puede ser nunca nominal, solo intervalar y ordinal. Puede ser cualq asimetría y puedo o
no conocer todos los datos de la X. 1ro se busca la mediana sino la media y sino el modo.
1ro hay q ordenar los datos, dsp encontrar el lugar de la mediana y x ultimo, encontrar el
valor de la mediana (deja x debajo al 50 % de los casos), toma la mitad. Cndo es – de 30
se le suma 1 y en todos los casos se divide x 2. Se hace x ej una fila de – edad a + edad o
viceversa, pero deben estar ordenados, dsp hay q buscar el lugar del medio (mediana de
orden). Los niveles de medición, si hay n° es intervalar continua o racional, para descubrir
cual es hay q descubrir cuál es el 0 de origen, el intervalar es arbitrario y el racional es
real. Para q sea simétrica lo imp es q haya mucho en el medio (parte de la MTC)

Las medidas de variabilidad acompañan a las MTC, indican su variación. La variabilidad,


es la medida de la dispersión de los datos en función del dato de la MDT. El desvio
estándar (S) solo se aplica a variables continuas para la mediana se usa la desviación
semiterquartil (Q) se promedian todas las distancias a la media. La desviación Q es lo
mismo q la S pero se trabaja con la mitad de los casos centrales.

Las medidas de orden/no centrales, y las MTC hacen los valores de la X solo se usan en
variables continuas ind, posiciones relativas de un ind. respecto de su grupo, todos tienen
siempre la misma unidad de variable y se ordenan de forma creciente. Tiene 4 tipos:
mediana (se divide en 2 partes de 50 %), cuantible (4 partes de 25 %), decible (10
partes de 10% c/u, se hacen 9 calculos, el valor de X deja x debajo a determinado n° de
casos si estoy en el decil 3 y hay otro en el 4 el menor es el del 3) y perceptible (100
partes de 1 %, 99 cortes). Hay 1 percentil que coincide con algo, ej decil 5 de decible
coincide con el 1 del mediana. 1ro ordenar los valores de la X, 2 encontrar el lugar,
calcular el valor de la medida de orden y 3 ver el cuartil, lugar en q se está. Cndo 1 grupo
tiende a la variación es heterogéneo (valor alto es heterogéneo, bajo es homogéneo). Las
medidas de variabilidad dan el valor menor y el mayor. El rango deja obtener la amplitud

3
total, q nos va a decir cuantos valores posibles de variables hay. Toma el valor mayor y le
resta el menor, dsp se le suma 1. Asi se calcula Q

Medidas de posición (estas medidas constituyen los valores de la variable que


representan ciertas posiciones dentro de la distribución de los datos) 1) Medidas de
tendencia central (marcan las posiciones centrales de la distribución) a) Modo (Mo, valor
de la variable que más veces se repite, tiene la mayor F absoluta, tiene en cuenta
aquellos casos cuyo valor se repite más veces, sin importar que estos casos se
encuentren efectivamente en el centro de la distribución) b) Mediana (Md, es el valor de
aquel caso que divide a la distribución en dos partes iguales, solo ve un caso, aquél que
se halla en una posición tal que divide a la distribución en dos partes iguales. Los casos
que se encuentran en los extremos no tienen ninguna influencia sobre ella) c) Media
aritmética (M, la sumatoria de los valores de todos los casos, dividido por la cantidad de
casos, contempla absolutamente todos los casos, ya que debo sumar todos sus valores).
2) Medidas de orden (son aquellas medidas que marcan las posiciones no centrales.
Surgen de dividir a la distribución en determinado número de partes, cada una con la
misma cantidad de observaciones) a) Cuartiles (C, los tres valores de la variable que
dividen a la distribución en cuatro partes, cada una de las cuales contiene al 25% de las
observaciones. Así, el Cuartil 1 (C1) será el valor de la variable que deje por debajo al
25% de los casos, C2 será aquel que supere al 50% de los mismos (coincidiendo de esta
manera con la Mediana) y C3 será el que supere al 75% de las observaciones) b) Deciles
(D, son nueve, y surgen de dividir a la distribución en 10 partes iguales, cada una con el
10% de las observaciones. El Decil 1 (D1) superará al 10% de los casos, D2 superará al
20% y así sucesivamente) c) Percentiles (P, son 99, y dividen a la distribución en 100
partes con el 1% de las observaciones cada una).

Medidas de variabilidad (indican cómo varían los valores u observaciones en relación a


la Medida de Tendencia Central que hemos hallado previamente, qué tanto se alejan o
aproximan a la misma) 1) Amplitud total (At, su cálculo es muy sencillo ya que se trata de
la diferencia entre el valor mayor y el valor menor de la distribución) 2) Desviación semi-
intercuartil (Q, se trata de la mitad de la distancia que hay entre los Cuartiles 1 y 3, Esta
medida ya no considera los valores extremos, sino que tiene en cuenta sólo aquellos dos
valores que delimitan el 50% central de los casos de la distribución, lo cual puede ser una
ventaja) Desviación estándar (S, nos dice cuánto se alejan, en promedio, todas las
observaciones de la distribución con respecto a la Media Aritmética).

También podría gustarte