Está en la página 1de 56

QUANTITATIVA

No hay cosas y fenómenos de tipo matemático y otros que no lo sean, si no que


siempre que expresemos una idea por medio de relaciones de orden entre sus
componentes, estaremos expresándola matemáticamente.

LAS RELACIONES DE ORDEN


El concepto de cuantidad i su diferencia con el concepto de cualidad.
- La calidad es aquella propiedad de las entidades que admite una gradación;
en definitiva, cualquier propiedad que permita una ordenación de las
entidades es una cantidad.
- La cantidad será el opuesto de aquellas propiedades (calidades) que no
admiten grados y que no generan ordenaciones.
MEDIR
Vol dir assignar números que ens expressin la intensitat o grau que ens indiqui la
propietat quantitativa.
- Llamaremos instrumento de medida, a un aparato, técnica u operar lógico
que implemente de algún modo la ordenación considerada de referencia. Los
problemas en Ciencias Sociales radican en los instrumentos de Medida, no
en las ordenaciones; y esos problemas pueden resolverse convirtiendo las
ordenaciones en funciones matemáticas y usándolas como si de un
instrumento se tratara.
- La actividad humana se puede medir. La arqueología teórica es la que se
debería encargar de desarrollar nuevos sistemas de medida.

MEDICIÓN DEL REGISTRO ARQUEOLÓGICO


- TAMAÑO
- FORMA
- TEXTURA
- MATERIALIDAD
- COMPOSICIÓN
- PROPIEDADES MECANICAS
- LOCALIZACIÓN
- ESPACIO
- TIEMPO
- la localización es una propiedad del objeto en relación con otros objetos mientras
que los otros son propiedades del objeto en sí.

¿Qué es el tamaño?
- Son las propiedades básicas cuantitativas
- longitud
- Diámetro
- Altura
- Volumen
- Masa (peso)
Es una propiedad de la arqueología el medir un objeto a través del dibujo, ahora
bien en la actualidad se tiende a lo contrario, se mide el objeto en 3D, no en 2D
(dibujo). En el caso de la cerámica es mucho más fácil esto ya que es un objeto
inerte mientras que los objetos líticos podríamos decir que están vivos, es decir, que
tienen una duración limitada a su uso.
Los objetos creados por una manufactura humana tienen a ser simétricos por una
cuestión de práctica. Porque con menos movimientos se crea un objeto eficiente.

¿Qué es la forma?
Todo tiene forma.
- Son las propiedades de una configuración de puntos invariantes al
tamaño, a la localización de las cosas y la localización del observador.
- Definición de forma según la rae: Configuración externa de algo.
- Aquello que da “unidad” a una entidad y nos permite distinguirla de su
contexto inmediato y de otras entidades.
- La forma es eso que no varía aunque el tamaño si lo haga.
- En el ámbito arqueológico el elemento estrella es el escáner, su uso debe
der ya prácticamente una herramienta imprescindible.
Superficie
- Formalmente hablando, una SUPERFICIE es un límite de separación
entre dos FASES.
- Una FASE es una masa de substancia homogénea (solido, liquido, gas)
que posee un límite bien definido.
- Cuando observamos dos fases …… (el gilipollas ha pasat de diapositiva)

CLASSE 2 JAVI
La idea a priori es veure com ordenem la materialitat.
Com organitzem els productes ceràmics? Què mesurem?
El que permet organitzar la materialitat es el procés de manufactura, la funcionalitat del
artefacte i la manufactura dels artefactes.

Quina acció social va causar (condicionar, influir, determinar) va causar aquesta materialitat
determinada?
- Manufactura
- Ús
- Distribució
- Manteniment
- amortització
Quina acció social es la causa de la mida, forma, composició, textura i localització?
El que veurem avui es el com podem saber coses del producte a partir de la mida,
forma, composició... sempre tenint em compte els processos pots deposicional i
l’acció de la investigació.
Quin és el grau d’afectació dels productes ceràmics? La fragmentació pot afectar
molt a la ceràmica, arribant a fer desaparèixer pels processos d’erosió parts del
artefacte ceràmic.
Mida à ens permeten mesurar les dimensions del artefacte
Forma-à la forma no es veu afectada per les dimensions. La forma seria el contorn
del artefacte.
La textura à totes aquelles característiques o atributs que tenen en la superfície
aquests elements.
Morfometria:
- tècniques de fabricació: modelat a mà
....
Com obtenim les mesures de l’objecte ceràmic? A partir d’una vora que conservi
com a mínim un 25% del seu diàmetre. Això es fa a partir de l’altura total i el
diàmetre de l’altura i la base.
Anàlisi de la mida i la forma:
- diàmetre de la vora
- diàmetre del punt tangencial
- diàmetre màxim
- altura conservada
- gruix de les parets
- índex d’obertura (seria el grau d’obertura que presenten els artefactes i
plantegen hipòtesis sobre la seva disponibilitat el calculem a partir de dividir
el diàmetre de la base amb el diàmetre màxim), i de profunditat.
Les ceràmiques en realitat es classifiquen en funció de les seves mesures
mètriques. Analitzem l’objecte ceràmic a partir del diàmetre de la vora, de la panxa ,
de la base i de l’índex de perfil.

Determinació mida i forma (mètrica i índex de relació) à classificació qualitativa


(punts característics i inflexions à .... à ....... à
El que intervé en els casos irregulars de la materialitat, es la mesura del contorn. Es
poden utilitzar diversos programes per analitzar-ho, com l’agmar. Normalment la
irregularitat en els productes ceràmics es indicatiu de produccions fetes a mà.

ANÀLISI DE LES MACROTRACES


Com determinen les tècniques de fabricació de les ceràmiques fetes a mà? Ho fem
a partir de:
Referencials experimentals:
- mateix grup de productors
- ruptura controlada
- mostra reiterada
- procés i tècnica de fabricació idèntica
Contrastació arqueològica.
- identificació i sistematització de les traces de fabricació
- formació indirecta (seccions)
- formació directa (superfícies)

Hi ha altres maneres d’analitzar i mesurar les tècniques de fabricació o


manufactures. Una d’elles utilitzar la micro-tomografia computeritzada i l’anàlisi
traceològica.
(buscar que es la micro-tomografia computeritzada i l’anàlisi traceològica)
El procés de fabricació condiciona per on es trencarà desprès la peça ceràmica.
(introduir esquema de la llibreta)
La irregularitat de la peça serà diferent depenent del tipus d’eina que s’hagi utilitzar
per a realitzar-la.
Variables a controlar:
- temps d’assecatge
- mitjà de treball i morfologia del mitjà de treball
- temps de treball
- objecte ( matèria de treball) i morfologia

com mesurem les superfícies de les ceràmiques?

COM MESUREM LA COMPOSICIÓ DE LA MATERIALITAT? (el penjarà al


campus)
QUAN PARLEM DE materialitat abans d’aplicar l’acció social s’anomena recursos i
desprès d’aplicar l’acció social s’anomena materialitat.
Volem saber realment quina acció social porta a aquesta materialitat. En aquest
apartat el que mirarem serà la composició.
Quan mesurem la composició ens referim a la intensitat en què diferents propietats
apareixen en una mateixa entitat, de manera que la suma de totes aquestes
propietats siguin la mateixa per a totes les entitats que es comparen.
- Proporció de la composició química dels objectes arqueològics.
- Proporció dels objectes d’aixovar en una tomba
- Proporció de cabanes d’un determinat tipus en un assentament.
- Proporció d’assentaments de diferent funcionalitat en un mateix
territori
- E.t.c
En el tema de la composició de diferents materials ve més donat per la patologia, a
vegades veiem marques d’ús no en la seva creació si no marques d’evidències d’ús,
com podria ser exposició al foc, marques d’un estri...
Quan treballem en las dades hem de tindre en compte:
Quantitat: o freqüència, això estipula quantes coses hi ha de cada tipus.
Medició: ?????
Descripció: una manera de descriure les qualitats o característiques d’una
materialitat es amb números o lletres.

En la pregunta de perquè els vasos tenen una composició diferent pot respondre a
les diferents utilitats i al fet que al ser algú prescindible i de molt fàcil manufactura es
igual del que realment estigui fet (això respondria a la producció de ceràmiques de
cuines, no vaixelles fines o per menjar).
(SINCERAMENT ENCARA NO SE QUE ESTEM FENT A
CLASSES)
INTRODUIR APUNTS DELS EXEMPLES
La determinació de la mida i forma à classificació qualitativa à anàlisi quantitativa à
resultats de grups per ús.

L’ESPAI
Què és l’espai?
L’espai no es un contenidor ni tampoc no existeix de manera independent de l’acció
humana. L’espai es producte de les accions naturals i antròpiques. L’espai i el
temps llavors son dos entitats unides que no es poden separar. L’espai es una
estructura relacionada, es a dir es relaciona amb el seu entorn. Hi ha molts tipus
d’espai cadascun te les seves característiques, però hi ha algunes que son
comunes, son la localització, la relació i dimensió. El que nosaltres parlarem serà
l’espai arqueològic, es un conjunt de localitzacions en el que l’espai físic en las que
van tindre lloc determinades accions socials y processos naturals, conservant-se
una fracció material d’efectes causats per tals accions.
La localització es un atribut de les restes materials de les acciones passades.
S’explora la totalitat del registre arqueològic a través de les relacions internes que la
composen.
Mitjançant l’anàlisi espai podem saber a traves de la distribució dels artefactes la
dispersió de les accions o les activitats socials.
La distància ens permet veure les interrelacions.
(COMPLEMENTAR TOT AMB EL POWER POINT)

23/10/18
Per la setmana que bé em d’entregar els deures. Buscar models de cadires, gots o
samarretes o algú fácil.
El que hem de preguntar-nos es perque serveix aquest objecte, mesurar-lo i agruparlo.
pero agafar objectes que tinguin una mateixa funcionalitat i estudiar-los com si no
sapiguessim que son ni perque serveixen.
IMPORTANT EXPLICANR EL QUE ET PREGUNTES AL AGAFAR/ANALITZAR L’OBJECTE

1. agafar objectes
2. mesurar objectes i desciure’l
3. mirar la seva composició
4. mirar la forma
5. agruparlos per composició o forma

descomposem en cas necesari l’objecte per tal de definirlo.

Quina es la resposta al fet dels diferents gots que hi han a casa:


- hi ha persones diferents que tenen un got diferent, podirem parlar de que cada got
pertany a una persona en excluvia (relació de propietat)
- S’han comprat en diferents llocs
- si no hi ha mostres de fabricació en el lloc vol dir que la diferencia de gots no respon
a una fabricació propia si no a compres

EL TREBALL S’HAURÀ DE PRESENTAR COMPLET EL DIMARTS


-Triar un material
-perque l’hem seleccionat (hi ha d’haver una pregunta arqueologica, per exemple perque hi
ha gots diferents, ha de ser una pregunta de semblança o diferencia dels objectes)
- mesurar els objecte (minim 15 objectes )
- fer el coeficient de similitud
- I fer tot el que hem anat explicant els dies anteriors

ens podem centrar també en una habitació de la casa


NURIETA TREBALL
AGAFAR PLATS DE LA CUINA I FER EL PLNATEJAMENT
- Perque triem una categoria material (perque es el que m’hes he trobat
a la cuina (en aquesta habitació) i es de fàcil analisi.
- com va ser produida, com va ser utilitzada
- perque hi han diverses formes (termes de semblança, similitud) perque
uns objectes iguals serveixen de diferents maneres
- perque hi ha plats amb formes diferents (raons estetiques, socials, etc)
- mesuraré la forma dels obejctes perque crec que la forma implica
diferents usos de objectes aparentment similar o amb diferencies
minimes com seria la fondaria.
- MINIM 4 PAGINES DE TREBALL (s’ha d’incloure l’expolicació i
l’estadistica, es a dir, anar possant tots els processos del treball )
- el treball s’entrega en paper
- en el meu cas em centraré en les semblançes de forma, es a dir, la
forma oberta ( forma de plat) i les petites diferencies entre ells com es
la fondaria.

VISUALIZANDO LA VARIABILIDAD DE LOS DATOS ARQUEOLÓGICOS (TEMA 6)

La primera tarea en cualquier investigacion arqueologica consiste en documentar la posible


variabilidad del fenomeno observado.
La manera más intuitiva imaginaba de descubrir si la distribución de un conjunto de
magnitudes es muy varibale o poco consiste en la simple enumeración de los distintos
valores observados.
Es decir, la frecuencia de cada valor será utilitzada como medida de la intensidad de cada
uno de los valores efectivamente medidios. Por “frecuencia” debemos entender no tanto el
número de veces que observamos un valor concreto, como el umero de veces que se repite
por unidad muestral.

basicamente se trata de ordenar de más pequeño a mayor los numeros.


cuando un gran conjunto de datos tiene muchos valores distintos en lugar de unos cuantos
valores repetidos, es posible juntar los valores en un conjunto agrupado de clases o
categorias y elaborar una distribución de frecuencias agrupadas.
Histograma:
dividimos el rango o amplitud de los daots en intervalos de igual anchura; la anchura
dependerá del numero de intervalos selecciones. Cada vez que una medida concreta cae
dentro de un intervalo particular, situamos encima un cuadrado con estas caracteristicas.
Hay diferentes formas en los histogramas: simetrico, uniforme, irregular,...

Hi han diverses regles que s’utiltizen, la primer la refla de Sturges que ens mostra el numero
d’intervals.

BUENO JA COMENÇEM AMB LES SEVES GILIPOLLADES, ESTÁ INTENTANT ARREGLAR LA


CAGADA DE L’ALTRE AMB EL MASCLISME.

Para poder comparar dos o más histogramas es fundamental que las escalas de los gráficos
sean idénticas, es decir, que los intervalos empìecen y acaben en los mismos puntos.

Otros metodos de visualización de la variabilidad: (buscar que es cada un)


- Kernel Density:
- Diagrama de pareto (no son molt abundants en arqueologia
- Diagrama de whittaker
MIDIENDO LA VIRIABILIDAD DE LOS DATOS ARQUEOLOGICOS

la semblança es una de les maneres de mesurem la variabilitat. la variació ho feiem a travès


d’histogrames si ho fem amb imatges, pero si queremos aprofundir más debemos medir la
variación, como lo hacemos?
entrando en la mesura de la variación.

MEDIA ARITMÉTICA: (la mitjana aritmetica) la media aritmetica (en inglés: mean) de un
conjunto de datos no es más que una estimación de la cuál debe ser el valor pormedio de
una serie de valores. lo podemos calcular sumando todos los valores y dividiendo por la
cantidad de individuos medidos.
Ahora bien, la media aritmética no suele ser una medida adecuada para medir la varibilidad
registrada, ya que se ve afectada de modo notable por la existencia de valores
extraordinadamente grandes o pequeños.
para compensar esto tenemos:
- las medias modificadas: se ha sugerido que puede ser conveniente trabajar con
medias podadas (trimmed mean), es decir, medias aritmeticas que en lugar de haber
sido caculadas con todos los valores medios, presciende de los valores más grandes y
de los más pequeños. por ejemplo, una media podada al 50% presciende del 25% de
los valores más grandes y un 25% de los valores más pequeños. equivalente a esta es
la media winsorizada, en la que el valor de la observacion más extrema, se sustituye
por el valor de la más proxima a ella.
- la mediana: denominaremos mediana (en inglés median) a aquel individuo situado
en el centro exacto de la distribución, esto es, que el 50% de los datos sean mayores
que él y el 50% menor.
- Moda: se denomina moda a aquel valor que más se repite en una serie. una
distribución de valores será multi-modal cuando se repitan distintos valores. Cuando
los valores de la magnitud no se repiten, podremos referirnos al intervalo modal o
clase modal para indicar cuál de las clases o intervalos en los que se han agrupado
los valores observados se destaca por su frecuencia. por ejemplo: un histograma que
no tenga moda, esto es, que todos los intervalos tengan aproximadamente la misma
frecuencia de observaciones pondrá de manifiesto una distribución uniforme.
MAL USO DE LAS MEDIAS
Una funesta mania de muchos de nosotros es limitarse a usar las medias, la mediana o la
moda de una serie de valores como ejemplo paradigmatico de todas las observaciones,
dejando de lado la mayor o menor variabilidad que exista en los datos.

variabilidad =dispersión
la manera más simple de estimar esa dispersion es restando el mayor de todos los valores
del menor. Este simple calculo nos proporciona el recorrido o amplitud (ingles range) de la
distribución. cuanto amyor sea ese parametro, mayor sera la dispersion.

recorrido (o distancia) intercuartil.--> como se calula? BUSCAR COMO SE CALCULA

Mesurar la dispersión: (varianza)

unvariate → unvariate stadistics : i el que s’ha de calcular es el coefficient de variació, mes


que calcular el que es fa es comparar. Això es fa per comparar la dispersió i la varició que hi
ha entre elles.

Asimetria: manca de simetria, en anglés Skewness. NO SE EXCACTAMENT PERQUE SERVEIX.


(preguntar al jordi o la Karaleta)
Curtósis: una curtosis es una mesura del grado, que en una serie los grados se concentran
en uno o pocos intervalos. tenemos 3 opciones: l’eptocurtica que es aquella que todos los
datos se concentran en uno o pocos intervalos, si no hay ninguno intervalo que destaque i
todos tienen mas o menos lo mismo sera platicurtica. despues tenemos la mesocurticas que
ya no se para que sirven.

Això també ho veiem en l’imatge anterior, per veure-ho seguim els mateixos pasos que
abans.
amb les mesures anterior es que fem es definir l’intensitat i la _____ de la variació
Aquestes mesures anteriors NO s’han d’utilitzar per les variables QUALITATIVES.

Variabilidad de una cualidad: la varianza se calcula mediante el rpoducto de las presencias


por las ausencias dividido por el número de observaciones.

AQUEST CAP DE SETMANA COMENÇEM A FER EL CONCEPTE DE VARIABILITAT I DE


SEMBLANÇA QUE HEM FET AVUI. pots enforcar-ho que en una unitat domestica al costat
de la teva has trobat objectes (plats) similars pero amb algunes diferencies a nivell de
decoració i de mesures.
pots introduir altres plats amb mesures diferents i fer una comparació entre ells (o potser
entre les decoracions, el que prefereixis).
- perque aquests plats diferents tenen unes mesures diferents? responen a alguna
cosa?
6/11/18
segons ell no estem fent res impactant, però no t’he en compte que això ens importa una merda i
l’unic que volem es estudiar.
(treball)
QUINA ES LA PROBLEMATICA SOCIAL QUE M’INTERESA? ENS INTERESSA EL PIRMER US, EL SEGON,
LA UTILITZACIÓ?
Em de posar en cada grafic quines varibles hem agafat per fer el grafic.

EL AZAR COMO MEDIDA DE TODAS LAS COSAS

para resolver un problema debemos conocer previamente la solución de ese mismo problema. el
metodo cientifico es ese modelo que me plantea una problematica y yo me planeto todas las
soluciones posibles en la cabeza.

podemos llegar a plantear todos las soluciones del problema?


si, porque todos esos resultados NO fueron igualmente probables, Esta afirmación constituye el
punto de partida de toda la investigación arqueologica e incluso de todas las Ciencias Sociales.

PORQUE?

El sentido común nos dice que las diferencias entre los resultados materiales de una misma acción
Intencionalmente ejecutada son debidas al azar. Por muy intencional que fuese en el pasado la
acción, seguro que existió una variación propia de los resultados de la acción, motivada por la
varibilidad de las circumstancias concretas en las que tuvo lugar, que explican por qué la
consecuencia material concreta de cada actividad no es obvia.

Un cierto margen de variación accidental es caracteristico del trabajo manual. es el resultado de los
errores de manufactura al estimar el tamaño del objeto que se pretende producir comparando…….
si repetimos una actividad cualquiera un pequeño numero de veces……
(GILIPOLLAS DE MERDA QUE M’HA DE PASAR LES DIAPOSITIVES A LA VELOCITAT DE LA LLUM, LI
REVENTAVA EL PUTO CRANI CONTRA EL SEU POWER POINT DE MERDA )

ES VA FER UN ESTUDI Y… els resultats suggereixen que si l’objecte d’estudi difereix d’un altre en
menys del 3% del seu pes o longitud l’esser humà per si sol no es capaç de diferenciar la diferencia.

La estandarización (o “normalizacion”) de la producción. cuanto mas repitas ese objeto o cosa,


acabas haciendo de manera similar ese mismo objeto, esto es la estandarización.

Hi ha una certa regularitat en els resultats (quan més repeteixes una cosa) més es pot contabilizar un
resultat.
Toda medición de una propiedad cuantitativa está afectada en mayor o menor grado por errores del
proceso de obtención de la medida. Debemos partir del supuesto según el cual por muchas
diferencias que haya las distintas medidas de un mismo elemento tienden a la misma medida.

Un fenomen es aleatori quan compleix 3 coses:


- el seu resultat esta influit o afectat per infinites causes.
- cada una d’aquestes causes te molt poques rellevàncies en el resultat final (lo important
es l’efecte de totes aquetes causes).
- totes aquestes causes son independents entre elles.

El azar es simetrico, es decir cuando se combinan muchas observaciones de un mismo fenomeno, los
errores accidentaales tiennden a cancelarse. como consecuencia, el valor verdadero de la constante
observada se encuentra en la proximidad de la mayor concentración de mediciones. De este modo,
se demuestra que el valor más probable de cuanquier fenomeno aleatorio es la medida de todas las
repeticiones del fenomeno. (El valor mas probable es la medida aritmetica.)

Aquesta simetria va ser estudiada per GAUSS al segle 19, ell va estudiar matematicament la
probablitat de qualsevol valor. qualsevol valor marcat per la corva de Gauss es pot calcular. la llei de
GAUSS es va començar a anomenar la llei normal.
La distribució normal, també coneguda com a distribució gaussiana, és una important família de
distribucions de probabilitat contínues i és aplicable a molts camps. Cada membre de la família
queda definit per dos paràmetres: la localització o mitjana i l'escala o desviació estàndard . Un cas
particular és la distribució normal estàndard, per la qual la mitjana és 0 i la desviació estàndard és 1.
Fou Carl Friedrich Gauss qui descobrí la distribució normal quan analitzava dades astronòmiques, i
definí l'equació de la seva funció de densitat de probabilitat. Aquesta distribució també s'anomena
campana de Gauss, atès que el gràfic de la seva funció de densitat de probabilitat s'assembla a una
campana.
La importància de la distribució normal en les ciències naturals i del comportament rau en el
teorema central del límit. Aquest teorema estableix que la suma d'un elevat nombre d'efectes
independents segueix (aproximadament) una distribució normal. D'aquesta manera, és útil en
processos en els quals hi ha errors de mesura que es deuen a un elevat nombre de factors, tots ells
contribuint una petita porció a l'error total. En la teoria de probabilitat i d'inferència estadística, el
teorema central del límit garanteix que un llarg nombre d'estadístics segueixen la distribució normal,
si més no aproximadament. Per exemple, la mitjana mostral o els estimadors màxim versemblants
segueixen aproximadament una distribució normal sota certes condicions matemàtiques que són
força generals.
https://ca.wikipedia.org/wiki/Distribuci%C3%B3_normal

TEOREMA CENTRAL DEL LÍMITE


vol dir que si estrec mostres d’una població al atzar, aquesta serà una micropoblació de referencia.
En matemàtiques, el Teorema del límit central (o Teorema central del límit) indica que la distribució
de la suma estandarditzada de variables aleatòries independents que tenen una variància finita
tendeix a una distribució normal estàndard quan el nombre de termes de la suma creix
indefinidament. Com a conseqüència d'aquest teorema, s'explica el fet que moltes variables
aleatòries siguin aproximadament normals i justifica la importància teòrica i pràctica de la distribució
normal.
https://ca.wikipedia.org/wiki/Teorema_del_l%C3%ADmit_central
ERROR TIPICO DE LA MEDIA
El error estandar de la media cuantificadas las oscilaciones de la media muestral alrededir de la
media poblacional. El EEM o SEM se estima generalmente dividiendo la desviación estándar de la
población entre la raiz cuadrada del tamaño de la muesta.
La media muestral es el estimador usual de una media poblacional. Sin embargo, diferentes
muestras escogidas de la misma población tienden en general a dar distintos valores de medias
muestrales. El error estándar de la media (es decir, el error debido a la estimación de la media
poblacional a partir de las medias muestrales) es la desviación estándar de todas las posibles
muestras (de un tamaño dado) escogidos de esa población. Además, el error estándar de la media
puede referirse a una estimación de la desviación estándar, calculada desde una muestra de datos
que está siendo analizada al mismo tiempo.
En aplicaciones prácticas, el verdadero valor de la desviación estándar (o del error) es generalmente
desconocido. Como resultado, el término "error estándar" se usa a veces para referirse a una
estimación de esta cantidad desconocida. En tales casos es importante tener claro de dónde
proviene, ya que el error estándar es sólo una estimación. Desafortunadamente, esto no es siempre
posible y puede ser mejor usar una aproximación que evite usar el error estándar, por ejemplo
usando la estimación de máxima verosimilitud o una aproximación más formal derivada de los
intervalos de confianza. Un caso bien conocido donde se pueda usar de forma apropiada puede ser
en la distribución t de Student para proporcionar un intervalo de confianza para una media estimada
o diferencia de medias. En otros casos, el error estándar puede ser usado para proveer una
indicación del tamaño de la incertidumbre, pero su uso formal o semi-formal para proporcionar
intervalos de confianza o test debe ser evitado a menos que el tamaño de la muestra sea al menos
moderadamente grande. Aquí el concepto "grande" dependerá de las cantidades particulares que
vayan a ser analizadas.
En análisis de regresión, el término error estándar o error típico es también usado como la media de
las diferencias entre la estimación por mínimos cuadrados y los valores dados de la muestra.
https://es.wikipedia.org/wiki/Error_est%C3%A1ndar

un dels problemes que podem tindre es que en el passat hi haguessin més d’una intencionalitat. ña
suma de intencionalidades diversas también produce UNIFORMIDAD.
13/11/18

mira encara no se que cony esztem fent aquí, però seria interessant fer l’exercici que era per avui

nomès si la intencionalitat es evident puc continuar l’estudi, si per al contrari no es evident qualsevol
hipotesi es viable. mentre que la primera sempre serà molt més exacta i la segona serà dificilment
interpretable.

primer criteri de seleccio: contemporaneitat de les dades (no podem utilitzar dades amb un desfas
cronologic de 200 anys)
segon criteri:
tercer criteri:
quart criteri:

15/11/2018

perque les nostres dades no es distribueixen com la llei normal? per un individu extern.
NO SE QUE COLLONS ESTÀ EXPLICANT
DEMANAR APUNTS A LA JORDINA

Hi ha una tecnica d’analisis (MISTURE ANALYSIS) ens permet fer no se que

La llei Log Normal. es la logarització de les dades. En probabilidades y estadísticas, la distribución


normal logarítmica es una distribución de probabilidad de una variable aleatoria cuyo logaritmo está
normalmente distribuido. Es decir, si X es una variable aleatoria con una distribución normal,
entonces exp(X) tiene una distribución log-normal.
La base de una función logarítmica no es importante, ya que log a X está distribuida normalmente si y
solo si logb X está distribuida normalmente, solo se diferencian en un factor constante.
Log-normal también se escribe log normal o lognormal o distribución de Tinaut.
Una variable puede ser modelada como log-normal si puede ser considerada como un producto
multiplicativo de muchos pequeños factores independientes. Un ejemplo típico es un retorno a largo
plazo de una inversión: puede considerarse como un producto de muchos retornos diarios.
La distribución log-normal tiende a la función densidad de probabilidad.
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_log-normal
PAST ( SELECCIONAR LES DADES A CANVIAR → PLOT → LOG)
Hi ha una cosa que no es distribueix segons la llei de gauss, es la riquesa. per exemple la riquesa de
tombes en una necropolis. això es el ue hauriem de resoldre amb la distribució exponencial, la
distribució de pareto.
En estadística la distribución Pareto, formulada por el ingeniero civil, economista y sociólogo
Vilfredo Pareto, es una distribución de probabilidad continua con dos parámetros, que tiene
aplicación en disciplinas como la sociología, geofísica y economía. En algunas disciplinas a veces se
refieren a la ley de Bradford. Por otro lado, el equivalente discreto de la distribución Pareto es la
distribución zeta (la ley de Zipf). La distribución de probabilidad de Pareto consiguiente describe la
probabilidad de ocurrencia de sucesos similares, y es la distribución de probabilidad típica de
variables estadísticas aleatorias que parten de cero, que no tienen un límite superior definido y cuya
probabilidad de ocurrencia es baja (retomando el ejemplo de Pareto, la fortuna de un ricachón tiene
un valor indeterminado de entre 0 y Dios sabe cuánto, y la probabilidad de tener una enorme
fortuna es baja). Las ventas de discos (unos pocos discos de oro copan la mayor parte de las ventas)
o los daños provocados por los terremotos (unos pocos seísmos causan la mayor parte de las
catástrofes) se rigen por distribuciones rigurosamente paretianas.

Multi-modalidad revela la Casualidad DIferenciada.


estudiaremos la causalidad a partir del concepto associacion (algo en comun, las relaciones de
semjanza) y relación (donde ponemos en contacto las propiedades y no el objeto).
Utilitzarem les relacions de coovariin (mira niputa idea d’això).
haurem de distinguir dos tipus de variables:
- la variable dependent: es la que no se perque varia
- la variable independent: es aquella variable que la seva aparició compren, se perque varia

SEGONS ELL A PARTIR DEL ACHALIENSE ELS OBJECTES NOMÈS TENIEN 1 ÚS.

M’HE PERDUT I NO SE QUE COLLONS ESTÀ DIENT, QUINA DEPRESSIÓ DE CLASSE SIUSPLAU, M’ESTIC
DORMINT, DEPRIMININT I TINC GANES DE MORIRME AMB AQUESTA PUTA MERDA.
EXERCICIS PAST 20/11/19 (demanar apunts a la KARAL)

ESTEM PREGUNTAT: L’ESPECIE HUMANA A INTERFERIT EN LA MIDA DE LA LLARGADA DELS FEMURS,


ES A DIR, DE LA MIDA DEL ANIMAL

La A seria l’especie domestica i la B de l’especie salvatge

la diferencia entre els individus es suficient per a que no s’expliqui mitjançant la variabilitat
gaussiana?

selecionem totes les dades, ens anem, a univariate, fem el summary estadistics. si anem a _______
veiem que en ambdos casos veiem
jo el que em pregunto es si hi ha nomès una població o dos, he fet el test de normalitat i he vist que
en tota la serie no hi ha normalitat, si no distinguis entre les dues especies no hi hauria una
normalitat. perque hi ha una diferencia? perque son dos especies

Agafem l’especie domestica, _____


la distribució del estudiant: En probabilitat i estadística, la distribució t de Student és una
distribució de probabilitat que sorgeix del problema d'estimar la mitjana d'una població normalment
distribuïda quan la mida de la mostra és petita. Aquesta és la base de la popular prova t de Student
per a la determinació de les diferències entre dues mitjanes mostrals i per a la construcció de
l'interval de confiança per a la diferència entre les mitjanes de dues poblacions.
La distribució t sorgeix, en la majoria dels estudis estadístics pràctics, quan la desviació típica d'una
població es desconeix i ha de ser estimada a partir de les dades d'una mostra.
https://es.wikipedia.org/wiki/Distribuci%C3%B3n_t_de_Student

Utilitzarem la distribució comprarem si la longitud del femur coincideix o no coincideix amb un valor
normal.

Seleccionem la columna de domestics, anem a univariate, one simple test, posem 22 (per ejemple)
de mitjana en femurs. i tenim la mitjana de la població, hauria de ser entre 13 i 16.
quan es superior (no se el que) tampoc se el que ha dit.
SINGLE CASE

posem per exemple, un os que mesura 32, computem i ens mostra la probabilitat de que sigui de
pertanyi a una població representada pels individus que tinc.
Estic compranat una mitjana teorica (la que seria la prova t- test) amb una mitjana de mostra que
tinc (single case), el que faig es mirar si coincideix un individu amb una mostra coneguda (les
mostres que tinc Vs una mostra que he trobat, un unic cas).
Prova, comprar dos mitjanes de dos mostres diferents (salvatges - domèstiques).
Per fer aquest calcul:
cliquem column atributes, cliquem a la ralleta i selecionem grup, despres a la tecla group.
selecciono les dos columnes, anem a univariate, seleciono two sample test.
aqui el que ens importa es que ens surtin les dos poblacions, ens diuen la mitjana de les dos
pobalcions, calculem l’interval de confiança (esta ja fet, nomès s’ha de mirar), veiem que entre els
domestics la variació es molt més petita.
Si el valor es inferior a 0.05 direm que son molt diferents heterocedasticitat, si es superior a 0.05
tindrem la condició de homocedasticitat.
si les semblances son diferents vaig a ______ i

DEMANAR APUNTS QUERALT

Arribem a la conclusió de que les dues mitjanes son diferents. per tant en aquest cas concret
arribarem a la conclusió que l’acció humana es la que explica les variacions obserables en la mida
dels individus.

EXEMPLE D’UNES ALTRES DADES PERÒ SERVEIX


DE VERITAT QUE NO SE DE QUE EM PARLA EL SEÑOR AQUEST, HE DE DEMANAR APUNTS SI O SI.
APUNTS LLUIS

Single case: mostra que hem trobat i no sabem si pot pertànyer al grup mesurat –
comparació d’1 individu amb 1 mostra de referència.
Per comprar els 2 Grups: Domestic VS Salvatges
Cas de treball amb una petita mostra de referència

Variance > 0.05 les variances son homocedasticitat: utilitzaré el test classic
Variance <0.05 = heterocedasticitat: utilitzaré el Uneq. Var test
Com que tots 2 p(same meanm) grups < 0.05 són especies inferiors: possible especiació
per intervenció humana.
La majoria dels pals no són igual que la mitjana.
La numeració de forma manual
Plot – Barch/Boxplot

Comparació de 2 valors de cada mostra el que volem es comprar les distribucions.


Per això hem de fer un histograma dels 2
El kernel density no coincideix.
Comparació de 2 distribucions ens interessa la probabilitat
La mat primera no explica les diferencies de pes.
Ens hem plantejat les proves d’1 mostra comparable amb una mitjana teòrica (ex:
arqueozoologia)
ANÁLISIS DE VARIANZA 22/11/18
En anglès (ANOVA acronim anglès)
per fer aquest analisis necesitem dos variables:
- una variable catgorica (els grups)
- una variable cuantitativa (el que hem mesurat)
el que ens plantegen es si els promitjos de la variable quantitativa…

1. muetsras provienen de pobalción con distribución normal y con similares desviaciaciónes


tipicas
2. la varianza de cada grupo es un estimativo de la varianza de la población
3. la varianza mezclada (pooled) de los grupos puede utilitzarse para calcular intervalo de
confianza de la diferencia de pares de promedio.

la variable ANOVA:
ANÁLISIS DE LA VARIANZA CON UN FACTOR (ANOVA)

El análisis de la varianza permite contrastar la hipótesis nula de que las medias de K poblaciones (K
>2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones difiere
de las demás en cuanto a su valor esperado. Este contraste es fundamental en el análisis de
resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o
'factores' con respecto a la variable dependiente o de interés.

El Anova requiere el cumplimiento los siguientes supuestos:


● Las poblaciones (distribuciones de probabilidad de la variable dependiente correspondiente
a cada factor) son normales.
● Las K muestras sobre las que se aplican los tratamientos son independientes.
● Las poblaciones tienen todas igual varianza (homoscedasticidad).

El ANOVA se basa en la descomposición de la variación total de los datos con respecto a la media

global (SCT), que bajo el supuesto de que H0 es cierta es una estimación de obtenida a partir de
toda la información muestral, en dos partes:
● Variación dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersión de los valores
de cada muestra con respecto a sus correspondientes medias.
● Variación entre muestras (SCE) o Inter-grupos, cuantifica la dispersión de las medias de las
muestras con respecto a la media global.

Las expresiones para el cálculo de los elementos que intervienen en el Anova son las siguientes:

Media Global:

Variación Total:

Variación Intra-grupos:
Variación Inter-grupos:

Siendo xij el i-ésimo valor de la muestra j-ésima; nj el tamaño de dicha muestra y su media.
Cuando la hipótesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores insesgados de la varianza
poblacional y el cociente entre ambos se distribuye según una F de Snedecor con K-1 grados de
libertad en el numerador y N-K grados de libertad en el denominador. Por lo tanto, si H0 es cierta es
de esperar que el cociente entre ambas estimaciones será aproximadamente igual a 1, de forma que
se rechazará H0 si dicho cociente difiere significativamente de 1.
La secuencia para realizar un ANOVA es:
Analizar
Comparar medias
ANOVA de un factor

http://www.ub.edu/aplica_infor/spss/cap4-7.htm

ANOVA de un factor (también llamada ANOVA unifactorial o one-way ANOVA en inglés) es una
técnica estadística que señala si dos variables (una independiente y otra dependiente) están
relacionadas en base a si las medias de la variable dependiente son diferentes en las categorías o
grupos de la variable independiente. Es decir, señala si las medias entre dos o más grupos son
similares o diferentes.

http://networkianos.com/anova-de-un-factor-que-es-como-analizar/

AQUESTA VARIABLE ES FA AMB DADES QUANTITATIVES

no es el mateix una magnitut que una freqüencia.

Test de anova, se asume que:


- cada muestra debe ser independiente de las otras
- cada muestra debe haber sido seleccionada al azar de la poblacion de donde proviene

Es molt important que totes les mostres es distribueixin segons una llei normal.
- Las varianzas de cada poblacion deben ser iguales, auqnue los promedios sean diferentes, es
decir cuando los tratamientos tengan efecto.

El test de variances s’anomena Leven’s test (el fem abans que el ANOVA, només el podrem fer si el
resultat de la prababilitat del test de Leven sigui major que 0.05 )
TEST DE LEVEN
en el cas de leven les variables son _____ quan el test de leven surt per sota de 0.05, hem d’anar a
les dades per veure quin es l’error

En estadística, la prueba de Levene es una prueba estadística inferencial utilizada para evaluar la
igualdad de las varianzas para una variable calculada para dos o más grupos. Algunos
procedimientos estadísticos comunes asumen que las varianzas de las poblaciones de las que se
extraen diferentes muestras son iguales. La prueba de Levene evalúa este supuesto. Se pone a
prueba la hipótesis nula de que las varianzas poblacionales son iguales (llamado homogeneidad de
varianza ú homocedasticidad). Si el P-valor resultante de la prueba de Levene es inferior a un cierto
nivel de significación (típicamente 0.05), es poco probable que las diferencias obtenidas en las
variaciones de la muestra se hayan producido sobre la base de un muestreo aleatorio de una
población con varianzas iguales. Por lo tanto, la hipótesis nula de igualdad de varianzas se rechaza y
se concluye que hay una diferencia entre las variaciones en la población.
Algunos de los procedimientos que asumen normalmente homocedasticidad, para lo cual uno puede
utilizar las pruebas de Levene, incluyen análisis de varianza y pruebas t.
La prueba de Levene se utiliza a menudo antes de que una comparación de medias. Cuando la
prueba de Levene muestra significación, se debe cambiar a pruebas generalizadas (pruebas no
paramétricas), libre de supuestos de homocedasticidad.
La prueba también puede ser utilizada como una prueba principal para responder a una pregunta
independiente de si dos sub-muestras en una población dada tienen varianzas iguales o diferentes.

NO VULL SUSPENDRE AQUESTA ASIGNATURA PERÒ ESTIC VEIENT QUE SI

LA SUMA TOTAL DE CUADRADOS:


- Esta basada en la suma de los cuadrados de las diferencias de cada una de las obervacioens
del promerido general.

em de buscar la probabilitat de F
EXEMPLE DE CLASSE:

seleciono les 2 columnes, plot, barchart/boxplot, selecionem boxplot. (ara tindiem l’extensio)

mirem la variança → univariate, normality test


univariate, summary stadistics : per seleccionar un grup y veure no se el que
ANOVA: seleccionem les dos columnes → univariate, anova, several sample test.

En aquest cas veiem que si que hi han diferencies apreciables, pero hi han variances apreciables?
mirem el test omega ^2 .

mirem això ara

mirem el quadre, si el numero es superior


a 0.05 entre una zona i una altra no hi ha
diferencia, pero si veiem que hi menys de
0.05 hi ha una diferencia apreciable.
Ara ho farem amb un cas real.

EXERCICI PER DIMARTS → FER AIXÒ AMB LES


TEVES DADES
(fer això amb els plats d’altres llocs que no
siguin a casa )
com si diguessim dos poblacions de platets.
4/12/18
Relación: cuando el comportamiento estadístico de una variable se ve afectado por los
valores que toma la otra

forma
tamaño textura
materialidad

En una proba d’hipotesis em de mirar la P. QUAN FEM ANOVA UNA HA D’ESTAR


DEFINIDA PER GRUP.

CAUSALIDAD EN ARQUEOLOGIA
covarianza: cuando a grandes valores de una de las variables suelen mayoritariamente
corresponderles los grandes de la otra y lo mismo se verifica para los pequeños valores de
una y la otra, se corrobora que tienden a mostrar similar comportamiento lo que se refleja
en un valor positivo de la covarianza.
WIKI EXPLICACIÓN: En probabilidad y estadística, la covarianza es un valor que indica el
grado de variación conjunta de dos variables aleatorias respecto a sus medias. Es el dato
básico para determinar si existe una dependencia entre ambas variables y además es el dato
necesario para estimar otros parámetros básicos, como el coeficiente de correlación lineal o
la recta de regresión.
● se interpreta: Cuando los valores altos de una de las variables suelen
mayoritariamente corresponderse con los valores altos de la otra, y lo mismo se
verifica para los pequeños valores de una con los de la otra, se corrobora que
tienden a mostrar comportamiento similar lo que se refleja en un valor positivo de la
covarianza.

Por el contrario, cuando a los mayores valores de una variable suelen corresponder
en general los menores de la otra, expresando un comportamiento opuesto, la
covarianza es negativa.
El signo de la covarianza, por lo tanto, expresa la tendencia en la relación lineal entre
las variables.
La magnitud requiere un esfuerzo adicional de interpretación:
La versión normalizada de la covarianza, el coeficiente de correlación indica la
magnitud de la especificidad de la relación lineal.
Se debe distinguir entre:
(1) la covarianza de dos variables aleatorias, parámetro estadístico de una población
considerado una propiedad de la distribución conjunta y
(2) la covarianza muestral que se emplea como un valor estadísticamente estimado
del parámetro.

CAUSALITAT IMPLICA CORRELACIÓ, PERÒ CORRELACIÓ NO IMPLICA CAUSALITAT.

a la practica més que la covariança el que acostumem a mesurar es la correlació.

CORRELACIÓN:
En probabilidad y estadística, la correlación indica la fuerza y la dirección de una relación
lineal y proporcionalidad entre dos variables estadísticas. Se considera que dos variables
cuantitativas están correlacionadas cuando los valores de una de ellas varían
sistemáticamente con respecto a los valores homónimos de la otra: si tenemos dos variables
(A y B) existe correlación entre ellas si al disminuir los valores de A lo hacen también los de B
y viceversa. La correlación entre dos variables no implica, por sí misma, ninguna relación de
causalidad.

Con la correlación de pearson mesuramos correlaciones lineales.


En estadística, el coeficiente de correlación de Pearson es una medida lineal entre dos
variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es
independiente de la escala de medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de Pearson como
un índice que puede utilizarse para medir el grado de relación de dos variables siempre y
cuando ambas sean cuantitativas y continuas.

INTERPRETACIÓN:
El valor del índice de correlación varía en el intervalo [-1,1], indicando el signo el sentido de
la relación:

● Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia


total entre las dos variables denominada relación directa: cuando una de ellas
aumenta, la otra también lo hace en proporción constante.
● Si 0 < r < 1, existe una correlación positiva.
● Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las
variables son independientes: pueden existir todavía relaciones no lineales entre las
dos variables.
● Si -1 < r < 0, existe una correlación negativa.
● Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia
total entre las dos variables llamada relación inversa: cuando una de ellas aumenta,
la otra disminuye en proporción constante

Si el valor de la p es superior a 0.05 no hi ha correlació.


a/b → es la P
B/a → es la R
el valor superior ens dona la P i el valor d’abaix ens dona la R
Com més rodó sigui, menys correlació tenen. i com menys pendent hi hagi menys correlació
hi ha.
11/12/18
ANÁLISIS COMPONENTES PRINCIPALES

Studying “resemblance”
- measuring distance as an alternative to “similarity”
- understanding “similarity”: when archaeological observables are similar in
composition.

Basicament estem davant de l’anàlisi de semblança.


el cluster anaylisis era l’analisi perfecte per si voliem saber si hi habia grups dins de les
nostres dades.

MULTIDIMENSIONAL SCALING Y ANALISIS DE LOS COMPONENTES PRINCIPALES:


https://es.wikipedia.org/wiki/Escalamiento_multidimensional

- El escalado multidimensional (EMD) (MDS por sus siglas en inglés) se refiere al


conjunto de técnicas estadísticas utilizadas habitualmente en marketing y ciencias
sociales para la visualización y exploración de datos. Es un procedimiento para tomar
preferencias y percepciones de los encuestados y representarlos en un diagrama
visual. Estos diagramas, llamados mapas perceptuales tienen generalmente dos
dimensiones, pero pueden representarse en más de dos. Los consumidores
potenciales tienen que comparar pares de productos y hacer juicios sobre sus
similitudes. Mientras otras técnicas (como análisis factorial, análisis discriminante y
análisis conjunto) obtienen dimensiones de las respuestas a los atributos de los
productos identificados por el investigador, MDS obtiene las dimensiones de los
juicios de los encuestados sobre la similitud de los productos. Esto supone una
ventaja importante pues los resultados no dependen de los juicios de los
investigadores. No es necesaria una lista de atributos que debe ser mostrada a los
encuestados. Las dimensiones resultantes vienen de los juicios de los encuestados
sobre pares de productos. Gracias a estas ventajas, MDS es la técnica más
comúnmente utilizada en mapeado perceptual.
se utiliza para:
Se utiliza para la representación visual de datos en más de una dimensión (si son más de
tres dimensiones, se requiere más de un gráfico).
Con ello se puede encontrar qué factores (dimensiones) subyacen bajo los datos obtenidos
en un estudio. Se aplica en estudios sobre cognición, psicofísica, psicometría, marketing y
ecología.
Procedimiento del mapeado perceptual:
Existen diferentes pasos que hay que dar para llevar a cabo una investigación de MDS:

● Formulación del problema - ¿Qué variables queremos comparar? ¿Cuántas variables quieres
comparar? Más de 20 sería engorroso. Menos de 8 (4 pares) no arrojaría resultados fiables.
¿Con qué propósito se va a realizar el estudio?
● Obtención de los datos. Los encuestados responden una serie de preguntas. Para cada par
de productos ellos tienen que puntuar la similitud (normalmente, en una escala Likert de 7
puntos de muy similar a muy diferente). La primera pregunta podría ser entre
Coca-Cola/Pepsi por ejemplo, la siguiente entre Coca-Cola/Hires (cerveza), la siguiente entre
Pepsi/Dr Pepper, la siguiente entre Dr Pepper/Hires, etc. El número de preguntas es una
función del número de marcas y puede ser calculado como Q = N (N - 1) / 2 donde Q es el
número de preguntas y N es el número de marcas. Esta aproximación se llama “Datos de
percepción : enfoque directo”. Existen otras dos formas. La "Datos de percepción: enfoque
derivado" en la que los productos se descomponen en atributos que se puntúan en una
escala de diferencias semánticas. La otra es la "Enfoque de datos de preferencia" en que los
encuestados son preguntados sobre sus preferencias y sobre similitudes.
● Manejo del programa estadístico MDS - El software para conducir el proceso está
disponible en la mayoría de las aplicaciones estadísticas. A menudo, se puede elegir entre
Metric MDS (que trata con datos de ratio de nivel o intervalo), y Nonmetric MDS (que trata
con datos originales). Los investigadores deben decidir el número de dimensiones que
quieren que el ordenador cree. Cuantas más dimensiones haya, más fiable será la estadística
pero más difícil será interpretar el resultado.
● Mapeo de los resultados y definición de las dimensiones - El programa estadístico (o un
módulo relacionado) mapeará los resultados. El mapeo situará cada producto normalmente,
en un espacio de dos dimensiones. La proximidad de productos a los demás indicará bien lo
similares que son o lo preferidos que resultan, dependiendo de qué sistema fue utilizado.
Las dimensiones deben ser clasificadas por el investigador. Ello requiere juicio subjetivo lo
que supone un reto. Luego, los resultados deben ser interpretados.
● Testar la validez y fiabilidad de los resultados . Determinar qué proporción o varianza de los
datos de la escala pueden ser tomados en cuenta para el procedimiento MDS. Un R-
cuadrado de 0.6 es considerado el nivel mínimo aceptable. Otros tests posibles son Kruskal’s
Stress, tests de división de datos, tests de estabilidad de datos (i.e.: eliminando una marca),
y fiabilidad test-retest.
- los componenetes principales son un método de analisis multivaariado que permite
reducir la dimensionalidad de conjuntos de datos cuantitativos…..
.

Mira que no tinc ni idea del que està explicant ara i m’importa tant poc sincerament que
l’únic que vull es treure un puto 5 a l’assignatura.

aquest resultat de dalt s’ha de comparar amb el cluster


es diu non metric perque podem barrejar dades molt diferents, podem vincular dades
qualitatives amb dades quantitatives. però per fer això em comptes de fer Euclidean, hem
de fer GOWER.
per 3D:

PER ARRIBAR A FER AQUESTA CHUMINADA HEM DE FER:


- PRIMER en comptes de posar 2D on estavem abans hem de posar 3D, computem,
anem a score, copiem les 3 columnes, les enganchem a les dades.
- SEGON, copiem les dades (no agafem la que posa NAME), son 3 columnes, anem a
PLOT, cliquem a 3D plots i agafem (de les 3 opcions)

- i tercer ja tenim la chuminada del 3D


AQUESTS DOS ÚLTIMS ENS SALVARAN EL CUL PERÒ ELS HEM DE POSAR BE, SI SON
SEMBLANÇA O DIsTANCIA. Aquests analisi anirà molt be quan no tinguem distancies
euclideas.
per exemple :(exemple dels jaciments, demanar apunts a la Laia).
ANALISI DE COMPONENTES PRINCIPALES (EN INGLÉS CLUSTERING TO CLASSIFICATION PCA):
https://es.wikipedia.org/wiki/An%C3%A1lisis_de_componentes_principales ← PER A MÉS
INFO MIRAR AQUÍ
- En estadística, el análisis de componentes principales (en español ACP, en inglés,
PCA) es una técnica utilizada para describir un conjunto de datos en términos de
nuevas variables ("componentes") no correlacionadas. Los componentes se ordenan
por la cantidad de varianza original que describen, por lo que la técnica es útil para
reducir la dimensionalidad de un conjunto de datos.
Técnicamente, el ACP busca la proyección según la cual los datos queden mejor
representados en términos de mínimos cuadrados. Esta convierte un conjunto de
observaciones de variables posiblemente correlacionadas en un conjunto de valores
de variables sin correlación lineal llamadas componentes principales.
El ACP se emplea sobre todo en análisis exploratorio de datos y para construir
modelos predictivos. El ACP comporta el cálculo de la descomposición en
autovalores de la matriz de covarianza, normalmente tras centrar los datos en la
media de cada atributo.
Debe diferenciarse del análisis factorial con el que tiene similaridades formales y en
el cual puede ser utilizado como un método de aproximación para la extracción de
factores.

Fundamento:
- El ACP construye una transformación lineal que escoge un nuevo sistema de
coordenadas para el conjunto original de datos en el cual la varianza de mayor
tamaño del conjunto de datos es capturada en el primer eje (llamado el Primer
Componente Principal), la segunda varianza más grande es el segundo eje, y así
sucesivamente. Para construir esta transformación lineal debe construirse primero la
matriz de covarianza o matriz de coeficientes de correlación. Debido a la simetría de
esta matriz existe una base completa de vectores propios de la misma. La
transformación que lleva de las antiguas coordenadas a las coordenadas de la
nueva base es precisamente la transformación lineal necesaria para reducir la
dimensionalidad de datos. Además las coordenadas en la nueva base dan la
composición en factores subyacentes de los datos iniciales.
El ACP es particularmente útil para reducir la dimensionalidad de un grupo de datos.
Los primeros componentes principales describen la mayor parte de la varianza de
los datos (más cuanto más correlacionadas estuvieran las variables originales).
Estos componentes de bajo orden a veces contienen el aspecto "más importante" de
la información, y los demás componentes se pueden ignorar. Existen diferentes
técnicas para estimar el número de componentes principales que son relevantes; la
técnica más apropiada dependerá de la estructura de correlaciones en los datos
originales
MÉS INFO FENT CAPUTES DE PANTALLA:
MIRAR PDF DESCARREGAT SOBRE AIXÒ, està ubicat a la primera carpeta de quantitativa del
drive.
li donem a correlation i fem recompute.
i anem explicant cada component. (ara be, no se per a que cony serveix)
DUBTES CLASSES 13/12/18

Per a que servia:


- MULTIDIMENSIONAL SCALING Y ANALISIS DE LOS COMPONENTES PRINCIPALES
- Per a que servia l’ANOVA
- PER A QUE SERVIA LA CORRELACIÓ I COM S’INTERPRETAVA
- Prueba de Levene

Per a que servia el Multidimensional scaling i l’analisi del components principals


(explicat als apunts)

Per a que servia l’ANOVA


En estadística, l'anàlisi de la variància (ANOVA, de l'anglès ANalysis Of VAriance) és un
conjunt de models estadístics que s'utilitzen per analitzar les diferències entre les mitjanes
de grups i els seus procediments associats desenvolupat per Ronald Fisher. En la
configuració ANOVA, la variància observada en una variable concreta es divideix en
components atribuïbles a diferents fonts de variació. En la forma més simple, l'ANOVA dóna
un test estadístic sobre si les mitjanes de diversos grups són iguals o no; per tant,
generalitza el test t per a més de dos grups. Com que dur a terme múltiples tests t entre
parelles de mostres tindria com a resultat un augment considerable de la probabilitat de
cometre un error de tipus I, els ANOVA són útils per comparar (testejar) tres o més mitjanes
(grups o variables) per a significació estadística.

Descripció general
Hi ha tres classes conceptuals d'aquests models:

1. El Model d'efectes fixos assumeix que les dades provenen de poblacions normals les
quals podrien diferir únicament en les seves mitjanes. (Model 1)
2. El Model d'efectes aleatoris assumeix que les dades descriuen una jerarquia de
diferents poblacions les diferències queden restringides per la jerarquia. Exemple:
L'experimentador ha après i ha considerat en l'experiment només tres de molts més
mètodes possibles, el mètode d'ensenyament és un factor aleatori en l'experiment.
(Model 2)
3. El Model d'efectes mixtes descriuen situacions que aquest pot prendre. Exemple: Si
el mètode d'ensenyament és analitzat com un factor que pot influir on estan
presents els dos tipus de factors: fixos i aleatoris. (Model 3)

https://ca.wikipedia.org/wiki/An%C3%A0lisi_de_la_vari%C3%A0ncia
Per a que servia la correlació i com s’interpretava

Per a que servia la prova de Levene i com es feia


Es una de les condicions de l’aplicació de l’analisi de variança, ja que l’analisi de la variança
era molt sensible a les diferencies de variança.
https://es.wikipedia.org/wiki/Prueba_de_Levene
En estadística, la prueba de Levene es una prueba estadística inferencial utilizada para
evaluar la igualdad de las varianzas para una variable calculada para dos o más grupos.
Algunos procedimientos estadísticos comunes asumen que las varianzas de las poblaciones
de las que se extraen diferentes muestras son iguales. La prueba de Levene evalúa este
supuesto. Se pone a prueba la hipótesis nula de que las varianzas poblacionales son iguales
(llamado homogeneidad de varianza ú homocedasticidad). Si el P-valor resultante de la
prueba de Levene es inferior a un cierto nivel de significación (típicamente 0.05), es poco
probable que las diferencias obtenidas en las variaciones de la muestra se hayan producido
sobre la base de un muestreo aleatorio de una población con varianzas iguales. Por lo tanto,
la hipótesis nula de igualdad de varianzas se rechaza y se concluye que hay una diferencia
entre las variaciones en la población.
Algunos de los procedimientos que asumen normalmente homocedasticidad, para lo cual
uno puede utilizar las pruebas de Levene, incluyen análisis de varianza y pruebas t.
La prueba de Levene se utiliza a menudo antes de que una comparación de medias. Cuando
la prueba de Levene muestra significación, se debe cambiar a pruebas generalizadas
(pruebas no paramétricas), libre de supuestos de homocedasticidad.
La prueba también puede ser utilizada como una prueba principal para responder a una
pregunta independiente de si dos sub-muestras en una población dada tienen varianzas
iguales o diferentes.
Si el resultat es inferior a 0.05 ens vol dir que la T de estudient i el test d’anova no es fiable.
si no es fiable ens anem amb l’anova a la proba de krustel weellis i amb la t de estudent
(????????) (només si tenim més de dos grups).

QUE ES LA HIPOTESIS NULA:

Es una manera rara de pensar, es allò que esperem, una situació que coneixem, pero que
podem asumir perfectament.
https://es.wikipedia.org/wiki/Hip%C3%B3tesis_nula
En estadística, una hipótesis es una afirmación sobre un parámetro de la población (como la
media o desviación estándar) y se representa con H 0. La hipótesis nula es una afirmación
que no se rechaza a menos que los datos de la muestra parezcan evidenciar que es falsa.
Para afirmar que la hipótesis nula es verdadera se requiere estudiar a toda la población. La
hipótesis nula generalmente incluye un no en su enunciado.
El término hipotesis nula surge de las primeras aplicaciones agrícolas y médicas de la
estadística. Con el fin de probar la efectividad de un nuevo fertilzante o una nueva medicina
la hipótesis que se probaba era que no hubo efecto, es decir no hubo diferencia entre las
muestras tratadas y no tratadas.
Si los resultados de nuestra muestra no respaldan la hipotesis nula, rechazamos la hipótesis
y la conclusión que si aceptamos se llama hipotesis alternativa H1.

el que mirem es la posibilitat de que aquesta hipotesis nuela es compleixi. Quina es la


probablibitat de que m’equivoqui si l’hipotesis nula es equivoca? això es el que ens dona la
P.

TREBALL FINAL

PEL TREBALL EVITAR QUAN ES DIU ES MOLT PROBABLE, SI ES DIU ES


NECESITA POSAR PERCENTATGES.

SEPARAR PER CATEGORIES D’ESPAI I TEMPS LES DADES QUE ENS DONI.

También podría gustarte