Multiblokk-metoder Oppsummering av metodene beskrevet i: Westerhuis etal., J. Chemometrics, 12(5), 301-321, 1998 Westerhuis etal., J. Chemometrics, 15(5), 485-493, 2001 - en del av Matalliansen UMB - Matforsk - Akvaforsk
Innhold Notasjon Multiblokk PCA CPCA HPCA Multiblokk PLS HPLS MBPLS - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 2 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Notasjon: Valg av bokstaver - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 3 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Grafisk notasjon: Vanlig PCA - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 4 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Grafisk notasjon: Vanlig PLS (NIPALS) - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 5 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Konsensus PCA og Hierarkisk PCA - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 6 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Konsensus PCA og Hierarkisk PCA (cont.) CPCA: HPCA: Wold et al. 1987: Bare w T normalisert til lengde 1. Pga. konvergensproblemer: Både w T og p b blir normalisert Wold et al. 1996: Bare t T normalisert til lengde 1. Pga. konvergensproblemer: Både t T og t b blir normalisert, se f.eks. Rännar et al. 1998. Men likevel har HPCA fremdeles konvergensproblemer: Løsningen er avhengig av startverdi: Bruk første egenvektor av X T X som t T. CPCA har samme objektfunksjon som PCA, mens for HPCA er objektfunksjonen uklar. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 7 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Konsensus PCA og Hierarkisk PCA (cont.) HPCA ignorerer sterke retninger fra én blokk til fordel for svakere retninger som er til stede i flere blokker. CPCA bruker et vektet gjennomsnitt av blokk-scorene. Forskjeller/likheter: Når blokkene er enige gir begge metodene samme resultat. Når alle blokker er ortogonale (ingen konsensus): CPCA velger den blokk-scoren med størst varians HPCA bruker gjennomsnittet av blokk-scorene, uavhengig av variansen. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 8 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Multiblokk PLS-metoder Stammer fra PLS path modelling (Gerlach, Kowalski, Wold, 1979), en ikkeprediktiv metode Prediktive versjoner publisert av bl.a. Frank og Kowalski (1984, 1984 og 1985) HPLS: Revidert utgave av Wold et al. (1987) (CPCA + PLS) Slama (1991) introduserte en annen normalisering, også brukt av Wold et al. (1996) MBPLS: Introdusert av Wangen og Kowalski (1988), basert på Wold, Martens og Wold (1984). Flere muligheter: Blokker kan være både høyre-, venste- og midt-blokker. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 9 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Hierarkisk PLS (HPLS = HPCA + PLS) - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 10 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Hierarkisk PLS (HPLS) (cont.) Originalt publisert (Wold et al. 1987) som CPCA + PLS, dvs. med w T normalisert til lengde 1. Senere publisert (Slama 1991 og Wold et al. 1996) som HPCA + PLS, dvs. med t T normalisert til lengde 1 - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 11 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Multiblokk PLS (MPLS = PLS + PLS) - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 12 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Multiblokk PLS (MPLS) (cont.) Publisert av Wangen og Kowalski (1988), basert på en artikkel av Wold, Martens og Wold (1984). Originalt: Blokk scores t b brukes til deflatering: Blokk-scorene blir ortogonale, mens super-scorene t T gjør det ikke. Westerhuis og Coenegracht (1997): Dette er ikke så lurt fordi bare w T t b brukes til prediksjon av Y: Man mister informasjon i X. Derfor: Bedre å bruke super-scores t T til deflatering. Dette gir ortogonale t T og svakt korrelerte t b. Men: Westerhuis et al. (2001): Deflatering av X med super-scores blander informasjonen i de ulike blokkene X b. Derfor: Bruk super-scores t T til deflatering, men deflater bare Y. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 13 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Sammenligning av HPLS og MBPLS Normalisering: HPLS: Bare super-scores t T normaliseres MBPLS: Både blokk-vekter w b og super-vekter w T blir normalisert Blokk-regresjon: HPLS: Y regresseres bare mot super-blokken T. MBPLS: Y regresseres både mot hver blokk X b og mot superblokken T. Felles: Blokk-scorene t b deles på roten av antallet variabler i hver blokk b, for at ikke blokker med mange variable skal dominere. Både HPLS og MBPLS (med super-score deflatering) kan brukes mot flere Y-blokker. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 14 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Sammenligning av HPLS og MBPLS HPLS fungerer som en blokk-seleksjons metode: For hver faktor brukes bare en eller noen få blokker. HPLS er som en HPCR: Super-scorene endrer seg nesten ikke hvis Y byttes ut med tilfeldige tall. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 15 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en
Sammenligning med standard metoder CPCA vs. PCA: Scores/loadings/vekter for hver blokk (også super-blokken) og forklart varians i hver blokk kan også finnes med vanlig PCA: X = [X 1 /m 1/2 X1,..., X B /m 1/2 XB ] t T t, og fra disse kan resten finnes. MBPLS vs. PLS: Scores/loadings/vekter for hver blokk (også super-blokken) og forklart varians i hver blokk kan også finnes med vanlig PLS: Gitt super-score deflatering, og samme X som over t T t og u u, og fra disse kan resten finnes. PCA og PLS er bedre til å håndtere missing values, fordi informasjon fra alle variablene utnyttes, ikke bare innen blokken Anbefales å bruke standard-metoder (med riktig vekting) og deretter regne ut blokk-faktorene. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 16 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en