Multiblokk-metoder. - en del av Matalliansen UMB - Matforsk - Akvaforsk



Like dokumenter
Holdbarhet av strimlet kyllingkjøtt

Likning- bingo ark 1

Salting of dry-cured ham

Consumers associations related to traditional food products

ST0202 Statistikk for samfunnsvitere

Notasjon og Tabell 8. ST0202 Statistikk for samfunnsvitere

1 Section 6-2: Standard normalfordelingen. 2 Section 6-3: Anvendelser av normalfordelingen. 3 Section 6-4: Observator fordeling

"Hjerneteppe!" er en huskelek hvor du skal huske stadig lengre rekker med bokstaver!

INF3170 / INF4171. Normalisering. Andreas Nakkerud. 24. september 2015

NORCEM A.S FoU Avd. RAPPORT NR. GRADERING Åpen 9D4/03017 OPPDRAG

Hvor i All Verden? Del 2 Erfaren Scratch PDF

UNIVERSITETET I OSLO

Hva er en algoritme? Har allerede sett på mange algoritmer til nå i IT1101. Forholdet mellom en algoritme og et program. Algoritme program prosess

Kap. 10: Inferens om to populasjoner. Eksempel. ST0202 Statistikk for samfunnsvitere

ØVINGER 2017 Løsninger til oppgaver. Øving 1

Eksamensoppgave i PSY3100 Forskningsmetode - Kvantitativ

10.1 Enkel lineær regresjon Multippel regresjon

Dataanalyse. Hva er en dataanalyse og hvordan gå frem for å gjennomføre en dataanalyse av det innsamlede datagrunnlaget fra en feltundersøkelse?

7.2 Sammenligning av to forventinger

Resultater fra kartlegging av rest-o 2 i pakninger for 3 påleggsvarianter

Innføring i bruk av skolens/barnehagens hjemmesider (for ansatte)

Noen Statistiske utfordringer ved analyse av PROM

1 10-2: Korrelasjon : Regresjon

Eksamensoppgave i TMA4267 Lineære statistiske modeller

Simulering med Applet fra boken, av z og t basert på en rekke utvalg av en gitt størrelse n fra N(μ,σ). Illustrerer hvordan estimering av variansen

Geometra. Brukermanual. Telefon:

Last ned På sykkel i fjellet - Øyvind Wold. Last ned. Last ned e-bok ny norsk På sykkel i fjellet Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi

ST0202 Statistikk for samfunnsvitere

ESTIMATION OF PREANALYTICAL UNCERTAINTY IN CLINICAL CHEMISTRY

Last ned Opus 9 - Gjermund Andreassen. Last ned

Skjema for søknad om prosjektmidler

Repeated Measures Anova.

Last ned Risiko - Ingvild Laila Vatnelid. Last ned. Last ned e-bok ny norsk Risiko Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi

MA1201 Lineær algebra og geometri Løsningsforslag for eksamen gitt 3. desember 2007

KOM I GANG MED WORDPRESS En enkel guide for å hjelpe deg gjennom det grunnleggende i Wordpress

EKSAMEN I FAG 75510/75515 STATISTIKK 1 Tirsdag 20. mai 1997 Tid: 09:00 14:00

Detaljerte forklaringer av begreper og metoder.

Farger Introduksjon Processing PDF

Bevaring av nettsider

Hvordan bruke Hageselskapets muligheter for levende bokmerker (RSS)?

Dokument-embeddings / Markov-kjeder. Fredrik Jørgensen, Schibsted Media/UiO

Øgrim Bakken Pettersen Skrindo Dypbukt Mustaparta Thorstensen Thorstensen. Digitalt verktøy for Sigma R1. Casio fx-9860

EKSAMEN 6108/6108N PROGRAMMERING I JAVA Alt trykt og skriftlig materiale.

Hvordan installere Java og easyio på Windows

Multippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.

UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet

Statistikk 1. Nico Keilman. ECON 2130 Vår 2014

Statistikk & dataanalyse: Et eksempel. Frode Svartdal UiT mars 2015

Rekursjon og lister. Stephan Oepen & Erik Velldal. 1. februar, Universitetet i Oslo

Flaksefugl Nybegynner Scratch Lærerveiledning

3D-Flakser, Del 1 Ekspert Scratch PDF

INF2220: Time 4 - Heap, Huffmann

Kapittel 3. Basisbånd demodulering/deteksjon. Avsnitt

Innstallasjon og oppsett av Wordpress

Kapittel 12. Spredt spektrum

STUDIEÅRET 2013/2014. Individuell skriftlig eksamen. VTM 200- Vitenskapsteori og metode. Fredag 25. april 2014 kl

Forelening 1, kapittel 4 Stokastiske variable

Kapittel 3: Studieopplegg

EKSAMENSOPPGAVE Georg Elvebakk NB! Det er ikke tillatt å levere inn kladd sammen med besvarelsen

Bygg et Hus. Steg 1: Prøv selv først. Sjekkliste. Introduksjon. Prøv selv

Steg 1: Opprette spillskjerm

Kort oversikt: VISUALISING MULTI-WAY SENSORY DATA

DEL 1 GRUNNLEGGENDE STATISTIKK

For å sjekke at Python virker som det skal begynner vi med å lage et kjempeenkelt program. Vi vil bare skrive en enkel hilsen på skjermen.

Forelesning 3: Effektivitet, bærekraft og markeder. Formål forstå dynamisk og statisk effesiens nåverdi og diskontering grunnrente og bærekraft

Utvidet brukerveiledning

Appendiks 5 Forutsetninger for lineær regresjonsanalyse

CP-foreningen Påmeldingsskjemaer for arrangementer

Last ned Sunrise in Kragerø - Hans-Martin Frydenberg Flaatten. Last ned

Gleason score 50 år! - Hvor står vi nå? Ulrika Axcrona overlege, dr. med. Årsmøte patologiforeningen april, 2016

Helsepolitikk i et valgår er ikke nødvendigvis god helseøkonomi

Lakebehandling av fiskefilet

Multiblokkseminaret: LS-PLS. Bjørn-Helge Mevik

Hvordan gjøre fjernhjelp til noen som ønsker hjelp med Hageselskapets portal? Av Ole Petter Vik, Asker Versjon

HØGSKOLEN I SØR-TRØNDELAG Avdeling for informatikk og e-læring - AITeL

Utfordringer knyttet til statistisk analyse av komposittdata

Last ned Airfix mobiliserer - Heine Wang. Last ned. Last ned e-bok ny norsk Airfix mobiliserer Gratis boken Pdf, ibook, Kindle, Txt, Doc, Mobi

Utfordringer og fordeler med en flerkulturell arbeidsplass

Gå til Drawing and Animation i Palette-menyen og legg til Canvas og Ball. OBS! Ball må slippes inni Canvas på skjermen for at den skal bli lagt til.

Mer om mengder: Tillegg til Kapittel 1. 1 Regneregler for Booleske operasjoner

EKSAMEN I PSY3100 FORSKNINGSMETODE KVANTITATIV HØSTEN 2012

ÅMA110 Sannsynlighetsregning med statistikk, våren

Hvis du får problemer eller ønsker mer hjelp til å gjøre dette, er Anders og Helene tilgjengelige for assistanse. Veiledning for Windows

Bruke handlinger til å gjøre ulike oppgaver

Løsningsforslag for eksamen i fag SIF8010 Algoritmer og datastrukturer Lørdag 9. august 2003, kl

16 Ortogonal diagonalisering

Veiledning og tilleggsoppgaver til kapittel 3 i Her bor vi 1

Algoritmer og Datastrukturer

Last ned Norsk grammatikk for læreren - Kirsti Mac Donald. Last ned

Last ned Norsk grammatikk for læreren - Kirsti Mac Donald. Last ned

Kapittel 5: Tilfeldige variable, forventning og varians.

Steg 1: Streken. Steg 2: En hoppende helt. Sjekkliste. Sjekkliste. Introduksjon. Hei der! Hoppehelt

Bygge en kube. Steg 1: Lage en ny mod. Sjekkliste. Introduksjon

Last ned Forurensningsloven - Øystein Wang. Last ned

Hvorfor er det så vanskelig å forklare nedgangen i antall drepte i trafikken?

Utvikling av ulykkesmodeller for ulykker på riks- og fylkesvegnettet i Norge

Deskriptiv statistikk., Introduksjon til dataanalyse

Hvordan agerer barn og unge?

Veiledningen gjelder skoler som ikke har Feide-innlogging.

Oppgavesett nr. 5. MAT110 Statistikk 1, Et transportfirma har et varemottak for lastebiler med spesialgods, se figur 1.

Transkript:

Multiblokk-metoder Oppsummering av metodene beskrevet i: Westerhuis etal., J. Chemometrics, 12(5), 301-321, 1998 Westerhuis etal., J. Chemometrics, 15(5), 485-493, 2001 - en del av Matalliansen UMB - Matforsk - Akvaforsk

Innhold Notasjon Multiblokk PCA CPCA HPCA Multiblokk PLS HPLS MBPLS - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 2 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Notasjon: Valg av bokstaver - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 3 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Grafisk notasjon: Vanlig PCA - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 4 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Grafisk notasjon: Vanlig PLS (NIPALS) - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 5 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Konsensus PCA og Hierarkisk PCA - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 6 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Konsensus PCA og Hierarkisk PCA (cont.) CPCA: HPCA: Wold et al. 1987: Bare w T normalisert til lengde 1. Pga. konvergensproblemer: Både w T og p b blir normalisert Wold et al. 1996: Bare t T normalisert til lengde 1. Pga. konvergensproblemer: Både t T og t b blir normalisert, se f.eks. Rännar et al. 1998. Men likevel har HPCA fremdeles konvergensproblemer: Løsningen er avhengig av startverdi: Bruk første egenvektor av X T X som t T. CPCA har samme objektfunksjon som PCA, mens for HPCA er objektfunksjonen uklar. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 7 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Konsensus PCA og Hierarkisk PCA (cont.) HPCA ignorerer sterke retninger fra én blokk til fordel for svakere retninger som er til stede i flere blokker. CPCA bruker et vektet gjennomsnitt av blokk-scorene. Forskjeller/likheter: Når blokkene er enige gir begge metodene samme resultat. Når alle blokker er ortogonale (ingen konsensus): CPCA velger den blokk-scoren med størst varians HPCA bruker gjennomsnittet av blokk-scorene, uavhengig av variansen. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 8 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Multiblokk PLS-metoder Stammer fra PLS path modelling (Gerlach, Kowalski, Wold, 1979), en ikkeprediktiv metode Prediktive versjoner publisert av bl.a. Frank og Kowalski (1984, 1984 og 1985) HPLS: Revidert utgave av Wold et al. (1987) (CPCA + PLS) Slama (1991) introduserte en annen normalisering, også brukt av Wold et al. (1996) MBPLS: Introdusert av Wangen og Kowalski (1988), basert på Wold, Martens og Wold (1984). Flere muligheter: Blokker kan være både høyre-, venste- og midt-blokker. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 9 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Hierarkisk PLS (HPLS = HPCA + PLS) - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 10 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Hierarkisk PLS (HPLS) (cont.) Originalt publisert (Wold et al. 1987) som CPCA + PLS, dvs. med w T normalisert til lengde 1. Senere publisert (Slama 1991 og Wold et al. 1996) som HPCA + PLS, dvs. med t T normalisert til lengde 1 - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 11 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Multiblokk PLS (MPLS = PLS + PLS) - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 12 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Multiblokk PLS (MPLS) (cont.) Publisert av Wangen og Kowalski (1988), basert på en artikkel av Wold, Martens og Wold (1984). Originalt: Blokk scores t b brukes til deflatering: Blokk-scorene blir ortogonale, mens super-scorene t T gjør det ikke. Westerhuis og Coenegracht (1997): Dette er ikke så lurt fordi bare w T t b brukes til prediksjon av Y: Man mister informasjon i X. Derfor: Bedre å bruke super-scores t T til deflatering. Dette gir ortogonale t T og svakt korrelerte t b. Men: Westerhuis et al. (2001): Deflatering av X med super-scores blander informasjonen i de ulike blokkene X b. Derfor: Bruk super-scores t T til deflatering, men deflater bare Y. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 13 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Sammenligning av HPLS og MBPLS Normalisering: HPLS: Bare super-scores t T normaliseres MBPLS: Både blokk-vekter w b og super-vekter w T blir normalisert Blokk-regresjon: HPLS: Y regresseres bare mot super-blokken T. MBPLS: Y regresseres både mot hver blokk X b og mot superblokken T. Felles: Blokk-scorene t b deles på roten av antallet variabler i hver blokk b, for at ikke blokker med mange variable skal dominere. Både HPLS og MBPLS (med super-score deflatering) kan brukes mot flere Y-blokker. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 14 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Sammenligning av HPLS og MBPLS HPLS fungerer som en blokk-seleksjons metode: For hver faktor brukes bare en eller noen få blokker. HPLS er som en HPCR: Super-scorene endrer seg nesten ikke hvis Y byttes ut med tilfeldige tall. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 15 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en

Sammenligning med standard metoder CPCA vs. PCA: Scores/loadings/vekter for hver blokk (også super-blokken) og forklart varians i hver blokk kan også finnes med vanlig PCA: X = [X 1 /m 1/2 X1,..., X B /m 1/2 XB ] t T t, og fra disse kan resten finnes. MBPLS vs. PLS: Scores/loadings/vekter for hver blokk (også super-blokken) og forklart varians i hver blokk kan også finnes med vanlig PLS: Gitt super-score deflatering, og samme X som over t T t og u u, og fra disse kan resten finnes. PCA og PLS er bedre til å håndtere missing values, fordi informasjon fra alle variablene utnyttes, ikke bare innen blokken Anbefales å bruke standard-metoder (med riktig vekting) og deretter regne ut blokk-faktorene. - en del av Matalliansen : UMB - Matforsk - Akvaforsk Ark nr.: 16 Tuesday, May 16, 2006 Forfatter: Martin Høy Arkivert: På Mac en