Maskinlæring og nevrale nettverk
|
|
- Grethe Nordli
- 6 år siden
- Visninger:
Transkript
1 Maskinlæring og nevrale nettverk En innføring Sven Haadem Unify AI, phd matematikk/statistikk UiO 1
2 Kan vi si noe om fremtiden og i så fall hva? A priori og a posteriori viten Emperi - problemet med induksjon Falsifisering Statistikk Deterministisk/stokastisk verden Frekventist Bayesiansk 2
3 Klassisk kunstig intelligens Hardkodede regler - Good Old-Fashioned AI (GOFAI) Er symbolsk: Bruker symboler og logikk for å beskrive hardkodete regler. Booles proposisjons-logikk Freges predikativ-logikk 3
4 Maskinlæring Connectionism En tilnærming som begynte på 50 tallet. Har fått kraftig fotfeste siste 10 år takket være utvikling i algoritmer og maskinvare. Bygger på kunstige nevrale nettverk. Er sub-symbolsk Legemlig kognisjon Intelligens uten intern representasjon. 4
5 Hva slags type kunstig intelligens kan vi lage og hvordan teste den Sterk AI Det Kinesiske rom argumentet (Sears) Svak AI Turing test 5
6 Hva ønsker vi å oppnå? Gitt et trenings-datasett hvor x er det vi måler og y er det vi ønsker å predikere ved en funksjon f av x. Da vil vi minimere avstanden mellom f (x) og y, hvor avstanden er målt ved en taps funksjon: ( ) eksempel L(y, f (x)) = (f (x) y) 2 Dermed har vi problmet min argl(y, f (x)) f 6
7 Enkel modell Y predikeres ved en lineær modell f (x) = β 0 + β 1 x. Hvor vi bruker minste kvadrats tap: L (y, f (x)) = (y f (x)) 2 = (y β 0 β 1 x) 2. Da har vi problemet: min arg β 0,β 1 (y β 0 β 1 x) 2 7
8 Enkel modell For hele datasettet har vi da totalt tap: N (y i β 0 β 1 x i ) 2. i=1 8
9 Enkel linear regresjon Ti variabler: alder kjønn kroppmasseindeks gjennomsnittlig blodtrykk seks blodserummålinger for n = 442 diabetespasienter samt nivå ett år etter første måling. For enkelhet bruker vi bare alder: (progresjon 1 år etter første prøve) = (alder justert). 9
10 Datasettet 10
11 Predikert 11
12 Naiv klassifisering Hva om vi prøver å predikere en klasse tilhørighet og ikke en kontinuerlig verdi? Kan ikke bruke lineær regresjon naivt. Eksempel: Prøv å predikere Iris blomstertype utifra lengde på spedal. To typer Iris: 1 og 0. Type = 0, 2 + 0, 1 (lengde på spedal). 12
13 Logistisk regresjon Vi må transformere den lineære predikasjonen til å ligge mellom 0 og 1: P(Type = 0 X = x) = exp(β 0 + β 1 x) 1 + exp(β 0 + β 1 x) 1 P(Type = 1 X = x) = 1 + exp(β 0 + β 1 x) Grunnet formen på støyet i denne modellen kan vi ikke minimere kvadrat funksjonen til tapet. Vi er nødt til å bruke maksimum likelihood. Denne metoden vil vi se igjen i nevrale nettverk. 13
14 Klassifisering 14
15 Datavisualisering av to klasser med data 15
16 Klassifisering 16
17 Overtilpasning Problem med avanserte metoder og store data mengder er overtilpasning. Løsninger: Trenings-sett og validerings-sett K-fold validering Legg till tilfeldig støy (dropout) Straff modeller med mange variabler (AIC, BIC) 17
18 La oss lage noen modeller av dataene og beregne modellenes nøyaktighet på usett data. Vi 1. Skiller ut en valideringsdatasettet. 2. Setter opp for bruk av 10-fold kryssvalidering. 3. Bygger 5 forskjellige modeller for å forutsi arter fra blomster målinger 4. Velger så den beste modellen. 18
19 Suksess-mål Precision: Recall: Accuracy: F1 Score. Rangerings korrelasjonsmål. ROC. sp sp + fp sp sp + fn sp + sn sp + sn + fp + fn 19
20 Flere modell-typer Logistic Regression (LR). Linear Discriminant Analysis (LDA). k-nearest Neighbors (KNN). Classification and Regression Trees (CART). Gaussian Naive Bayes (NB). Support Vector Machines (SVM). 20
21 k-nearest Neighbors (KNN) Veldig enkel og effektiv metode ved lave dimensjoner. Tar snittet av de k-nærmeste naboene f (x) = 1 k x i N k (x) y i. Hvor N k (x) er de k nærmeste naboene til x. 21
22 Support vector machines (SVM) Istedenfor kvadratet bruker vi nå absolutt verdien som tapsfunskjon L (y, f (x)) = y f (x) La oss slippe noen datapunkter over grensen mellom klassene y f (x) ɛ, if y f (x) > ɛ L (y, f (x)) = 0, if y f (x) ɛ 22
23 Enesmble Ofte kan mange enkle modeller sammen gi bedre resultat enn en avansert. Bagging Boosting Bøtte med modeller Bayesiansk parameter gjenomsnitt Bayesiansk modell kombinering Stacking Klassifisering og regresjons trær (CART) bruker ofte bagging eller boosting. 23
24 Klassifiserings trær 24
25 Online trening La nå X være en vektor (eller matrise) av observerte. Vi ønsker da å minimere (Y βx ) 2 med hensyn på β. Løsningen er gitt ved β = (XX T ) 1 XY 25
26 Bratteste nedstigning Vi ønsker og oppdatere vår parameter β for hvert nytt datapunkt uten å gjøre alle beregningene på nytt. Kan da bruke bratteste nedstigning: For vår taps-funksjon β n = β n 1 + µ n L(β n 1 ) L (y, f (x)) = (y f (x)) 2 = (y β 0 β 1 x) 2. får vi β n = β n 1 µ ( XX T β n 1 XY ) 26
27 Stokastisk approksimasjon Vi vil helst slippe å beregne XX T for hele datasettet, vi vet det ikke på forhånd. Bruk approksimasjon β n = β n 1 + µ n L(β n 1, y n, x n ) For vår taps-funksjon L (y, f (x)) = (y f (x)) 2 = (y β 0 β 1 x) 2. får vi β n = β n 1 + µ n x n (y n x n β n 1 ) 27
28 Konveks optimalisering Hva om taps-funksjonen L(y, f (x)) ikke er konveks? 28
29 Tidsserier ARMA State Space Kalmanfilter Partikkelfilter VARMA Rekurente nevrale nettverk (Deep Learning) 29
30 Grafiske modeller og nettverk 30
31 Sigmoid aktiverings funksjon Se på klassifiserings funksjonen vi brukte: 31
32 Perceptron 32
33 Nevrale nettverk 33
34 Trening av nevrale nettverk 34
35 Trening av nevrale nettverk 35
36 Trening av nevrale nettverk 36
37 Trening av nevrale nettverk 37
38 Trening av nevrale nettverk 38
39 Trening av nevrale nettverk 39
40 Trening av nevrale nettverk 40
41 Trening av nevrale nettverk 41
42 Trening av nevrale nettverk 42
43 Convolutional nevrale nettverk (CNN) Ofte brukt til å kategorisere objekter i bilder. Les først bilde i RGB form: 43
44 Convolutional nevrale nettverk (CNN) Kjør filter (kernel) over bildet. Trekk ut viktig informasjon: 44
45 Hvilken informasjon trekker kernelene ut Orginalt bilde: Hva kernelene velger ut: 45
46 Økosystem Python SQL og NO-SQL Sparks pipelines 46
47 Kan vi lage beviste maskiner? Materialistisk syn Framvoksende når det blir komplekst nok Eksisterer ikke - en illusjon (Daniell Dennett) Bevissthet utvikles - Bicameral Mind (Julian Jaynes -Westworld) Bevissthet er en indre fokus - Global Workspace Theory Hjernen ser seg selv - Hoffstaders strange loops Bevissthet er en ikke-materiell egenskap Bevissthet er en egenskap ved alle partikler - Integrated information theory (Tononi) En maskin kan aldri bli bevist En maskin kan tiltrekke seg bevissthet Gödel s ufullstendighets teorem 47
48 Trengs det bevissthet for å tenke intelligent? Bevissthet er et nivå som overkjører lavere bevisstheter, uten den er ikke virkelig intelligente maskiner mulig. Nei. 48
49 Vi har sett: Fundamentet til maskinlæring. Enkle modeller Linear regresjon Logistisk regresjon k-nearest Neighbors (KNN). Avanserte metoder Ensembling Klassifisering og regresjons trær (CART). Support Vector Machines (SVM). Nevrale nettverk og Deep Learning Håndtering av overtilpasning Mål for suksess Økosystem for maskinlæring 49
50 Uttrekk fra klassisk datasett 50
51 Begrenset binært datasett 51
52 Python eksempel x = tf. placeholder (tf.float32, [None, 784], name="x-in") true_y = tf. placeholder (tf.float32, [None, 10], name="y-in") keep_prob = tf. placeholder (" float ") x_image = tf. reshape (x,[ -1,28,28,1]) hidden_1 = slim. conv2d ( x_image,5,[5,5]) pool_1 = slim. max_pool2d ( hidden_1,[2,2]) hidden_2 = slim. conv2d ( pool_1,5,[5,5]) pool_2 = slim. max_pool2d ( hidden_2,[2,2]) hidden_3 = slim. conv2d ( pool_2,20,[5,5]) hidden_3 = slim. dropout (hidden_3, keep_prob ) out_y = slim. fully_connected (slim. flatten ( hidden_3 ),10, activation_fn =tf.nn. softmax ) cross_entropy = -tf. reduce_sum ( true_y *tf.log ( out_y )) correct_prediction = tf. equal (tf. argmax (out_y,1), tf. argmax (true_y,1)) accuracy = tf. reduce_mean (tf.cast ( correct_prediction, " float ")) train_step = tf. train. AdamOptimizer (1e -4). minimize ( cross_entropy ) 52
53 Overtilpasning - løsning Del opp treningssettet i trening- og validerings-sett X_train, X_test, y_train, y_test = train_test_split (X, Y) regr = linear_model. LogisticRegression () regr. fit ( X_train, y_train ) 53
(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2018) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
STK Maskinlæring og statistiske metoder for prediksjon og klassifikasjon
STK2100 - Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Oppsummering av kurset 17. april 2018 Hovedproblem Input x R p. Output y Numerisk: regresjon Kategorisk: Klassifikasjon Gitt
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
Eksamen i TDT Oppgaver. Ruben Spaans. December 6, 2012
Eksamen i TDT4173 Ruben Spaans December 6, 2012 1 Oppgaver Oppgave 1. Dener hva et velformulert læringsproblem (well-posed learning problem) er. Svar Det betyr at læringen vil forbedres med erfaring for
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2 Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Eksamensdag: Torsdag 4. juni 28. Tid for eksamen: 4.3
Eksamen - INF 283 Maskinlæring
Eksamen - INF 283 Maskinlæring 23 feb. 2016 Tid: 3 timer Eksamen inneholder 15 oppgaver, som vil bli vektet likt ved evaluering. 1 Table 1 attributt antall personer forsørget av låntaker månedlig inntekt
Ridge regresjon og lasso notat til STK2120
Ridge regresjon og lasso notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på noen alternativer til minste kvadraters metode ved lineær regresjon. Metodene er særlig aktuelle
Om eksamen. Never, never, never give up!
I dag I dag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve 3 a og b (inkl SME) Om eksamen (Truleg) 10 punkt.
Prøveeksamen STK2100 (fasit) - vår 2018
Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen
Modellering av Customer Lifetime Value og hvordan bruke det Øystein Sørensen Data Scientist
Modellering av Customer Lifetime Value og hvordan bruke det Øystein Sørensen Data Scientist Customer Lifetime Value (CLV) Diskontert nåverdi av hele det fremtidige kundeforholdet CLV for alle kunder gir
STK Oppsummering
STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer
Om eksamen. Never, never, never give up!
Plan vidare Onsdag Gjere ferdig kap 11 + repetisjon Fredag Rekning av eksamensoppgåver Eksamen Mai 2014, oppgåve 2 (inkl normal fordeling, lin.reg. og deskriptiv statistikk) Eksamen August 2012, oppgåve
Forbedret kundeopplevelse og reduserte driftskostnader ved bruk av maskinlæring i nettskyen. Heidi Brunborg IT-direktør i Lånekassen
Forbedret kundeopplevelse og reduserte driftskostnader ved bruk av maskinlæring i nettskyen Heidi Brunborg IT-direktør i Lånekassen Før vi starter Utbetaler årlig 30 milliarder kroner i utdanningsstøtte
KUNSTIG INTELLIGENS I PRAKSIS NOKIOS 2018 KURS 1.
KUNSTIG INTELLIGENS I PRAKSIS NOKIOS 2018 KURS 1. HVEM ER VI Fabian Sødal Dietrichson Accenture Technology Martin Kowalik Gran Accenture Technology Runar Gunnerud Accenture Consulting XKCD.COM AGENDA 1.
Prøveeksamen STK vår 2017
Prøveeksamen STK2100 - vår 2017 Geir Storvik Vår 2017 Oppgave 1 Anta en lineær regresjonsmodell p Y i = β 0 + β j x ij + ε i, j=1 ε i uif N(0, σ 2 ) Vi kan skrive denne modellen på vektor/matrise-form:
TMA4240 Statistikk Høst 2009
TMA4240 Statistikk Høst 2009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Oppgave 1 Oppgave 11.5 fra læreboka. Oppgave 2 Oppgave 11.21 fra læreboka. Oppgave
Kurs i automatisk skog kartlegging 5-7 september 2018
Kurs i automatisk skog kartlegging 5-7 september 2018 juni 2018 TerraNor har gleden av å invitere til kurs i bruken av ecognition Developer fra Trimble, verdens mest avanserte program for objekt analyse
Robotene kommer - Introduksjon om RPA og AI
Robotene kommer - Introduksjon om RPA og AI Hva er kunstig intelligens, hva kan det brukes til og hvordan må man bygge compliance inn i jobben som utføres? Høstseminar 18. oktober 2017 18.10.2017 Knowit
TMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
Kapittel 6 - modell seleksjon og regularisering
Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,
Casio. Et oppdatert Casio Manual som tar av seg litt av faget MA-155. En basis guide for bruk av Casio. Denne manualen er skrevet av «EFN»
Casio Et oppdatert Casio Manual som tar av seg litt av faget MA-155. En basis guide for bruk av Casio. Denne manualen er skrevet av «EFN» Denne manualen bruker eksempler fra utgaven 2017: Statistikk En
Generalisering til mange klasser - feilrettingsmetodene
Mange klasser Generalisering til mange klasser - feilrettingsmetodene Kesslers konstruksjon - omskriving av c-klasseproblemet til et toklasseproblem. Her innføres en sammensatt vektvektor a og et sett
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1. Eksamensdag: Tirsdag 11. desember 2012. Tid for eksamen: 14.30 18.30. Oppgavesettet
Snøtetthet. Institutt for matematiske fag, NTNU 15. august Notat for TMA4240/TMA4245 Statistikk
Snøtetthet Notat for TMA424/TMA4245 Statistikk Institutt for matematiske fag, NTNU 5. august 22 I forbindelse med varsling av om, klimaforskning og særlig kraftproduksjon er det viktig å kunne anslå hvor
HMM-tagging INF4820 H2008. Jan Tore Lønning. 30. september. Institutt for Informatikk Universitetet i Oslo
INF4820 H2008 Institutt for Informatikk Universitetet i Oslo 30. september Outline 1 2 3 4 5 Outline 1 2 3 4 5 Flertydighet Example "" "fisk" subst appell mask ub fl @løs-np "fisker" subst appell
STK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
Gruvedrift. Institutt for matematiske fag, NTNU. Notat for TMA4240/TMA4245 Statistikk
Gruvedrift Notat for TMA/TMA Statistikk Institutt for matematiske fag, NTNU I forbindelse med planlegging av gruvedrift i et område er det mange hensyn som må tas når en skal vurdere om prosjektet er lønnsomt.
TMA4245 Statistikk Eksamen desember 2016
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4245 Statistikk Eksamen desember 2016 Oppgave 1 En bedrift produserer elektriske komponenter. Komponentene kan ha to typer
Kap. 8: Utvalsfordelingar og databeskrivelse
Kap. 8: Utvalsfordelingar og databeskrivelse Utvalsfordelingar Utvalsfordeling for gjennomsnitt (med kjent varians) ( X ) Sentralgrenseteoremet (SGT) Utvalsfordeling for varians (normalfordeling) Utvalfordeling
Dyp læring. Sigmund Rolfsjord
Dyp læring Sigmund Rolfsjord Oversikt 1. Grunnleggende om dyp læring og nevrale nett 2. Konvolusjonsnett 3. Synsfelt med konvolusjonsnett Lær mer: Kurs fra Stanford: http://cs231n.stanford.edu/ Mer inngående
IN2110 Obligatorisk innlevering 1a
IN2110 Obligatorisk innlevering 1a Oppsett Leveres innen fredag 15. februar kl. 23.59 i Devilry. For IN2110 har vi laget et utviklingsmiljø for Python som inneholder programvare og data for de obligatoriske
UNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på
Weibullfordelingen. Kjetil L. Nielsen. Innhold. 1 Teori. 1.1 Tetthetsfunksjon og fordelingsfunksjon
Weibullfordelingen Kjetil L. Nielsen Innhold Teori......................................... Tetthetsfunksjon og fordelingsfunksjon......................2 Parameterene i Weibullfordelingen.......................
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er
Nøyaktig prediksjon av grunnstøtinger, fartøysbevegelser, og ankomsttider
Nøyaktig prediksjon av grunnstøtinger, fartøysbevegelser, og ankomsttider og andre røverhistorier om kunstig intelligens Andreas Ravnestad Gruppeleder Systemutvikling & AI Norconsult Informasjonssystemer
Eksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Tlf: Eksamensdato: August 2014 Eksamenstid (fra til): Hjelpemiddelkode/Tillatte hjelpemidler:
Klassisering. Insitutt for matematiske fag, NTNU 21. august Klassiseringsproblemet. Notat for TMA4240/TMA4245 Statistikk
Klassisering Notat for TMA4240/TMA4245 Statistikk Insitutt for matematiske fag, NTNU 21. august 2012 Innen maskinlæring studerer man algoritmer som tillater datamaskiner å utvikle atferd på grunnlag av
EKSAMEN. Flexibel ingeniørutdanning, 2kl. Bygg.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. REA 1081F REA1081) EKSAMENSDATO: 1. juni 2010. KLASSE: Flexibel ingeniørutdanning, 2kl. Bygg. TID: kl. 9.00 12.00. FAGLÆRER: Hans Petter Hornæs ANTALL
EKSAMEN. TILLATTE HJELPEMIDLER: Kalkulator. Hornæs: Formelsamling statistikk HiG. John Haugan: Formler og tabeller.
KANDIDATNUMMER: EKSAMEN FAGNAVN: FAGNUMMER: Statistikk. BtG207 EKSAMENSDATO: 1. juni 2010. KLASSE: HIS 08 11. TID: kl. 8.00 13.00. FAGLÆRER: Hans Petter Hornæs ANTALL SIDER UTLEVERT: 3 (innkl. forside)
Tilleggsoppgaver for STK1110 Høst 2015
Tilleggsoppgaver for STK0 Høst 205 Geir Storvik 22. november 205 Tilleggsoppgave Anta X,..., X n N(µ, σ) der σ er kjent. Vi ønsker å teste H 0 : µ = µ 0 mot H a : µ µ 0 (a) Formuler hypotesene som H 0
Kapittel 2. Utforske og beskrive data. Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.
Kapittel 2 Utforske og beskrive data Sammenhenger mellom variable Kap. 2.1 om assosiasjon og kryssplott forrige uke. Kap. 2.2, 2.3, 2.4 denne uken To kryssplott av samme datasett, men med forskjellig skala
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Underveiseksamen i: STK1000 Innføring i anvendt statistikk. Eksamensdag: Fredag 13.10.2006. Tid for eksamen: Kl. 09.00 11.00. Tillatte hjelpemidler:
Generell informasjon om faget er tilgjengelig fra It s learning. 1 En kort oppsummering Adaptiv filtrering 2. 3 Prediksjon 4
Stavanger, 13. august 2013 Det teknisknaturvitenskapelige fakultet ELE500 Signalbehandling, 2013. Generell informasjon om faget er tilgjengelig fra It s learning. Innhold 1 En kort oppsummering. 1 2 Adaptiv
TMA4240 Statistikk 2014
TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten
Kp. 11 Enkel lineær regresjon (og korrelasjon) Kp. 11 Regresjonsanalyse; oversikt
Bjørn H. Auestad Kp. 11: Regresjonsanalyse 1 / 57 Kp. 11 Regresjonsanalyse; oversikt 11.1 Introduction to Linear Regression 11.2 Simple Linear Regression 11.3 Least Squares and the Fitted Model 11.4 Properties
Oppfriskning av blokk 1 i TMA4240
Oppfriskning av blokk 1 i TMA4240 Geir-Arne Fuglstad November 21, 2016 2 Hva har vi gjort i dette kurset? Vi har studert to sterkt relaterte grener av matematikk Sannsynlighetsteori: matematisk teori for
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Torsdag 9. oktober 2008. Tid for eksamen: 15:00 17:00. Oppgavesettet er på
Innlevering BYPE2000 Matematikk 2000 HIOA Obligatorisk innlevering 2 Innleveringsfrist Tirsdag 1. april 2014 kl. 12:45 Antall oppgaver: 8+2
Innlevering BYPE2000 Matematikk 2000 HIOA Obligatorisk innlevering 2 Innleveringsfrist Tirsdag 1. april 2014 kl. 12:45 Antall oppgaver: 8+2 1 Bestem den naturlige denisjonsmengden til følgende funksjoner.
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Kap. 13: Lineær korrelasjons- og regresjonsanalyse Kap. 13.1-13.3: Lineær korrelasjonsanalyse. Disse avsnitt er ikke pensum,
Forslag til endringar
Forslag til endringar Bakgrunn: Vi har ingen forelesningar veka etter påske. Eg skal bort 18. og 19. april. Eksamen er 30.mai Forslag til endringar: Ekstra forelesningar onsdag 16.mars og onsdag 30 mars
TMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik
Industri prosess. Hvordan produsere smartere. Per-Olav Hansen
Industri prosess Hvordan produsere smartere Per-Olav Hansen Fakta om Unger Fabrikker Etablert : 1922 Omsetning : 646 MNOK* Resultat før skatt : 86 MNOK* Volum : >40.000 MT Eksportandel : >90%, 75 land
n n i=1 x2 i n x2 n i=1 Y i og x = 1 n i=1 (x i x)y i = 5942 og n T = i=1 (x i x) 2 t n 2
TMA4245 Statistikk Vår 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalte oppgaver 12, blokk II Denne øvingen består av oppgaver om enkel lineær regresjon. De handler
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig
regresjonsmodeller multippel logistisk regresjon logistisk regresjon prediksjon vs assosiasjon den logistisk funksjonen (2)
Innføring i medisinsk statistikk del 2 regresjonsmodeller Hvorfor vil man bruke regresjonsmodeller? multippel logistisk regresjon. predikere et utfall (f.eks. sykdom, død, blodtrykk) basert på et sett
Eksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Mette Langaas a, Ingelin Steinsland b, Geir-Arne Fuglstad c Tlf: a 988 47 649, b 926 63 096, c 452 70 806
Bred profil på statistikk?
Bred profil på statistikk? Geir Storvik Juleseminar CSE 30. November 2012 Statistikk Statistikk involverer innsamling, organisering, analysering, tolkning og presentasjon av data Sentralt: Ta hensyn til
år i 1 2 3 4 5 6 7 8 9 alder x i 37 38 39 40 41 42 43 44 45 tid y i 45.54 41.38 42.50 38.80 41.26 37.20 38.19 38.05 37.45 i=1 (x i x) 2 = 60, 9
TMA424 Statistikk Vår 214 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 11, blokk II Oppgave 1 Matlabkoden linearreg.m, tilgjengelig fra emnets hjemmeside, utfører
UNIVERSITETET I OSLO
Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 10. oktober 2012. Tid for eksamen: 15:00 17:00. Oppgavesettet
Litt om Logikk og Litt om Vår Forskning
og Litt om Vår Forskning February 2, 2009 Hva vi skal snakke om? 1 Hva er? 2 Hva er? 3 Hva driver to tilfeldig valget matematiske logikere (vi) med? Noen definisjoner av er (det formelle) studiet av gyldige
Introduksjon til Generaliserte Lineære Modeller (GLM)
Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell
TMA4240 Statistikk Høst 2016
TMA4240 Statistikk Høst 2016 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Anbefalt øving 12 Denne øvingen består av oppgaver om enkel lineær regresjon. De handler blant
10.1 Enkel lineær regresjon Multippel regresjon
Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel
Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere
2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Analysere en observator for å finne ut noe om korresponderende
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 1. n + (x 0 x) 1 2 ) = 1 γ
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.25 (11.27, 11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal nne
Mer om Markov modeller
Høyere ordens Markov modeller Mer om Markov modeller p h mnr = Pr( Y j+ 3 = ah Y j+ 2 = am, Y j+ 1 = an, Y j = a : r For en k-te ordens Markov modell som modellerer en DNA prosess vil det være 3*4 k mulige
Tabell 1: Antallet besøkende pasienter og gjennomsnittlig ventetid i minutter (fiktive data).
Viktige modeller og begrep Når du skal lese forskningsartikler, kan det være nyttig at du kjenner navnet på noen viktige modeller og begreper. Tekst: Hugo Lewi Hammer og Ketil Gundro Bruberg I de tidligere
MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag
MAT-INF 2360: Obligatorisk oppgave 3. Løsningsforslag I kapittel 9 i kompendiet forklarte vi at maximum-likelihood er en av de viktige anvendelsene av ikke-lineær optimering. Vi skal se litt mer på hva
UNIVERSITETET I OSLO
Deleksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 13. oktober 2010. Tid for eksamen: 15:00 17:00. Oppgavesettet
TMA4240 Statistikk Høst 2009
TMA440 Statistikk Høst 009 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer b6 Løsningsskisse Oppgave a) n 8, i x i 675, x 37.5, i y i 488, i x i 375, i x iy i
Eksamensoppgave i TMA4240 Statistikk
Institutt for matematiske fag Eksamensoppgave i TMA4240 Statistikk Faglig kontakt under eksamen: Sara Martino a, Torstein Fjeldstad b Tlf: a 994 03 330, b 962 09 710 Eksamensdato: 28. november 2018 Eksamenstid
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 8 (s. 1) Oppgaver fra boka:
MOT30 Statistiske metoder, høsten 2006 Løsninger til regneøving nr. 8 (s. ) Oppgaver fra boka: Oppgave.5 (.3:5) ) Først om tolking av datautskriften. Sammendrag gir følgende informasjon: Multippel R =R,
ST0202 Statistikk for samfunnsvitere
ST0202 Statistikk for samfunnsvitere Bo Lindqvist Institutt for matematiske fag 2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk Eksamensdag: Torsdag 2. desember 2010. Tid for eksamen: 09.00 13.00. Oppgavesettet er på
Notat 3 - ST februar 2005
Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk
DEL 1 GRUNNLEGGENDE STATISTIKK
INNHOLD 1 INNLEDNING 15 1.1 Parallelle verdener........................... 18 1.2 Telle gunstige.............................. 20 1.3 Regneverktøy og webstøtte....................... 22 1.4 Oppgaver................................
Forelesning 2 torsdag den 21. august
Forelesning 2 torsdag den 21 august 15 Flere eksempler på bevis ved induksjon Proposisjon 151 La n være et naturlig tall Da er 1 + 2 + 4 + + 2 n 1 = 2 n 1 Bevis Først sjekker vi om proposisjonen er sann
Kvinner, minoriteter og kvotering i Indisk politikk
Kvinner, minoriteter og kvotering i Indisk politikk I denne oppgaven skal dere se litt på kvinner, minoriteter og kvotering i Indisk politikk. Vi tar utgangspunkt i artikkelen til Fransesca Jensenius (2016)
TMA4240 Statistikk Høst 2018
TMA4240 Statistikk Høst 2018 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Innlevering 5 Dette er andre av tre innleveringer i blokk 2. Denne øvingen skal oppsummere pensum
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: n + (x 0 x) 2 σ2
MOT310 Statistiske metoder 1, høsten 2006 Løsninger til regneøving nr. 7 (s. 1) Oppgaver fra boka: Oppgave 11.27 (11.6:13) Modell: Y i = α + βx i + ε i der ε 1,..., ε n u.i.f. N(0, σ 2 ). Skal finne konfidensintervall
Sannsynlighetsbegrepet
Sannsynlighetsbegrepet Notat til STK1100 Ørnulf Borgan Matematisk institutt Universitetet i Oslo Januar 2004 Formål Dette notatet er et supplement til kapittel 1 i Mathematical Statistics and Data Analysis
EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 6 Kontakt under eksamen: Ingelin Steinsland (92 66 30 96) EKSAMEN I TMA4315 GENERALISERTE LINEÆRE MODELLER Tirsdag
Eksamensoppgave i TMA4267 Lineære statistiske modeller
Institutt for matematiske fag Eksamensoppgave i TMA4267 Lineære statistiske modeller Faglig kontakt under eksamen: Mette Langaas Tlf: 988 47 649 Eksamensdato: 22. mai 2014 Eksamenstid (fra til): 09.00-13.00
TMA4245 Statistikk Eksamen august 2014
TMA4245 Statistikk Eksamen august 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Oppgave 1 En bedrift produserer en type medisin i pulverform Medisinen selges på flasker
6.6 Anvendelser på lineære modeller
6.6 Anvendelser på lineære modeller Skal først se på lineær regresjon for gitte punkter i planet: det kan formuleres og løses som et minste kvadraters problem! I mere generelle lineære modeller er man
Statistisk inferens (kap. 8) Hovedtyper av statistisk inferens. ST0202 Statistikk for samfunnsvitere
2 Statistisk inferens (kap. 8) Statistisk inferens er å tolke/analysere resultater fra utvalget for å finne ut mest mulig om populasjonen. Konkret: Å analysere en utvalgsobservator for å trekke slutninger
1 + γ 2 X i + V i (2)
Seminaroppgave 8 8.1 I en studie av sammenhengen mellom gjennomsnittlig inntekt og utgifter til offentlig skoledrift for ulike amerikanske stater i 1979 estimeres modellen; Y i = β 0 + β 1 X i + β 2 Xi
EKSAMEN. Informasjon om eksamen. Emnekode og -navn: ITD37018 Anvendt Robotteknikk. Dato og tid: , 3 timer. Faglærer: Haris Jasarevic
Informasjon om eksamen EKSAMEN Emnekode og -navn: ITD37018 Anvendt Robotteknikk Dato og tid: 10.12.18, 3 timer Faglærer: Haris Jasarevic Hjelpemidler: Ingen hjelpemidler tillatt Om oppgaven: Alle oppgavene
Fasit og løsningsforslag STK 1110
Fasit og løsningsforslag STK 1110 Uke 36: Eercise 8.4: a) (57.1, 59.5), b) (57.7, 58, 9), c) (57.5, 59.1), d) (57.9, 58.7) og e) n 239. (Hint: l(n) = 1 = 2z 1 α/2 σ/n 1/2 ). Eercise 8.10: a) (2.7, 7.5),
EKSAMEN I TMA4255 ANVENDT STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 7 Faglig kontakt under eksamen: Mette Langaas (988 47 649) BOKMÅL EKSAMEN I TMA4255 ANVENDT STATISTIKK Fredag 25.
LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 10 LØSNINGSFORSLAG TIL EKSAMEN I FAG TMA4240 STATISTIKK Mandag 12. desember 2011 Oppgave 1 Oljeleting a) Siden P(A
EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 12 Faglig kontakt under eksamen: Bo Lindqvist Tlf. 975 89 418 EKSAMEN I FAG TMA4260 INDUSTRIELL STATISTIKK Onsdag
Introduksjon til statistikk og dataanalyse. Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013
Introduksjon til statistikk og dataanalyse Arild Brandrud Næss TMA4240 Statistikk NTNU, høsten 2013 Introduksjon til statistikk og dataanalyse Hollywood-filmer fra 2011 135 filmer Samla budsjett: $ 7 166
Inferens i regresjon
Strategi som er fulgt hittil: Inferens i regresjon Deskriptiv analyse og dataanalyse først. Analyse av en variabel før studie av samvariasjon. Emne for dette kapittel er inferens når det er en respons
Prøveeksamen i STK3100/4100 høsten 2011.
Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan
Oppgave 1. Vi må forutsette at dataene kommer fra uavhengige og normalfordelte tilfeldige variable,
MOT30 Statistiske metoder Løsningsforslag til eksamen vår 0 s. Oppgave a Vi har x = 6. og x i x = 4.6. Herav s x = n Et 90% kondensintervall er gitt ved x i x = 4.6 = 0.89 6 SX X t 0.056 X + t S X 0.056
UNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk. Eksamensdag: Onsdag 7. oktober 2009. Tid for eksamen: 15:00 17:00. Oppgavesettet er på
HØGSKOLEN I STAVANGER
HØGSKOLEN I STAVANGER Avdeling for TEKNISK NATURVITEN- EKSAMEN I: TE199 SANNSYNLIGHETSREGNING MED STATISTIKK SKAPELIGE FAG VARIGHET: 4 TIMER DATO: 5. JUNI 2003 TILLATTE HJELPEMIDLER: KALKULATOR OPPGAVESETTET
MNFIT 272. Kunstig intelligens (AI) 2002
MNFIT 272 Kunstig intelligens (AI) 2002 Fagansvarlig: Professor Agnar Aamodt Institutt for datateknikk og informasjonsvitenskap, IT Vest, Rom 322, Email agnar.aamodt@idi.ntnu.no Kunstig intelligens (MNFIT-272)