Modellering av Customer Lifetime Value og hvordan bruke det Øystein Sørensen Data Scientist
|
|
- Kristian Eliassen
- 7 år siden
- Visninger:
Transkript
1 Modellering av Customer Lifetime Value og hvordan bruke det Øystein Sørensen Data Scientist
2 Customer Lifetime Value (CLV) Diskontert nåverdi av hele det fremtidige kundeforholdet CLV for alle kunder gir nåverdien av hele kundebasen
3 Komponentene i CLV For å estimere CLV, trenger vi «Overlevelsessannsynlighet» per tidsenhet s t Kunderesultat R t Diskonteringsrente d I praksis beregner vi ofte avgangssannsynligheten p t og beregner s t = 1 p t CLV = n t=1 R t s t (1 + d) t 1
4 Plan for foredraget CLVs byggesteiner Levetidsmodell Kunderesultat Koble komponentene sammen Bruk av CLV Eksempelcase: Norsk strømleverandør Konseptene er relevante i en rekke bransjer
5 Estimering av avgangssannsynlighet
6 Estimering av avgangssannsynlighet per tidsenhet To metoder Binær regresjonsmodell Overlevelsesanalyse Begge gir avgangssannsynlighet per kunde Vi ønsker ikke bare avgangssannsynligheten i neste periode, men også lengre fram i tid
7 Binær regresjonsmodell
8 Binær regresjonsmodell En modell som estimerer P(avgang neste periode data) F.eks. logistisk regresjon Må bestemme tidsoppløsning (uke, måned, kvartal, år) Estimerer sannsynligheten for avgang per tidsenhet Skiller seg fra en vanlig churnmodell ved at tidsoppløsningen er svært viktig
9 Binær regresjonsmodell Prediktorer: Data tom. Q Utfall: Avgang Q Prediktorer: Data tom. Q Utfall: Avgang Q Prediktorer: Data tom. Q Utfall: Avgang Q TRENINGSDATA Prediktorer: Data tom. Q Utfall: Avgang Q Prediktorer: Data tom. Q Utfall: Avgang Q Prediktorer: Data tom. Q PREDIKSJON AV FRAMTIDA Q Q Q Q Q Q Tid
10 Binær regresjonsmodell Hver kunde har én rad per periode de var tilstede Fallgruve Datafelter som overskrives, uten historikkhåndtering, kan få modellen til å virke mye bedre enn den faktisk er Eksempel: Kunder merket med «redning» Dato Churn Kunde Var1 Var2 Q Q Q Q Q Q Q
11 Modellvalg Målet er å estimere avgangssannsynligheten P(avgang neste periode data) Må bruke en probabilistisk modell, f.eks. Logistisk regresjon (proc glm) Gradient boosting (proc gradboost) Random forest (proc forest) Neural nets (proc nnet) Ren klassifiseringsmodell som Support Vector Machine (SVM) funker ikke! log log p = Logistisk regresjon p 1 p = α + β 1x β p x p Generelt («ML») p 1 p = f(x) Avgangssannsynlighet ef(x) 1+ e f(x) (per tidsenhet) Forventet levetid Forventet levetid = 1/p P(«overlever» n perioder) = (1 p) n
12 Overlevelsesanalyse Alternativ metode for estimering av avgangssannsynlighet Typisk Cox Proportional Hazards Model (proc phreg)
13 Overlevelsesanalyse Cox Proportional Hazards Model (proc phreg) Fordeler Håndterer sensurerte data Estimerer levetidskurver Ulemper Ikke egnet for data som forandrer seg hyppig over tid Ikkelineære metoder lite utviklet
14 Overlevelsesanalyse AVGANG SENSURERT TRENINGSDATA AVGANG NYE KUNDER HVOR LENGE? Prediktorer: Data ved opppstart av kundeforholdet Start 3 mnd 6 mnd 9 mnd 12 mnd 15 mnd Kundeforholdets varighet
15 Oppbygging av en modell for avgangssannsynlighet Eksempelcase
16 Eksempelcase - datakilder Datavarehus Produkter, henvendelser, utgående aktiviteter, netteier i området, historikk av kundeforhold = noen hundre variabler Data Lake / Sandbox Forbruksdata, fakturahistorikk, værhistorikk Konkurrentovervåkning Google Trends på fylkesnivå, hentet ut med Python-skript Bredt datasett Kobler sammen alle datakilder på tid og kunde Text mining Eget uttrekk
17 Konkurrentovervåkning Avgang er ofte geografisk konsentrert til områder der konkurrenter har høy aktivitet Ved hjelp av Google Trends kan vi overvåke antallet søk på konkurrentene med fylkesoppløsning
18
19 Konkurrentovervåkning
20
21 Demo SAS Visual Analytics
22
23 Feature Engineering Mer forklaringskraft kan hentes ut av et gitt datasett ved å lage syntetiske variabler, f.eks. Endring i produktbeholdning siste 6 måneder Endring i antall pålogginger I eksempelcaset økte vi antall variabler fra rundt 200 til 500 Ga betydelig økning i nøyaktighet Hvor mange henvendelser til kundesenteret siste periode? Hvor mange henvendelser til kundesenteret siste to perioder? Endring i antall henvendelser til kundesenteret siste to perioder? Hvor mange henvendelser til kundesenteret siste tre perioder? Hvor mange henvendelser siste år? Hvor mange henvendelser hele kundeforholdet? Text Mining Sentimentanalyse
24 Feature Engineering Eksempel på funn Kunder som har fakturagebyr har lav avgangsrisiko Kunder som får fakturagebyr har økt avgangsrisiko neste måned
25 Hvordan teste hvor gode prediksjonene er?
26 Testing av modellen Periode 1 Periode 2 Periode 3 Periode 4 Periode 5 Treningsdata Testdata
27 Mer relevant test framover i tid Periode 1 Periode 2 Periode 3 Periode 4 Periode 5 Treningsdata Testdata
28 Hvor mye historikk er optimalt? Periode 1 Periode 2 Periode 3 Periode 4 Periode 5 Treningsdata Testdata
29 Hvor mange perioder framover ønsker vi å predikere? Periode 1 Periode 2 Periode 3 Periode 4 Periode 5 Treningsdata Testdata
30 Valg av algoritmer ROC-kurve på testdata Aktuelle metoder for prediksjon av levetid er Gradient Boosting (proc gradboost) Random Forest (proc forest) Neural Nets (proc nnet) Umulig å vite på forhånd hvilken som passer best Test flere algoritmer! For hver algoritme, test ulike verdier av hyperparameterne
31 Testing av algoritmer Demo med SAS Visual Analytics
32
33 Gain Chart Eksempelcase Nær 40 % økning i churn-andel blant kundene med topp-10 % predikert sannsynlighet 40 % flere relevante kunder blir møtt med bevaringstiltak Kan også mer presist måle effekten av bevaringstiltak
34 Kunderesultatet Den neste viktige komponenten
35 Kunderesultat For å beregne CLV trenger vi netto kunderesultat per tidsenhet Ofte definert utfra kundens produkter
36 Kunderesultat vs Avgangssannsynlighet Identifikasjon av segmenter og mikrosegmenter Muliggjør målrettet testing av tiltak for å øke lønnsomhet eller levetid
37 Framtidig kunderesultat I eksempelcaset antok vi konstant kunderesultat framover i tid Kan også legge inn antagelser Kunden blir eldre Hva er sannsynligheten for at kunden kjøper flere produkter? Kan kunden bli mer/mindre kostbar å betjene? Endringer i produkttilbud?
38 Customer Lifetime Value
39 Customer Lifetime Value Hver kunde har sitt CLV-tall, basert på Kundens overlevelses-sannsynlighet s t Kundens resultat R t CLV = n t=1 R t s t (1 + d) t 1
40 CLV i allerede definerte segmenter Hva er rekrutteringskostnaden i hver av kanalene? For hver kanal, hva kjennetegner kundene med høy og lav CLV? Hvilke konsekvenser har dette for strategien? Web: Rekrutterings-kostnad Dørsalg: Rekrutterings-kostnad Yngre Eldre
41 Simulere effekten av tiltak Endring i avgangssannsynlighet Hva er effekten av en prisendring? Endring i kunderesultat, R t Endring i CLV
42 Hva er optimale valg? CLV Som illustrert på forrige side, kan vi bruke Machine Learning til å simulere effekten av tiltak, f.eks. Prisendring Rekrutteringskanaler Endring i kundebetjening En nyttig guide for strategisk diskusjon kan være å bruke optimeringsteori til å finne parameterne som optimerer CLV Parameter 2 Parameter 1
43
Modellering og prediksjon av kundeavgang
www.nr.no Modellering og prediksjon av kundeavgang Clara-Cecilie Günther, Ingunn Fride Tvete, Geir Inge Sandnes, Ørnulf Borgan, Kjersti Aas Statistics for Innovation (SFI) 2 Årsmøte Norsk ASTIN-gruppe,
DetaljerEksamen ST2303 Medisinsk statistikk Onsdag 3 juni 2009 kl
1 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Faglig kontakt under eksamen Stian Lydersen tlf 72575428 / 92632393 Eksamen ST2303 Medisinsk statistikk Onsdag 3 juni 2009
DetaljerPrøveeksamen STK vår 2017
Prøveeksamen STK2100 - vår 2017 Geir Storvik Vår 2017 Oppgave 1 Anta en lineær regresjonsmodell p Y i = β 0 + β j x ij + ε i, j=1 ε i uif N(0, σ 2 ) Vi kan skrive denne modellen på vektor/matrise-form:
DetaljerMASKINLÆRING KRAVENE TIL MARKEDSANALYTIKEREN ENDRER SEG - EN LITEN INNFØRING I MASKINLÆRING NMF
MASKINLÆRING KRAVENE TIL MARKEDSANALYTIKEREN ENDRER SEG - EN LITEN INNFØRING I MASKINLÆRING NMF 31.1.2019 Hva er maskinlæring? Bruk av datamaskiner for å finne mønstre i et datasett Mønsteret oversettes
DetaljerForbedret kundeopplevelse og reduserte driftskostnader ved bruk av maskinlæring i nettskyen. Heidi Brunborg IT-direktør i Lånekassen
Forbedret kundeopplevelse og reduserte driftskostnader ved bruk av maskinlæring i nettskyen Heidi Brunborg IT-direktør i Lånekassen Før vi starter Utbetaler årlig 30 milliarder kroner i utdanningsstøtte
DetaljerDetaljerte forklaringer av begreper og metoder.
Appendiks til Ingar Holme, Serena Tonstad. Risikofaktorer og dødelighet oppfølging av Oslo-undersøkelsen fra 1972-73. Tidsskr Nor Legeforen 2011; 131: 456 60. Dette appendikset er et tillegg til artikkelen
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2 Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Eksamensdag: Torsdag 4. juni 28. Tid for eksamen: 4.3
DetaljerEksamen - INF 283 Maskinlæring
Eksamen - INF 283 Maskinlæring 23 feb. 2016 Tid: 3 timer Eksamen inneholder 15 oppgaver, som vil bli vektet likt ved evaluering. 1 Table 1 attributt antall personer forsørget av låntaker månedlig inntekt
DetaljerEKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005 Tid: 09:00 13:00
Norges teknisk naturvitenskapelige universitet Institutt for matematiske fag Side 1 av 5 Faglig kontakt under eksamen: Bo Lindqvist 975 89 418 EKSAMEN I FAG TMA4275 LEVETIDSANALYSE Lørdag 4. juni 2005
DetaljerOptimalisering av bedriftens kundeportefølje
Optimalisering av bedriftens kundeportefølje DM Huset 25. mai 2005 Professor Fred Selnes Handelshøyskolen BI Bakgrunn På 90 tallet vokste det frem en bred forståelse for verdien av fornøyde og lojale kunder
DetaljerPraktisk bruk av maskinlæring i vedlikehold
Praktisk bruk av maskinlæring i vedlikehold MainTech konferansen 2018 Andreas Marhaug. Trondheim 04.04.2018 Alpinlandslaget https://www.dagbladet.no/sport/osterrike-og-sveits-fortviler-etter-norskalpinrevolusjon---hva-i-all-verden-driver-norge-med/67657591/amp
DetaljerPrøveeksamen STK2100 (fasit) - vår 2018
Prøveeksamen STK2100 (fasit) - vår 2018 Geir Storvik Vår 2018 Oppgave 1 (a) Vi har at E = Y Ŷ =Xβ + ε X(XT X) 1 X T (Xβ + ε) =[I X(X T X) 1 X T ]ε Dette gir direkte at E[E] = 0. Vi får at kovariansmatrisen
DetaljerSTK juni 2016
Løsningsforslag til eksamen i STK220 3 juni 206 Oppgave a N i er binomisk fordelt og EN i np i, der n 204 Hvis H 0 er sann, er forventningen lik E i n 204/6 34 for i, 2,, 6 6 Hvis H 0 er sann er χ 2 6
DetaljerKanalstrategier i kundesenteret - forflytt kunden til mer effektive og rimeligere kanaler
Kanalstrategier i kundesenteret - forflytt kunden til mer effektive og rimeligere kanaler Kristian Schüffner Hvor mange har vært i kontakt med kundeservice de siste 14 dagene? Hvor mange har vært i kontakt
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK1110 Statistiske metoder og dataanalyse 1 Eksamensdag: Mandag 30. november 2015. Tid for eksamen: 14.30 18.00. Oppgavesettet
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Literatur / program Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-20. august 2007 Sven Ove Samuelsen Plan for første forelesning: 1. Introduksjon, Literatur, Program 2. ksempler 3. Uformell
DetaljerSTK Maskinlæring og statistiske metoder for prediksjon og klassifikasjon
STK2100 - Maskinlæring og statistiske metoder for prediksjon og klassifikasjon Oppsummering av kurset 17. april 2018 Hovedproblem Input x R p. Output y Numerisk: regresjon Kategorisk: Klassifikasjon Gitt
DetaljerUNIVERSITETET I OSLO
Eksamen i: UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet STK1000 Innføring i anvendt statistikk Eksamensdag: Mandag 3. desember 2018. Tid for eksamen: 14.30 18.30. Oppgavesettet er på
DetaljerMaskin læring et praktisk eksempel
Maskin læring et praktisk eksempel Introduksjon og erfaringer fra forprosjekt Alcoa Gunnar Andreas Aarvold Mo I Rana Olje & Gassklynge Helgeland 14.02.2018 Mål for møtet: Hva er prediktivt vedlikehold?
Detaljer(a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x].
FORMELSAMLING TIL STK2100 (Versjon Mai 2017) 1 Tapsfunksjoner (a) For regresjon brukes vanligvis kvadratisk tap: L(y, ŷ) = (y ŷ) 2. Den optimale prediktor basert på input variable x er da Ŷ = E[Y x]. (b)
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlige stokastiske variabelen X ha fordelingsfunksjon (sannsynlighetstetthet
DetaljerMultippel regresjon. Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p.
Multippel regresjon Her utvider vi perspektivet for enkel lineær regresjon til også å omfatte flere forklaringsvariable x 1, x 2,, x p. Det er fortsatt en responsvariabel y. Måten dette gjøre på er nokså
DetaljerL12-Dataanalyse. Introduksjon. Nelson Aalen plott. Page 76 of Introduksjon til dataanalyse. Levetider og sensurerte tider
Page 76 of 80 L12-Dataanalyse Introduksjon Introduksjon til dataanalyse Presentasjonen her fokuserer på dataanalyseteknikker med formål å estimere parametere (MTTF,, osv) i modeller vi benytter for vedlikeholdsoptimering
DetaljerOppgave 1. X 1 B(n 1, p 1 ) X 2. Vi er interessert i forskjellen i andeler p 1 p 2, som vi estimerer med. p 1 p 2 = X 1. n 1 n 2.
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 17 november 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk Tapir
DetaljerBedre kalibrerte prognoser med ensembleteknikker
Bedre kalibrerte prognoser med ensembleteknikker John Bjørnar Bremnes Kraftrelatert hydrologi, meteorologi og klima, Trondheim, 2008-11-18. Oversikt 1. Bedre oppløsning i LAMEPS (2006) 2. Kalibrering ved
DetaljerPar-copula konstruksjoner: Et fleksibelt verktøy for å modellere multivariat avhengighet
Par-copula konstruksjoner: Et fleksibelt verktøy for å modellere multivariat avhengighet Foredrag for Norsk ASTIN-gruppe (NAG) Lysaker, 14. November, 2010 Kjersti Aas Norsk Regnesentral Innhold Innledning
DetaljerPrøveeksamen i STK3100/4100 høsten 2011.
Prøveeksamen i STK3100/4100 høsten 2011. Oppgave 1 (a) Angi tetthet/punktsannsynlighet for eksponensielle klasser med og uten sprednings(dispersjons)ledd. Nevn alle fordelingsklassene du kjenner som kan
DetaljerLogistisk regresjon 1
Logistisk regresjon Hovedideen: Binær logistisk regresjon håndterer avhengige, dikotome variable Et hovedmål er å predikere sannsynligheter for å ha verdien på avhengig variabel for bestemte (sosiale)
DetaljerSocial Network Analysis. Process Capability Analysis. Vector Autoregressive Models. Discrete Event Simulation. Decision Trees. Psychometric Analysis
Analysis of Variance Spectral Analysis R Integration Nonlinear Programming Matrix Programming Neural Networks Statistical Analysis Exploratory Data Analysis Data Visualization Text Analytics Design of
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i STK1000 Innføring i anvendt statistikk Eksamensdag: Torsdag 2. desember 2010. Tid for eksamen: 09.00 13.00. Oppgavesettet er på
Detaljerregresjonsmodeller multippel logistisk regresjon logistisk regresjon prediksjon vs assosiasjon den logistisk funksjonen (2)
Innføring i medisinsk statistikk del 2 regresjonsmodeller Hvorfor vil man bruke regresjonsmodeller? multippel logistisk regresjon. predikere et utfall (f.eks. sykdom, død, blodtrykk) basert på et sett
DetaljerForelesning 9 STK3100/4100
p. 1/3 Forelesning 9 STK3100/4100 Plan for forelesning: 18. oktober 2012 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 2/3 Modell med
DetaljerSAS-forum 2013. BI Strategi og BICC
SAS-forum 2013 BI Strategi og BICC Tormod Kojen BN Bank ASA Agenda Kort om BN Bank Hvilke systemer har vi Modenhetsanalyse BI-strategi BICC 2 BN Bank BN Bank er en landsdekkende bank Innskudd fra kunder:
DetaljerIntelligent digitalisering av dialogen: hvordan komme i gang?
Intelligent digitalisering av dialogen: hvordan komme i gang? Anne Johanne Solhjell og Ståle Sørensen Winorg Fokusområder for forbedringer «Empower» de ansatte Engasjere medlemmer, givere, frivillige og
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM)
Introduksjon til Generaliserte Lineære Modeller (GLM) p. 1/25 Introduksjon til Generaliserte Lineære Modeller (GLM) STK3100-23. august 2010 Sven Ove Samuelsen/Anders Rygh Swensen Plan for første forelesning:
DetaljerFem steg for å tilgjengeliggjøre geografiske data til innbyggere og næringsliv
Fem steg for å tilgjengeliggjøre geografiske data til innbyggere og næringsliv Norkart presenterer e-torg, en selvbetjent løsning der både innbyggere og næringsliv kan finne eiendoms- og kartdata fra kommunen.
Detaljer10.1 Enkel lineær regresjon Multippel regresjon
Inferens for regresjon 10.1 Enkel lineær regresjon 11.1-11.2 Multippel regresjon 2012 W.H. Freeman and Company Denne uken: Enkel lineær regresjon Litt repetisjon fra kapittel 2 Statistisk modell for enkel
DetaljerForelesning 8 STK3100/4100
Forelesning STK300/400 Plan for forelesning: 0. oktober 0 Geir Storvik. Lineære blandede modeller. Eksempler - data og modeller 3. lme 4. Indusert korrelasjonsstruktur. Marginale modeller. Estimering -
DetaljerEksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
FA K U L T E T FO R NA T U R V I T E N S K A P O G TE K N O L O G I EKSAMENSOPPGAVE Eksamen i: STA-1002 Statistikk og sannsynlighet 2 Dato: Fredag 31. mai 2013 Tid: Kl 09:00 13:00 Sted: Administrasjonsbygget
DetaljerIntroduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller
Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller p. 1/34 Introduksjon til Generaliserte Lineære Modeller (GLM) og blandede modeller STK3100/4100-23. august 2011 Geir Storvik (Oppdatert
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: ST 202 Statistiske slutninger for den eksponentielle fordelingsklasse. Eksamensdag: Fredag 15. desember 1995. Tid for eksamen:
DetaljerAnvendt Maskinlæring. MainTech Konferansen Anton Eskov, Data Scientist, Inmeta.
Anvendt Maskinlæring MainTech Konferansen - 2017 Anton Eskov, Data Scientist, Inmeta www.inmeta.no 130 Ansatte Oslo & Trondheim Solid og lønnsomt selskap Del av Crayon Group med over 1000 ansatte Portal
DetaljerVarighet som arbeidssøker
AV FRØYDIS BAKKEN OG LARS CHRISTIAN AASEBØ SAMMENDRAG Denne artikkelen omhandler den totale varigheten som arbeidssøker for personer som registrerte seg ved NAV 1. kvartal 2005. Problemstillingen tar for
DetaljerPlanning & Forecasting. retning / ansvar / verdi
Planning & Forecasting retning / ansvar / verdi RAV Norge AS Hvem er vi? Spesialister på løsninger innen: Business intelligence and analytics Data visualization and discovery Performance management 44
DetaljerHvilke muligheter gir RegTech? 26. september 2018
Hvilke muligheter gir RegTech? 26. september 2018 Steinar Breen Associate Partner E-post: Steinar.Breen@no.ey.com Telefon: 95 00 60 77 Page 2 Agenda 01 Introduksjon til RegTech 02 Våre erfaringer med RegTech
DetaljerMaskinlæring og nevrale nettverk
Maskinlæring og nevrale nettverk En innføring Sven Haadem 15.02.2017 Unify AI, phd matematikk/statistikk UiO 1 Kan vi si noe om fremtiden og i så fall hva? A priori og a posteriori viten Emperi - problemet
DetaljerKonsekvenser av familiepolitikk 2
Konsekvenser av familiepolitikk 2 Nico Keilman Befolkning og velferd ECON 1730 Høst 2017 Denne forelesningen: Effekt av innføring av kontantstøtte på foreldrenes yrkesdeltakelse Konsekvenser av - barnetrygd
DetaljerNotat 4 - ST februar 2005
Notat 4 - ST1301 8. februar 2005 1 While- og repeat-løkker Vi har tidligere sett på bruk av før-løkker. Slike løkker er hensiktsmessig å bruke når vi skal gjenta visse beregninger (løkke-kroppen) et antall
DetaljerLogistisk regresjon 2
Logistisk regresjon 2 SPSS Utskrift: Trivariat regresjon a KJONN UTDAAR Constant Variables in the Equation B S.E. Wald df Sig. Exp(B) -,536,3 84,56,000,25,84,08 09,956,000,202 -,469,083 35,7,000,230 a.
DetaljerErfaringer fra bruk av Scrum i PS2000-prosjekter NSP temadag Agile metoder i prosjekt 13.05.2009. Motivasjon av kunder og Nyttige verktøy
Erfaringer fra bruk av Scrum i PS2000-prosjekter NSP temadag Agile metoder i prosjekt 13.05.2009 Motivasjon av kunder og Nyttige verktøy 2009-05-20 Computas AS 2008 Computas-metodikk fra da til nå Computas
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2100 - FASIT Eksamensdag: Torsdag 15. juni 2017. Tid for eksamen: 09.00 13.00. Oppgavesettet er på 5 sider. Vedlegg: Tillatte
Detaljer3.A IKKE-STASJONARITET
Norwegian Business School 3.A IKKE-STASJONARITET BST 1612 ANVENDT MAKROØKONOMI MODUL 5 Foreleser: Drago Bergholt E-post: Drago.Bergholt@bi.no 11. november 2011 OVERSIKT - Ikke-stasjonære tidsserier - Trendstasjonaritet
Detaljer14 Konkursprediksjon for norske selskaper
14 Konkursprediksjon for norske selskaper en sammenligning av regresjonsmodeller og maskinlæringsteknikker Arild Brandrud Næss, Ranik Raaen Wahlstrøm, Fredrik Forbord Helland og Frode Kjærland Sammendrag
DetaljerDigitalisering Status i Felleskjøpet
Digitalisering Status i Felleskjøpet Digitaliseringen gir mange muligheter og det er ikke en fremtidsvisjon for landbruket. Oppsummering og læring fra 2017 - Muligheter for verdiskapning gjennom mer relevante
DetaljerLevetid (varighet av en tilstand)
Levetid (varighet av en tilstand) Levetidsanalyse (survival analysis) Rosner.8-. av Stian Lydersen Forlesning 6 april 8 Eksempler: Tid til personen dør (målt fra fødsel, fra diagnose, fra behandling) Tid
DetaljerKapittel 6 - modell seleksjon og regularisering
Kapittel 6 - modell seleksjon og regularisering Geir Storvik 21. februar 2017 1/22 Lineær regresjon med mange forklaringsvariable Lineær modell: Y = β 0 + β 1 x 1 + + β p x p + ε Data: {(x 1, y 1 ),...,
DetaljerAv Thomas Welte, SINTEF Energi, Bjarne Børresen, Energi Norge
Av Thomas Welte, SINTEF Energi, Bjarne Børresen, Energi Norge Sammendrag Rapporten oppsummerer resultatene fra forskningsprosjektet "System for tilstands- og levetidsrelaterte data for kraftsystemkomponenter
DetaljerForelesning 9 STK3100/4100
Forelesning 9 STK3100/4100 Plan for forelesning: 17. oktober 2011 Geir Storvik 1. Lineære blandede modeller 2. Marginale modeller 3. Estimering - ML og REML 4. Modell seleksjon p. 1 Modell med alle antagelser
DetaljerKontroller at oppgavesettet er komplett før du begynner å besvare spørsmålene. Ved sensuren teller alle delspørsmål likt.
Eksamen i: MET040 Statistikk for økonomer Eksamensdag: 4 november 2008 Tid for eksamen: 09.00-13.00 Oppgavesettet er på 4 sider. Tillatte hjelpemidler: Alle trykte eller egenskrevne hjelpemidler og kalkulator.
DetaljerDATAUTFORSKNING I EG, EG 7.1 OG EGENDEFINERTE FUNKSJONER SAS FANS I STAVANGER 4. MARS 2014, MARIT FISKAAEN
DATAUTFORSKNING I EG, EG 7.1 OG EGENDEFINERTE FUNKSJONER SAS FANS I STAVANGER 4. MARS 2014, MARIT FISKAAEN 2 INNLEDNING TEMA I SAS Enterprise Guide versjon 5.1 (februar 2012) kom det et nytt datautforskingsverktøy,
DetaljerModellvalg ved multippel regresjon notat til STK2120
Modellvalg ved multippel regresjon notat til STK2120 Ørulf Borgan februar 2016 I dette notatet vil vi se litt nærmere på hvordan vi kan velge ut hvilke forklaringsvariabler vi skal ha med i en regresjonsmodell.
DetaljerTMA4240 Statistikk Eksamen desember 2015
Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag TMA4240 Statistikk Eksamen desember 15 Oppgave 1 La den kontinuerlege stokastiske variabelen X ha fordelingsfunksjon (sannsynstettleik
DetaljerAnalyse av kundeavgang IBM Watson Content Analytics. Oslo, 19. november, 2015 Mons Nørve, Capgemini
Analyse av kundeavgang IBM Watson Content Analytics Oslo, 19. november, 2015 Mons Nørve, Capgemini Agenda Prosjektet: Kundeavgang Prosess og metode Teknisk «demo» Resultater Erfaringer Copyright Capgemini
DetaljerKort overblikk over kurset sålangt
Kort overblikk over kurset sålangt Kapittel 1: Deskriptiv statististikk for en variabel Kapittel 2: Deskriptiv statistikk for samvariasjon mellom to variable (regresjon) Kapittel 3: Metoder for å innhente
DetaljerKvinner, minoriteter og kvotering i Indisk politikk
Kvinner, minoriteter og kvotering i Indisk politikk I denne oppgaven skal dere se litt på kvinner, minoriteter og kvotering i Indisk politikk. Vi tar utgangspunkt i artikkelen til Fransesca Jensenius (2016)
DetaljerRekrutteringsfunksjoner for sild, torsk og lodde
Rekrutteringsfunksjoner for sild, torsk og lodde Sild 0 50 100 150 200 250 300 Beverton-Holt Ricker linear regression paa log-skala 0 2 4 6 8 10 12 14 Gytebimoasse (millioner tonn) Torsk 0 5 10 15 20 25
DetaljerRegresjonsmodeller. HEL 8020 Analyse av registerdata i forskning. Tom Wilsgaard
Regresjonsmodeller HEL 8020 Analyse av registerdata i forskning Tom Wilsgaard Intro Mye forskning innen medisin og helsefag dreier seg om å studere assosiasjonen mellom en eller flere eksponeringsvariabler
DetaljerOppgraderinger i SAP. Planlegge, organisere og gjennomføre en oppgradering til ECC 5.0/ECC 6.0. Sveinung Gehrken
Oppgraderinger i SAP Planlegge, organisere og gjennomføre en oppgradering til ECC 5.0/ECC 6.0. Sveinung Gehrken Gehrken Systems Agenda Vurdere 1 2 oppgradering 4 Erfaringer og hjelpemidler Planlegge oppgradering
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
DetaljerECON3610 Samfunnsøkonomisk lønnsomhet og økonomisk politikk Forelesning 2
ECON360 Samfunnsøkonomisk lønnsomhet og økonomisk politikk Forelesning Diderik Lund Økonomisk institutt Universitetet i Oslo 30. august 0 Diderik Lund, Økonomisk inst., UiO () ECON360 Forelesning 30. august
DetaljerOppgave 1. T = 9 Hypotesetest for å teste om kolesterolnivået har endret seg etter dietten: T observert = 2.16 0
Løsningsforslag til eksamen i MOT310 STATISTISKE METODER 1 VARIGHET: 4 TIMER DATO: 08. mai 2008 TILLATTE HJELPEMIDLER: Kalkulator: HP30S, Casio FX82 eller TI-30 Tabeller og formler i statistikk (Tapir
DetaljerNedgangen i spedbarnsdødeligheten i Norge over 40 år et eksempel på sykehusmedisinens bidrag
Nedgangen i spedbarnsdødeligheten i Norge over 40 år et eksempel på sykehusmedisinens bidrag Grytten J, Monkerud L, Skau I, Eskild A, Sørensen R, Saugstad OD Universitetet i Oslo, Handelshøyskolen BI,
DetaljerOPPGAVEHEFTE I STK1000 TIL KAPITTEL Regneoppgaver til kapittel 7. X 1,i, X 2 = 1 n 2. D = X 1 X 2. På onsdagsforelesningen påstod jeg at da må
OPPGAVEHEFTE I STK000 TIL KAPITTEL 7 Regneoppgaver til kapittel 7 Oppgave Anta at man har resultatet av et randomisert forsøk med to grupper, og observerer fra gruppe, mens man observerer X,, X,2,, X,n
DetaljerSTK Oppsummering
STK1110 - Oppsummering Geir Storvik 11. November 2015 STK1110 To hovedtemaer Introduksjon til inferensmetoder Punktestimering Konfidensintervall Hypotesetesting Inferens innen spesifikke modeller/problemer
DetaljerOppgave 1: Terningsutfall På en kubisk terning er det 1/6 sannsynlighet for hver type utfall fra 1 til 6. Ved to terninger, er utfallene antatt
Oppgave 1: Terningsutfall På en kubisk terning er det 1/6 sannsnlighet for hver tpe utfall fra 1 til 6. Ved to terninger, er utfallene antatt uavhengig. a) Hva er sannsnligheten for å få et spesifikt utfall
DetaljerGenerell informasjon om faget er tilgjengelig fra It s learning. 1 En kort oppsummering Adaptiv filtrering 2. 3 Prediksjon 4
Stavanger, 13. august 2013 Det teknisknaturvitenskapelige fakultet ELE500 Signalbehandling, 2013. Generell informasjon om faget er tilgjengelig fra It s learning. Innhold 1 En kort oppsummering. 1 2 Adaptiv
DetaljerStatistikk og havressurser
Statistikk og havressurser STK2120-16. april 2012 Geir Storvik April 16, 2012 Fiskeri i Norge Norges havområder er mer enn seks ganger større enn våre landområder, og har noen av verdens rikeste fiskebanker.
DetaljerForelesning 18 SOS1002
Forelesning 8 SOS002 Bruk av regresjonsmodeller til å predikere verdier? Hvordan kan vi predikere timelønn ut fra denne lineære regresjonsmodellen? B SEB Beta t Sig. t Kvinner(kvinne=, mann=0) -4,0 0,96-0,23-4,66
DetaljerMOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1. Oppgave 1
MOT 310 Statistiske metoder 1 Løsningsforslag til eksamen høst 2006, s. 1 Oppgave 1 a) Normalantakelse: Målingene x 1,..., x 21 og y 1,..., y 8 betraktes som utfall av tilfeldige variable X 1,..., X 21
DetaljerSAS Credit Scoring for Banking
SAS USER FORUM Banking Fra datafangst til avgjørelser Ewa Nybakk & Mikkel Brudvik Sanderud, 8. juni 2017 Agenda Standardløsning Tilpasning av løsningen Designprinsipper Styrker Oppsummering og spørsmål
DetaljerNotat 3 - ST februar 2005
Notat 3 - ST1301 1. februar 2005 1 Simulering fra modell Når vi skal analysere et gitt konkret innsamlet datasett vil vi gjøre dette med utgangspunkt i en statistisk modell. Vi kan si at en slik statistisk
DetaljerFra data til innsikt. Ronny Seehuus 26.11.2014
Fra data til innsikt Ronny Seehuus 26.11.2014 Big data handler om å utnytte innsikt fra et dataunivers som er i eksponentiell vekst Petabytes - Zettabytes Terabytes - Petabytes Annen Text tekst Bilder
DetaljerKundeinnsikt gir vellykkede kampanjer. Telenor Consumer v/ Lasse Nagell Prytz
Kundeinnsikt gir vellykkede kampanjer Telenor Consumer v/ Lasse Nagell Prytz Telenor Consumer - 4 aksesser, modne markeder, mange konkurrenter Mobil Telefoni Telenor Internett TV 2 00 Month 0000 Telenors
DetaljerEksamensoppgave i TMA4275 Levetidsanalyse
Institutt for matematiske fag Eksamensoppgave i TMA4275 Levetidsanalyse Faglig kontakt under eksamen: Bo Lindqvist Tlf: 975 89 418 Eksamensdato: Lørdag 31. mai 2014 Eksamenstid (fra til): 09:00-13:00 Hjelpemiddelkode/Tillatte
DetaljerBioberegninger - notat 4: Mer om sannsynlighetsmaksimering
Bioberegninger - notat 4: Mer om sannsynlighetsmaksimering 8. mars 2004 1 Kort om Newton s metode i flere dimensjoner Newton s metode kan generaliseres til å løse sett av n ligninger med n ukjente. Skal
DetaljerAlle skal kunne teste alt - overalt KDRS TRONDHEIM JUNI 2017
Alle skal kunne teste alt - overalt KDRS TRONDHEIM - 13. JUNI 2017 Det eksistensielle - Arkivverkets oppgaver 2 Det eksistensielle - Arkivverkets oppgaver Vår oppgave er - - - å dokumentere samtid for
DetaljerEksponensielle klasser og GLM
!! 3 ksponensielle klasser, Dobson, Kap 3 ksponensielle klasser GLM n stokastisk variabel sies å ha fordeling i den eksponensielle fordelingsklasse som tettheten pktsannsh til kan skrives på formen STK3-3
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Obligatorisk oppgave: STK 2400 - Elementær innføring i risiko- og pålitelighetsanalyse Innleveringsfrist: Torsdag 10. november 2011, kl.
DetaljerOppgave N(0, 1) under H 0. S t n 3
MOT310 Statistiske metoder 1, høsten 2011 Løsninger til regneøving nr 9 (s 1) Oppgave 1 Modell: Y i β 0 + β 1 x i + β 2 x 2 i + ε i der ε 1,, ε n uif N(0, σ 2 ) e) Y Xβ + ε der Y Y 1 Y n, X 1 x 1 x 2 1
DetaljerDårlige tider gir gode verktøy - visualisering av komplekse feilsituasjoner -
Dårlige tider gir gode verktøy - visualisering av komplekse feilsituasjoner - Rune Sørensen Statens pensjonskasse mai 2011 Agenda System: Pensjonsberegning Black-box testing, Regresjonstesting PERFORM
DetaljerUNIVERSITETET I OSLO
UNIVERSITETET I OSLO Det matematisk-naturvitenskapelige fakultet Eksamen i: STK2120 Statistiske metoder og dataanalyse 2. Eksamensdag: Fredag 7. juni 2013. Tid for eksamen: 14.30 18.30. Oppgavesettet er
DetaljerLojalitetens mange ansikt. Pål Silseth Leder, Norsk Kundebarometer Handelshøyskolen BI
Lojalitetens mange ansikt Pål Silseth Leder, Norsk Kundebarometer Handelshøyskolen BI Lojalitet Ulike former for lojalitet Emosjonell (affektiv) Rasjonell (kalkulativ) Moralsk. Test av samfunnsansvar påvirker
DetaljerTMA4240 Statistikk 2014
TMA4240 Statistikk 2014 Norges teknisk-naturvitenskapelige universitet Institutt for matematiske fag Øving nummer 12, blokk II Oppgave 1 På ein av vegane inn til Trondheim er UP interessert i å måle effekten
DetaljerGenerelle lineære modeller i praksis
Generelle lineære modeller Regresjonsmodeller med Forskjellige spesialtilfeller Uavhengige variabler Én binær variabel Analysen omtales som Toutvalgs t-test én responsvariabel: Y en eller flere uavhengige
DetaljerMaskinlæring for predikering av live odds
Maskinlæring for predikering av live odds Christian Hunstad Daniel Reinholdt Master i datateknologi Innlevert: juni 2017 Hovedveileder: Trond Aalberg, IDI Medveileder: Ole Markus With, Sportradar Norges
DetaljerDu skal besvare åtte av de ti spørsmålene som er gitt nedenfor. a) Gi en kort beskrivelse av konjunkturutviklingen i Norge det siste året.
Skriftlig eksamen: BST 16121 Anvendt Makroøkonomi Eksamensdato: 12.12.2012 kl. 09.00-14.00 Totalt antall sider: 5 inkl. vedlegg Antall vedlegg: 1 (1 side) Tillatte hjelpemidler: BI-definert eksamenskalkulator
DetaljerStatistikk for språk- og musikkvitere 1
Statistikk for språk- og musikkvitere 1 Mitt navn: Åsne Haaland, Vitenskapelig databehandling USIT Ikke nøl, avbryt med spørsmål! Hva oppnår en med statistikk? Få oversikt over data: typisk verdi, spredning,
DetaljerTilstandsestimering Oppgaver
Telemark University College Department of Electrical Engineering, Information Technology and Cybernetics Tilstandsestimering Oppgaver HANS-PETTER HALVORSEN, 2012.01.27 Faculty of Technology, Postboks 203,
DetaljerIntroduksjon Lineære blanda modellar Generaliserte lineære blanda modellar Analyser av modellar Eit randproblem Oppsummering. Blanda modellar i R
Blanda modellar i R Jorunn Slagstad Universitetet i Bergen 20. desember 2006 1 Introduksjon 2 Lineære blanda modellar 3 Generaliserte lineære blanda modellar 4 Analyser av modellar 5 Eit randproblem 6
DetaljerForelesning 17 Logistisk regresjonsanalyse
Forelesning 17 Logistisk regresjonsanalyse Logistiske regresjons er den mest brukte regresjonsanalysen når den avhengige variabelen er todelt Metoden kan brukes til å: teste hypoteser om variablers effekt
Detaljer