Vedlegg 1 - Regresjonsanalyser 1 Innledning og formål (1) Konkurransetilsynet har i forbindelse med Vedtak 2015-24, (heretter "Vedtaket") utført kvantitative analyser på data fra kundeundersøkelsen. I det følgende vil Konkurransetilsynet beskrive formålet med undersøkelsen, datamaterialet som ble benyttet, hovedresultatene, samt en tolkning av resultatet. (2) Regresjonsanalyse er en statistisk metode for å analysere sammenhenger mellom ulike variabler. Metoden gjør det mulig å analyse hvilke faktorer, såkalte forklaringsvariabler, som påvirker en annen observerbar variabel man er interessert i. Variabelen man er opptatt av å forklare kalles gjerne den avhengige variabelen. Regresjonsanalyser gjør det mulig å analysere hvordan én forklaringsvariabel samvarierer med den avhengige variabelen gitt at alle andre forklaringsvariabler holdes konstant. (3) Som det fremgår av Vedtaket er inntektsdiversjonsratene (heretter "diversjonsratene") et nyttig verktøy for å analysere konkurransenærheten mellom butikkene i dagligvaremarkedet. Konkurransetilsynet har i vedtakets kapittel 7 gjengitt deskriptiv statistikk som viser hvordan inntektsdiversjonsratene påvirkes av for eksempel butikkenes beliggenhet. (4) Konkurransetilsynet har utført regresjonsanalyser på diversjonsratene fra et utvalg av partenes butikker (heretter "målbutikker") som vil presenteres i dette vedlegget. Formålet med disse analysene har vært å få en bedre forståelse av sammenhengen mellom diversjonsratene og observerbare forklaringsvariabler som blant annet målbutikkenes omsetning, beliggenhet, markedsandeler, antallet butikker i nærområdet og butikkenes segmenttilhørighet. 2 Datagrunnlaget (5) Dataene benyttet i analysen er fra kundeundersøkelser utført i 60 av partenes butikker i desember 2014, jf. vedlegg 3 i Vedtaket. Rundt 200 kunder i hver butikk ble blant annet spurt "Tenk deg at du før avreise til butikken visste at [navn på målbutikk] var permanent stengt hvor ville du da handlet". Kundene ble videre spurt om hvor mye de handlet for. Basert på disse svarene har Konkurransetilsynet beregnet diversjonsrater. (6) I datamaterialet fra spørreundersøkelsene inngikk beregnede diversjonsrater fra følgende 60 målbutikker: Tabell 1 Datagrunnlag Profil Lavpris Supermarked Hypermarked Totalt Coop Prix 4 4 Coop Extra 13 5 Coop Mega 7 7 Coop Obs 5 13 Rimi 24 24 Ica Supermarked 7 7 Totalt 41 14 5 60 (7) En del butikker i målbutikkenes nærområder har ikke fått noen observert diversjon i undersøkelsen. Diversjonen kan være lik null fordi ingen av de 200 kundene i utvalget har
2 divergert til svarbutikken, selv om det eksisterer kunder som ville ha divergert til den svarbutikken (utvalgs-nuller). I så tilfelle bør disse butikkene inkluderes i datautvalget som nullobservasjoner. Butikker som aldri ville blitt valgt av noen av kundene (strukturelle nuller) bør enten fjernes fra utvalget eller modelleres forskjellig fra andre diversjonsrater. 1 Det er ikke klart hvordan en skal skille disse to kategoriene nullobservasjoner fra hverandre. Konkurransetilsynet har i en del av de følgende analysene lagt til grunn at alle nullobservasjonene er utvalgs-nuller, noe som sannsynligvis fører til inkludering av en rekke ikke-relevante nullobservasjoner. Antall nullobservasjoner i analysene vil derfor bli rapportert, samt at det blir presentert robusthetstester for hva som skjer dersom nullobservasjoner droppes. (8) Videre er data om både målbutikkene og svarbutikkene lagt til for hver observasjon, herunder blant annet kjøretid, rangert nærhet, omsetning og segment. 2 Videre er størrelsen på kjøretidsisokronene (heretter "isokronene") benyttet i Konkurransetilsynets screening lagt inn for hver målbutikk. 3 (9) Konkurransetilsynets undersøkelser antyder at diversjonen fra målbutikker som er hypermarkeder skiller seg fra diversjonen fra supermarkeder og lavprisbutikker. 4 Samtidig er antallet slike butikker utvalget er svært begrenset, totalt fem. På denne bakgrunn er observasjonene fra de fem målbutikkene som er hypermarkeder utelatt i det følgende, og de generelle resultatene gjelder derfor nødvendigvis ikke for målbutikker som er hypermarkeder. Det samme forbeholdet gjelder for nærbutikker da det ikke ble utført noen kundeundersøkelser i nærbutikker. (10) Videre ble observerte diversjonsrater til butikker med kjøretid over 25 minutter droppet. Dette utgjorde totalt 29 observasjoner. Disse 29 observasjonene hadde en snittdiversjon på 0,0077 og utgjorde derfor en marginal del av datamaterialet. Den høyeste droppede diversjonsraten var på 0,026. 3 Forbehold (11) Det er flere svakheter med utvalget som gjør at en må tolke resultatene av analysene presentert i det følgende med noe varsomhet. (12) For det første er det problemer med utelatte forklaringsvariabler som vanskelig lar seg observere eller kvantifisere. Eksempelvis vil faktorer som tilgangen til parkeringsplasser, kjøpmannens/daglig leders dyktighet, bo- og handlemønsteret, kjøremønsteret, og butikkenes plassering i forhold til hverandre være vesentlige for konkurransesituasjonen og dermed diversjonen. Videre vil flere av disse faktorene være korrelert med forklaringsvariabler vi inkluderer i modellen, eksempelvis omsetning. En må dermed være varsom med å tolke resultatene som kausaleffekter. (13) For det andre er antallet observasjoner i form av antall målbutikker lavt, noe som resulterer i forholdsvis store konfidensintervaller for de estimerte koeffisientene. Videre er ikke målbutikkene tilfeldig valgt ut, altså har vi ikke tilfeldig trekninger fra populasjonen av butikker. (14) Endelig er den avhengige variabelen en beregnet verdi basert på rundt 200 observasjoner rundt hver målbutikk, noe som gjør at disse ikke nødvendigvis er helt identiske med de sanne verdiene man optimalt sett burde benyttet. 1 Se eksempelvis Walters, 2007, Diversion ahead! Approximating diversion ratios for retail chain mergers. 2 Fra Nielsens kategorisering. 3 Jf. vedtakets kapitel 7.3.6.1 4 Kundene som handler i hypermarked divergerer for eksempel til butikker innenfor et større geografisk område enn kunder i supermarkeder og lavprisbutikker.
3 4 Variabler (15) I det følgende vil Konkurransetilsynet presentere resultater fra to regresjonsmodeller som har følgende forklaringsvariabler: Tabell 2 Variabler i regresjonsanalysen Variabelnavn Kjøretid Kjøretid kvadrert Rang n Segment Relativ omsetning Markedsandel Beskrivelse Kjøretid til svarbutikken målt i antall minutter fra målbutikken Kjøretid til svarbutikken målt i antall minutter fra målbutikken kvadrert. Indikatorvariabler for svarbutikkens rangerte relative nærhet til målbutikken (Rang 1=nærmeste butikk osv.) Basisgruppen er alle i utvalget med rang høyere enn 5. Indikatorvariabler for svar-butikkens segment. Basisgruppen er lavprisbutikker. Svarbutikkens omsetning delt på gjennomsnittlig omsetning til de andre svarbutikkene i det avgrensede området, fratrukket 1 (en gjennomsnittlig butikk får da verdien 0). De beregnede verdiene i det følgende ligger i intervallet [-1, 8,2 > Svarbutikkens markedsandel beregnet som svarbutikkens omsetning delt på totalomsetningen til butikkene i utvalget (fratrukket målbutikkens omsetning). Antall invers 1 delt på antallet svarbutikker i det avgrensede området. (16) For deskriptiv statistikk om variablene for de enkelte utvalgene i regresjonene så henvises det til Vedtakets vedlegg 2, tabell 3-13. 5 Metode (17) Konkurransetilsynet har i regresjonsanalysene benyttet minste kvadraters metode med de observerte inntektsdiversjonsratene som avhengig variabel. Standardavvikene er clustret på målbutikkenes i alle regresjonene som presenteres. (18) Ettersom de estimerte koeffisientens størrelse er sensitive for hvilket utvalg regresjonene kjøres på (altså hvilke svarbutikker som inkluderes som observasjoner i regresjonene), vil resultatene fra hver regresjon presenteres for en rekke ulike utvalg. Utvalgene er definert ut fra et eller flere kriterier, og regresjonene er navngitt ut ifra filtrene som er benyttet til å definere utvalgene. Disse filtrene er: Rangert nærhet i kjøretid fra målbutikken maksimalt lik R (rr). Regresjonen benevnt r10 inkluderer altså kun de 10 svarbutikker som er lokalisert nærmest målbutikken. Uniform kjøretid fra målbutikkene lik T (tt) eller kjøretid fra hver butikk lik den enkelte butikks isokron-størrelse (ti). 5 Regresjonen benevnt t10 inkluderer altså kun de svarbutikker som er lokalisert innenfor 10 minutters kjøretid fra målbutikken. Samtlige nullobservasjoner droppes (P). 6 Regresjonen benevnt t25p inkluderer altså kun de svarbutikker som er lokalisert innenfor 25 minutters kjøretid fra målbutikken, og som har en positiv diversjonsrate. (19) Det vil bli presentert resultater fra to regresjonsmodeller kjørt på 11 ulike utvalg. De to modellene inneholder mange av de samme forklaringsvariablene. Modell 1 skiller seg fra modell 2 ved at modell 1 inneholder et mål på relativ omsetning, samt et mål på antallet 5 Jf. avsnitt (8). 6 Jf. avsnitt (7)
4 butikker i utvalget. Modell 2 har ikke disse to forklaringsvariablene, men benytter kun estimerte markedsandeler i utvalget beregnet ut fra omsetning. Markedsandeler målt i omsetning samvarierer med både omsetningen og antallet butikker. (20) Merk at alle variablene (utenom rang, kjøretid og segmenttilhørighet) dermed beregnes for hvert enkelt utvalg, altså vil eksempelvis ikke variabelen for markedsandel til den enkelte svarbutikk være lik i utvalgene. 6 Resultater (21) I det følgende vil resultatene fra Konkurransetilsynets regresjonsanalyser presenteres. (22) For hvert utvalg regresjonsmodellene er kjørt på presenteres det antall svarbutikker i utvalget, antall observasjoner med positiv observert diversjon, antall nullobservasjoner, antall målbutikker, gjennomsnittlig totaldiversjon fra hver målbutikk i utvalget 7 og forklaringsgraden til regresjonen. 6.1 Modell 1 - Relativ omsetning og antall butikker (23) Den første regresjonen er en regresjon med kjøretid, kvadrert kjøretid, rang 1-5, en variabel for relativ omsetning til butikkene i utvalget, en variabel for antallet butikker, og tre indikatorvariabler for svarbutikkenes segment. [ ] [ ] [ ] (24) En utskrift av koeffisientene fra regresjonene fremgår av Vedtakets vedlegg 2, tabell 1. (25) Navnene over regresjonene angir som nevnt utvalget regresjonen er gjort på. Eksempelvis består utvalget i regresjonen med navn r6ti av de seks butikkene med kortest kjøretid rundt hver målbutikk, men forutsatt at disse også ligger innenfor kjøretidsisokronet fra den geografiske markedsavgrensningen. Koeffisientene fra regresjonen skal tolkes på følgende måte: Kjøretid: For hvert kjørte minutt fra målbutikken til svarbutikken så faller diversjonen med 0,0369, men effekten er avtakende ettersom diversjonen også stiger med 0,00215 multiplisert med antallet kjørte minutter opphøyd i annen. For 5 minutters kjøretid blir altså effekten estimerte -0,13 sammenliknet med en butikk lokalisert ved siden av målbutikken. 8 Marginaleffekten av ytterligere et minutts økt kjøretid blir ved fem minutter lik -0,0154. 9 Rang: Den nærmeste butikken får, alt annet likt, 0,132 høyere diversjon enn basisgruppen (bestående av butikker med rang 6 og som er innenfor isokronene). Segment: Dersom butikken er en nærbutikk, så er diversjonen 0,0612 lavere enn hva som ville vært tilfelle for en lavprisbutikk. Relativ omsetning: En butikk med dobbelt så høy omsetning 10 som de andre 5 nærmeste butikkene innenfor isokronet får en estimert økt diversjon på 0,0428. Antall svarbutikker: Dersom det kun er 5 svarbutikker innenfor isokronet så får hver butikk en ytterligere estimert diversjon på 0,823 * 1/5 = 0,165. Konstantledd: Hver butikk i utvalget får et ytterligere tillegg på 0,0246. 7 Altså er det for hver av de 55 målbutikkene beregnet summert inntektsdiversjon til alle svarbutikkene rundt målbutikken som er inkludert i det aktuelle utvalget. Totaldiversjonen presentert i tabellen er gjennomsnittet av denne summen for de 55 målbutikkene. 8-0,0369 x 5 + 0,00215 x (5^2) = -0,1845 + 0,0538 = -0,1303 9-0,0369 + 2 x 5 x 0,00215 = - 0,0154. 10 Altså blir variabelens verdi lik (2/1 1) = 1
5 (26) Regresjonen ble kjørt på et utvalg bestående av totalt 317 observasjoner, hvorav 285 var observasjoner med positiv diversjon og 32 var nullobservasjoner. Det var totalt 55 målbutikker i utvalget, og gjennomsnittlig akkumulert diversjon i disse områdene var 0,79. Regresjonen gav en forklaringsgrad på 0,425. 6.2 Modell 2 Markedsandeler målt ut ifra omsetning (27) Et alternativ til å se på både butikkenes relative omsetning og antall butikker er å benytte butikkenes markedsandeler. [ ] [ ] [ ] (28) Resultatene av analysen fremgår av tabell 2 i vedlegg 2 til Vedtaket. (29) Eksempelvis skal koeffisienten Markedsandel for regresjonen med utvalg r6ti tolkes som at en butikk med 40 prosents markedsandel får estimert 0,509 * (0,4-0,2) = 0,10 høyere diversjon enn en butikk med 20 prosents markedsandel. Øvrige koeffisienter har lik tolkning som i modell 1 7 Oppsummering (30) En ser av resultatene fra regresjonsanalysene at koeffisientene for kjøreavstand og kjøreavstand kvadrert er klart signifikante og at fortegnene ikke endrer seg med ulike utvalg og modeller. Lenger kjøretid fra målbutikken til svarbutikken tilsier, alt annet likt, klart lavere diversjon, men marginaleffekten er avtakende. Koeffisientene er størst i regresjoner med små utvalg, og marginaleffektene er større desto kortere avstanden mellom målbutikken og svarbutikken er. (31) En ser videre at de aller nærmeste butikkene har høyere diversjon enn hva som kan forklares med lav kjøretid. Den nærmeste butikken får isolert sett rundt 6-8 prosentpoeng høyere diversjon enn den nest nærmeste butikken, som igjen får 2-4 prosentpoeng høyere diversjon enn den tredje nærmeste. Den tredje nærmeste butikken får rundt 5-7 prosentpoeng høyere diversjon enn den fjerde nærmeste, som igjen får 0-2 prosentpoeng høyere diversjon enn resten av butikkene i utvalget. (32) Videre ser en at koeffisientene for relativ omsetning blir klart signifikante for samtlige utvalg, men koeffisientene blir lavere når antallet butikker rundt målbutikkene økes. Koeffisienten ligger i intervallet [0,008-0,043] med mindre man inkluderer et svært stort antall nullobservasjoner, altså vil en butikk med dobbelt så høy omsetning som gjennomsnittet av de andre butikkene i utvalget, få en estimert økt diversjon på 0,8 4,3 prosentpoeng. En høyere omsetning relativt til de andre butikkene i nærområdet tilsier dermed høyere diversjon. Relativ størrelse har større betydning i utvalg der en kun inkluderer svarbutikker som er lokalisert nært målbutikken. (33) Koeffisienten for antall butikker i utvalget blir klart signifikant for samtlige utvalg 11, og de estimerte koeffisientene er i størrelsesorden 0,31 0,87. Altså vil en, alt annet likt, vente at diversjonen til hver butikk i et område med to butikker vil være mellom 5 og 14,5 % høyere enn i et område med tre butikker. 12 (34) Koeffisienten for markedsandeler blir signifikant positiv i samtlige utvalg, og koeffisientene ligger i intervallet [0,29-0,51]. Ett prosentpoeng økning i markedsandel tilsier dermed 0,29 0,51 prosentpoeng økning i diversjon. Markedsandel har større betydning i utvalg der en kun inkluderer svarbutikker som er lokalisert nært målbutikken. (35) Endelig viser resultatene at nærbutikker har en signifikant lavere diversjon enn lavprisbutikker. Effekten er størst når utvalget er snevert. I utvalg med forholdsvis få nullobservasjoner ligger effekten i intervallet [-0,009 - -0,06]. Nærbutikker har dermed, alt annet likt, 0,9 6,0 prosentpoeng lavere diversjon enn lavprisbutikker. Koeffisientene for 11 Unntaket er utvalget r6 der det er svært begrenset variasjon i variabelen. 12 [0,31 0,87] * (1/2) - [0,31 0,87] * (1/3) = [0,052 0,145]
6 supermarkeder og hypermarkeder blir ikke signifikant forskjellig fra lavprisbutikker for noen av utvalgene. 8 Øvrige tester (36) Konkurransetilsynet har utført diverse øvrige analyser for å sjekke robustheten av resultatene. (37) Konkurransetilsynet har blant annet gjort regresjoner med indikatorvariabler på målbutikkenes segment og interagert disse indikatorvariablene med flere av forklaringsvariablene nevnt i den foregående analysen, jf. tabell 4 i vedlegg 2 til Vedtaket. Resultatene fra regresjonene gir koeffisienter i samme størrelsesorden som estimert over. (38) Konkurransetilsynet har også gjort regresjoner med tilsvarende regresjonsmodell som benyttet i Walker (2007). For små utvalg blir marginaleffektene fra regresjonen svært like som koeffisientene estimert i modellene over. Når antallet nullobservasjoner øker, så gir GLMmodellen lavere absoluttverdier på koeffisientene.