Barn, badevann og rusforebyggende tiltak i ungdomsskolen

Størrelse: px
Begynne med side:

Download "Barn, badevann og rusforebyggende tiltak i ungdomsskolen"

Transkript

1 Kommentarer HENRIK NATVIG Barn, badevann og rusforebyggende tiltak i ungdomsskolen Suspekte forskere, manglende økologisk validitet og generell pessimisme Er evalueringer av skolebaserte tiltak gode nok til å gi faglig holdbar grunn til å kunne anbefale noen tiltak framfor andre overfor politikere og bevilgende myndigheter. Hilde Papes (2009) problemstilling er helt grunnleggende og den er viktig for rusforebyggingsfeltet. Hun innleder friskt med å påstå at skolebaserte tiltak stort sett ikke har nevneverdig effekt på unges bruk av rusmidler. I en velskrevet og interessant litteraturgjennomgang framhever hun problemer knyttet til to forhold: 1) Det publiseres feilaktig for mange funn som viser at tiltak har ønsket effekt, mens negative funn underrapporteres. Dette skyldes dels forskeres ønsker om positive funn der forskerne direkte via samarbeidspartnere har bidratt til å utvikle tiltakene de evaluerer og på annen måte har økonomiske interesser i positive funn, og dels publiseringsskjevhet som innebærer at negative resultater ikke så lett blir publisert; 2) spørsmålet om økologisk validitet gjenskapes de publiserte positive effektene fra de forskerstyrte forebyggingstiltakene når skolene er overlatt til seg selv og lærerne skal sette tiltakene ut i livet i stor skala i den vanlige skolehverdagen. Pape har oppsummert mye litteratur og det er lett å være enig i at negative/manglende funn vil ha vanskelig for å kunne publiseres som hun viser til men heller av mindre suspekte grunner enn de artikkelen framhever (s ). Både forskeren selv og redaktøren/referee ene som vurderer publisering av manglende/motstridende funn vil i utgangspunktet mistenke at noe har gått galt (i prosedyren; med operasjonaliseringer og måleinstrumenter; i instruksjonene til utvalget; i implementeringen av tiltaket; i lærersamarbeidet; i respondentenes tillit, motivasjon eller interesse for å bidra i programmet, osv.). Denne type feil gjør at det blir lite interessant å publisere manglende resultater, man vet jo ikke hva de skyldes. Derimot når en forsker rapporterer statistisk signifikante sammenhenger som er teoretisk velbegrunnet, så vil både forskeren selv og en redaktør/referee lett tro at studien viser noe om reelle sammenhenger i den virkelige verden. Jeg savner å se en omfattende litteraturgjennomgang med mer optimistiske perspektiver, for eksempel a la tilhengere av Botvins Life Skills Training (LST), project ALERT eller andre kampanjer forsvare disses effekt fra sitt ståsted eller å se på forskning fra andre felt som røykestopp 355

2 eller kostholdsfelt eller andre helserelaterte atferder og således gjeninnføre troen på at det er mulig å utvikle effektive programmer som Pape et al. (2006), Room (2005) og andre ser ut til å mangle. Pape samstemmer med Room og ønsker tilsynelatende å begrense kampanjer til å informere om skadevirkninger for således å berede grunnen for at myndighetene skal gå i gang med sine strukturelle tiltak (lukketider, priser, aldersgrenser mv.) som det blant forskere råder bred enighet om virker på forbruket. Spørsmålet om økologisk validitet er sentralt og interessant. Klart det er viktig å få effekter av et forebyggingsprogram når forskerne overlater ansvaret til lærere og andre som skal bruke programmet i sin hverdag. Men her synes jeg Pape slipper barnet ut sammen med badevannet. Det at skoler overlatt til seg selv ikke klarer eller orker å gjennomføre et forebyggingsprogram slik forskerne har sagt at det må gjøres for å virke, betyr ikke at programmet er ubrukelig eller ikke kan anbefales. Svikten handler i utgangspunktet om motivasjons- og kunnskapsmangel fra de som skal implementere programmet, ikke om kvaliteten på programmet som sådan. Det blir som å hevde at antibiotika ikke virker fordi i mange fattige land fører feil bruk til resistente bakterier og farlige sykdommer fordi helsepersonell ikke har kapasitet til å følge opp at pasienter gjennomfører foreskrevne kurer. Problemet er ikke at den anbefalte behandlingen ikke virker, men at kuren ikke gjennomføres på riktig måte. Tilsvarende må vi ikke miste troen på at rusmiddelforebygging kan virke. Problemene med implementering må også takles, selv om det synes naturlig ennå en tid å ha fokus på utviklingen av mer effektive tiltak innen rusmiddelforskningen. Unge & Rus evalueringen Når det gjelder Unge & Rus hevder Pape at programmet anbefales i forskergruppens rapport (Nordahl et al. 2006) som jeg var med på å skrive. Papes framstilling gir et feil inntrykk. Vi skrev at programmet kvalifiserte til kategori 3, som blant annet betød at programmet hadde dokumenterte resultater i henhold til listen med spesifikasjoner (s. 10 i rapporten; 1. Være forskningbasert; 2. Være utprøvd i skolen med minst en positiv evaluering; 3. Ha metodisk godt nok design; 4. Klart definerte implementeringsstrategier; 5. Ikke spesielt avgrenset i valg av målgruppe og teori). Kategori 3 og vår omtale av Unge & Rus betød ikke (som Pape gir inntrykk av s ) at vi anbefalte skoler å benytte programmet, men kun at programmet fulgte spesifikasjonene og hadde dokumenterte atferdseffekter. Siden dette kunne misforstås og har blitt et tema (Pape et al. 2007) burde vi vært tydeligere på at det ustrukturerte opplegget ikke hadde dokumentert ønsket atferdseffekt. Som jeg skal komme tilbake til nedenfor, ser det heller ikke ut til at det har en negativ effekt, kun manglende effekt. Det er misvisende (Pape s ; Pape et al. 2007) at Nordahl et al. (2006) underslo at det kun var det strukturerte opplegget som hadde fått en positiv evaluering. Addiction-artikkelen (Wilhelmsen et al. 1994) sammen med en doktorgradsavhandling (Wilhelmsen 1997) fungerte som et kvalitetsstempel i samlingen av 16 norske programmer der de fleste manglet metodisk gode evalueringer. Vi gjorde ikke en vurdering av hvorvidt programmet burde implementeres i skolene eller ikke. 356

3 Vi påviste positive atferdseffekter innen et metodisk godt design, altså kategori 3. Under overskriften Evaluering (Nordahl et al. 2006, 109) oppsummerte vi: Evalueringen viser at det ble positive resultater knyttet til endringer i oppfatninger av alkohol og alkoholatferd i den gruppen av elever som fulgte det mest strukturerte opplegget. Og under den noe uheldige overskriften Anbefaling (samme overskrift for samtlige 16 programmer), presiserte vi (s. 109): kategori 3. Program med dokumenterte resultater. Dette forutsetter at programmet implementeres og gjennomføres i samsvar med struktur og retningslinjer i det tidligere programmet Ungdom og alkohol. Forskergruppen mente dette gjorde det klart at Wilhelmsen hadde publisert empirisk støtte for en strukturert implementering, det var utenfor vårt mandat å gå inn på å vurdere detaljer ved programmet, som hvilke konsekvenser det ville få om det ble implementert på en ustrukturert måte. Om ikke det skulle være nok, så framhevet vi behovet for grundigere evaluering: Det kan være behov for en sterkere kvalitetssikring av programmet enn det det legges opp til i dag. (s. 109). Sentralt i Papes kritikk er at Wilhelmsen og kolleger har brukt et alkoholmål som er uegnet til å påvise endring eller stabilitet over tid. (Pape, note 1). Sumskåren er ulogisk og den har dårlig innholdsvaliditet. Men imidlertid fungerer den godt i denne aldersgruppen til å rangere de unge etter hvor mye de drikker. Kriterivaliditet er en annen måte å validere et mål på. Og det kan være like godt som innholdsvaliditet. I flere egne datasett av åringer (jf. Natvig 1995; Aas 1995) har jeg prøvd ut ulike alkoholskårer, inkludert det klassiske frekvens x mengde. Det klart beste alkoholmålet i denne aldersgruppen inkluderte de ulogiske frekvensleddene for øl, vin og brennevin. Slike sumskårer korrelerte langt bedre med alkoholforventninger, mestringsforventninger og andre indikatorer (Aas, 1993; Aas et al. 1995), samt med ulike alkoholmål longitudinelt, enn det logisk korrekte frekvens x mengde som også ble testet i en datainnsamling. Frekvens som ett spørsmål er nært assosiert med selvrapportert mengde. I en studie av 12 til 19 åringer korrelerte disse to målene med 0.81 (Aas & Klepp 1992). Basert på kriterievaliditet så det ikke ut til at det ble et bedre mål på ungdoms alkoholbruk ved å ta med selvrapportert mengde til frekvens, heller dårligere. Spørsmålet om hvor mye de unge vanligvis eller gjennomsnittlig drikker de gangene de drikker blir kanskje mistolket av så mange åringer at det er bedre å kutte ut spørsmålet. Jeg vil derfor forsvare å bruke ulike kriterier for å validere en operasjonalisering av alkoholbruk når disse kriteriene empirisk og teoretisk korrelerer høyt med alkoholbruk. En bør ta hensyn til at den ulogiske alkoholbrukssumskåren korrelerte langt sterkere enn en logisk frekvens/mengde skåre, spesielt når dette gjentas i ulike utvalg i denne aldersgruppen. I et utvalg på over og 15 åringer (Aas et al. 1995) var korrelasjonen mellom intensjon om å drikke og en svært lik alkoholsumskåre som den Wilhelmsen et al. (1994) brukte på Nye dataanalyser I anledning denne kommentaren gjenskapte jeg en ryddet fil fra rådata (med Wilhelmsens godkjenning). Wilhelmsen et al. (1994) delte utvalget (N=855) inn i 357

4 tre grupper: LRS=lite struktur, HRS=høy struktur, K=kontrollgruppe. Alkoholsumskåren var slått sammen av frekvens på å drikke øl, vin og brennevin, alle skåres fra 0 til 3, og sumskåren ble rekodet slik at ca 8 (1 %) på T1 og 24 (3 %) på T2 fikk skåren satt ned til 5. De opererte med åtte flere personer på T1 enn T2, i min gjenskaping av filen har jeg dels gjennomført missingerstatning og dels beholdt kun de som hadde tilfredsstillende svar på begge. Derfor ble det noen små forskjeller mellom de data jeg presenterer og Wilhelmsen et al. s (1994). Data ble samlet inn i uke 2 (T1) og uke 15 (T2) (Wilhelmsen, 1997). Den forventede utviklingen for 13-åringer er økende alkoholbruk. I løpet av denne 13-ukers perioden kan stillstand i alkoholbruk regnes som en positiv forebyggingseffekt og økt alkoholbruk forventes som normalutvikling. Det handler først om en negativ effekt av et program når økningen er større enn forventet (for eksempel målt i en kontrollgruppe). I tillegg til sumskårene for hver gruppe Wilhelmsen et al. (1994) brukte, viser tabell 1 også skårene på en ny variabel som, så vidt jeg vet, ikke har blitt publisert tidligere. Fordelingen viser hvor ofte respondentene oppgir at de har vært beruset de siste 6 månedene, med svarkategoriene null (0), 1 gang (1), 2 4 ganger (2), 5 10 (3) og mer enn 10 ganger (4). Det var 91,5 % (T1) og 87.7 % (T2) som rapporterte de aldri hadde vært beruset, altså en økning på 3.8 prosentpoeng for hele utvalget. Tabell 1 viser tydelig nok at det var kun i intervensjonsgruppen med høy struktur (HRS) at det var en nedgang i alkoholsumskåren, mens de to andre hadde en oppgang. Uansett er det små endringer. Det mest overraskende er at det faktisk blir en liten nedgang i denne aldersgruppen i det hele tatt. Oppgangen i LRS-gruppen ser ganske stor ut for alkoholsumskåren (og enda litt større i mine gjenskapte tall) sammenlignet med kontrollgruppen. Det kan jo indikere at LRS-tiltaket kan virke alkoholfremmende. Men endringene for beruselsesfrekvens viser at LRS-tiltaket er svært likt kontrollgruppens. Og selv om HRS-gruppen øker fra 0.11 til 0.15, så kan dette stadig tolkes som en atferdseffekt i ønsket retning, nemlig tregere økning enn forventet basert på kontrollgruppens økning. Som støtte for operasjonaliseringene av alkoholbruk, så viste Pearson korrelasjon mellom sosiale alkoholforventninger (fra AEQ-A) på den ene siden og a) alkoholsumskåren og b) beruselsesskåre på den andre følgende (N=852): T1: a) 0.55 og b) Tabell 1. Gjennomsnitt på sumskåre og beruselsesskåre for tre grupper, to intervensjons- og en kontrollgruppe (tall fra Wilhelmsen et al i parentes). Alkoholsumskåre Beruselsesskåre N T1 T2 T1 T2 Lite struktur (LRS) 320 (314) 0.81 (0.80) 0.96 (0.90) Høy struktur (HRS) 273 (279) 0.71 (0.71) 0.55 (0.53) Kontrollgruppe 259 (262) 0.69 (0.67) 0.73 (0.69) Samlet 852 (855)

5 0.47; T2: a) 0.62 og b) Det er vanlig å finne høyere korrelasjoner blant 15 åringer enn 13 åringer (Natvig 1995; Aas 1995), delvis fordi variansen i alkoholbruk øker etter hvert som flere begynner å drikke. På denne bakgrunn vil jeg hevde at kritikken mot alkoholsumskåren blir uviktig. I studien til Wilhelmsen støttes sumskårens validitet av at mønsteret i beruselsesskåren bekrefter resultatene, og derved støttes også at det var riktig å gi kategori 3 til Unge & Rus i Nordahl-rapporten. Utviklingen av forebyggingsprogram Potensielle mediatorers betydning framheves av Hansen og McNeal (1996, 502) i sin diskusjon om hvordan få til effektive forebyggingstiltak: the law of maximum expected potential effect, which specifies that the magnitude of change in behavioral outcome that a program can produce is directly limited by the strength of relationships that exist between mediators and targeted behaviors. Altså at de prediktorene som samvarierer sterkest med atferden (for eksempel alkoholbruk), er de en bør rette forebyggingstiltak mot siden disse vil ha størst mulighet til å påvirke atferden. Som et minimum bør en dekke komponentene i Ajzens (1988) Theory of Planned Behavior som inkluderer holdninger, sosial påvirkning og mestring/ kontroll, men også en rekke andre potensielle mediatorer bør undersøkes, som selvbilde, verdier, commitment, forventet anger, opplevelse i situasjonen, moralske normer, forventninger om forsterkning og implementeringsintensjoner, for å nevne noen. Det er et mål å komme videre i utviklingen av forebyggingsprogram. For å oppnå dette må vi få mange nye tiltak satt ut i livet, de må være forskningsbasert (Hansen & McNeal 1996), og gjennom stadige gode evalueringer vil vi komme lenger. Pape framhever at resultatene er så dårlige at det ikke har noen hensikt å drive med forebygging, det høres for meg ut som å hive barnet ut med badevannet. Det er prematurt å konkludere nå med at rusmiddelforebygging ikke vil kunne virke. Pape gir inntrykk av at dårlig kvalitet på tiltakene nå gjør at de bør erstattes av opplysningsprogrammer. Vi er, etter min mening, i startgropen og trenger å sette en lang rekke tiltak ut i livet, gjerne etter Hansens modell (og således beholde barnet i badekaret). Botvin (2000) hevder at de mest lovende forbyggingstiltakene rettes mot ungdom tidlig i tenårene, og han anbefaler på empirisk grunnlag i sin litteraturgjennomgang av skolebaserte forebyggingstiltak følgende: teach drug resistance skills and norm setting either alone or in combination with general personal and social skills. Hansen og McNeal s (1996) oppskrift for veien videre kan oppsummeres omtrent slik: start tiltak med 1) En forundersøkelse i populasjonen. Forundersøkelsen vil angi typen av forebygging en bør satse på. 2) Hva korrelerer sterkest med atferden? Prøv å få til en atferdsendring via den/de medierende variabelen(e) som virker best. 3) Tilpass tiltaket til de potensielle mediatorene i populasjonen. Er holdninger viktigst, så bruk teori og empiri for effektiv holdningspåvirkning, gjerne fra sosialpsykologien. Er sosial påvirkning viktigst, prøv å korriger flertallsmisforståelser (korrigere deskriptive normer, jf. Aas & Klepp 1992) eller prøv å endre de injunktive normene for alkoholbruk i klassen. Er det mestringsferdighe 359

6 tene (opplevd atferdskontroll) som korrelerer sterkest med alkoholbruk, sett i gang rollespill og annen ferdighetstrening både direkte og via modellæring, osv. 4) Om tiltaket gir atferdsendring, så blir neste skritt å analysere endringer i potensielle mediatorer. På denne måten kan vi nærme oss å kartlegge hvilke mediatorer som er sentrale og påvirkbare. Det finnes trolig også vesentlige moderatorer (kjønn, alder, religion, etc.) som utvalg bør gruppere etter for å oppnå optimale mediatoranalyser. Tiltak må uansett på lenger sikt forventes å skulle tilpasses undergrupper i populasjonen for å bli mest mulig effektive. Vi har stadig et stort behov for flere og bedre evidensbaserte forebyggingsprogram i Norge. Selv i USA er det overraskende nok først i våre dager slike begynner å bli utbredt. Ringwalt et al. (2009) undersøkte i 2005 et representativt utvalg på skoler i USA. De fant at av alle som brukte forebyggingsprogram var det bare 42.6 % av skolene som brukte evidensbaserte forebyggingsprogram. Dette var likevel en økning på åtte prosentpoeng fra De to viktigste programmene var Botvins LST og Project ALERT som hver ble benyttet av 19 % av alle skolene. Henrik Natvig, Dr. psychol. Psykologisk institutt, Universitetet i Oslo Postboks 1094 Blindern 0317 Oslo Norge E-post: REFERANSER Aas, H. (1993): Adaptation of the Alcohol Expectancy Questionnaire (AEQ-A): A short version for use among 13-year-olds in Norway. Scandinavian Journal of Psychology 34: Aas, H. & Klepp, K.-I. (1992): Adolescents alcohol use related to perceived norms. Scandinavian Journal of Psychology 33: Aas, H. & Klepp, K.-I. & Laberg, J.C. & Aarø, L.E. (1995): Predicting adolescents intention to drink alcohol: Outcome expectancies and self-efficacy. Journal of Studies on Alcohol, 56: Ajzen, I. (1988): Attitudes, personality, and behavior. Belmont, Calif.: Dorsey Press Botvin, G. J. (2000): Preventing drug abuse in schools: Social and competence enhancement approaches targeting individual-level etiological factors. Addictive Behaviors 25 (6): Hansen, W.B. & McNeal, R.B. jr. (1996): The law of maximum expected potential effect: constraints placed on program effectiveness by mediator relationships. Health Education Research, Theory & Practice 11 (4): Natvig Aas, H. (1995): Alcohol expectancies and socialization: Adolescents learning to drink. Doktorgradsavhandling, HEMILsenteret, Psykologisk fakultet, Universitetet i Bergen Nordahl, T. & Natvig, H. & Samdal, O. & Tyholdt, R. & Wilhelmsen, B. U. (2006): Vurdering av rusprogrammer i skolen. I Nordahl, T. & Gravrok, Ø.& Knudsmoen, H.T. & Larsen, M.B. & Rørnes, K. (red.): Forebyggende innsatser i skolen. Oslo: Utdanningsdirektoratet Pape, H. (2009): Skoletiltak som synes å gi effekt: Fruktbar forskning om rusforebygging eller suspekte historier om suksess? 26 (5): Pape, H. & Baklien, B. & Rossow, I. (2007): Villedende om rusforebygging i skolen. Tidsskrift for Den norske legeforening 127: 1399 Pape, H. & Storvoll, E.E. & Rossow, I. (2006): 360

7 Så feil kan man ta! En studie av unge menneskers kunnskap om alkohol- og narkotikabruk. Tidsskrift for Ungdomsforskning 6: Ringwalt, C. & Vincus, A. & Hanley, S. & Ennett, S. & Bowling, J. & Rohrbach, L. (2009): The Prevalence of Evidence-Based Drug Use Prevention Curricula in U.S. Middle Schools in Prevention Science 10 (1): Room, R. (2005): What to expect from a social aspects organization, and what to expect from schoolbased alcohol education. Addiction 100: Wilhelmsen, B.U. (1997): Development and evaluation of two educational programmes designed to prevent alcohol use among adolescents. Doktorgradsavhandling, HEMIL-senteret, Psykologisk fakultet, Universitetet i Bergen Wilhelmsen, B.U. & Laberg, J.C. & Klepp, K.-I. (1994): Evaluation of two student and teacher involved alcohol prevention programmes. Addiction, 89: