Det er relativt stor enighet blant både praktikere, forskere og politikere om at tiltak innen barn og unges psykiske helse må ha best mulig dokumentasjon på effekt. Samtidig er det noe ulike syn på hva som skal ligge til grunn for å hevde at et tiltak er evidens basert. Ungsinns kriterier bygger på flere organisasjoners syn på evidens.
 
Teksten under er hentet fra: Martinussen, M., Reedtz, C., Eng, H., Neumer, S.-P., Patras, J., & Mørch, W. T. (2019). Kriterier for prosedyrer og vurdering og klassifisering av tiltak (2. utgave, v. 2.1). Ungsinn – Tidsskrift for virksomme tiltak for barn og unge.
 

Evidensbasert praksis

I rapporten “Bedre føre var…” om helsefremmende og forebyggende tiltak og anbefalinger (Major, Dalgard, Mathisen, Nord, Ose, Rognerud og Aarø (2011), heter det “…det bør stilles krav om at tiltaket skal være prøvd ut på forhånd og at en skal ha dokumentasjon for at det virker etter hensikten”. Forfatterne av rapporten mener tiltak må være forskningsbaserte; altså basert på kunnskap som er fremskaffet gjennom forskning. Folkehelseinstituttet peker på dette som et rimelig og nødvendig krav for helsefremmende og sykdomsforebyggende tiltak på området barn og unges psykiske helse.

Den vanligste forståelsen av kunnskapsbasert praksis/evidensbasert praksis er at kunnskap fra forskning integreres med praktikeres erfaringsbaserte kunnskap og brukernes ønsker og behov (Sackett, Rosenberg, Gray, Haynes & Richardson, 1996). Dette er en forståelse med opprinnelse i medisin («Evidence based medicine»), opprinnelig brukt i forhold til beslutninger om behandlingsvalg for den enkelte pasient. Denne måten å forstå kunnskapsbasert praksis kan også brukes ved andre beslutninger som har betydning for hvilke tilbud som blir tilgjengelig for brukerne av tjenestene.

På norsk brukes ofte begrepene kunnskapsbasert praksis og evidensbasert praksis om hverandre. I Ungsinn legges det til grunn at begge begrepene har sin opprinnelse fra det engelske begrepet evidence based practice og at de dermed har samme betydning. Den forskningsbaserte kunnskapen i evidensbasert praksis skal være den best tilgjengelige dokumentasjon (best avaliable reseach evidence) i forhold til det kliniske spørsmål som stilles. Når det kliniske spørsmålet handler om et tiltaks virkning, vil det være forskningsbasert kunnskap om tiltakets effekter som må ligge til grunn. Det er også viktig å skille mellom begrepene evidensbaserte tiltak (empirisk støttede tiltak) og evidensbasert praksis. Evidensbaserte tiltak er tiltak med god dokumentasjon på effekt. Evidensbasert praksis oppstår når man integrerer den forskningsbaserte kunnskapen om de ulike tiltaks effekter med praktikerens erfaringsbaserte kunnskap og brukernes ønsker og behov (Sackett m. fl., 1996; American Psycological Association, 2005).

Ungsinn er en kilde til informasjon om tiltak og deres evidens. Dette gir praktikere og beslutningstakere tilgang til forskningsbasert kunnskap som de kan benytte i sitt arbeid med å utvikle en kunnskapsbasert praksis. Med fem nivåer graderes kvaliteten på evidens, der de to nederste nivåene representerer grunnlagsarbeidet som skal til å for å kunne skaffe til veie dokumentasjon på tiltakets effekt, og de tre øverste representerer ulik kvalitet av dokumentasjon basert på empirisk forskning. I tillegg er det i den siste versjonen av kriteriene (v2.1) lagt til et nivå 0 som indikerer ingen effekt.

Forståelse av evidens

Ulike standarder for evidens på tiltak
Det finnes ulike organisasjoner som har utarbeidet kriterier for hva som kan sies å være evidens i forskning og praksis. En slik organisasjon er Society for Prevention Research (SPR). I deres standarder for evidens (Flay m. fl., 2005) beskrives kriterier for effektive tiltak undersøkt under velkontrollerte betingelser (efficacy), effektive tiltak dokumentert i ordinær forebyggende/klinisk praksis (effectiveness) og tiltak som ligger til rette for allmenn spredning (dissemination).

I henhold til denne standarden skal et effektivt tiltak (efficacy) ha vært testet i minst to omfattende studier der en klar påstand om tiltakets effekt er undersøkt for en veldefinert målgruppe. Tiltaket skal være beskrevet på en måte som gjør det mulig for andre å replikere funnene i nye studier. Det skal være brukt valide og reliable psykometriske instrumenter og gode datainnsamlingsmetoder. Designet må danne grunnlag for klare kausale påstander og generaliseringer av funnene, noe som har konsekvenser for valg av sammenligningsgrupper og fordeling til grupper (f. eks. randomisert eller matchet). Det må foreligge konkrete beskrivelser av utvalget. Data skal være analysert med passende statistiske metoder. Resultatene fra slike studier skal vise konsistent positive effekter og man skal ha positive resultater fra minst én langtids oppfølgingsstudie (> 6 mnd.). Det er anbefalt (Weisz & Kazdin, 2017) at man først prøver ut tiltak under optimale betingelser med et design som sikrer høy indre validitet slik man gjør det i velkontrollerte studier, før man deretter, med nye studier og under mer realistiske forhold, tester hvorvidt effekten også kan dokumenteres i vanlig praksis (effektivitetsstudier).

I følge SPR skal evidens fra effektivitetsstudier (effectiveness) møte alle standarder som i velkontrollerte effektstudier (efficacy), men det må i tillegg foreligge en klar beskrivelse av tiltaket (manualer, opplæring og materiell) slik at en tredjepart kan adoptere og implementere metoden. Tiltaket skal ha vært evaluert under naturlige betingelser overfor den målgruppen som metoden retter seg inn mot, og tiltaket skal ha en klar teori som forklarer årsaksmekanismene i tiltaket (hvilken mekanisme som antas å lede til effekt). Evalueringer skal ha sannsynliggjort betydningen av resultatene i det virkelige liv (praktisk betydning) og skal tydelig ha demonstrert til hvilke/n gruppe/r resultatene kan generaliseres.

En metode som er klar for en bred spredning (dissemination) skal møte alle standarder for tiltak dokumentert gjennom velkontrollerte effektstudier og tiltak dokumentert i effektivitetsstudier, men må i tillegg vise at metoden/tiltaket ligger til rette for spredning i stor skala. Tiltaket må ha klare opplegg for opplæring og for vedlikehold av tiltaksutøvernes ferdigheter, samt inneholde klar informasjon om kostnader knyttet til implementeringen. Tiltaket må også ha evalueringsverktøy slik at organisasjoner kan måle effekter av tiltaket og evaluere implementeringsprosessen.

Andre organisasjoners syn på evidens
SPR setter høye standarder for at et forebyggende tiltak kan hevdes å være evidensbasert eller ha empirisk støtte. Mange andre organisasjoner har også etablert egne kriterier for evidens. Blant annet har den amerikanske organisasjonen Substance Abuse and mental Health Services Administration (SAMHSA) systemer for å vurdere kvaliteten på forskning. Blueprint er en annen database som drives av det amerikanske justisdepartementet. Den inneholder presentasjoner av effektive kriminalitetsforebyggende tiltak. I Nederland finnes databasen: Database of Effective Youth Interventions.  Den inneholder tiltak tilgjengelig i Nederland som retter seg mot barn og unges helse, omsorg og velferd. California Evidence-Based Clearinghouse for Child Welfare (CEBC) presenterer og klassifiserer programmer og kartleggingsverktøy som kan benyttes i barnevernet. Hver av disse databasene har sine egne kriterier for å vurdere og klassifisere evidens.

Den amerikanske psykologforeningen (APA) formulerte i 2005 en erklæring, APA Policy Statement, (American Psycological Association, 2005) der de listet opp hvilke faktorer de mente ville sikre en effektiv psykologisk praksis («evidence based psychological practice», ofte forkortet til EBPP). APA fulgte også stort sett SPR sine evidensstandarder for det de beskrev som den praksis som var støttet av den beste forskningsevidensen (Best Research Evidens). De pekte i tillegg på klinisk ekspertise som en forutsetning for effektiv praksis, samt hvilke kliniske ferdigheter klinisk ekspertise besto av. Den norske psykologforeningen har vedtatt en prinsipperklæring om evidensbasert psykologisk praksis som er en tilslutning til APA’s erklæring (Norsk psykologforening, 2007).

Gradering av evidens
Selv om de ulike organisasjonene har noe ulike kriterier, erkjennes det i alle systemene at evidens ikke er en absolutt størrelse, men noe som det foreligger mer eller mindre av. Konsekvensen av dette er at evidensen graderes. De ulike systemene har ganske like standarder for hva som er sterk evidens, men skiller seg noe for hva som kan anses som noe eller svakere evidens. Selv om SPR sine standarder for evidens innebærer en form for gradering, har alle nivåene strenge krav til kvalitet på dokumentasjonen. På samme måte har databasene Blueprint (Blueprints for Healthy Youth Development, nd) og CEBC (California Evidence-Based Clearinghouse for Child Welfare; CEBC), nd) alle systemer for gradering. For å konkludere med en positiv vurdering av evidens i disse databasene er det likevel en forutsetning at det foreligger positive resultater fra studier av høy kvalitet. Studiene må minimum ha et kvasi-eksperimentelt forskningsdesign.

Mange nasjonale og internasjonale organisasjoner (for eksempel Verdens helseorganisasjon og Nasjonalt kunnskapssenter for helsetjenesten) har samlet seg om en felles tilnærming til gradering av evidens gjennom systemet GRADE (Grading of Recommendations, Assessments, Development and Evaluation; Guyatt, Oxman, Vist, Kunz, Falck-Ytter, Alonso-Coello & Schünemann, 2008; WHO Guidelines, 2012). Kvaliteten på dokumentasjonen graderes i fire nivåer: høy kvalitet, middels kvalitet, lav kvalitet og svært lav kvalitet. Systemet anvendes i hele medisin- og helsefeltet, og det evalueres og utvikles kontinuerlig. GRADE tar utgangspunktet i at RCT (Randomized Controlled Trials, eller på norsk; randomiserte kontrollerte studier) er det beste forskningsdesignet for å avdekke en årsakssammenheng mellom tiltak og effekt. I tillegg vurderes andre faktorer som kan svekke eller styrke påliteligheten til resultatene, eksempelvis prosedyrer for randomisering, blinding (uvitenhet om forskningsbetingelser) og konsistens mellom ulike studier. Generelt stiller GRADE høye krav til metodisk kvalitet. Kravene og feilkildene som vurderes i GRADE er særlig aktuelle ved utprøving av medikamenter og medisinsk behandling og er i noe mindre grad tilpasset studier som undersøker effekten av psykososiale intervensjoner.

Den Nederlandske kunnskapsdatabasen; Database of Effective Youth Interventions har mindre strenge kriterier enn det som brukes for eksempel i GRADE på de laveste nivåene av evidens. På
denne måten inkluderes flere av de tiltakene som tilbys i vanlig prakis. Deres tenkning er at flere tiltak enn de som er evaluert med de beste metodene, kan være virksomme, og at enklere studier
gir mer informasjon enn ingen forskning. De har tre nivåer for evidens: teoretisk basert, mulig virksom og etablert virksom basert på systemet utviklet av Veerman og van Yperen (2007). Om det er gjennomført nye studier på et tiltak kan det vurderes på nytt og oppnå en høyere klassifisering. Den samme tenkningen ligger til grunn for Ungsinns kriterier.

American psycoloical association (APA). (2005). Policy Statement on Evidence-Based Practice in Psychology (2005). Hentet fra http://www.apa.org/practice/guidelines/evidence-based-statement.aspx

Blueprints for Healthy Youth Development. (udatert). Program criteria. Hentet fra: http://www.blueprintsprograms.com/programCriteria.php

California Evidence-Based Clearinghouse for Child Welfare (CEBC).(udatert). CEBC Review Process. Hentet fra: http://www.cebc4cw.org/home/how-are-programs-on-the-cebc-reviewed/

Flay, R. B., Biglan, A., Boruch,R. F., Castro, F. G., Gottfredson, D., Kellam, S., … Ji, P. (2005). Standards of evidence: criteria for efficacy, effectiveness and dissemination. Prevention Science, 6, 151-175. doi: 10.1007/s11121-005-5553-y

Guyatt, G. H., Oxman, A., Vist, G. E. V., Kunz, R. Falck-Ytter, Y. Alonso-Coello, P. & Schünemann, H. J. (2008). GRADE: an emerging consensus on rating quality of evidence and strength of recommendations. BMJ ,336:924.

Major, E. F., Dalgard, O. S., Mathisen, K. S., Nord, E., Ose, S., Rognerud, M., & Aarø, L. E. (2011). Bedre føre var…Psykisk helse: Helsefremmende og forebyggende tiltak og anbefalinger (rapport 1). Oslo: Folkehelseinstituttet.

Norsk psykolgforening. (2007). Prinsipperklæring om evidensbasert psykologisk praksis. Lastet ned fra: http://www.psykologforeningen.no/medlem/evidensbasert-praksis/prinsipperklaering-1-om-evidensbasert-psykologisk-praksis-2

Sackett, D. L., Rosenberg, W. M. Gray, J. A., Haynes, R. B. & Richardson, W. S. (1996). Evidence based medicine: what it is and what it isn’t. British Medical Journal, 312(7023): 71–72.

Veerman, J., W., & van Yperen, T. A. (2007). Degrees of freedom and degrees of certainty: A developmental model for the establishment of evidence-based youth care. Evaluation and Program Planning, 30, 212-221.

Weisz, J. & Kazdin, A. E. (2017). The present and future of evidence-based psychotherapies for children and
youths. I J. R. Weisz & A. E. Kazdin (Red.) Evidence-based psychotherapy for children and adolescent (3. Utg.)
(s. 577-597). New York: The Guildford Press

WHO. Guideline development handbook. (2012). Hentet fra http://apps.who.int/iris/bitstream/10665/75146/1/9789241548441_eng.pdf