‘Hoeveel effect heeft die interventie?’ Een logische vraag die de wethouder stelde. Hij moet immers de uitgaven in zijn beleid kunnen onderbouwen. Waarschijnlijk geldt de vraag voor veel van de keuzen die hij dagelijks moet maken. Het betrof in dit geval echter een educatief programma dat zou worden ingezet in het kader van de integrale aanpak van obesitas onder de jeugd in zijn gemeente. We zullen in dit artikel laten zien waarom de vraag van de wethouder de verkeerde is. Een betere is: ‘Kan ik deze interventie in mijn gemeente laten bijdragen aan de preventie van obesitas onder jongeren?’ We beargumenteren in dit artikel niet alleen waarom deze vraag beter past bij integrale obesitaspreventie, maar ook dat voor het beantwoorden ervan niet zozeer naar de interventie-elementen moet worden gekeken, als wel vooral naar de aard van de context waarin de interventie moet worden ingepast.

De pvc-buis

Voor de intrede van de smartphone, tablet en Xbox speelden kinderen buiten met zelfgemaakt speelgoed. Van oude pvc-buizen werden blaaspijpen gemaakt om pijltjes te schieten, gemaakt van kapotgescheurde kranten. Voordat u gaat denken dat dit een bijdrage wordt in de trant van ‘vroeger was alles beter’, kunnen we u geruststellen. We noemen de pvc-buis alleen even als voorbeeld. Hoewel de afname in buitenspeeltijd waarschijnlijk een rol speelt bij de toename van overgewicht bij kinderen in de afgelopen decennia, is overgewicht de resultante van vele verschillende gedragingen, die elkaar ook nog beïnvloeden. Daarnaast geldt dat een preventieprogramma in de ene gemeente in Nederland niet per definitie tot dezelfde resultaten leidt als in een andere gemeente. Niettemin denken veel beleidsmakers, onderzoekers en praktijkwerkers nog vaak in de traditionele pvc-buismetafoor. Deze metafoor veronderstelt dat bewijs uit gecontroleerd (laboratorium)onderzoek door een lange pijp kan worden geblazen en zich uiteindelijk vertaalt in een effectieve aanpak van overgewicht die, mits goed uitgevoerd, automatisch leidt tot het beoogde effect. Het is tijd om te stoppen met dit soort aannamen en denktradities. Hoewel we op basis van onderzoek weten hoe lastig het is om tradities te doorbreken, willen we toch graag een bijdrage leveren aan het opstarten van het ontwenningsproces.

Context als complex adaptief systeem

We moeten af van de gewoonte om evaluatie uitsluitend te baseren op de vraag of een programma ter preventie van obesitas effectief is. Het zijn namelijk niet zozeer de programma’s op zichzelf die effectief zijn, als wel de middelen en mogelijkheden die zij bieden om het systeem in staat te stellen om ze effectief te maken. En de mate waarin en wijze waarop dit gebeurt, verschilt per context. In de ene context gaat het sneller dan in de andere en een programma leidt in de ene context tot andere (clusters van) uitkomsten dan in de andere. Evaluatieprotocollen die geen rekening houden met deze principes van complexe adaptieve systemen zijn niet alleen niet passend, maar ook gevaarlijk, omdat ze tot verkeerde conclusies kunnen leiden. Wanneer we denken in systemen in plaats van in pijpleidingen, erkennen we dat de deelnemers in een systeem adaptief te werk gaan en responsief zijn op basis van veranderingen en feedback. Reacties op kleine veranderingen in de omgeving kunnen lange tijd niet leiden tot zichtbare veranderingen, maar op den duur samenballen tot grote veranderingen in gedrag. Er kunnen dus lange periodes zijn waarin niets gebeurt op het niveau van uitkomsten, gevolgd door periodes waarin een heleboel gebeurt. Wanneer we dergelijke non-lineaire processen negeren door alleen te kijken naar het einde van een pijpleiding (incidentie, prevalentie), kunnen mooie en zorgzaam vormgegeven implementatietrajecten in de kiem worden gesmoord. Interventies worden dan bijvoorbeeld ten onrechte (te vroeg) als niet-effectief betiteld. Bovendien is dan onduidelijk of de interventie voor niemand of in geen enkele context effectief was en welke processen een volgende keer anders zouden moeten verlopen.

Jongeren Op Gezond Gewicht (JOGG)

We gaan in dit artikel niet in op de vraag waarom beleidsmakers (net als onderzoekers, gezondheidsbevorderaars, timmermannen en andere mensen overigens) graag vasthouden aan conventionele denkwijzen, maar willen beargumenteren waarom het paradigma van de evaluatie van obesitaspreventie veranderd zou moeten worden. Om dit te concretiseren kijken we naar de JOGG-aanpak (Jongeren op Gezond Gewicht). Onder de paraplu van de gemeente ondersteunt JOGG partijen in de wijk om samen meer aandacht aan voeding, sport en beweging te geven. Daarnaast helpt JOGG met het creëren van een gezonde omgeving op plekken waar kinderen en jongeren veel komen, zoals het schoolplein, het sportveld en hun werk.

In essentie is de JOGG-aanpak een zogenaamd complex community initiative [1, 2]. Dergelijke complexe initiatieven zijn gericht op het bewerkstelligen van verandering op (ten minste) de volgende vlakken [3]:

  • individuen (bijvoorbeeld verandering van leefstijl om excessieve gewichtsstijging te voorkomen);

  • populaties (bijvoorbeeld verminderde incidentie van overgewicht bij kinderen in een stad);

  • gemeenschappen (communities, bijvoorbeeld toegenomen sociale cohesie in een wijk);

  • diensten (bijvoorbeeld betere toeleiding van kinderen met een hoog risico op gewichtsstijging naar een passend aanbod);

  • systemen (de processen waarin de betrokken partijen samenwerken, gezamenlijke doelen bepalen, diensten leveren en organisatiestructuren vormgeven).

In deze aanpak worden ‘interventies’ gezien als nieuwe elementen die moeten worden ingepast in een bestaand adaptief systeem. De metafoor van de pvc-buis gaat hier dus volledig mank. De term ‘complexe interventies’ die vaak wordt gebruikt in het kader van obesitas slaat dus ook niet op de interventie zelf (de term ‘multicomponent’ is dan wellicht veel toepasselijker), maar veel meer op de context waarin deze wordt geïmplementeerd [4]. En het is juist in het belang van deze context, die we willen promoveren van traditionele ‘achtergrondvariabele’ (confounder) naar een ‘voorgrondvariabele’ [5]. Niet alleen in het vormgeven of contextueel adaptief maken van een interventie (dat is in essentie de integrale aanpak die JOGG tracht vorm te geven), maar ook in het evalueren ervan.

JOGG in context

Context behelst alle condities waaronder een programma wordt geïmplementeerd. Dat leidt tot vragen als ‘voor wie’ en ‘onder welke omstandigheden’ programma’s werken. Voor de evaluatie van JOGG is het van belang te onderkennen dat de context onderdeel is van het open systeem waarin JOGG opereert. Met andere woorden, JOGG is onderdeel van het systeem (‘add-in’); het staat er niet los van (‘add-on’). De context zelf is onderhevig aan verandering, al dan niet als gevolg van JOGG-interventies, en al dan niet bedoeld met de implementatie van een JOGG-interventie. De keuze, adaptatie en wijze van implementatie van activiteiten binnen JOGG zijn afhankelijk van de lokale context. Maar ook de context zal zich aan de nieuwe elementen aanpassen. Dergelijke patronen van feedback en adaptatie zien we vaak bij complexe interventies [4]. De ‘effectiviteit van JOGG’ kan op deze manier dus ook niet meer losgetrokken worden van de context (het systeem) waar deze aanpak onderdeel van is geworden.

In systeemtheoretische termen behelzen de uitkomsten van een aanpak als JOGG zowel de bedoelde als de onbedoelde effecten van de activatie van verschillende processen. Dat impliceert dat niet kan worden vertrouwd op één enkele effectmaat, zoals de verandering in de gemiddelde BMI-z-score in een populatie, om een geslaagd/gezakt vonnis te vellen over een aanpak [6]. We beseffen terdege dat dit in de praktijk vaak moeilijk uit te leggen is, zeker als de gemeenteraad en wethouder gefocust zijn op verandering in gewicht [7]. Het is vanuit een contextuele benadering echter onmogelijk om een heel strak omlijnd verschil te definiëren tussen output (intermediaire implementatiedoelen) en outcome (veranderingen in gewicht). Uitkomstpatronen kunnen vele vormen aannemen en JOGG zou dus getoetst moeten worden in het licht van een breed spectrum van (clusters van) uitkomsten (output- én outcome-maten).

Interessant, maar ingewikkeld voor onder anderen beleidsmakers, is dat interventies in complexe systemen tot extreme uitkomsten kunnen leiden. Dosis-responsrelaties zijn niet lineair: kleine veranderingen leiden soms tot grote effecten, en grote aanpassingen hebben soms geen effecten. Een meta-analyse van Burton liet zien dat de effect sizes van complexe interventies, in vergelijking met ‘simpele’ interventies gericht op individuen, ‘lange, zware staarten’ hebben [8]. Burton bedoelt hiermee dat er enorm veel variatie te zien is in de effecten die complexe interventies teweegbrengen, precies zoals je zou verwachten van systemische interventies die sterk contextafhankelijk zijn. De praktische implicatie hiervan betreft onder andere de beperkte waarde van ‘bewezen effectieve interventies’. Gezondheidsbevorderaars zullen geneigd zijn om de outliers, de interventies die verantwoordelijk zijn voor de lange, zware staarten, te selecteren voor landelijke uitrol. Maar ‘bewezen effectief’ is dan mogelijk niet veel meer dan ‘natuurlijke variatie’ rondom een gemiddelde effect size, aldus Burton. Dit fenomeen speelt zich ook af bij ‘simpele’ interventies, maar de kans dat toeval een ongunstige rol speelt is daar veel kleiner.

De effectiviteit van complexe interventies kan niet los worden gezien van het systeem waarin het is geïmplementeerd. Vooral bij complexe interventies als JOGG geldt dus: succes in gemeente A kan niet als vanzelfsprekend worden vertaald naar gemeente B. De uitdaging die hier voor de evaluatie van JOGG uit voortvloeit is om steeds de hierboven besproken aspecten van complexiteit (interacties tussen en binnen partijen, vertraging, responsiviteit, adaptatie, feedback-loops, clusters van uitkomsten) mee te nemen in de evaluatie [9].

Hoe dan?

Van Koperen en collega’s gaven in een recent artikel in TSG aan hoe belangrijk het is om draagvlak te creëren voor evaluatie, met bijbehorende allocatie van budget hiervoor [7]. Daarnaast gaven de auteurs aan dat de dialoog over het belang en de aard van de evaluatie binnen de gemeente bevorderd dient te worden. We hopen dat artikelen als dit dergelijke dialogen stimuleren en sturen.

Hoe moet dat veranderde paradigma van de evaluatie van obesitaspreventie dan vorm krijgen? We geloven dat actieondersteunende evaluatie het beste past bij de fase waarin JOGG zich nu bevindt. We mogen aannemen dat de integrale aanpak die JOGG implementeert in beginsel de optimale aanpak is in het kader van obesitaspreventie. De keuze voor deze aanpak wordt ondersteund door empirisch onderzoek, praktijkkennis en (systeem)theorie [10]. De noodzaak om deze aanpak voortdurend in een pijpleiding te proppen en aan de achterkant te kijken wat eruit komt, is afwezig. Het gaat er nu om te begrijpen hoe systeemaanpassingen in verschillende contexten verlopen, en die kennis te gebruiken om uitkomsten te optimaliseren. Actieondersteunende evaluatie is een benadering waarin de onderzoeker systeemveranderingen ondersteunt, terwijl hij er tegelijkertijd kritisch kennis over vergaart. Evaluatie is dan niet langer een externe observatie van veranderstrategieën, maar wordt een van de strategieën. Ze is adaptief, participatief en ondersteunend. Het mag duidelijk zijn dat het leggen van de nadruk op één uitkomstmaat, zoals BMI-z, onvoldoende informatie geeft om de implementatie van JOGG-activiteiten in een bepaalde context optimaal te ondersteunen. Evalueren doe je niet op één geïsoleerde parameter, maar op het gehele systeem. Hiervoor is het nodig om te evalueren door middel van kwantitatief onderzoek (bijvoorbeeld vragenlijsten, BMI-z-metingen) en ook kwalitatief onderzoek (observaties, interviews, netwerkanalyse, documentanalyse). Het adaptieve karakter van de evaluatie stelt de onderzoeker in staat om gedurende het implementatietraject te beoordelen wat in een bepaalde fase de meest optimale (clusters van) uitkomsten zijn.

Er worden bij deze manier van evalueren dus geen stappen ondernomen om uitkomsten toe te wijzen aan de vorm van specifieke JOGG-activiteiten of werkzame elementen (bijvoorbeeld het uitdelen van waterflessen, de belijning van het schoolplein, het uitschrijven van voedingsbeleid). In plaats daarvan richt de aandacht zich op de functie van de verschillende onderdelen van de JOGG-aanpak. Kennis over de functie van activiteiten (bijvoorbeeld bewustwording, eigenaarschap, institutionalisering) in de evolutie van systemen kan helpen bij het ondersteunen van JOGG-activiteiten in andere contexten. Het gaat er dus om inzicht te krijgen in welke contexten om welke interventiefuncties vragen. Evaluaties dienen niet te werken als middel om interventie-elementen te scoren op ‘werkzaamheid’, zonder oog te hebben voor de context. Evaluaties zijn bedoeld om JOGG-gemeenten te ondersteunen bij hun plannen om de adaptiviteit van hun aanpak groter te maken met het oog op de context waarbinnen ze werken [11]. En dat brengt ons toch terug bij de herintroductie van het goeie oude wapen om pijltjes mee te schieten. De metafoor van de pvc-buis dient bij toepassing op obesitaspreventie dan wel een andere betekenis te krijgen – pvc: plek voor context.