Psychodeliki vs antydepresanty: co naprawdę mówią dane?

Ta metaanaliza hula jak halny po internetach. Nagłówki krzyczą, ludzie podają dalej, komentarze się mnożą. Ale jak patrzę na te dyskusje, to widzę głównie reakcje na abstrakt. „Psychodeliki nie lepsze od antydepresantów!” Szok, niedowierzanie, triumf, albo oburzenie. Świętej wojny ciąg dalszy. Tyle że abstrakt to jest… Abstrakt. Cała historia jest w środku, w metodologii, w dyskusji, w tym, czego autorzy nie napisali wprost. Bebechy są tłuste. A tłuszczyk jest ponoć nośnikiem smaku, więc będzie syta szama! :) Przepraszam zaprzyjaźnionych wegan za porównanie, ale ta jakoś weszło ;-)

Więc pochylmy się nad tym daniem.

Pamiętacie? Zaczęło się od nagłówków typu „Psychodeliki skuteczniejsze od antydepresantów.” „Psilocybina zmienia życie po jednym podaniu.” „Rewolucja w psychiatrii.” Podawało się dalej na ślepo. Kto nie podał dalej i nie pomyślał no wreszcie? Ja przyznam, że byłem nie raz z fascynacji wstawiony.

Trzeba uczciwie powiedzieć, że te nagłówki nie brały się znikąd. Wczesne badania z psilocybiną, ayahuaską, LSD wyglądały naprawdę dobrze. Duże efekty, szybka poprawa, pacjenci opisujący doświadczenia, które zmieniały sposób, w jaki rozumieli siebie. Dla kogoś, kto pracuje z ludźmi z depresją to jest silna obietnica. Dla samych pacjentów to potencjalny przełom. Możliwość, że jedno głębokie doświadczenie psychodeliczne, osadzone w relacji terapeutycznej, może zrobić coś, czego miesiące farmakoterapii nie potrafią, jest intelektualnie i klinicznie pociągające ponad skalę, przyznajcie. Prawda? Trudno się nie ekscytować.

Tyle że ekscytacja to nie dane. To nie dowód.

W minionym tygodniu w JAMA Psychiatry ukazała się metaanaliza Williamsa, Barnett i Szigetiego (2026). Metaanaliza to rodzaj badania, które nie zbiera własnych danych, ale bierze wyniki wielu wcześniejszych badań i analizuje je łącznie. To statystyczne narzędzie, które pozwala zobaczyć wzorzec tam, gdzie pojedyncze badanie pokazuje tylko fragment. Z tego powodu metaanalizy stoją wysoko w hierarchii dowodów (danych naukowych). Dlatego media i influencerzy się na nie rzucają i dlatego warto je czytać uważnie. Siła metaanalizy zawsze zależy od jakości badań, które do niej weszły. Wchodzi bałagan, wychodzi elegancko zapakowany bałagan ;-) A jak było tym razem?

Tym razem to wyszła praca, do której będę wracał. (I jak się ładnie zrymowało!) Czytałem ją że trzy razy i nie mogłem do końca się z nią ułożyć. Ilekroć zaznałem spokoju, traciłem go gdzieś pomiędzy zachwytem nad elegancją statystyczną a nierównym rytmem przez ograniczenia, które autorzy potraktowali trochę po macoszemu. Myślę, że spokojnie mogę powiedzieć, że ta analiza to majstersztyk. Ale jak każdy majstersztyk… prowokuje pytania, na które sama nie odpowiada.

Uprzedzam od razu: to nie jest łatwa lektura. Dużo statystyki, dużo metodologii, dużo matematyki. Modelowanie bayesowskie, ROPE, konwersje skal, analizy wrażliwości. Trzeba się przez to przegryźć. Ale dopiero jak się przegryzie, widać, że to jest piękna nauka. Tak, nauka jest piękna również dzięki statystyce. Może zwłaszcza dzięki statystyce.

Koniec wstępu. Do rzeczy.

Skąd się wzięła „przewaga 5 punktów”

Żeby zrozumieć, dlaczego ta metaanaliza jest ważna, trzeba najpierw zrozumieć, co próbuje wyjaśnić. A żeby to zrozumieć, trzeba cofnąć się o krok i porozmawiać o tym, jak w ogóle mierzymy, czy lek na depresję działa.

W badaniach klinicznych standardowym narzędziem jest Skala Depresji Hamiltona (HAM-D), 17-pozycyjny kwestionariusz wypełniany przez klinicystę. Pacjent odpowiada na pytania o sen, apetyt, nastrój, lęk, poczucie winy, spowolnienie psychomotoryczne. Każda pozycja to kilka punktów, łącznie do 52. Im wyższy wynik, tym cięższa depresja.

I tu pojawia się pojęcie, które będzie wracać: minimalna klinicznie istotna różnica, w skrócie MCID (Minimal Clinically Important Difference). To próg, poniżej którego zmiana w wynikach istnieje w danych, ale pacjent jej nie czuje w swoim życiu. Grupa ekspertów NICE (Kendrick i Pilling, 2012) zaproponowała, że dla HAM-D ten próg wynosi 3 punkty. Trzy punkty. Żeby było jasne, co to oznacza w praktyce: wyobraźcie sobie dwie osoby z depresją. Jedna budzi się o trzeciej w nocy i nie może zasnąć do rana. Druga śpi kiepsko, ale przesypia noc. Na HAM-D ta różnica to może 2 punkty na jednej pozycji. Różnica 3 punktów na całej skali to jest mniej więcej granica, przy której pacjent zaczyna mówić „czuję, że coś się zmieniło”. Poniżej tej granicy zmiana jest statystyczna, nie ludzka.

I tu warto się na chwilę zatrzymać przy czymś, o czym rzadko się mówi wprost. Nauczyliśmy się rozmawiać o depresji przez pryzmat skal. Tyle a tyle punktów na HAM-D, tyle na BDI, tyle na PHQ-9. To jest użyteczne, bo daje nam wspólny język i porównywalność między badaniami. Ale depresja to nie jest wynik na skali. Depresja to jest budzenie się z uczuciem, że dzień nie ma sensu, zanim jeszcze się zaczął. To jest niezdolność do cieszenia się obecnością własnego dziecka. To jest cierpienie, które żaden kwestionariusz nie ogarnia w całości. Może kiedyś dojdziemy do metodologii, która potrafi to uchwycić lepiej. Na razie mamy to, co mamy, i musimy wiedzieć, jak to czytać.

Wracam do historii. Historyczne dane z badań nad depresją wyglądały następująco: klasyczne antydepresanty (SSRI, SNRI) w porównaniu z placebo dawały poprawę o około 2.4 punktu HAM-D. Dwa i cztery dziesiąte. Przy progu MCID wynoszącym 3 punkty. To jest standard, na którym od dekad opiera się farmakoterapia depresji. Niewiele, ale to jest to, co mamy.

Potem pojawiły się psychodeliki. Badania z psilocybiną, ayahuaską, LSD wykazywały poprawę o około 7.3 punktu HAM-D w porównaniu z placebo. Trzy razy więcej niż te 2.4 dla antydepresantów. Na papierze wyglądało to jak skok jakościowy. Nagłówki pisały się same, zanim jeszcze na świat przyszedł ChatGPT.

Różnica między tymi dwoma liczbami, między 2.4 a 7.3, wynosi około 5 punktów. Zachary Williams (badacz z Vanderbilt University, zajmujący się metanauką i metodologią badań klinicznych), Holly Barnett i Balázs Szigeti (neuronaukowiec z Imperial College London, znany z prac nad efektem placebo i funkcjonalnym odślepieniem w badaniach psychodelicznych) postanowili wyjaśnić, skąd ta 5-punktowa różnica się bierze. I znaleźli odpowiedź, która jest elegancka, ale nieprzyjemna.

Problem zaślepienia, czyli dlaczego porównanie jest trudne

Autorzy przeanalizowali 24 badania. 8 z terapią psychodeliczną (łącznie 249 pacjentów) i 16 z klasycznymi antydepresantami podawanymi bez zaślepienia (7921 pacjentów). I tu warto się na chwilę zatrzymać przy tych ośmiu badaniach. Bo pod etykietą „terapia psychodeliczna” kryją się bardzo różne rzeczy. Psilocybina, ayahuasca, LSD, 5-MeO-DMT. Każda z tych substancji ma inny profil farmakologiczny, inny czas działania, inny charakter doświadczenia. Do tego różnią się protokoły terapeutyczne. Różna bywa liczba sesji przygotowawczych, różne bywają dawki, inna obecność i rola terapeuty, inne metody integracji po sesji. Wrzucenie tego wszystkiego do jednego worka i porównanie z antydepresantami to uproszczenie, które trzeba mieć na uwadze, czytając wyniki. Metaanaliza widzi wzorzec, ale zaciera różnice.

Pytanie autorów było elegancko proste. Co się stanie, jeśli wyrównamy warunki zaślepienia, a raczej odślepienia? Jeśli w obu grupach pacjent wie, co dostaje?

Bo to jest sedno problemu. W standardowym badaniu klinicznym ani pacjent, ani badacz nie wiedzą, kto dostał lek, a kto placebo. Przynajmniej jest to o wiele, wiele trudniejsze by się “domyślić”. Escitalopram może nam zabijać w żołądku, ale świat nie stanie się bardziej kolorowy. Ta niemożność posiadania przekonania, co do zastosowanej substancji to “zaślepienie”. Dzięki niemu możemy oddzielić efekt substancji od efektu oczekiwań, od samej nadziei, że „to mi pomoże”. W badaniach z psychodelikami ten mechanizm nie działa. Po psilocybinie często nie trzeba się domyślać, w której grupie się jest. Doświadczenie jest tak charakterystyczne, że 90 do 95 procent uczestników poprawnie identyfikuje swoją grupę. Dla porównania, w badaniach z klasycznymi antydepresantami ten odsetek to około 60 procent. Nie mniej jednak zauważmy, że są osoby, które nie doświadczają efektu psychodelicznego nawet po pełnej dawce w badaniach oraz takie, które doświadczają tych efektów w grupie 1 mg substancji. Zaślepienie w badaniach klinicznych to nie techniczny drobiazg. To jest pytanie o to, ile z tego, co widzimy w wynikach badań, jest efektem farmakologii, a ile efektem bycia przekonanym, że dostałem coś przełomowego. Można to odślepienie minimalizować i są lepsze i gorsze badania pod tym względem, ale to na inny post.

Autorzy metaanalizy podeszli do tego sprytnie. Zamiast porównywać psychodeliki z placebo (gdzie zaślepienie jest trudne), porównali je z antydepresantami podawanymi otwarcie, bez zaślepienia. “Wyrównali warunki”. Porównali badania, w których w obu grupach pacjent wiedział, co bierze.

Wynik? Różnica na 17-punktowej Skali Depresji Hamiltona (HAM-D) między terapią psychodeliczną a otwartą terapią antydepresantami: 0.3 punktu. Na 52-punktowej skali. Przy p równym 0.73. Statystycznie i klinicznie: nic.

I moim zdaniem dobrze. Niech te dane schładzają entuzjazm. Nie dlatego, że psychodeliki nie działają. Działają, i to między innymi dobitnie pokazuje ta analiza. Powyższy wynik jest dowodem, że działają nie gorzej niż klasyczne leki przeciwdepresyjne. Ale entuzjazm bez pokrycia w danych prowadzi do szkód. Prowadzi do pacjentów, którzy rezygnują z leczenia, które działa, na rzecz leczenia, które obiecuje więcej, niż na razie potrafi udowodnić.

Dekonstrukcja matematyczna: skąd te 5 punktów?

Ale ta praca ma też swoją ciemną stronę, stronę, o której nagłówki nie mówią. I dopiero za trzecim razem do mnie dotarło!

Autorzy rozkładają tę 5-punktową przewagę na dwa składniki. I robią to w sposób, który jest jednocześnie fascynujący i przygnębiający.

Zanim opiszę te składniki, ważne zastrzeżenie: to nie jest tak, że autorzy wzięli kalkulator i „udowodnili” swoją tezę jednym równaniem. To jest interpretacja oparta na porównaniu wielkości efektów z różnych analiz w ramach ich modelu statystycznego. Matematyka się zgadza, ale jak każda interpretacja, opiera się na założeniach modelu. Siła tego argumentu polega na tym, że liczby pasują do siebie zbyt dobrze, żeby to był przypadek. Ale to jest argument za spójnością wyjaśnienia, nie dowód w sensie matematycznym.

Składnik 1: efekt oczekiwań (expectancy/blinding effect). Gdy pacjent wie, że bierze aktywny lek (podanie otwarte, tzw. open-label), poprawa jest o około 1.29 punktu HAM-D większa niż gdy tego nie wie (podanie zaślepione). To jest czysta siła świadomości: „biorę lek, który ma mi pomóc”. Ten efekt dotyczy obu grup, psychodelików i antydepresantów. W badaniach z psychodelikami jest jednak zawsze obecny (bo pacjent zawsze wie, co dostał), a w zaślepionych badaniach z antydepresantami częściowo ukryty.

Składnik 2: efekt nocebo, czyli „know-cebo”. I tu jest najciekawsze. Sam termin „know-cebo” to neologizm Szigetiego, podkreślający, że nie chodzi tu o klasyczny efekt nocebo (pogorszenie pod wpływem negatywnych oczekiwań wobec substancji), ale o coś specyficznego: pogorszenie wynikające z wiedzy, że nie dostało się substancji aktywnej.

Grupy placebo w badaniach psychodelicznych wypadają o około 4.0 punkty HAM-D gorzej niż grupy placebo w badaniach z antydepresantami. Nie dlatego, że placebo w badaniach z antydepresantami działa lepiej. Dlatego, że placebo w badaniach psychodelicznych aktywnie szkodzi.

Wyobraźcie sobie. Chorujesz od dłuższego czasu na ciężką depresję. Zapisujesz się do badania. Przez tygodnie przygotowujesz się na doświadczenie, które ma zmienić Twoje życie. Przychodzisz do pokoju z przygaszonym światłem, dostajesz tabletkę, zakładasz maskę na oczy, puszczają Ci muzykę. I po godzinie zdajesz sobie sprawę, że nic się nie dzieje. Nie dostałeś psilocybiny. Dostałeś nikotynamid¹. Rozczarowanie, które w tym momencie czujesz, nie jest neutralne. Ono pogłębia depresję.

Suma tych dwóch efektów: 1.29 + 4.0 = 5.29 punktu HAM-D. Co niemal idealnie odpowiada obserwowanej różnicy 4.9-5.0 punktu między psychodelikami a antydepresantami w tradycyjnych porównaniach. I to jest właśnie ta siła argumentu, o której pisałem wyżej. Że dwa niezależnie oszacowane efekty sumują się do liczby, która niemal co do punktu odpowiada obserwowanej różnicy, to nie jest przypadkowa zbieżność. To jest silna przesłanka za tym, że dekonstrukcja trafnie identyfikuje źródła tej przewagi. Nie dowód w sensie logicznym, ale coś, co trudno zignorować.

Innymi słowy: ponad 55% raportowanej przewagi psychodelików nad antydepresantami nie wynika z tego, że psychodeliki działają lepiej. Wynika z tego, że grupa placebo w badaniach psychodelicznych radzi sobie dramatycznie gorzej.

To nie psychodeliki wygrywają. To placebo przegrywa. I tak uważają autorzy, pisząc wprost, że obserwowana przewaga psychodelików w zaślepionych badaniach jest w dużej mierze artefaktem funkcjonalnego odślepienia.

¹ Nikotynamid (amid kwasu nikotynowego, forma witaminy B3) jest stosowany jako aktywne placebo w badaniach psychodelicznych, ponieważ wywołuje odczuwalne efekty somatyczne (np. zaczerwienienie skóry, uczucie ciepła), co ma utrudniać pacjentowi jednoznaczne rozpoznanie, czy otrzymał substancję aktywną. W praktyce to utrudnienie działa słabo, bo doświadczenie psychodeliczne jest jakościowo nieporównywalne z uderzeniem gorąca.

Analiza bayesowska: jak pewni możemy być?

Autorzy nie poprzestawali na klasycznej statystyce. A żeby zrozumieć, dlaczego to ważne, warto na chwilę zatrzymać się przy tym, czym właściwie różnią się te dwa podejścia.

Klasyczna statystyka (tzw. częstościowa, frequentist) odpowiada na pytanie: „Gdyby naprawdę nie było żadnej różnicy między psychodelikami a antydepresantami, jak prawdopodobne byłoby uzyskanie takich wyników, jakie uzyskaliśmy?” To jest wartość p. W tym przypadku p = 0.73, co oznacza, że takie wyniki byłyby bardzo prawdopodobne nawet gdyby różnicy nie było. Czyli: brak podstaw do odrzucenia hipotezy, że leczenia działają tak samo.

Ale statystyka bayesowska zadaje inne pytanie, bardziej intuicyjne: „Biorąc pod uwagę dane, które zebraliśmy, jakie jest prawdopodobieństwo, że psychodeliki są naprawdę lepsze?” To jest subtelna, ale fundamentalna różnica. Częstościowa mówi o danych przy założeniu hipotezy. Bayesowska mówi o hipotezie przy danych, które mamy. I to drugie jest bliższe temu, co chcemy wiedzieć.

Autorzy zdefiniowali minimalną klinicznie istotną różnicę (MCID) na poziomie 3 punktów HAM-D. Żeby to poczuć: 3 punkty na HAM-D to mniej więcej różnica między kimś, kto budzi się rano z poczuciem pustki, ale funkcjonuje, a kimś, kto nie potrafi wstać z łóżka. Albo między kimś, kto je z przymusu, a kimś, kto zaczyna odczuwać smak jedzenia. To nie jest wielka zmiana na papierze, ale pacjent ją czuje.

Wynik analizy bayesowskiej: szansa, że terapia psychodeliczna przewyższa klasyczne antydepresanty o co najmniej te 3 punkty HAM-D, wynosi 0.2%. Mówiąc prościej: gdybyśmy postawili 500 zakładów na to, że psychodeliki są klinicznie lepsze, wygralibyśmy mniej więcej jeden.

Z drugiej strony: 99.1% wyników analizy mieści się w tak zwanym ROPE (Region of Practical Equivalence), czyli obszarze ±3 punkty HAM-D, w którym uznajemy, że dwie interwencje są praktycznie równoważne. ROPE to taki pas bezpieczeństwa: jeśli prawie cały rozkład prawdopodobieństwa (to, co analiza bayesowska „widzi” jako możliwe wartości rzeczywistej różnicy) mieści się w tym pasie, to znaczy, że różnica, o ile w ogóle istnieje, jest tak mała, że pacjent jej nie poczuje.

To nie jest „nie znaleźliśmy różnicy”. To jest aktywne potwierdzenie, że różnicy nie ma. Cieszyć się czy płakać? Myślę, że jedno i drugie, zależnie od tego, czego się spodziewaliśmy.

Problem czasu: 3.4 vs 8.1 tygodnia

I tu dochodzimy do czegoś, co uważam za najpoważniejsze ograniczenie tej metaanalizy.

Ale najpierw wyjaśnienie: w badaniach klinicznych „punkt końcowy” (endpoint) to moment, w którym badacze mierzą efekt leczenia. To jest z góry ustalony termin, kiedy pytamy: czy pacjentowi jest lepiej? Pierwszy punkt końcowy (primary endpoint) to ten najważniejszy, ten, na którym opiera się główny wniosek badania.

Średni czas do oceny tego pierwszego punktu końcowego w badaniach psychodelicznych wynosił 3.4 tygodnia. W badaniach z antydepresantami: 8.1 tygodnia. To nie jest drobna różnica techniczna. To jest fundamentalna asymetria w tym, co właściwie mierzymy. To jest porównanie dwóch klatek z zupełnie różnych momentów filmu.

Antydepresanty z grupy SSRI potrzebują 4-6 tygodni, żeby osiągnąć pełne działanie farmakologiczne. Punkt pomiarowy w 8 tygodniu łapie je w momencie szczytowej skuteczności. Psychodeliki mierzone są po 3.4 tygodnia, nierzadko jeszcze w fazie, gdy efekt doświadczenia psychodelicznego dopiero się integruje.

Porównanie tych dwóch punktów końcowych to jak porównanie sprintera z maratończykiem na odcinku kilometra. Sprinter wygląda świetnie, ale nie wiemy jeszcze, kto dobiegnie do mety.

Autorzy wspominają o tej dysproporcji w sekcji ograniczeń. Przyznają, że ta różnica może wpływać na wyniki. Ale nie modelują jej statystycznie. Nie włączają czasu do punktu końcowego jako zmiennej w swoim modelu. Zostawiają to jako zastrzeżenie, nie jako element analizy.

A to jest istotne, bo metody pozwalające modelować trajektorie zmian (a nie tylko statyczne punkty pomiarowe z różnych momentów czasu) istnieją. Tak zwane IPD meta-analizy (Individual Participant Data meta-analyses) pozwalają na modelowanie krzywych zmian na poziomie poszczególnych uczestników, a nie zagregowanych wyników badań. Wymagają dostępu do surowych danych z każdego badania, co jest logistycznie trudne, ale metodologicznie możliwe. Nie wiemy, czy trajektorie zmiany u pacjentów leczonych psychodelikami i antydepresantami zmierzają w to samo miejsce, czy po prostu patrzymy na różne odcinki drogi. To jest kierunek, w którym ta dziedzina powinna pójść.

Badanie EPISODE: co mówi o mechanizmie?

Metaanaliza Williamsa, Barnett i Szigetiego mówi nam, że psychodeliki nie działają lepiej niż antydepresanty, gdy wyrównamy warunki. Ale nie mówi nam, co w psychodelikach właściwie działa. I właśnie dlatego warto spojrzeć na inne badanie, które ukazało się w tym samym numerze JAMA Psychiatry.

Badanie EPISODE (Mertens i in., 2026) to randomizowane badanie kliniczne: 144 osoby z depresją lekooporną, psilocybina 25 mg versus aktywne placebo (nikotynamid 100 mg), potrójne zaślepienie, dwa ośrodki w Niemczech. Pacjenci mogli otrzymać dwie dawki w odstępie 6 tygodni.

Główny wynik? Psilocybina nie osiągnęła istotności statystycznej na pierwszorzędowym punkcie końcowym, czyli na odpowiedzi na leczenie (response). Mówiąc prościej: odsetek pacjentów, u których objawy depresji zmniejszyły się o co najmniej 50%, nie różnił się istotnie między grupami.

Ale jest w tym badaniu coś innego, coś, co uważam za potencjalnie ważniejsze od głównego wyniku. Pacjenci, którzy raportowali tak zwane emotional breakthroughs, stany pogłębionej otwartości emocjonalnej, wglądu, poczucia przełomu wewnętrznego, mieli lepszą odpowiedź na leczenie. I te emotional breakthroughs były raportowane częściej w grupie otrzymującej wyższe dawki psilocybiny.

To mnie zatrzymuje. Jeśli efekt antydepresyjny koreluje nie tyle z dawką substancji, co z jakością doświadczenia emocjonalnego, to zaczynamy rozmawiać o czymś zupełnie innym niż „lek na depresję”. Zaczynamy rozmawiać o interwencji złożonej.

Czym jest interwencja złożona? Czy działa substancja, terapia, setting, nadzieja?

Terapia psychodeliczna to nie tabletka. To jest substancja plus tygodnie przygotowania terapeutycznego, plus obecność terapeuty (często dwóch) przez 6-8 godzin doświadczenia, plus sesje integracyjne po. To jest, jak argumentują Muthukumaraswamy i współpracownicy (2025), interwencja złożona (complex intervention), w której substancja, psychoterapia, setting i oczekiwania pacjenta są ze sobą splecione.

Paradygmat randomizowanego badania klinicznego został zaprojektowany do testowania izolowanego działania substancji. Oddzielasz lek od kontekstu, dajesz jednym lek a drugim placebo i patrzysz, co robi sam lek. W terapii psychodelicznej to oddzielenie jest strukturalnie niemożliwe. Nie dlatego, że badacze są niekompetentni. Dlatego, że sam obiekt badania jest nierozerwalny.

I tu trafiłem na coś, o czym warto wspomnieć, bo niewiele osób o tym wie. Istnieje narzędzie o nazwie PRECIS-2 (Pragmatic-Explanatory Continuum Indicator Summary), które mierzy, na ile dane badanie kliniczne jest „laboratoryjne” (explanatory, nastawione na wyjaśnienie mechanizmu w kontrolowanych warunkach) versus „kliniczne” (pragmatic, nastawione na sprawdzenie, jak leczenie działa w realnym świecie). Wynik PRECIS-2 dla badań z psychodelikami wynosi około 15-16, co lokuje je blisko bieguna wyjaśniającego, daleko od pragmatycznego. Badamy psychodeliki w warunkach, pokój z przygaszonym światłem, muzyka, dwóch terapeutów, wielogodzinna sesja, które mają niewiele wspólnego z tym, jak leczenie wyglądałoby w realnym gabinecie psychiatrycznym. To jest ciekawostka, ale też problem. Może warto o PRECIS-2 napisać oddzielny post?

Co mówią eksperci

James Rucker, psychiatra i starszy wykładowca w Institute of Psychiatry, Psychology & Neuroscience przy King’s College London, kierujący Psychoactive Trials Group i będący jednym z najbardziej doświadczonych badaczy klinicznych psychodelików w Europie, komentując oba artykuły dla Science Media Centre, powiedział coś, co warto zapamiętać. Że wyniki potwierdzają realny efekt antydepresyjny psychodelików, ale sugerują, że istotna część tego efektu jest mediowana przez pozytywne oczekiwania. I dodał perspektywę kliniczną, którą uważam za kluczową: w praktyce leki nie są podawane na ślepo, pacjent zawsze wie, co bierze. Więc porównanie z open-label jest bliższe temu, co dzieje się w gabinecie.

David Owens, emerytowany profesor psychiatrii klinicznej na University of Edinburgh, podkreślił, że oba artykuły dotykają centralnego problemu w ocenie psychodelików jako narzędzi terapeutycznych: problemu zaślepienia. Że dopóki nie rozwiążemy tego problemu, będziemy się kręcić w kółko z interpretacją wyników.

A w kontekście badania EPISODE inni komentatorzy zauważyli, że psilocybina, mimo nieosiągnięcia istotności na pierwszorzędowym punkcie końcowym, wykazała efekt antydepresyjny na wtórnych miarach i że druga dawka podawana po 6 tygodniach wydaje się wzmacniać ten efekt. Pytanie, czy to jest efekt farmakologiczny, czy efekt drugiego intensywnego doświadczenia terapeutycznego, pozostaje otwarte.

Alternatywne wyjaśnienia: czego ta metaanaliza nie rozstrzyga

Metaanaliza Szigetiego jest elegancka, ale nie wszechmocna. Poniżej moje pytania, te, które nie dają mi spokoju, a na które ta praca nie odpowiada.

Czy równoważność na HAM-D oznacza równoważność kliniczną? Skala Hamiltona mierzy objawy: bezsenność, utratę apetytu, spowolnienie psychomotoryczne. Nie mierzy sensu, relacji, zdolności do pracy, jakości życia. Badanie escitalopram versus psilocybina (Carhart-Harris i in.) wykazało, że przy identycznych wynikach na HAM-D, grupa psilocybinowa miała lepsze wyniki funkcjonalne po 6 miesiącach. Równość na HAM-D to nie to samo co równość w gabinecie.

Czy episodyczne podanie jest klinicznie lepsze od chronicznego? Jeśli jedno doświadczenie psychodeliczne daje taki sam spadek na HAM-D jak miesiące codziennego łykania SSRI, ale bez codziennych skutków ubocznych (stępienie emocjonalne, przyrost masy ciała, dysfunkcje seksualne), to ta równoważność wygląda zupełnie inaczej z perspektywy pacjenta. Równoważność statystyczna to nie równoważność doświadczenia.

Co z trajektorią w czasie? Problem 3.4 vs 8.1 tygodnia to nie tylko kwestia techniczna. To jest pytanie o to, czy psychodeliki osiągają swój pełny efekt szybciej i czy ten efekt utrzymuje się długoterminowo. Tego metaanaliza nie bada.

Co z terapią lekooporną? Autorzy przeprowadzili analizę wrażliwości wykluczając badania z depresją lekooporną (TRD) i wynik się nie zmienił. Ale to nie odpowiada na pytanie, czy dla pacjenta, który nie odpowiada na trzeci z kolei antydepresant, psychodeliki mogą być wartościową alternatywą nawet przy identycznej skuteczności populacyjnej. Dla tego pacjenta „nie gorsze” to może być „jedyne, co zostało”.

Gdzie to nas zostawia

Zanim ktoś powie „czyli psychodeliki nie działają”, zatrzymajmy się. Bo ta metaanaliza nie mówi, że nie działają. Mówi, że nie działają lepiej niż klasyczne antydepresanty, gdy wyrównamy jeden kluczowy czynnik, jakim jest wiedza osoby uczestniczącej w badaniu o tym, co bierze.

Ta metaanaliza jest ważna. Jest potrzebna. Robi dokładnie to, co powinna: chłodzi narrację, która wyprzedziła dane. Ale nie zamyka dyskusji. Otwiera ją.

I tu zaczyna się ciekawsza rozmowa. O tym, co tak naprawdę leczy… molekuła, doświadczenie emocjonalne, relacja terapeutyczna, nadzieja, czy to wszystko razem w proporcjach, których jeszcze nie rozumiemy.

Psychodeliki prawdopodobnie działają. Pytanie, co dokładnie w nich działa.

Będę o tym mówił na konferencji Nauka Psychodeliczna 2026 (13-14 czerwca, Uniwersytet Warszawski) w wykładzie „Niewidoczne zmienne: czego jeszcze o terapii psychodelicznej nie wiemy?”. Nacisk położę na perspektywę klinicznego zastosowania: co te dane oznaczają dla człowieka siedzącego naprzeciwko mnie w gabinecie, a nie tylko dla modelu statystycznego.

Jeśli temat Was interesuje, zapiszcie się: https://naukapsychodeliczna.org/etn/konferencja-nauka-psychodeliczna-2026/

Zaciekawione Szanowne Osoby? :))

Źródła

Kendrick, T. i Pilling, S. (2012). Common mental health disorders: Identification and pathways to care: NICE clinical guideline. British Journal of General Practice, 62(594), 47–49.

Mertens, L. J., Hinze, T., Gründer, G., Bröcker, A., Jungaberle, H., Böhringer, A., Kambeitz, J., Jessen, F. i Schmidt, S. (2026). Efficacy and safety of psilocybin in treatment-resistant major depression: The EPISODE randomized clinical trial. JAMA Psychiatry. https://doi.org/10.1001/jamapsychiatry.2025.4810

Muthukumaraswamy, S. D., Baggott, M. J., Schenberg, E. E., Decker, R. i Reckweg, J. T. (2025). Psychedelic-assisted therapy as a complex intervention: Implications for clinical trial design. Therapeutic Advances in Psychopharmacology, 15. https://doi.org/10.1177/20451253251381074

Williams, Z. J., Barnett, H. i Szigeti, B. (2026). Psychedelic therapy vs antidepressants for the treatment of depression under equal unblinding conditions: A systematic review and meta-analysis. JAMA Psychiatry. https://doi.org/10.1001/jamapsychiatry.2025.4809