Różnorodna dieta zapobiega rakowi... NOT!

7.9.2010 - 22 minut czytania - 4555 słów [Nauka]

Znowu komentarz do artykułu z “Gazety”, na szczęście chyba na portalu tylko – w papierowej wersji jeszcze go dzisiaj nie ma. Krótka notka o wynikach grupy naukowców skupionych wokół projektu EPIC – European Prospective Investigation into Cancer and Nutrition.

EPIC to rodzaj tzw. prospective study (niech mi ktoś powie, jak to jest po polsku!), w którym grupę osób poddaje się wieloletniej obserwacji. W przypadku EPIC chodziło o niemal pół miliona zdrowych osób i niemal dziesięć lat obserwacji diety. W ciągu tych kilku lat ponad półtora tysiąca badanych zachorowało na raka płuc.

Niedawno opublikowane badania (Büchner et al. 2010) pokazały, że jest związek między różnorodnością spożywanych warzyw i owoców, a ryzykiem zachorowania na raka. W pracy chodziło głównie o wyeliminowanie efektu ilości spożywanych warzyw, który ma wpływ na ryzyko zachorowania na raka (chociaż niezbyt wielki).

Inaczej jednak niż przedstawia to notka z GW, zmniejszenie ryzyka dotyczyło wyłącznie (a nie “głównie”) palaczy i to tylko ryzyka jednej, konkretnej odmiany raka – mianowicie raka płaskonabłonkowego płuca (squamous cell lung carcinoma; o tym w notce z GW wspomniano). Fakt, że jest to częsta odmiana raka (czy najczęstsza, o to można się spierać, ale na pewno mowa o przynajmniej 30% wszystkich przypadków raka płuc). Rzeczywiście, autorzy stwierdzili, że palacze spożywający regularnie urozmaiconą dietę złożoną z wielu różnych owoców i warzyw rzadziej zapadają na tego raka niż palacze, których dieta jest mniej różnorodna.

Wielkość efektu nie jest jednak zbyt duża – przyjmując ryzyko zachorowania na raka w grupie osób żywiących się najmniej różnorodnie za 1, względne ryzyko w grupie palaczy zmniejszało się o jakieś trzy procent wraz z wzrostem różnorodności warzyw / jarzyn o dwa produkty.

Co gorsza, 95% przedział ufności oszacowanego względnego ryzyka niemal zahacza o wartość jeden. Co to właściwie znaczy?

To, co cytowane badania mają nam oszacować, ich ostateczny, najbardziej interesujący wynik to jest tzw. hazard ratio – mniej więcej względny współczynnik ryzyka. Jeśli HR=0.87 w przypadku palaczy jedzących rozmaite owoce (grupa A) i w stosunku do palaczy jedzących zawsze tylko jedną grupę owoców (grupa B), to znaczy to, że przewidujemy, iż na każdych stu palaczy z grupy B którzy zachorowali na raka przypadnie średnio tylko 87 chorych na raka palaczy z grupy A. Zatem HR odzwierciedla nam stopień, w jaki jedzenie różnorodnej diety zmniejsza ryzyko raka. Jeśli HR=1, to żadnej różnicy między grupami nie ma.

Oczywiście, my tego ryzyka tak naprawdę nie znamy – usiłujemy oszacować je na podstawie pewnych badań, pewnej grupie osób, które były obserwowane. Tak więc istnieje jakiś “prawdziwy” związek między różnorodną dietą a ryzykiem raka, jakieś prawdziwe hr, które szacujemy na podstawie danych. Przedział ufności wyjaśnia, na ile ten szacunek jest wiarygodny.

Jak wspomniałem, nie wiemy, jaka jest prawdziwa wartość hr – szacujemy, że HR=0.87. Przedział ufności to taki zakres, np. 0.57-0.93, dla danego poziomu ufności – w tym wypadku, 95%. Oznacza to, że jeśli prawdziwa wartość hr leży poza zakresem przedziału ufności (czyli np. naprawdę hr = 1.0), to prawdopodobieństwo, że otrzymane wyniki będą takie, jakie są, jest mniejsze niż 5%. Innymi słowy: jeśli nie ma związku między różnorodną dietą a rakiem, a więc hr jest równe jeden, to gdybyśmy przeprowadzili dwadzieścia projektów EPIC na dwudziestu różnych grupach, to w jednym z tych projektów wyniki byłyby takie, jak w cytowanej wyżej pracy. Jest więc stosunkowo mało prawdopodobne, że tak naprawdę nie ma wpływu różnorodności diety na raka (u palaczy!).

Niestety, mam dwa problemy z wynikami Büchner i współpracowników. Pierwszy jest taki, że przedział ufności wyznacza nam pewne granice, w obrębie których możemy “poruszać” oszacowaną wartością HR. Czyli, że relatywne ryzyko może być równie dobrze 0.6, jak i 0.9, a więc efekt może być niewielki. Drugi problem jest nieco bardziej subtelny: czy poziom ufności 95% jest wystarczający? Prawdopodobnie przyjmując poziom ufności 99% (jak to się robi w wielu współczesnych pracach) autorzy nie zaobserwowaliby w ogóle żadnych statystycznie istotnych efektów. Sami autorzy mają zresztą podobne obiekcje, i przypominają jeszcze o jednej, ważnej sprawie: różnorodna dieta może mieć związek z określonym stylem życia – a więc obserwowane niższe ryzyko może wynikać z innych czynników niż sama dieta.

Podsumowując – nawet, jeśli dość słabe efekty zaobserwowane w zakrojonym na dużą skale projekcie są prawdziwe, to najprawdopodobniej są niewielkie i dotyczą konkretnej odmiany raka i palaczy. To oczywiście nie oznacza, że dieta złożona z wielu rodzaju owoców nie jest zdrowa i nie powinno się jej zalecać – ale oznacza, że przed rakiem płuc nie uchroni nas różnorodna dieta.

Powtarzając główną konkluzję autorów z ostatniego zdania pracy – najlepszym sposobem na zredukowanie ryzyka raka płuc ever jest rzucenie palenia.

Na podstawie:

Büchner FL, Bueno-de-Mesquita HB, Ros MM, Overvad K, Dahm CC, Hansen L, Tjønneland A, Clavel-Chapelon F, Boutron-Ruault MC, Touillaud M, Kaaks R, Rohrmann S, Boeing H, Nöthlings U, Trichopoulou A, Zylis D, Dilis V, Palli D, Sieri S, Vineis P, Tumino R, Panico S, Peeters PH, van Gils CH, Lund E, Gram IT, Braaten T, Sánchez MJ, Agudo A, Larrañaga N, Ardanaz E, Navarro C, Argüelles MV, Manjer J, Wirfält E, Hallmans G, Rasmuson T, Key TJ, Khaw KT, Wareham N, Slimani N, Vergnaud AC, Xun WW, Kiemeney LA, & Riboli E (2010). Variety in Fruit and Vegetable Consumption and the Risk of Lung Cancer in the European Prospective Investigation into Cancer and Nutrition. Cancer epidemiology, biomarkers & prevention : a publication of the American Association for Cancer Research, cosponsored by the American Society of Preventive Oncology PMID: 20807832

Komentarze

Komentarz: kwik, 2010-09-07 14:25:35:

Nie wiem, ale prospective study można chyba bez większej szkody spalszczyć na badanie prospektywne. Co do samej diety - a niby jak to można porządnie zbadać? Jak z takiego badania usunąć wszystkie czynniki zakłócające, przecież jedna rozsądna skłonność idzie zwykle w parze z innymi rozsądnymi skłonnościami. Może amatorzy warzyw są zarazem nieco chudsi, aktywniejsi fizycznie, weselski, nie dopalają do końca, słabiej się zaciągają, robią dłuższe przerwy między kolejnymi sztachami, palą słabsze fajki, z lepszymi filtrami?

Mnie po jedzeniu surówki z marchwi nigdy nie chciało się palić. Ale może ten sam efekt byłby gdybym marchew tylko żuł i wypluwał.

Komentarz: kwik, 2010-09-07 14:30:18:

Aha, na początek jako tzw. sanity check należałoby zobaczyć, czy wśród palaczy jest podobny odsetek amatorów warzyw co wśród niepalących. Jeśli jest ich mniej, to od razu dać sobie siana, bo potwierdza to moją wyssaną z palca tezę, że zdrowe skłonności chodzą parami.

Komentarz: ztrewq, 2010-09-07 14:42:56:

Wydaje mi się, że próbowali wykluczyć tego typu interakcje. Niestety, nie mam na to twardych dowodów, bo ich sformułowania nie są wystarczająco jasne. Z jednej strony podają listę najróżniejszych czynników takich jak BMI czy spożycie alkoholu, z drugiej strony explicité mowa jest tylko o korekcji względem całkowitego spożycia warzyw i owoców.

W “Dyskusji” autorzy piszą:

It should be kept in mind, however, that irrespective of adjustment for total quantity, individuals with a more varied fruit and vegetable consumption are in general also the individuals consuming more fruits and vegetables, and these individuals are probably also comparable for other lifestyle factors. Although we adjust for several of these factors, residual confounding cannot be ruled out.

Za wyjątkiem jednej grupy (z najwyższą różnorodnością jarzyn i owoców), proporcje palących są we wszystkich grupach bardzo podobne.

Komentarz: kwik, 2010-09-07 15:08:06:

No tak, ale czy w całej populacji jest podobny odsetek amatorów warzyw wśród palaczy i niepalących. Bo że do badania wybrali odpowiednie grupy to nie wątpię. Chyba muszę zajrzeć do źródła.

Komentarz: kwik, 2010-09-07 15:32:42:

Już mi się odchciało czytać, za trudne dla mnie te tabele. Po za tym grzyby są (to warzywa), ale oliwek i orzechów nie ma, jakieś to bardzo arbitralne: The eight subgroups of vegetables used were: leafy vegetables, fruiting vegetables, root vegetables, cabbages, mushrooms, grain and pod vegetables, onion and garlic, and stalk vegetables. (…) The consumption of vegetables did not include legumes, potatoes, and other tubers. The consumption of fruit included fresh, dried, and canned fruits but excluded nuts, seeds, and olives.

Natomiast u nich w tabeli (inaczej niż w wikipedii) najwięcej jest adenokarcynom czyli gruczolakoraków (542), SCC dużo mniej (329).

Komentarz: fan-terlika, 2010-09-07 19:59:06:

“najlepszym sposobem na zredukowanie ryzyka raka płuc ever jest rzucenie palenia”

Właśnie, a skąd legenda, że po rzuceniu ryzyko wzrasta, żeby dopiero potem opaść? Nawet chyba to nie była jakaś kompletna bzdura, tylko nie pamiętam już nawet skąd to było. Ktoś mógłby się odnieść?

Komentarz: bart, 2010-09-07 21:17:35:

Właśnie, a skąd legenda, że po rzuceniu ryzyko wzrasta, żeby dopiero potem opaść?

To chyba nie do końca legenda. Kiedyś coś udało mi się wyguglać:

http://blogdebart.pl/2009/07/03/pseudonauka-i-cycki/comment-page-1/#comment-48145

Czytając te dane, trzeba pamiętać, że rak płuc nie jest głównym zagrożeniem dla palaczy - przede wszystkim grożą im choroby serca i układu krążenia, których ryzyko spada gwałtownie po rzuceniu.

Komentarz: fan-terlika, 2010-09-07 21:36:21:

No właśnie nie tyle legenda, że bujda, tylko że opowieść, ale nie mogłem znaleźć słowa. Mem mi się nie podoba. A sam w tę opowieść właśnie wierzyłem i ją nawet rozpowszechniałem jako anegdotkę (teraz już wiem dlaczego, skoro to było w komciach pseudonauki i cycków), ale jak teraz chciałem to zweryfikować, to nie znalazłem żadnego potwierdzenia.

Komentarz: ztrewq, 2010-09-07 21:53:01:

Głównym efektem jest jednak chyba quitting ill. Spora część osób rzuca palenie albo już po diagnozie raka, albo w wyniku objawów stanowiących preludium dla diagnozy: Knoke et al. 2009 twierdzą, że to utrudnia dokładne obliczenia redukcji ryzyka po rzuceniu palenia.

Rzecz ciekawa, referencje, które podaje artykuł Lange et al. z “Medical Hypotheses”, który cytujesz, wspominają o tym efekcie – natomiast nie wspominają o nim Lange et al.

Komentarz: ztrewq, 2010-09-07 22:20:11:

W sumie materiał na mini-notkę, z dyskusją artykułu z “Medical Hypothesis”. Do mnie najbardziej przemawia wyjaśnienie oparte na efekcie quitting ill. Tym bardziej, że mniej więcej w połowie artykułów na ten temat efekt nie został zaobserwowany (np. tu).

Nie jestem jednak pewien, do jakiego stopnia “quitting-ill effect” jest naprawdę zbadany, a do jakiego jest tylko wygodnym wyjaśnieniem – czyli także niesprawdzoną hipotezą. Nie udało mi się znaleźć danych na temat badań prospektywnych (brzmi nieźle), w których brano by pod uwagę przyczyny rzucania palenia i stan zdrowotny palacza w momencie rzucania.

Aha, no i o jednym też nie należy zapominać: tak czy siak na pewno nie można oczekiwać natychmiastowej redukcji ryzyka, bo każdy rak potrzebuje czasu, żeby się rozwinąć. Palenie nie powoduje śmierci na raka; powoduje raka. Dopiero mniej więcej po pięciu latach ryzyko jest znacznie mniejsze; do poziomu niepalących ryzyko zbliża się po parudziesięciu latach.

Komentarz: bart, 2010-09-08 08:28:09:

No ale dlaczego w takim razie quitting ill nie zakłamuje spadku zachorowań na serce?

Nie rozumiem też, dlaczego bierze się pod uwagę osoby, które rzuciły palenie po diagnozie - przecież wtedy trafiają do kategorii tych, u których rak płuc wystąpił w czasie pozostawania w nałogu. Czyli niby są quitting ill, ale nie wpływają na zakłamanie wyników.

Tak czy owak, można wyguglać badania, które faktycznie nie zauważają wzrostu ryzyka zachorowania na raka po rzuceniu palenia.

Komentarz: ztrewq, 2010-09-08 09:43:20:

Widziałem, że omawiano te problemy w niektórych czasopismach. Chyba chodzi po prostu o to, że rak dłużej może być niezauważony niż choroba wieńcowa.

A dlaczego się bierze ludzi ze zdiagnozowanym rakiem? Nie mam bladego pojęcia.

Z tymi badaniami, które nie zauważają efektu quitting ill też może być różnie, bo niektóre po prostu nie biorą pod uwagę najwcześniejszych danych.

Komentarz: Ija_Ijewna, 2010-09-08 10:44:40:

A nie badania podłużne aby?

Komentarz: ztrewq, 2010-09-08 11:08:47:

Nie, podłużne to “longitudinal study”, w których pod lupę – przez wiele lat – bierze się poszczególne jednostki. W badaniach typu prospective cohort study bierze się jakąś hipotezę i bardzo dużą grupę ludzi, i przez jakiś czas zbiera statystykę na temat tej grupy.

Różnica jest subtelna – bo może być i to, i to (longitudinal prospective study). Tylko, że wynikiem studiów podłużnych typowo jest seria czasowa, natomiast wynikiem badań prospektywnych – już niekoniecznie, bo to może być jedna statystyka za cały okres badań. Ach, no i oczywiście – badania podłużne mogą też być retrospektywne.

Natomiast istotą badań prospektywnych jest sformułowanie problemu już na starcie (w tym wypadku – czy jedzenie warzyw i owoców zmniejsza ryzyko zachorowania na raka płuc?), gdy tymczasem informacje zbierane w badaniach podłużnych mogą polegać w całości na zbieraniu jakichkolwiek danych.

Przyznaję, że terminy trochę na siebie zachodzą, i są w literaturze czasem stosowane wymiennie.

Komentarz: doskonaleszare, 2010-09-08 12:58:13:

January, mam pytanie odnośnie tego stwierdzenia

“[J]eśli prawdziwa wartość […] leży poza zakresem przedziału ufności […] to prawdopodobieństwo, że otrzymane wyniki będą takie, jakie są, jest mniejsze niż 5%.”

Nie rozumiem, co u Ciebie oznacza “wyniki będą takie, jakie są”? Wyniki są przecież tą samą próbą, której użyliśmy do wyliczenia przedziałów ufności, więc jeśli prawdziwa wartość leży poza zakresem przedziału ufności z prawdopodobieństwem 1, to wyniki są jakie są też z prawdopodobieństwem 1.

Przyznam że wydawało mi się że rozumiem jak interpretować przedziały ufności, ale teraz przejrzałem kilka podręczników i nie jestem już tego taki pewien - wszyscy poza bayezjanami jak ognia unikają przypisywania prawdopodobieństw w innym kontekście niż konstrukcja całego (nieskończonego) zbioru CI.

Komentarz: ztrewq, 2010-09-09 08:10:39:

Nie rozumiem, co u Ciebie oznacza „wyniki będą takie, jakie są”?

Tzn. przy powtarzaniu tego samego eksperymentu (dla danego hr), to niezależnie od tego, jakie to hr rzeczywiście jest, w 95% powtórzeń policzony na podstawie próbki losowej przedział ufności będzie je zawierał.

Chciałem uniknąć błędnego skojarzenia, że dla danej próbki losowej i dla danego przedziału ufności 95% opisuje prawdopodobieństwo, że hr jest w tym przedziale. Jak słusznie zauważasz, w konkretnym przypadku albo prawdziwe hr leży w przedziale, albo nie leży. Co innego, jeśli rozważamy ogólne prawidłowości tworzenia przedziałów ufności.

Rozważmy taką grę: biorę do ręki rewolwer sześciostrzałowy, w którym jest jedna kula. Pokręcam go bębenkiem i przykładam go do skroni. Prawdopodobieństwo, że naciskając spust się zastrzelę, wynosi $latex \frac{1}{6}$.

Naciskam spust. Strzał nie pada. Nie mogę powiedzieć, że zabiłem się z prawdopodobieństwem $latex \frac{1}{6}$, nespa? Bo się nie zabiłem. Natomiast strzelając wielokrotnie (um, i uzupełniając kule po każdym strzale), średnio raz na sześć razy padnie strzał.

Lepsza metafora: na bruku leży moneta. Jesteśmy oryginalni i zamiast rzucać monetą w statystycznym eksperymencie myślowym, rzucamy kapeluszem, który symbolizuje nasz przedział ufności. Rzut kapeluszem symbolizuje zebranie próbki losowej i policzenie przedziału ufności. Przedział ufności 95% to kapelusz tej wielkości, że w 95 razach na 100 moneta po naszym rzucie znajdzie się pod kapeluszem. (Skąd wiemy, jaki duży ma być kapelusz? Powiedzmy, że dostaliśmy wzór na wielkość kapelusza od Kapelusznika, który jest mądry i ma rozum.) Niestety, możemy rzucić kapeluszem tylko raz. Moneta po rzucie albo znajdzie się pod kapeluszem, albo nie; ale nie ma sensu mówić, że prawdopodobieństwo, że moneta jest pod kapeluszem, wynosi 0.95; albo jest, albo nie jest, nawet, jeśli mamy oczy zamknięte.

Teraz będzie trochę zabawy, bo niedawno odkryłem jak się używa $latex \LaTeX$-a na blogach Wordpress :-)

Stosunkowo najprościej rozważyć CI na przykładzie zmiennej losowej o rozkładzie normalnym. Losujemy ileś tam (powiedzmy: N) obserwacji z populacji o rzeczywistym rozkładzie (μ, σ). Nasza próbka losowa to $latex { x_1 … x_N}$, ze średnią $latex \overline{X} = \frac{\sum_{i=1}^N x_i}{N}$. Gdy losujemy próbkę losową o wielkości N, to 95% wartości $latex x_i$ w próbce będzie leżało w przedziale $latex (\mu -1.96 \sigma_X, \mu +1.96 \sigma_X)$ – z własności rozkładu normalnego.

Natomiast 95% policzonych średnich wartości $latex \overline{X}$ będzie leżało w przedziale $latex (\mu -1.96 \sigma_X, \mu +1.96 \sigma_X)$, gdzie $latex \sigma_X$ to odchylenie standardowe średniej, a więc $latex \sigma / \sqrt{N}$. Możemy to zapisać tak:

$latex P{ \mu - 1.96 \sigma_X \le \overline{X} \le \mu + 1.96 \sigma_X } = 0.95$

No dobrze, ale możemy nierówności w powyższym równaniu zapisać inaczej:

$latex P{ \overline{X} - 1.96 \sigma_X \le \mu \le \overline{X} + 1.96 \sigma_X } = 0.95$

Czyli: prawdopodobieństwo, że próbka losowa da nam taką wartość $latex \overline{X}$, że powyższa nierówność będzie spełniona wynosi 0.95, a więc jest to prawdopodobieństwo, że $latex \mu$ będzie leżało w przedziale ufności. To tylko pozornie stoi w sprzeczności z tym, co napisałem poprzednio, bo $latex \mu$ nie jest zmienną losową, jest konkretną, niezmienną wartością; to, co się zmienia (z eksperymentu na eksperyment), to $latex \overline{X}$, i prawdopodobieństwa dotyczą właśnie tego $latex \overline{X}$.

Oczywiście, pozostaje nam jeszcze drobny “strzegół”: nie znamy prawdziwych wartości $latex \mu$ ani $latex \sigma$. Żeby sobie z tym poradzić, trzeba jeszcze zaprząc do roboty studenta, ale nie będziemy tego robić, bo studenci, tak jak postdokowie, mają już i tak dosyć pracy.

Komentarz: kwik, 2010-09-09 09:52:09:

A to każdy może się LaTeX-ować w komentarzach czy tylko gospodarz bloga? Zaraz zobaczę: $latex \frac{1}{7}$

Komentarz: ztrewq, 2010-09-09 09:58:58:

No proszę, działa :-)))

Komentarz: doskonaleszare, 2010-09-09 11:12:53:

“Tzn. przy powtarzaniu tego samego eksperymentu (dla danego hr), to niezależnie od tego, jakie to hr rzeczywiście jest, w 95% powtórzeń policzony na podstawie próbki losowej przedział ufności będzie je zawierał.”

No właśnie, zmyliło mnie sformułowanie “jeśli prawdziwa wartość”, przez co wydawało mi się że mówiłeś o jakimś prawdopodobieństwie warunkowym (w rodzaju: P(O|H_0)) i nie mogłem zrozumieć, o jakim (poza trywialnym sensem: policzmy te przedziały ufności, dla których prawdziwa wartość jest poza ich granicami).

“Co innego, jeśli rozważamy ogólne prawidłowości tworzenia przedziałów ufności.”

Ok, i to jest to o czym pisałem wyżej - prawdopodobieństwo odnosi się do procesu konstrukcji CI z nieskończoną ilością replikacji.

“Przedział ufności 95% to kapelusz tej wielkości, że w 95 razach na 100 moneta po naszym rzucie znajdzie się pod kapeluszem. (Skąd wiemy, jaki duży ma być kapelusz? Powiedzmy, że dostaliśmy wzór na wielkość kapelusza od Kapelusznika, który jest mądry i ma rozum.)”

Dodajmy, że wielkość kapelusza nie jest stała, bo kapelusznik nie jest aż taki mądry, by nie musiał estymować jego wielkości…

“Teraz będzie trochę zabawy, bo niedawno odkryłem jak się używa \LaTeX-a na blogach WordPress :-)”

To jeden z powodów, dla których rozważam od dłuższego czasu przesiadkę na wordpressa. Nawet założyłem placeholdera dawno dawno temu…

“Żeby sobie z tym poradzić, trzeba jeszcze zaprząc do roboty studenta”

Tak czy owak jakiś student musi się napracować - dzięki czemu albo mamy dużą próbę i możemy używać rozkładu normalnego, albo próba jest mała więc sięgamy po t-studenta…

Komentarz: ztrewq, 2010-09-09 11:58:54:

Tak czy owak jakiś student musi się napracować – dzięki czemu albo mamy dużą próbę i możemy używać rozkładu normalnego, albo próba jest mała więc sięgamy po t-studenta…

:-) Nie do wiary, jak rozciągliwe potrafią być niektóre aluzje.

Komentarz: telemach, 2010-09-09 18:48:10:

Będzie może od czapy, ale nie mogę się powstrzymać bo sprawa nie daje mi spokoju. Przed (wielu) laty, jako młody doktorant, korzystając z uprzejmości szefa kliniki (połączonej z przychodnią) , zbierałem sobie dane dotyczące grupy pacjentów. Był to rodzaj rozszerzonej anamnezy - formularz sam opracowałem. Krótko (bo nudne): chodziło o epidemiologię zapalenia wątroby zwanego wówczas jeszcze nonA, nonB, a obecnie C. A konkretnie o uchwycenie momentu infekcji, analizę dróg zakażeń, ocenę ryzyka w różnych grupach zawodowych, wiekowych itepe.(Wiem, wiem, to wszystko jest w podręcznikach, ale wtedy nie było) Poliklinika była centralnym miejscemm, przez które przewijali się wszyscy pacjenci chorzy na WZW C jednego niemieckiego landu. Zajęcie było nudne. Dla jaj włączyłem do ankiety pytanie o “wysokość zamieszkania”. Ku swojemu osłupieniu musiałem stwierdzić, że ponad 70% “przepytanej” przeze mnie wielkomiejskiej populacji chorych na hepatitis C zamieszkuje na parterze lub pierwszym piętrze. Z nikim nie podzieliłem się wynikami mojego żartu. Nigdy nie odważyłem się tego dokończyć, a co dopiero opublikować. Co było tym łatwiejsze, że nie dokończywszy zaczętej pracy porzuciłem mozół i przerzuciłem się na tzw. autoimmune hepatitis, schorzenie tak interesujące, jak niebywale rzadkie.

Komentarz: ztrewq, 2010-09-09 21:51:15:

Hm, strasznie ciekawe, ale bez kompletnych danych – nic się nie da chyba nawet wymyślić. Bo przecież po pierwsze, więcej ludzi mieszka na pierwszym piętrze niż parterze niż na jakimkolwiek innym; proporcja ludzi mieszkających na I p. lub parterze może być więc nawet w dużym mieście dość znaczna.

Po drugie, może być związek między położeniem mieszkania a wiekiem pacjenta (np. ludzie starsi w Niemczech rzadziej chyba mieszkają na poddaszach). A wiek ma wpływ nie tylko na szansę infekcji, to na pewno na dotkliwość objawów, jak twierdzi pan Szybki Gugiel. Jest dość prac o epidemiologii HCV, żeby ukuć kilka hipotez ad hoc. Ale wszystkie będą pewnie zależeć od tego, jak wyglądała struktura społeczności w której przeprowadzałeś badania.

Skoro doktoryzowałeś się z żółtaczki zakaźnej, w Niemczech, i pewnie wtedy, kiedy myślę, to czy mówi Ci coś nazwisko Heinza Schallera, badacza HBV?

Komentarz: telemach, 2010-09-10 09:01:07:

Nazwisko mówi. Chociaż osobiście nie miałem przyjemności. I już, z wiadomych przyczyn, nie będę. BTW: autoimmune hepatitis nie jest schorzeniem zakaźnym. Przynajmniej nie jest jako takie uznawane. Do dzisiaj nie wiadomo jak i z czym to jeść. Tzn. patogenetycznie nie wiadomo. W przeciwieństwie do HBV i HCV mało się tutaj w ostatnich 20 latach ruszyło.

Komentarz: ztrewq, 2010-09-10 09:05:39:

Ja miałem; pracowałem w sąsiednim labie. Bardzo fajny gość, niezwykle przyjazny i pomocny. Mam jedną jego książkę, której nigdy nie oddałem. Sporo anegdot.

Wiem, że AIH nie jest zakaźne – ale jeśli dobrze zrozumiałem, to zaczynałeś od HCV.

Komentarz: telemach, 2010-09-10 09:08:55:

Acha, dygresja z komentarza nr. 21 nie była przypadkowa. Po prostu była to dla mnie lekcja pokory jeśli chodzi o “statistische Auswertung des Unerwarteten”. Przeważnie szukamy korelacji chcianych i wyobrażalnych. I takie też znajdujemy. Pewne związki eliminujemy jako absurdalne i nieracjonalne “a priori” (nie wpadniemy np. na pomysł aby szukać związku pomiędzy kolorem włosów, stanem uzębienia i częstością zapadania na choroby weneryczne). Dokonując tej eliminacji pozbawiamy się wglądu w rzeczywistość, która nie jest naszą konstrukcją. Pies się gryzie.

Komentarz: telemach, 2010-09-10 09:12:20:

“Wiem, że AIH nie jest zakaźne — ale jeśli dobrze zrozumiałem, to zaczynałeś od HCV.” Zgadza się. A skończyłem na PBC (primary biliary cirrhosis) - jeszcze jedna choroba, z którą do dzisiaj (zupełnie) nie bardzo wiadomo co począć.

Komentarz: ztrewq, 2010-09-10 09:33:41:

No to będzie dygresja o psie.

W ramach kursu statystyki u prof. Łomnickiego trzeba było wykonywać całe mnóstwo czasochłonnych zadań. M.in. do nauki testu $latex \chi^2$ należało wymyślić sobie jakieś badania.

Wymyśliłem sobie ankietę badającą związek między średnią z ocen studentów (mierzoną odpowiedzią na pytanie “czy dostajesz stypendium naukowe?”) a kilkoma zupełnie odczapiastymi kategoriami. Jedną z kategorii było “czy masz psa?”.

I właśnie ta kategoria dała mi najistotniejszy statystycznie związek. Ludzie, którzy mieli własnego psa, częściej otrzymywali stypendium naukowe. Teraz proszę p.t. czytelników o wyobrażenie sobie dwóch rzeczy: (a) jakiego typu spekulacje przemykały mi przez głowę, oraz (b) jak wyglądałby tytuł doniesienia prasowego na temat takich wyników (tu wracamy do punktu wyjścia tej notki).

A morał z tego (i Twojej, Telemachu, historii) może być również i taki, że z agrestu poddanego torturom, niejedno można wycisnąć. Jeśli bada się odpowiednio dużą liczbę zmiennych, to któraś zawsze będzie istotna, jeśli nie przez przypadek, to drogą bardzo odległych związków przyczynowo-skutkowych albo niekontrolowanych błędów systematycznych.

Co zaś do odrzucania nieracjonalnego a priori – jest też druga strona medalu, gdzie bada się na oślep wszystko, co tylko człowiekowi przychodzi do głowy, bez planu, ładu, składu i hipotezy. Im więcej, tym lepiej. Zróbmy sto mikromacierzy, do tego zsekwencjonujmy dziesięć genomów, przeliczmy dwieście żeli 2D, zbierzmy dane o trzydziestu cytokinach i pięciuset związkach chemicznych. COŚ znajdziemy.

Komentarz: telemach, 2010-09-10 13:22:27:

“Co zaś do odrzucania nieracjonalnego a priori — jest też druga strona medalu, gdzie bada się na oślep wszystko(…)”

No, wszystkiego się nie da. Na szczęście. A tak wewogle: Gdyby tylko istniały proste, łatwe i ogólnie zrozumiałe kryteria pozwalające na aprioryczne odróżnianie racjonalnego od nieracjonalnego - to w zasadzie nic nie trzeba by badać, wystarczyłoby potwierdzać. Ponieważ jednak takich kryteriów nie ma, wykluczanie z góry “irracjonalnego” bo tak nam się wydaje, skazuje nas na dreptanie w miejscu. Jakość uzyskiwanych odpowiedzi pozostaje w ścisłym związku z jakością i nieortodoksyjnością zadawanych pytań. To wynika z przeszłości. Tak, że wcale to wszystko nie jest (obawiam się) takie proste i jednoznaczne jak bym (ja też) chciał.

Komentarz: telemach, 2010-09-10 13:29:14:

“Jeśli bada się odpowiednio dużą liczbę zmiennych, to któraś zawsze będzie istotna, jeśli nie przez przypadek, to drogą bardzo odległych związków przyczynowo-skutkowych albo niekontrolowanych błędów systematycznych.”

Ale czy (przez odwrócenie) nie oznacza to nakazu ostrożności w interpretowaniu (być może pozornie) jednoznacznych i statystycznie istotnych wyników? Niekontrolowane błędy systematyczne mogą się przecież pojawić również w przypadku zależności i związków zrozumiałych, zgodnych z naszymi uprzedzeniami i dlatego oczekiwanych.

Komentarz: malapucyusz, 2010-09-10 14:12:07:

“Z agrestu, poddanego torturom, niejedno można wyciągnąć”. Ostatni wariant uznał profesor Grypianus za klucz do szyfru i po trzystu tysiącach prób odkrył, że gdy doda się do siebie wszystkie litery listu, potem odejmie od nich paralaksę słońca i roczną produkcję parasoli, a z reszty wyciągnie się trzeci pierwiastek, to wychodzi z tego jedno słowo: “Krucafiks”. W książce adresowej znaleziono obywatela nazwiskiem Krucafuks. Grypianus uznał, że błąd wprowadzono rozmyślnie dla zatarcia śladów, i Krucafuksa aresztowano.

Tyle Lem. Dodam jeszcze sztandarowy przykład z kursu statystyki na uczelniach medycznych - badanie korelacji zachorowalności na raka płuc z występowaniem żółtych plam na dłoniach (kiedyś palacze takie mieli). Oczywiście badania wykażą statystycznie istotny związek, i to na poziomie istotności, który zadowoli nawet ztrewq`a. Ale czy żółte plamy po farbkach w szkole będą przyczyną raka płuc? Myjąc dłonie zapobiegasz rakowi płuc?

Kiedyś próbowałem swych sił w interpretacji badań przy pomocy regresji wielorakiej (wieloczynnikowej), to czasami jest wyjście.

Komentarz: Leczenie hormonami płciowymi a ryzyko raka piersi | Globalny Śmietnik, 2010-09-12 19:05:47:

[…] lubi podręczników a kocha Internet – warto przyjrzeć się tłumaczeniom Januarego na blogu Biokompost. 95% przedział ufności oznacza, iż jeżeli rzeczywisty wynik znajduje się poza obliczonym […]

Komentarz: ztrewq, 2010-09-13 08:20:00:

Ponieważ jednak takich kryteriów nie ma, wykluczanie z góry „irracjonalnego” bo tak nam się wydaje, skazuje nas na dreptanie w miejscu.

Um, nie do końca – wydaje mi się, że skazuje nas na stawianie drobnych kroków, ale niekoniecznie w miejscu.

Jakość uzyskiwanych odpowiedzi pozostaje w ścisłym związku z jakością i nieortodoksyjnością zadawanych pytań.

Ale ja nie o tym. Piszę o zagubieniu, które wynika nie z nieortodoksyjności pytań, ale z ich nadmiaru, nadmiaru jakichkolwiek pytań.

Komentarz: ztrewq, 2010-09-13 08:22:59:

Ale czy (przez odwrócenie) nie oznacza to nakazu ostrożności w interpretowaniu (być może pozornie) jednoznacznych i statystycznie istotnych wyników?

Oczywiście! Ale też i nie zapominając o brzytwie Ockhama.

Komentarz: ztrewq, 2010-09-13 08:46:31:

Tyle Lem. Dodam jeszcze sztandarowy przykład z kursu statystyki na uczelniach medycznych – badanie korelacji zachorowalności na raka płuc z występowaniem żółtych plam na dłoniach (kiedyś palacze takie mieli). Oczywiście badania wykażą statystycznie istotny związek, i to na poziomie istotności, który zadowoli nawet ztrewq`a. Ale czy żółte plamy po farbkach w szkole będą przyczyną raka płuc? Myjąc dłonie zapobiegasz rakowi płuc?

No ale to jest jedna z anegdot mających na celu wytłumaczenie różnicy między korelacją a związkiem przyczynowo-skutkowym. Jeszcze bardziej znana jest przecież anegdota o korelacji między liczbą urodzin dzieci a występowaniem bocianów.

Kiedyś próbowałem swych sił w interpretacji badań przy pomocy regresji wielorakiej (wieloczynnikowej), to czasami jest wyjście.

W regresji wychodzisz z założenia o istnieniu zmiennej bądź zmiennych zależnych i niezależnych, a więc zakładasz istnienie związku przyczynowo-skutkowego jeszcze zanim wklepiesz pierwszy model do komputera.

Żeby przejść od korelacji do związku przyczynowo-skutkowego, postulujesz pewien model, proponujesz hipotezę: jak to niby ma działać. Stąd możesz przejść do konkretnych, zaplanowanych działań: badań podłużnych, testowania elementów Twojego modelu przez zaplanowane eksperymenty (manipulacje jedną zmienną) itd.

Komentarz: Blog » Blog Archive » Leczenie hormonami płciowymi a ryzyko raka piersi, 2013-01-29 07:28:47:

Komentarz: Medycyna, Ochrona Zdrowia, Globalny Śmietnik » » Leczenie hormonami płciowymi a ryzyko raka piersi, 2013-02-08 20:52:55:

Komentarz: Помогает ли витамин D в профилактике многих заболеваний?, 2017-05-20 07:48:54:

[…] я позволю себе напомнить анекдотическую дискуссию о первом этаже, втором этаже и собаке*. Стоит обратить внимание также на слова Януария в […]

Original post