Kolider

Ilustracja przedstawia graf zawierający przyczynę, skutek, mediator, zmienną zakłócającą i collider.
Przykład grafu systemu przyczynowego, w którym badanemu związkowi przyczyny X {\displaystyle X} ze skutkiem Y {\displaystyle Y} towarzyszy mediator M , {\displaystyle M,} zmienna zakłócająca Z {\displaystyle Z} i kolider K . {\displaystyle K.} Typowy problem pominiętej zmiennej polega na nieuwzględnieniu w modelu czynników typu Z . {\displaystyle Z.} Dla kontrastu, statystyczne kontrolowanie zmiennych typu M {\displaystyle M} i K {\displaystyle K} jest generalnie także niepożądane, i również zwiększa błąd oszacowania.

Kolider, zderzacz[1] (ang. collider)[a]– we wnioskowaniu przyczynowym i statystyce, zewnętrzna zmienna, która w modelu badanego zjawiska podlega wpływowi przyczynowemu (jest skutkiem) zmiennej objaśniającej; może być dodatkowo również skutkiem zmiennej objaśnianej[1][2].

Pomimo iż kolider jest skorelowany ze zmiennymi, które są centralnym przedmiotem badania, nie jest przyczyną żadnej z nich i nie wpływa na ich wzajemne bezwarunkowe prawdopodobieństwo. Nieuwzględnienie go w modelu statystycznym nie prowadzi do problemu pominiętych zmiennych i nie zniekształca generowanych oszacowań[3].

Do błędu prowadzi właśnie samo eksperymentalne lub statystyczne kontrolowanie koliderów – czego najprostszym przykładem jest błąd selekcji i paradoks Berksona, w których grupa eksperymentalna i porównawcza są dobierane warunkowo względem wartości zewnętrznego czynnika który jest sam w sobie skutkiem badanego zjawiska. Sztucznie wprowadzone warunkowe prawdopodobieństwo odzwierciedla się w zawyżonych estymacjach.

W oryginalnym przypadku opisanym przez Berksona, analiza roli cukrzycy w rozwoju zapalenia pęcherzyka żółciowego wykonana w nieprzemyślany sposób jedynie w populacji osób hospitalizowanych prowadziła do błędnej konkluzji, że pierwsze zaburzenie jest czynnikiem ryzyka w rozwoju drugiego. W rzeczywistości obie choroby z osobna wpływają na prawdopodobieństwo hospitalizacji, więc u samych osób hospitalizowanych warunkowe prawdopodobieństwo obu razem jest zawyżone. Pozorna korelacja występuje jednak tylko w tak ograniczonej próbie, i nie przekłada się na występowanie takiej zależności w całej populacji, oraz na istnienie jakiegokolwiek realnego mechanizmu przyczynowego[4].

Zobacz też

Uwagi

  1. Pojęcie collider jest na ten moment bardzo rzadko tłumaczone na język polski. Tu użyty przekład „kolider” występuje np. u Kawalca (2006, op.cit.). Alternatywne tłumaczenie „zderzacz” pojawiło się w polskim tłumaczeniu książki Pearla (tłum. T. Chawziuk, 2021, op.cit.).

Przypisy

  1. a b JudeaJ. Pearl JudeaJ., DanaD. Mackenzie DanaD., Przyczyny i skutki. Rewolucyjna nauka wnioskowania przyczynowego, TadeuszT. Chawziuk (tłum.), Copernicus Center Press, 2021, ISBN 978-83-7886-592-6  (pol.).
  2. PawełP. Kawalec PawełP., Przyczyna i wyjaśnianie: studium z filozofii i metodologii nauk, Lublin: KUL, 2006, s. 152, ISBN 83-7363-362-6, OCLC 162507559 [dostęp 2019-03-11] .
  3. 4. Confounding and Deconfounding: Or, Slaying the Lurking Variable, [w:] JudeaJ. Pearl JudeaJ., DanaD. Mackenzie DanaD., The book of why: the new science of cause and effect, First edition, New York, NY 2018, ISBN 978-0-465-09760-9, OCLC 1003311466 [dostęp 2019-03-11] .
  4. JosephJ. Berkson JosephJ., Limitations of the Application of Fourfold Table Analysis to Hospital Data.*,†, „International Journal of Epidemiology”, 43 (2), 2014, s. 511–515, DOI: 10.1093/ije/dyu022, ISSN 1464-3685 [dostęp 2019-03-11]  (ang.).