의학 연구는 임상 진료에 도입되기 전에
진짜 효과가 있는지 혹 해를 끼치진 않는지 사전에 확인하고 동료 의사에 의해 심사도 받아야 합니다.
이러한 의학 연구에서 가장 믿음직한 연구 다자인은 "무작위 배정 연구"이라고 통상적으로 생각되고 있지만, 무작위 배정 연구는 품도 많이 들고 비용도 많이 들어 개별 난임 클리닉에서 "무작위 배정 연구"를 수행하긴 어렵습니다.
그래서 대부분의 난임 연구는 후향적 연구인 경우가 많지요.
이러한 후향적 연구는 데이터 생성과 결론으로 이어지게 하는 흐름을 단순해 보이지만, 이를 맥락에서 해석해야 하는 어려움이 있어요.
난임 원인이 있으니 관련된 치료를 하고 바로 결과가 나오는 심플한 흐름을 가지고 있지가 않아요.
매의 눈을 가지고 옳고 그름, 효율적/비효율적을 판단해야 해요. eagle's eyes가 필요하지요.
좀더 들어가보면 난임 진료는 난임 원인에 다른 난소 자극법, 상이한 난자 채취 과정과 다양한 배아 생성 방법, 신선 주기과 다른 냉동 배아 이식, 그리고 다양한 방식의 이식 주기 전처치 등이 있어요.
더 나아가 adds-on 치료라는 CoQ10, 자궁내막자극술, 자궁강내 PRP 주입술등이 새로운 개입 행위가 갖는 효과를 측정하기 어렵게 하지요.
GIGO라는 말이 있어요. Garbage in, Garbage out라고
연구 결과의 신뢰도는 "우수한 연구 설계 및 실행"에 달려 있고
동시에 제공된 데이터를 "적절히 분석하고 해석"해야 합니다.
일단 난임 시술에선 분자와 분모가 다양합니다. 특히 결과 지표가 매우 다양하게 존재합니다.
만약 결과 지표를 적절하게 다루지 않게 되면 길을 잃을 수 있어요.
해당 논문에 따르면 361개의 분자 (numerator)/ 87개의 분모 (denominator)가 난임 시술에 존재한다 해요.
즉, 난임 치료에서 나오는 다양한 좋은 결과들은 실제 허수일 수도 있다는 것입니다.
유의한 결과지표가 아닌, 유의미한 결과가 나온 대리 지표를 보고할 수 있다는 것이지요.
연구자들은 보고할 선택지가 많아, 골라서 발표할 수도 있다는 의미입니다. 연구를 해석할 때 주의해야 하는 부분이기도 하지요.
이런 의미에서 대체적으로 생존아 출산 (Live birth)를 최종 1차 결과로 생각하는 경향이 있으나, 이는 현실에선 다소 동떨어진 생각일 수 있어요.
좀 더 현실적인 대리 결과를 선택하고 판단해야 좀 더 알찬 정보를 얻을 수 있지요.
예를 들어 새로운 난소 자극법인 경우, 생존아 출산이 아닌 성숙 난자수를 대리 지표로 삼는 게 대표적인 예입니다.
살짝 주제에서 벗어나 무작위 연구인 경우에도,
(두 집단의 차이가 설사 있더라도 적절 샘플로 무작위 배정을 하면) 두 집단 간의 비교 가능성을 보장하나,
무작위배정 이후 발생하는 사건을 분모로 삼으면
이전에 선정했던 무작위 배정 집단과는 동등해지지 않는다는 점도 유의해야 합니다.
대표적이 예로, PGT-A 검사 유효성을 판단하기 위해 무작위 배정을 했으나 비교 지표를 이식당 임신율로 하면 되지 않는다는 것이지요.
무작위 배정으로 끝나야지,
PGT-A 후 이상 배아를 배제한 선별 이식건수를 분모로 잡아선 안된다는 이야기입니다.
결국엔 전문가의 도움이 필요해요.
즉, 연구 초기 단계에서 통계 전문가의 조언을 구해 디자인을 잡는 게 중요하고
발표된 연구를 읽을 때 항상 예리한 시각으로 관련된 데이터를 해석할 필요가 있다는 이야기이지요.
그러려면 논문을 많이 읽어봐야 해요. 결국은.
참고 문헌: (2021, Wilkinson J, RF)