در تعیین مناسب ترین مقدار برش آزمون: مورد آزمایشات با نتایج مداوم

ساخت وبلاگ

معیارهای مختلفی برای تعیین مناسب ترین مقدار برش در یک آزمایش تشخیصی با نتایج مداوم وجود دارد. بیشتر مبتنی بر تجزیه و تحلیل ویژگی عامل گیرنده (ROC) ، روشهای مختلفی برای تعیین مقدار برش آزمون وجود دارد. رایج ترین معیارها نقطه ای از منحنی ROC است که در آن حساسیت و ویژگی تست برابر است. نقطه روی منحنی با حداقل فاصله از گوشه سمت چپ مربع واحد. و نکته ای که شاخص Youden حداکثر است. همچنین روش هایی که عمدتا بر اساس تجزیه و تحلیل تصمیم بیزی وجود دارد. در اینجا ، ما نشان می دهیم که یک روش پیشنهادی که حداکثر وزن مورد نیاز برای تشخیص نادرست را به حداکثر می رساند ، شاخصی از اثربخشی آزمایش تشخیصی که قبلاً پیشنهاد کردیم ، مناسب ترین تکنیک در مقایسه با موارد فوق است. برای تعیین ارزش برش ، ما باید احتمال ابتلا به بیماری علاقه و همچنین هزینه های ناشی از تشخیص نادرست را بدانیم. این بدان معنی است که حتی برای یک آزمایش تشخیصی خاص ، مقدار برش جهانی نیست و باید برای هر منطقه و برای هر بیماری تعیین شود.

مقدمه

آزمایش های تشخیصی ابزارهای بالینی مهمی هستند. در صورت امکان ، ما برای تشخیص بیماری ها باید از آزمایشات استاندارد طلا استفاده کنیم. با این حال ، یک آزمایش استاندارد طلای وجود ندارد یا برای شرایط خاص بیماری بسیار دشوار یا گران است (1). بنابراین ، ما باید از تست های تشخیصی جایگزین به عنوان جانشین آزمایشات استاندارد طلا استفاده کنیم.

در حالی که تفسیر یک آزمون با نتایج باینری مستقیم به جلو است ، تفسیر یک آزمایش با نتایج مداوم چندان ساده نیست. به عنوان مثال ، فرض کنید که این آزمون برای تبعیض تنها دو ایالت ، "بیمار" (D +) و "غیرقانونی" (D-) است و مقادیر آزمون بالاتر در بین افراد D + احتمال بیشتری دارد. برای تبعیض افراد D + و D-ما باید یک مقدار برش تعیین کنیم. نتایج آزمون برابر یا بیشتر از این مقدار مثبت در نظر گرفته می شود (T +) ، در غیر این صورت منفی هستند (T -). انتخاب مقدار برش ، نرخ نتایج مثبت مثبت (TP) ، منفی واقعی (TN) ، مثبت کاذب (FP) و نتایج آزمون منفی کاذب (FN) را تعیین می کند (2). حساسیت (SE) یک آزمون به عنوان احتمال آزمایش مثبت (T +) در یک فرد بیمار (D +) تعریف می شود ، یعنی (3):

ویژگی تست (Sp) به عنوان احتمال منفی بودن تست (T ) در فرد بدون بیماری (D ) تعریف می شود، یعنی (3):

بنابراین، یک تست حساس نرخ FN پایینی دارد - نتیجه منفی (T - ) بسیار محتمل است TN. بنابراین، می توان از یک آزمایش حساس برای رد یک وضعیت بیماری استفاده کرد. به طور مشابه، با داشتن نرخ FP پایین، می توان از یک آزمایش خاص برای حکمرانی در یک بیماری استفاده کرد.

در آزمونی با نتایج پیوسته (یا چندگانه)، هر مقدار آزمون ممکن را می توان نقطه برش در نظر گرفت. این مقدار برش تست Se و Sp را تعیین می کند. با این حال، برای یک آزمایش مشخص، نمی توانیم Se و S را همزمان افزایش دهیم. Se با هزینه Sp افزایش می یابد و بالعکس. کاهش مقدار برش برای افزایش تست Se باعث کاهش Sp می شود. اگر می خواهید تست اختصاصی تری داشته باشید (با افزایش مقدار برش)، تست حساسیت کمتری خواهید داشت.

تجزیه و تحلیل منحنی مشخصه عملیاتی گیرنده (ROC).

یکی از متداول ترین روش های مورد استفاده برای تجزیه و تحلیل اثربخشی یک تست تشخیصی، تجزیه و تحلیل منحنی مشخصه عملکرد گیرنده (ROC) است (4-6). استفاده از این روش به جنگ جهانی دوم برمی گردد، زمانی که توانایی اپراتورهای رادار (گیرنده ها) برای تعیین اینکه آیا یک ضربه روی صفحه رادار نشان دهنده یک شی (سیگنال، یک نتیجه TP) است یا نویز (نتیجه FP) آزمایش شد، از این رو،نام (7). چندین سال بعد، این روش در بسیاری از رشته های علمی دیگر از جمله پزشکی تشخیصی که در آن پزشک باید TP را از نتیجه آزمایش FP متمایز کند، مفید بود. منحنی ROC یک تصویر گرافیکی از مبادله فوق الذکر بین تست Se و Sp را ارائه می دهد و نرخ TP (Se) را در برابر نرخ FP (1 - Sp) برای هر مقدار برش (7) نشان می دهد.

ساختار کلی یک منحنی ROC ساده است. منحنی در یک مربع UNRIT محدود شده است (شکل 1). گوشه چپ چپ (SE = 0 ، SP = 1) با بالاترین مقدار برش تست ممکن مطابقت دارد. با کاهش مقدار برش ، تست SE افزایش می یابد و SP کاهش می یابد ، و روی منحنی از گوشه سمت چپ به سمت بالا و به سمت راست حرکت می کند تا در نهایت به گوشه سمت راست مربع برسد که در آن SE = 1 و SP = 0، مربوط به کمترین مقدار برش تست ممکن. از نظر تئوری ، ما می توانیم به یک منحنی مداوم با تعداد بی نهایت امتیاز فکر کنیم. با این حال ، در دنیای واقعی ، یک منحنی ROC بر اساس چند نکته گسسته ساخته می شود. اگرچه ما می توانیم این نقاط را با استفاده از روشهای مختلف (بخش های خط ، spline ، اتصالات منحنی و غیره) وصل کنیم ، اما منحنی متفاوت نیست و بنابراین ، در عمل تعیین شیب دقیق در هر نقطه امکان پذیر نیست.

شکل 1

ساختار کلی یک منحنی ROC. منحنی (خط متراکم) که کاملاً بالاتر از منحنی دیگر (خط جامد) قرار دارد ، به وضوح آزمایش بهتری است زیرا دارای منطقه بالاتری در زیر منحنی است. با داشتن گوشه چپ به سمت چپ روی منحنی ROC (خط جامد) ، مساحت منطقه مستطیل سایه دار سایه دار حداکثر است که طرفین آن (SE و SP) برابر باشند. SE - حساسیت. SP - ویژگی.

در یک تست کامل ، هر دو SE و SP برابر با 1 هستند. منحنی ROC مربوط به یک تست کامل (یعنی استاندارد طلا) یک بخش خط است که گوشه چپ چپ را به گوشه سمت چپ و به سمت راست وصل می کندگوشه فوقانی (یک منحنی همزمان با طرف های سمت چپ و بالا) از مربع واحد (8). از طرف دیگر ، منحنی ROC مربوط به یک آزمایش بدون مقدار تشخیصی ، قطعه خط است که گوشه سمت چپ پایین را به گوشه سمت راست وصل می کند-خط مورب 45 درجه (شکل 1). در عمل ، منحنی در جایی بین این دو افراط قرار دارد. مساحت زیر منحنی ROC (AUC) بین 0. 5 (برای خط مورب 45 درجه که نشان دهنده یک تست ناآگاهانه است) و برای یک آزمایش عالی 1. 0 متفاوت است.

AUC را می توان شاخصی از توانایی تبعیض آمیز یک آزمون در نظر گرفت (1 ، 8). از نظر ریاضی ، منطقه معادل احتمال اینکه نتیجه آزمایش در یک شخص D + به طور تصادفی انتخاب شود ، بالاتر از آن است که در یک شخص D اندازه گیری می شود (7). یک آزمایش با AUC 0. 5 معادل پرتاب یک سکه است - یک تست بی اطلاع. AUC به ویژه در مقایسه با دو یا چند آزمایش تشخیصی مفید است. داشتن AUC بالاتر ، آزمایشی با منحنی ROC که کاملاً بالاتر از منحنی دیگر قرار دارد ، به وضوح بهتر است (شکل 1). روش های محاسبه AUC عمدتا بر اساس یک آزمون آماری غیر پارامتری ، آزمون رتبه بندی Wilcoxon ، ارائه شده توسط DeLong و همکاران است. و هانلی و همکاران.(8 - 10). از روشهای پیشنهادی می توان برای آزمایش استفاده کرد که آیا AUC یک منحنی به طور قابل توجهی بالاتر از 0. 5 (AUC یک آزمایش ناآگاهانه) یا مقایسه AUC های دو یا چند آزمایش است.

معیارهای انتخاب مناسب ترین مقدار برش

انتخاب یک مقدار برش مناسب در استفاده از یک آزمایش به طور مؤثر از اهمیت ویژه ای برخوردار است. معیارهای مختلفی ، بیشتر بر اساس تجزیه و تحلیل ROC ، تاکنون برای انتخاب مناسب ترین مقدار برش (2 ، 5 ، 11 - 13) پیشنهاد شده است. هر نقطه روی یک منحنی ROC با یک مقدار برش مطابقت دارد و با تست SE و SP همراه است. پیدا کردن نقطه برش بنابراین نیاز به سازش بین SE و SP دارد. در بعضی موارد ، SE از SP مهمتر است ، به عنوان مثال وقتی یک بیماری بسیار عفونی است یا با عوارض جدی همراه است. از طرف دیگر ، در شرایط خاص ، SP ممکن است نسبت به SE ترجیح داده شود ، بگویید وقتی آزمایش تشخیصی بعدی خطرناک یا پرهزینه است (2). اگر اولویت بین SE و SP وجود نداشته باشد ، با این وجود ، یک رویکرد معقول برای به حداکثر رساندن هر دو شاخص است.

کمترین مقدار برش مربوط به Se = 1 و Sp = 0 است. با افزایش مقدار برش، Se تست کاهش می یابد و Sp تست افزایش می یابد تا زمانی که یک مقدار برش مربوط به تست Se = 0 و Sp = باشد. 1. در این بازه، یک مقدار برش وجود دارد که در آن تست Se معادل تست Sp است. یکی از معیارهای پرکاربرد برای تعیین مقدار برش آزمون، معیار مربوط به این نقطه خاص است که در آن Se = Sp. این نقطه از نظر ریاضی تقاطع خطی است که گوشه بالا سمت چپ و گوشه راست به پایین مربع واحد (خط Se = Sp) و منحنی ROC را به هم متصل می کند (شکل 1). این نقطه از منحنی جایی است که حاصل ضرب این دو شاخص (Se x Sp) حداکثر است - مساحت مستطیل سایه دار در شکل 1 زمانی حداکثر است که اضلاع آن (Se و Sp) برابر باشند، یک مربع.

روش دیگر برای به حداکثر رساندن Se و Sp، به حداکثر رساندن جمع آنها (Se + Sp) است. در این مرحله، شاخص Youden (Se + Sp 1) نیز حداکثر است (11، 14 - 16). این روشی است که معمولاً برای تعیین مناسب ترین مقدار برش استفاده می شود و مربوط به نقطه ای در منحنی ROC با بالاترین فاصله عمودی از خط مورب 45 درجه است (ROC یک آزمون غیر اطلاعاتی). در این مرحله، تفاوت بین نرخ تست TP (Se) و نرخ FP (1 Sp) نیز حداکثر است (15).

ROC یک آزمون کامل از گوشه سمت چپ و بالای مربع واحد عبور می کند، نقطه ای که هر دو Se و Sp برابر با 1 هستند (آزمون کامل؛ استاندارد طلایی). هر چه منحنی به این نقطه نزدیکتر باشد، آزمایش بهتری است. جای تعجب نیست، یکی دیگر از معیارهای رایج برای انتخاب مناسب ترین مقدار برش، انتخاب نقطه روی منحنی ROC با حداقل فاصله از گوشه سمت چپ بالای مربع واحد است (8، 15، 16).

اگرچه معیارهای فوق مبتنی بر مفروضات مختلفی است و سودمندی آنها صرفاً به اعتبار پیش فرض های مطرح شده در محیط عملی بستگی دارد، اما برخی از محققان روشی را به روش دیگر ترجیح می دهند. به عنوان مثال، پرکینز و شیسترمن استفاده از شاخص Youden را توصیه می کنند و در مورد استفاده از نقطه با حداقل فاصله از گوشه بالا سمت چپ هشدار می دهند (16). با این وجود، انتخاب معیار مورد استفاده باید بر اساس وضعیت آزمون مورد استفاده و اهمیت آزمون Se در مقایسه با Sp باشد. به عنوان مثال در طراحی یک تست غربالگری، برای کاهش نرخ FN به یک Se به اندازه کافی بالا، مثلاً 0. 8 یا بیشتر، نیاز داریم. در غیر این صورت، بسیاری از افراد بیمار از دست خواهند رفت.

همه این روشها برای استفاده ساده است. با این حال ، در تمام روشهای فوق ، ما به طور فراگیر فرض می کنیم که هیچ تفاوتی بین نتیجه FN و FP وجود ندارد. ما احتمال قبلی بیماری مورد نظر را نیز در نظر نمی گیریم. با در نظر گرفتن این متغیرها ، انتظار می رود معادلات پیچیده تر شود (و امیدوارم دقیق تر). این ما را به یک موضوع مرتبط سوق می دهد - تجزیه و تحلیل تصمیم بیزی (17).

رویکرد بیزی در تعیین مقدار برش

با استفاده از یک رویکرد بیزی ، شانس یک بیماری قبل و بعد از آزمایش تشخیصی به طور کلی می تواند به شرح زیر باشد:

شانس پس از آزمون D + = شانس پیش آزمون فاکتور D + X Bayes ،

جایی که می توان "فاکتور بیز" را بر اساس فرضیات ما بدست آورد. رویکرد بیزی اطلاعاتی را در مورد چگونگی تغییر نتیجه آزمایش (و در نتیجه احتمال) یک بیماری در اختیار ما قرار می دهد (18).

فاکتور Bayes را می توان به روش های مختلف تعیین کرد. به عنوان مثال ، اگر ابزار مورد انتظار بیمار را برای تعیین فاکتور Bayes در معادله فوق به حداکثر برسانیم ، به شرایطی می رسیم که نشان می دهد مناسب ترین مقدار برش مربوط به یک نقطه در منحنی ROC است که در آن شیب مماس استخط به منحنی معادله زیر را برآورده می کند (2 ، 5):

در جایی که PR نمایانگر احتمال ابتلا به بیماری (قبلی) بیماری است ، H آسیب خالص معالجه افرادی است که این بیماری را ندارند (مضرات نتیجه FP) ، و B سود خالص درمان افراد مبتلا به این بیماری (به عبارت دیگر ، مضرات نتیجه FN).

هزینه های مرتبط با مضرات نتیجه آزمایش FN و FP (به ترتیب B و H) و تشخیص غلط پزشکی موضوع در حال رشد تعداد مقالات (19) بوده است. انستیتوی پزشکی (IOM) ، یک سازمان غیرانتفاعی آمریکایی غیر دولتی ، گزارش می دهد که حدود 30 ٪ هزینه های مراقبت های بهداشتی در ایالات متحده ، حدود 750 میلیارد دلار آمریکا ، در خدمات غیر ضروری هدر می رود (20). در این نوع تجزیه و تحلیل ، یک درخت تصمیم گیری بر اساس گزینه های درمانی موجود ساخته می شود و شواهد فعلی در مورد خطرات و مزایای مرتبط با هر گزینه (2 ، 21). بر اساس این ساختار ، ما می توانیم مقرون به صرفه بودن و در معرض خطر در تصمیم گیری هر تصمیم را تخمین بزنیم و در نتیجه نتیجه احتمالی و مضرات مرتبط با نتایج FN و FP (21-23). پروتکل های درمانی و برنامه های غربالگری عمدتاً بر اساس نتایج چنین مطالعاتی شکل می گیرند (24 ، 25).

محدودیت معادله 1 با این وجود این است که اگرچه شیب را در مناسب ترین نقطه مشخص می کند ، اما نقطه همیشه نمی تواند به راحتی واقع شود. در عمل ، همانطور که در بالا ذکر شد ، یک منحنی ROC فقط بر اساس چند نقطه گسسته (غیر متمایز) ساخته شده است (واقعاً یک منحنی مداوم نیست) ، و در نتیجه یافتن نقطه با شیب داده شده روی منحنی به طور کلی دشوار است ،اگر غیرممکن نباشدما در بهترین حالت به تقریب می رسیم. اگرچه از نظر تئوری صحیح است ، این روش کاملاً مفید نیست. بنابراین اگر بتوانیم هماهنگی (به جای شیب) نقطه را روی یک منحنی ROC متناسب با مناسب ترین مقدار برش از طریق یک روش تحلیلی تشخیص دهیم ، امکان پذیر خواهد بود.

روش تحلیلی برای محاسبه مقدار برش آزمون

پیش از این ، ما یک شاخص آزمون ، به اصطلاح "تعداد مورد نیاز برای تشخیص نادرست" (NNM) (26) را پیشنهاد کردیم ، که تعداد بیمارانی است که باید آزمایش شوند تا یک نفر از آزمون تشخیص داده شود ، به شرح زیر:

جایی که PR نشان دهنده احتمال پیش آزمون بیماری است. به عنوان مثال ، NNM 20 برای آزمایش به این معنی است که از 20 نفر آزمایش شده یک تشخیص داده شده است (یا FP یا FN). هرچه NNM یک آزمایش بالاتر باشد ، آزمایش به استاندارد طلا نزدیک تر است ، از این رو ، یک آزمایش بهتر است.

برای تعیین مناسب ترین مقدار برش می توانیم NNM را به حداکثر برسانیم. با این حال ، در محاسبه NNM ، هزینه نتایج FN و FP برابر است. با این وجود هزینه تشخیص اشتباه (یا FP یا FN) به طور کلی متفاوت است. توجه داشته باشید که در اینجا ، "هزینه" به کلیه هزینه های متحمل شده است - هزینه مالی ، زمان هدر رفتن در معالجه نامناسب ، از دست دادن فرصت برای درمان یک فرد بیمار با عواقب (عوارض ، عوارض ، ناتوانی ، مرگ و میر و غیره) و مضراتدرمان افراد بدون بیماری با آسیب های عاطفی بعدی به بیمار ، تجربه عوارض جانبی دارویی ، مسائل حقوقی و غیره (27 ، 28). برای در نظر گرفتن این مسئله ، می توانیم فرض کنیم که هزینه یک نتیجه FN (تشخیص نادرست یک شخص D + به عنوان D -) برابر است که هزینه یک FP (تشخیص یک D - شخص به عنوان D +) است و "NNM وزنی" را تعریف می کند. به شرح زیر است:

به عنوان مثال، اگر C = 5 باشد، نتیجه FN پنج برابر هزینه بیشتری نسبت به FP ایجاد می کند. C = 1 به این معنی است که هزینه ها برای نتایج FN و FP برابر است. سپس، برای یافتن مناسب ترین مقدار برش، می توانیم NNM وزنی را به حداکثر برسانیم - تا هم نزدیکی نتایج آزمایش به نتایج استاندارد طلایی و هم هزینه های تشخیص اشتباه (اعم از FP یا FN) را در نظر بگیریم.

برای یافتن یک راه حل تحلیلی برای مسئله، اجازه دهید f(x) و g(x) تابع چگالی احتمال یک آزمون تشخیصی فرضی را با نتایج پیوسته برای جمعیت D + و D - تعیین کنند (شکل 2). فرض کنید میانگین و انحراف معیار (SD) توزیع به ترتیب 0 و 1 برای افراد D و d و s برای جمعیت D + باشد. همانطور که قبلا ذکر شد، Se و S توابعی از مقدار برش هستند. برای مقدار برش x، Se و Sp را می توان به صورت زیر محاسبه کرد:

شکل 2

توابع چگالی احتمال یک تست تشخیصی پیوسته برای افراد بیمار (f(x)، خط چین قرمز) و غیر بیمار (g(x)، خط جامد آبی). g(x) دارای میانگین 0 و انحراف استاندارد 1 است. f(x) دارای میانگین d و انحراف معیار s است. مقدار برش با خط نقطه چین عمودی نشان داده می شود. تمام مقادیر تست مساوی یا بزرگتر از این مقدار مثبت (T +) و در غیر این صورت منفی (T ) در نظر گرفته می شوند. از آنجایی که f(x) و g(x) توابع چگالی احتمال هستند، مساحت زیر منحنی برای هر یک از آنها برابر با یک است. ناحیه زیر f(x) در سمت راست مقدار برش (ناحیه صورتی) Se است و ناحیه زیر g(x) در سمت چپ مقدار برش (ناحیه آبی روشن) Sp است. این شکل بر اساس اولین مجموعه داده (N = 400) ارائه شده در متن ترسیم شده است. دو محور x وجود دارد: محور بالایی نشان دهنده اسمولاریته سرم افراد مورد مطالعه است. محور پایین مقادیر استاندارد شده مربوطه را نشان می دهد.

برای به حداکثر رساندن NNM وزنی (معادله 2)، مخرج معادله، باید به حداقل برسد. با استفاده از حساب دیفرانسیل و انتگرال، برای انجام این کار، معادله زیر باید حل شود:

از معادلات 3 و 4 داریم:

علامت منفی قبل از f(x) به این دلیل است که Se تابع نزولی x است. Sp در حال افزایش است. سپس، معادله 5 تبدیل می شود:

برای سادگی، اجازه دهید g(x) دارای توزیع نرمال باشد. با در نظر گرفتن میانگین و SD آن به ترتیب 0 و 1، داریم (29):

فرض کنید f(x) نیز توزیع نرمال داشته باشد و با در نظر گرفتن میانگین آن، و SD d و s هستند، (29):

حل معادله 7 برای x:

این مقدار با مناسب ترین مقدار برش تست مطابقت دارد.

کلی روش تحلیلی

بسیاری از تکنیک های متداول فوق الذکر در تجزیه و تحلیل ROC می توانند موارد خاصی از روش تحلیلی پیشنهادی (معادلات 8 و 9) در نظر گرفته شوند. به عنوان نمونه ، اگر فرض کنیم احتمال پیش آزمون (PR) 0. 5 است ، اگر هزینه های FN و FP برابر باشند (C = 1) ، و اگر پراکندگی (SDS) مقادیر آزمون برای افراد بیمار و غیر دفع استمساوی (S = 1) ، سپس مقدار برش پیش بینی شده با روش تحلیلی پیشنهادی (معادله 9 که فرض S = 1) ، به: کاهش می یابد:

مقداری که از یکی از متداول ترین روشها به تجزیه و تحلیل ROC بدست می آید ، یعنی نقطه ای که Se = sp.

همچنین می توان نشان داد که نقطه برش بهینه حاصل از روش تحلیلی پیشنهادی (معادله 8) دقیقاً شیب محاسبه شده توسط معادله را دارد. با استفاده از معادله 6 ، و مقادیر جایگزین F (x) و G (x) ،شیب منحنی ROC:

جایگزینی X از معادله 8 (هماهنگی نقطه برش مشتق شده) در بازده معادله فوق:

اما ، 1/c هزینه یک نتیجه FP است که با هزینه یک نتیجه FN تقسیم می شود و برابر با H/B (معادله 1) است. بنابراین ، این دو روش از نظر فنی معادل هستند. این بدان معنی است که به حداکثر رساندن ابزار مورد انتظار بیمار یا NNM وزنی منجر به همان مقدار برش می شود.

با این حال ، مزیت روش تحلیلی پیشنهادی (معادله 8) بر معادله 1 ، سهولت استفاده از آن است: اگرچه پیدا کردن نقطه روی یک منحنی ROC به طور کلی امکان پذیر نیست و صرفاً بر اساس شیب نقطه (شکل 3) ،محاسبه مقدار برش با روش تحلیلی پیشنهادی (معادلات 8 و 9) مستقیم به جلو است-شما فقط باید بدانید که نتیجه آزمایش به معنای بیماری بیمار و غیرقانونی ، SDS ، احتمال پیش آزمون بیماری است (یک تخمیناز شیوع بیماری ، اگر اطلاعات دیگری در دسترس نباشد) و برآورد هزینه های آزمایش FN و FP (معادله 1 نیز به دو متغیر آخر نیاز دارد).

شکل 3

منحنی ROC ساخته شده بر اساس اولین مجموعه داده (400 نفر) ارائه شده در متن: مجموعه داده های واقعی به عنوان منحنی جامد قرمز ارائه شده است. مقادیر پیش بینی شده از مدل ریاضی پیشنهادی به عنوان منحنی متراکم آبی ارائه شده است. فلش نقاط مربوط به مقادیر برش حاصل از روشهای مختلف را نشان می دهد (جدول 1). خط شکسته سبز خط مماس با شیب 0. 853 است. توجه داشته باشید که خط مماس در دو نقطه از منحنی ROC عبور می کند. SE - حساسیت. SP - ویژگی.

مثال

To compare the results obtained from different methods for the derivation of the most appropriate test cut-off value, we used the data set provided by Hooper et al. , who studied the diagnostic accuracy of calculated serum osmolarity to predict dehydration in people aged 65 years or more ( 30 ). They used the directly measured serum/plasma osmolality of 595 participants to determine if they had dehydration (serum/plasma osmolality>300 MOSM/kg) یا نه (آزمایش استاندارد طلا در نظر گرفته شده). آنها سپس اسمولاریته سرم را برای هر شرکت کننده بر اساس سدیم سدیم ، پتاسیم ، گلوکز و اوره سرم خود محاسبه کردند و از مقدار محاسبه شده به عنوان نتیجه آزمایش استفاده کردند. اسمولاریته سرم محاسبه شده به نزدیکترین مقدار عدد صحیح (31) گرد شد. سپس ، برای هر مقدار برش ، آزمایش در برابر نتیجه تست استاندارد طلا مقایسه شد. شیوع کم آبی در بین جمعیت مورد مطالعه 19/0 (30) در نظر گرفته شد. هوپر و همکاران. همچنین تخمین زده می شود که هزینه یک نتیجه FN (از دست دادن یک فرد کم آب و پیامدهای سلامتی آن) پنج برابر هزینه نتیجه FP (برچسب زدن یک شخص به عنوان کم آبی ، هنگامی که در واقع نیست ، و در نتیجه آزمایش خون بیشتری انجام می شودبه طور مستقیم اسمولالی بودن سرم یا تشویق آنها به نوشیدن بیشتر) (30).

ما به طور تصادفی داده های مجموعه را به زیر مجموعه های 400 نفره و 195 نفره تقسیم کردیم. اندازه گروه ها دلخواه انتخاب شدند. اولین مجموعه داده برای محاسبه مقادیر برش با استفاده از تکنیک های فوق استفاده شد. از مجموعه داده های دوم برای آزمایش اثربخشی هر روش برای طبقه بندی شرکت کنندگان استفاده شد. SPSS ® برای Windows ® ، ver. 17 (SPSS Inc ، Chicago ، IL ، USA) برای تقسیم داده ها به طور تصادفی به دو زیر مجموعه و تجزیه و تحلیل داده ها از جمله تجزیه و تحلیل ROC استفاده شد.

جدول 1 مقادیر برش حاصل از هر یک از معیارهای قبلاً شرح داده شده را نشان می دهد. از لحاظ تئوریکی ، تقاطع منحنی ROC (خط جامد قرمز) و خط SE = SP (شکل 3) مطابق با نقطه ای است که Se = sp. با این حال ، هیچ نکته ای در مجموعه داده های ما وجود ندارد که این معادله را برآورده کند و نزدیکترین نقطه جایی است که SE و SP به ترتیب 0. 718 و 0. 767 هستند ، به ترتیب ، مربوط به یک مقدار برش اسمولاریته سرم 298 MOSM/L است. این نقطه همچنین حداقل فاصله از گوشه سمت چپ مربع واحد دارد (شکل 3 ، جدول 1). مقدار برش 299 MOSM/L شاخص Youden را به حداکثر می رساند (شکل 3 ، جدول 1).

میز 1

مقادیر برش آزمون بر اساس اولین مجموعه داده های گروهی با استفاده از معیارهای مختلف محاسبه می شود

ملاک مقدار برش (MOSM/L) سس صدای بلند هزینه تشخیص غلط ($) در مجموعه داده دوم (N = 195)
SE = SP 298 0. 718 0. 767 10،500
فهرست حداکثر Youden 299 0. 667 0. 845 11،300
حداقل فاصله از گوشه سمت چپ مربع واحد 298 0. 718 0. 767 10،500
شیب منحنی ROC (شیب = 0. 853 ، C = 5) ?* ?* ?* ?*
روش تحلیلی (C = 5) 297 0. 795 0. 693 9800
حداکثر NNM وزنی (C = 5) 297 0. 795 0. 693 9800
*نمی توان به طور دقیق قرار گرفت (خط مماس را در شکل 3 مشاهده کنید).

از آنجا که هیچ اطلاعات دیگری در مورد شرکت کنندگان وجود ندارد ، بهترین تخمین برای احتمال پیش آزمون شیوع کم آبی بدن ، 19/0 بود. بر اساس معادله 1 ، شیب خط مماس به منحنی ROC در مناسب ترین نقطه برش 0. 853 است (شکل 3 ، خط شکسته سبز) ، با فرض اینکه H/B برابر با 1/5 ، یعنی هزینه های هزینه هایمضرات نتیجه FN پنج برابر مضرات نتیجه FP است (30). با این حال ، به دلیل مجموعه داده های گسسته (غیر متمایز) ، ما نتوانستیم نقطه مربوطه را صرفاً بر اساس دانستن شیب آن (بدون اتصالات منحنی) پیدا کنیم. برای فهمیدن نقطه مورد علاقه طبق دستورالعمل شرح داده شده قبلاً (4) ، ما یک خط با شیب را از طریق گوشه سمت چپ مربع واحد عبور دادیم و آن را به سمت منحنی ROC (خط جامد قرمز) حرکت دادیم تا اینکه برای اولین بار از آن عبور کردمنحنی. با این حال ، خط منحنی را در دو نقطه تقاطع می کند (شکل 3). از نظر عملی ، یافتن نقطه مورد علاقه بصری با دقت کافی بسیار سخت بود.

میانگین اسمولاریته سرم (آزمون) در گروه اول (400 نفر) 292. 3 (SD 8. 2) MOSM/L در 322 شرکت کننده بدون کم آبی (D -) و 302. 2 (SD 8. 0) MOSM/L در 78 بیمار مبتلا به کم آبی بود(D +). با استفاده از روش تحلیلی که ما پیشنهاد کردیم (معادله 8) ، ما:

با فرض اینکه احتمال پیش آزمون (برآورد شیوع کم آبی بدن) 0. 19 است ، اگر هزینه نتیجه FN پنج برابر هزینه یک نتیجه FP باشد (C = 5) ، معادله 8 بازده x = 0. 463 مربوط به یکمقدار برش 296. 1 (292. 3 + 0. 463 x 8. 2) MOSM/L برای اسمولاریته سرم که مربوط به SE 0. 777 و SP از 0. 678 است (شکل 3 ، منحنی آبی متراکم). بر اساس محاسبه ، نزدیکترین مقدار برش موجود در مجموعه داده های ما 297 MOSM/L است که مربوط به تست SE 0. 795 و SP 0. 693 است (جدول 1). این جایی است که NNM وزنی نیز حداکثر است (شکل 3 ، جدول 1).

بگذارید هزینه برچسب زدن به یک فرد به عنوان کم آبی، در حالی که واقعاً نیست (نتیجه FP) تقریباً 100 دلار آمریکا باشد (آزمایش خون بیشتر برای اندازه گیری مستقیم اسمولالیته سرم، تشویق آنها به نوشیدن بیشتر، اتلاف وقت) وهزینه گم شدن یک فرد کم آبی و پیامدهای سلامتی آن حدود 500 دلار آمریکا است. اگر از مقادیر برش ذکر شده در بالا برای آزمایش مجموعه داده دوم (N = 195) استفاده کنیم و هزینه های متحمل شده توسط نتایج آزمایش FN یا FP را محاسبه کنیم. هزینه FN به اضافه هزینه FP، مقدار برش به دست آمده با روش تحلیلی و به حداکثر رساندن NNM وزنی (که در این مورد یکسان است) با هزینه های کمتری نسبت به روش های دیگر همراه است (جدول 1).

نتیجه گیری

روش تحلیلی پیشنهادی یک مقدار برش می دهد که به احتمال پیش آزمون بیماری مورد نظر بستگی دارد. در صورت عدم وجود هرگونه اطلاعات قبلی یا نتایج آزمایش در فرد، احتمال پیش آزمون را می توان به عنوان شیوع بیماری مورد نظر تخمین زد. با توجه به روش پیشنهادی، مقدار برش در مکان هایی که بیماری شیوع کمتری دارد بیشتر است.

در نظر گرفتن احتمال (یا شیوع) قبل از آزمون بیماری مورد نظر، پیامدهای بالینی عمده ای را به همراه خواهد داشت. نقطه برش مناسب بستگی به مکانی دارد که آزمایش قرار است در آن استفاده شود. به عنوان مثال، با در نظر گرفتن معادله 8، مقدار برش اسمولاریته سرم برای تشخیص کم آبی در یک منطقه گرمسیری، که شیوع بیماری در آن بالا است، باید کمتر (آزمایش حساس تر) نسبت به منطقه سرد باشد. در جایی که شیوع کم آبی کمتر است - برای تشخیص کم آبی در یک منطقه آندمیک به آزمایش حساس تری نیاز داریم. حتی در یک مکان معین، مقدار برش مناسب به گروه افرادی که نیاز به آزمایش دارند بستگی دارد. به عنوان مثال، مقدار برش برای گروهی از ورزشکارانی که ورزش می کنند (خطر بیشتر/شیوع کم آبی بدن) باید کمتر از جمعیت عمومی باشد.

مقدار برش نیز برای تشخیص بیماری ها با میزان شیوع مختلف در یک منطقه متفاوت است. به عنوان نمونه ، اگر در یک منطقه شیوع کمبود آب بدن با شیوع دیابت insipidus متفاوت باشد ، اگر می خواهیم از اسمولاریته سرم به عنوان یک آزمایش تشخیصی استفاده کنیم ، باید برای تشخیص این دو شرط دو مقدار برش متفاوت تعیین کنیمواداین یافته از اهمیت توصیه های موسسه استانداردهای بالینی و آزمایشگاهی (CLSI) و فدراسیون بین المللی شیمی بالینی (IFCC) C28-A3 که در سال 2008 منتشر شده است ، پشتیبانی می کند ، با بیان اینکه فواصل مرجع برای تجزیه و تحلیل آزمایشگاهی باید به صورت محلی تأیید شود. نمونه هایی که از افراد محلی سالم گرفته شده است (32 ، 33). فواصل مرجع با محدودیت تصمیم گیری بالینی متفاوت است. در حالی که اولی بر اساس نتایج آزمایش در جمعیت عادی است ، دومی یک مقدار برش است که از یکی از روشهای فوق الذکر حاصل می شود و بر اساس توزیع نتایج آزمایش در هر دو جمعیت عادی و بیمار است (32). معادلات 8 و 9 این ارتباط را به وضوح توصیف می کنند.

با استفاده از یک رویکرد بیزی ، احتمال پس آزمون (خلفی) یک بیماری به احتمال پیش آزمون بیماری و نتیجه آزمایش بستگی دارد. احتمال پس از آزمون یک بیماری پس از آزمایش بیمار می تواند احتمال پیش آزمون آزمایش بعدی را که باید انجام شود در نظر گرفته شود. بر اساس آنچه ارائه شده است ، مقدار برش آزمایش دوم باید برای دو بیمار مشکوک به همان بیماری متفاوت باشد اما نتایج متفاوتی در آزمایش اول آنها دارد ، از این رو احتمالات مختلف پس از آزمون.

در روش تحلیلی ما برای استخراج معادلات 8 و 9، فرض کردیم که نتایج آزمون از توزیع نرمال برای افراد D + و D - پیروی می کند. این فرض، اگرچه با داده های گسترده از مطالعات روانی و پزشکی پشتیبانی می شود (9)، ممکن است به طور کلی درست نباشد. با این وجود، ما نشان داده ایم که روش تحلیلی پیشنهادی، که مبتنی بر به حداکثر رساندن NNM وزن دار است، از نظر ریاضی معادل با معادله 1 است، که استخراج آن بر اساس به حداکثر رساندن مطلوبیت مورد انتظار بیمار است (2، 5). از آنجایی که به حداکثر رساندن مطلوبیت مورد انتظار بیمار یا NNM وزنی منجر به همان نتیجه می شود، به نظر می رسد که حداکثر کردن NNM وزنی (معادله 2) بهترین روش موجود برای تعیین مناسب ترین مقدار برش تست باشد. این را می توان به راحتی با تخمین احتمال پیش از آزمایش بیماری، هزینه نسبی نتیجه آزمایش FN به FP (C) و مقادیر Se و Sp برای هر نقطه برش انجام داد که به راحتی در دسترس هستند. اکثر خروجی های آماری نرم افزاراستفاده از NNM وزنی ذکر شده در بالا همچنین فرض توزیع نرمال مقادیر آزمایش را در افراد بیمار و غیر بیمار لغو می کند.

تنها با در نظر گرفتن احتمال پیش آزمون (شیوع، در صورت نبود اطلاعات دیگر) بیماری مورد علاقه در جمعیت مورد مطالعه و با در نظر گرفتن هزینه (نه فقط مالی) نتایج FN و FP، می توانیم مناسب ترین را پیدا کنیم. مقدار برش برای یک تست تشخیصیهمه اینها مطالعه بیشتر در مورد شیوع (به عنوان تخمینی از احتمال پیش آزمون در صورت کمبود اطلاعات) و هزینه نتایج آزمون FN و FP در جمعیت های مختلف ضروری است. علاوه بر نمونه مورد تجزیه و تحلیل، اتوآنالایزرهای آینده باید با تخمینی از احتمال پیش آزمون (بر اساس نتایج آزمایش قبلی)، بیماری مورد علاقه و هزینه مرتبط با تشخیص اشتباه تغذیه شوند. آنها همچنین به یک سیستم موقعیت یابی جهانی مجهز هستند تا بتوانند داده های مهم مرتبط (به عنوان مثال، شیوع یک بیماری) را برای تعیین اینکه آیا آزمایش برای یک بیماری خاص مثبت است یا نه، بازیابی کنند.

سپاسگزاریها

نویسندگان مایلند از دکتر رابرت فلچر از دانشکده پزشکی هاروارد، دکتر استیون گودمن از دانشکده پزشکی استنفورد و دکتر مارگارت وینکر، سردبیر دانشگاهی سابق PLoS، برای پیشنهادات و نظرات ارزشمندشان در مورد نسخه قبلی این مقاله تشکر کنند. مقاله. ما همچنین از دکتر لی هوپر و همکاران تشکر می کنیم.، که با مهربانی مجموعه داده های خود را برای آزمایش مدل ریاضی ما ارائه کردند. مسئولیت نظرات بیان شده تنها بر عهده نویسندگان است.

بهترین استراتژی معاملات...
ما را در سایت بهترین استراتژی معاملات دنبال می کنید

برچسب : نویسنده : صدرا ذوالریاستین بازدید : 49 تاريخ : سه شنبه 22 فروردين 1402 ساعت: 20:45