Document Type : Original Article
Authors
Abstract
Background & Objectives: Lung cancer due to low chance of survival is the most important and the most common fatal cancer and has the highest mortality rates compared to breast and prostate cancer and other multiple cancers. The purpose of this study is to analyze survival data of patients having lung cancer in the province of West Azerbaijan.
Materials & Methods: The information of this study is relevant to 355 patients refered to hospitals exiting in West Azerbaijan province between 1386-93. The situation of the patients was followed up until the end of the Khordad 1393. The data are compromized from Histopathologic and demographic information. For analyzing the data and classifying the patients, the model of decision tree was used. All analysis and synthesis were performed using the software of R.
Results: The mean and the median time of survival for 355 patients having lung cancer were estimated 13 and 4.8 months, respectively. The probable of 1-year surviving was about 39% and only 7% of patients had experienced 3-year survival. The model of decision tree of state therapy variables, Eastern Cooperative Oncology Group (ECOG), smoking status, age of diagnosis and tumor stage were identified as important variables.
Conclusion: The model of classification tree can identify the important and effective risk factors on the survival of the patients and identifying these factors in the cancer patients can prevent progression of the disease and increase survival time of patients.
Keywords
ارزیابی متغیرهای پیشآگهی در ردهبندی نرخ بقای بیماران مبتلا به سرطان ریه با استفاده از مدل درخت تصمیم در استان آذربایجان غربی
مالک اباذری1، رضا اباذری2، قدرتاله روشنایی3، مهدیا غلامنژاد4، یوسف روستا5، حسین محجوب6*
[1] دانشجوی دوره کارشناسی ارشد آمار زیستی، گروه آمار زیستی و اپیدمیولوژی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران
2 باشگاه پژوهشگران و نخبگان جوان دانشگاه آزاد اسلامی واحد اردبیل، دانشگاه آزاد اسلامی، اردبیل، ایران
3 استادیار، دکترای آمار زیستی، گروه آمارزیستی و اپیدمیولوژی، مرکز تحقیقات مدلسازی بیماریهای غیرواگیر، دانشکدهی بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران
4 استادیار، فوق تخصص بیماریهای ریه، دانشگاه علوم پزشکی ارومیه، ارومیه، ایران
5 رزیدنت داخلی، دانشگاه علوم پزشکی ارومیه، ارومیه، ایران
6 استاد، دکترای آمار زیستی، گروه آمار زیستی و اپیدمیولوژی، مرکز تحقیقات علوم بهداشتی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران
* نشانی نویسنده مسؤول: همدان، دانشگاه علوم پزشکی، مرکز تحقیقات علوم بهداشتی، دکتر حسین محجوب
E-mail: mahjub@umsha.ac.ir
وصول: 11/9/93 ،اصلاح: 23/10/93 ،پذیرش:28/11/93
چکیده
زمینه و هدف: سرطان ریه بهعلت شانس پایین زندهماندن از مهمترین و کشندهترین نوع سرطان محسوب میشود و بیشترین میزان مرگومیر را در مقایسه با سرطانهای سینه، پروستات و سایر سرطانهای چندگانه دارد. هدف از این مطالعه، تحلیل دادههای بقای بیماران مبتلا به سرطان ریه در استان آذربایجان غربی میباشد.
مواد و روشها: در این مطالعه همگروهی تاریخی اطلاعات مربوط به 355 بیمار مراجعهکننده به بیمارستانهای استان آذربایجان غربی در فاصله سالهای 93-1386 مورد بررسی و وضعیت بقای بیماران تا پایان خرداد 1393 مورد پیگیری قرارگرفت. دادهها شامل اطلاعات دموگرافی و هیستوپاتولوژیک هستند. زمان بقای بیماران از زمان تشخیص تا مرگ یا پایان مطالعه در نظرگرفتهشد. برای تحلیل دادهها و رده بندی بیماران از مدل درخت تصمیم استفادهگردید. کلیهی تحلیلها با استفاده از نرمافزار R صورتگرفت.
یافتهها: میانگین و میانهی زمان بقا برای 355 بیمار مبتلا به سرطان ریه بهترتیب 13 ماه و 4/8 ماه برآوردگردید. احتمال بقای 1ساله 39 درصد بوده و تنها 7 درصد از بیماران، بقای 3 ساله را تجربه کردبودند. مدل درخت تصمیم متغیرهای وضعیت درمان، EasternCooperativeOncology Group (ECOG)، وضعیت سیگاری بودن، سنّ تشخیص بیماری و مرحلهی تومور بهعنوان متغیرهای مهم شناساییکرد.
نتیجهگیری: استفاده از مدل درخت ردهبندی، میتواند منجر به شناسایی ریسک فاکتورهای مهم و موثر بر بقای بیماران شود و شناسایی این عوامل در بیماران سرطانی میتواند باعث جلوگیری از پیشرفت بیماری شده و زمان بقای بیماران را افزایش دهد.
واژه های کلیدی: سرطان ریه، ایران، درخت تصمیم، بقا.
مقدّمه
سرطان، یکی از مهمترین علتهای اختلالات، مرگومیر و ناتوانی در سراسر جهان است(1). این بیماری که یکی از بیماریهای شایع و درحال افزایش است، حجم زیادی از تلاشهای نظامهای مراقبتی را به خود اختصاص میدهد(2, 3). سرطان، نوعی بیماری است که در آن، سلولهای غیرطبیعی بهشکل غیرقابل مهار تقسیم میشوند و قادرند به سایر بافتهای بدن گسترش یابند(4). سرطان در ایران بعد از بیماریهای قلبیـعروقی و سوانح، سومین علت مرگومیر میباشد(5). سرطانها در ایران باعث تحمیل 2/662 دالی(Disability Adjusted Life Years:DALY) در هر صد هزار نفر میشوند و سرطان ریه، بعد از سرطان معده با ایجاد 3/56 دالی در رتبهی دوم میباشد(3). سرطان ریه، بیشترین میزان مرگومیر را در مقایسه با سرطانهای سینه، پروستات و سایر سرطانهای چندگانه (ابتلای فرد به بیش از یک سرطان) دارد(6). سرطان ریه بهعلت شانس پایین زندهماندن از مهمترین و کشندهترین نوع سرطان محسوبمیگردد. بهطوریکه تنها 13% از ابتلایان به سرطان ریه پنج سال پس از تشخیص زنده میمانند(7, 8).
براساس تقسیمبندی انجمن سرطان آمریکا (American Cancer Society) دو نوع سرطان وجود دارد: سرطان ریه با یاختههای کوچک(Smell cell lung cancer; SCLC) و سرطان ریه با یاختههای غیرکوچک (Non-Small cell lung cancer; NSCLC)(9). متأسفانه چندین سال طول میکشد تا نشانههای سرطان ریه خود را بروز دهد. لذا در بیشتر مواقع این بیماری در مراحل بسیار پیشرفته تشخیصداده میشود(10, 11). میزان بقا پس از تشخیص، درمان و بررسی عوامل خطرساز در بیماران سرطانی یکی از شاخصهای مهم در کنترل بیماری و ارزیابی روشهای درمانی مورد استفاده است(12). در اکثر تحقیقات پزشکی از مدل نیمه پارامتری کاکس برای ارزیابی عوامل استفادهشدهاست(6, 13-16). مدل کاکس بر فرض اساسی، بر متناسب بودن خطرات مبتنی است که در بیشتر دادهها ممکن است این فرض برقرار نباشد. لذا در دو دههی اخیر، تکنیکهای دیگری از قبیل روشهای مبتنی بر مدلهای درختی(Tree- based methods)، که به آنها «روشهای افراز بازگشتی(Recursive partitioning methods)» نیز گفتهمیشود، رواجیافتهاند(17). این مدلها روشهای تحلیلی قدرتمندی برای کشف ساختار دادهها بهشمارمیروند و کاربرد بسیار گستردهای در علوم پزشکی دارند.(18). این مدل برای آنالیز اکتشافی دادهها با استفاده از قواعد منطقی و ایجاد ردهبندی ساده و قابل تفسیر بهکارمیروند(19). روشهای مبتنی بر مدلهای درختی در ابتدا تحت عنوان «ردهبندی و رگرسیون درختی» توسط مورگان و سونیکیست(Morgan and Sonquist) در سال 1963 برای بررسی اثرات متقابل متغییرها در دادههای علوم اجتماعی پیشنهادشدند و سپس بهطور جامعتر توسط بریمن(Breiman) در سال 1984 مورد بررسی قرارگرفتند(20) این مدلها برای اولین بار توسط الشن(Olshen) در زمینهی تحقیقات بالینی بهکار گرفتهشدند(21). این مدلها به دلیل عدم نیاز به پیشفرضهای ضروری در روشهای پارامتری و سادگی تفسیر نتایج، در آنالیز بقا نیز توسعهیافته و در ردهبندی بیماران در معرض عوامل خطر و پیشبینی نرخ بقا، بهکارگرفتهمیشوند(18). با توجه به مطالعات اندک در زمینه رده بندی نرخ بقای بیماران با استفاده از مدل درخت تصمیم در ایران، هدف از این مطالعه، ارایهی فاکتورهای پیشآگهی مهم و تعیین زیر گروههای همگن در بیماران مبتلا به سرطان ریه است.
مواد و روش ها
در این مطالعه که بهصورت کوهورت تاریخی انجامگرفتهاست، دادهها از پروندهی 355 بیمار مبتلا به سرطان ریه در فاصلهی سالهای 1386 تا 1393 که به بیمارستانهای استان آذربایجان غربی مراجعهکردهاند، ثبت گردید. شرط ورود به مطالعه برای بیماران، تشخیص سرطان ریه درنظرگرفته شده و گزارش پاتولوژی این بیماران در بیمارستانهای مربوط موجوداست. مدت زمان بقای بیماران از زمان تشخیص بیماری آنها تا 15 خرداد 93 برحسب ماه تعیینشد که در این زمان، افراد یا پیشامد مرگ را تجربهکرده(رخداد مورد نظر) و یا زنده مانده بودند(سانسور راست). ازطریق تماس تلفنی، مرگ یا زنده ماندن بیماران پیگیری و تاییدگردید و افرادی که مرگ آنها علتهایی غیر از بیماری سرطان ریه داشت بهعنوان سانسور منظورگردید. افرادی که دارای عود بیماری بودند در این مطالعه درنظرگرفتهنشدند. برای همه بیماران بر اساس اطلاعات موجود در پروندهی بیمارستانی، متغیرهای دموگرافیک همچون: سنّ تشخیص بیماری، جنسیّت و متغیرهای بیولوژیک شامل عملکرد ECOG، مصرف دخانیات، نوع تومور، مرحلهی بیماری، گسترش بیماری(Metastasis)، وضعیت درمان (بیمارانی که یک یا بیش از یک روش درمان کموتراپی، رادیوتراپی و جراحی را تجربه کردهبودند و بیمارانی که بهعلت عدم رضایت بیمار یا همراهان بیمار یا ناتوانی شدید جسمانی و بیماریهای زمینهای دیگر، درمان اختصاصی دریافت نکردهبودند)، استخراج و ثبت گردید.
تحلیلهای آماری
در روشهای مبتنی بر مدلهای درختی، برای برازش مدل، تمام افرازهای ممکن برای هر متغیر کمکی ارزیابی میشوند. درنهایت متغیر کمکی و نقطهی برشی برای افراز دادهها انتخاب خواهدشد که بیشترین کاهش در ناخالصی را ارایهدهند. منظور از ناخالصی، بیان ناهمگنی دادهها در یک گره است. کاهش ناخالصی در گره p که به دو گره چپ و راست افراز میشود به صورت ذیل بهدستمیآید:
G(p)=R(p)-[R(l(p))+R(r(p))]
که در آن R(p) باقیماندهی خطا در یک گره است، R(r(p)) باقیماندهی خطا در گره راست و R(l(p)) باقیماندهی خطا در گره چپ، ناشی از افراز گره p هستند. در بیشتر تکنیکهای افراز بازگشتی برای دادههای سانسور شدهی بقا، برای محاسبه G(p) بین دو گره، از آماره لگاریتم رتبهای استفادهمیشود. آمار لگاریتم رتبهای برای یک افراز s که گره ریشهای p را به گرههای راست r و چپ l افراز میکند به صورت ذیل تعریفمیشود:
اینجا متغیر تصادفی متناظر با تعداد رخداد مورد نظر (مشاهدات سانسورنشده) در گره راست برای iامین گره است.
فرض صفر که بهوسیلهی این آماره آزمون میشود، یکسانبودن نرخ شکست در دو گره راست و چپ ناشی از افراز است. در آن ثابت است و برای وزن دهی به گرههای مربوط است. بنابراین معنادارشدن این آزمون بهمعنای انتخاب یک متغیر با نقطهی برش مناسب برای افراز است. با استفاده از افراز بازگشتی مبتنی بر آمارهی شرح دادهشده، درنهایت گرههایی از افراد با ویژگیهای مشابه (همگن) تشکیل خواهندشد و گرهها دارای حداکثر تفاوت ممکن در نرخ شکست (احتمال بقا) خواهندبود. به عبارت دیگر، افراد به زیرگروههای همگن با حداکثر تفاوت برحسب پاسخ مورد نظر افراز خواهندشد. فرایند افراز درخت تا جایی ادامه مییابد که تمام مشاهدات درون گرههای پایانی دارای توزیع یکسانی باشند. در هر فرآیند افراز مدلسازی، هدف رسیدن به یک مدل بهینه است.
درختِ بهینه، درختی است که از لحاظ اندازه و برآورد اشتباه، بهینه باشد. معنادار بودن نرخ بقای زیر گروهها با استفاده از آزمون لگاریتم رتبهای نشاندهندهی بهینهبودن درخت و در نهایت کارایی مدل است. در روشهای مبتنی بر مدلهای درختی، برای رسیدن به درخت بهینه، با استفاده از تکنیکهای هرس، درخت را هرس کرده و نایتاً با استفاده از قاعدهی مناسب، درختی با مینیمم خطا و اندازه مناسب انتخاب میگردد. برای هرس کردن درخت تصمیم دو روش کلی پیشنهاد شدهاست: روش مبتنی بر تغییرات درون گرهای که بر اساس تکنیک هزینه ـ پیچیدگی درخت است و روش مبتنی بر اختلاف بین گرهها که بر اساس تکنیک افراز ـ پیچیدگی است(19, 20). در این مطالعه برای هرسکردن درخت تصمیم از روش هزینه ـ پیچیدگی که پیشفرض بسته نرمافزاری مورد استفاده میباشد، استفادهگردیده است. برای تحلیل اطلاعات، از آزمونهای تی مستقل و لگاریتم رتبهای و برای برازش مدل درخت بقا از نرمافزار R و بستهی نرمافزاری partykit استفاده شد.
یافتهها
تعداد بیماران مورد بررسی، 355 نفر بود که 240 نفر فوتکرده و 115 نفر سانسور(censoring ) شده بودند. 1/72 درصد افراد مبتلا (256 نفر)، مرد و 9/27 درصد افرا مبتلا (99 نفر)، زن بودند ( نسبت مردها به زنها برابر 6/2 میباشد). میانگین سنّ تشخیص افراد مبتلا 5/13±5/63 سال تعیین شد (با دامنهی 91-11 سال). میانگین سنّ تشخیص سرطان برای مردان 4/12±65 سال و برای زنان 5/16±4/59 سال بهدست آمد که میانگین سنّ تشخیص سرطان برای مردان و زنان ازنظر آماری، متفاوت بود (P=0/002). 49 درصد از مردان و 62 درصد از زنان مبتلا به سرطان ریه در سنین زیر 65 سال و 4/20 درصد مردان و 4/14 درصد زنان در ردهی سنّی بالای 75 سال قرار داشتند. میانگین و میانهی زمان بقا برای بیماران بهترتیب، 13 ماه و 4/8 ماه حاصل شد.
با استفاده از روش کاپلان مایر میزان بقای 1ساله، 2ساله و 3 ساله بهترتیب 39 درصد، 18 درصد و 07/0 درصد بهدست آمد. در برازش مدل در اولین مرحله مهمترین متغیری که برای افراز دادهها انتخابمیشود، متغیر وضعیت درمان بیماران با P<0.001 میباشد. با تکرار الگوریتم برای گرههای حاصل از افراز مرحلهی اول، متغیر ECOG با P=0.006 بهعنوان مهمترین متغیر بعدی برای بیمارانی که در گره چپ (دریافت درمان) و متغیر وضعیت سیگاری بودن با P=0.007 برای بیمارانی که در گره راست (عدم دریافت درمان) حاصل از افراز در مرحلهی اول هستند، انتخابمیشوند. متغیرهای سنّ در زمان تشخیص و مرحلهی تومور بهعنوان متغیرهای مهم دیگر شناسایی شدند. شکل 1 مدل درخت تصمیم و زیرگروههای افراز شدهی بیماران به همراه مهمترین متغیرهای انتخاب شده را نشانمیدهد. در جدول شمارهی 1 میانگین و میانه بقا در زیر گروههای حاصل از مدل درخت تصمیم آورده شده است. براین اساس بیمارانی که درمان دریافت کردهبودند و دارای مرحلهی I,II,III از متغیر ECOG و بالای 58 سال بودند، دارای بالاترین بقا (با میانه بقای 22.26 و میانگین بقای 19.27) محسوب میشدند و بیمارانی که در ردهی عدم دریافت درمان، سیگاری و دارای مرحلهی تومور IV بودند کمترین بقا را (با میانه بقای 2 و میانگین بقای 3.82) تجربهکردهبودند. نتیجهی آزمون لگاریتم رتبهای برای مقایسه نرخ بقا در شش زیر گروه، بیانگر اختلاف معنادار بین این زیر گروهها هست (P<0.001) که نشان دهندهی کارایی مدل میباشد.
بحث
مدلهای ردهبندی درختی، هیچ نوع پیشفرضها و محدودیتهایی را که برای مدلهای پارامتری و نیمه پارامتری برقراراست، شامل نمیشوند. مدلهای ردهبندی درختی علاوه بر شناسایی و معرفی متغیرهای مهم، زیرگروههای همگنی از بیماران را برای تحقیقات بالینی بعدی ارایهمیدهد. ارایهی این زیرگروهها برای انتخاب پروتکلهای درمانی، مؤثر و در طراحی کارآزمایی بالینی برای مطالعات بعدی بسیار مفید است.
یافتههای حاصل از مدل درخت تصمیم، متغیر وضعیت درمان را بهعنوان مهمترین فاکتور پیشآگهی معرفیمیکند. مطالعات مختلفی در این زمینه وجوددارد که مهم و مؤثربودن متغیر وضعیت درمان بر بقای بیماران را تأییدمیکند که ازمیان آنها میتوان به مطالعهی زهیر و همکاران در سال 2012 و مطالعهی برگمنس و همکاران در سال 2005 اشارهکرد (6, 22).
در ارزیابی فاکتورهای پاتولوژیک، عملکردی براساس سیستمEastern Cooperative Oncology Group (ECOG)، بهعنوان دیگر متغیر مهم شناسایی شد. بهگونهایکه کمترین میزان بقا برای بیمارانی که در ردهی دریافت درمان قرارداشتند، با میزان 8.1 ماه مربوط به مرحلهی V از متغیر ECOG بود.
در مطالعات میتسودومی و همکاران (23)، کاواگوجی و همکاران(24) وضعیت سیگاری بودن یا نبودن، متغیرِ تأثیرگذاری بر زمان بقا میباشد. در مطالعهی ما نیز این مقوله بهعنوان متغیر مهم شناسایی شد، ولی مطالعهی شو و همکاران(25) با این موضوع همخوانی ندارند و وضعیت سیگار، بهعنوان متغیرِ تأثیرگذاری معرفی نشده است.
بر پایهی مطالعه ما میانگین سنّ تشخیص بیماری 5/13±5/63 با مطالعهی داخل کشور و خارج کشور همخوانی داشت(6, 26). در این مطالعه سنّ تشخیص بیماری مانند مطالعات (6, 27) متغیر مهمی تشخیص دادهشد. انتخاب نقطهی افراز 58 سال برای سنّ تشخیص بیماری، بر اساس یافتن بیشترین اختلاف بین میزان بقای دو زیرگروه میباشد.
مرحلهی تومور دیگر متغیر مهم در این مطالعه با استفاده از مدل درخت تصمیم بود. در مطالعهی کاواگوچی و همکاران نیز این متغیر عامل مؤثری بر میزان بقای بیماران تشخیص دادهشده است(24). با اینکه جنسیّت یکی از فاکتورهای مؤثر در بقاست، اما مطالعهی ما این متغیر را مهم نشان نداد. هرچند با مطالعهی زهیر و همکاران همخوانی داشت(6)، اما برخی مطالعات نیز نشان داد که بقا برای زنان بیشتر از مردان است(27, 28).
در این مطالعه نوع تومور متغیر با اهمّیّتی تشخیص دادهنشد که این مورد، اگرچه با مطالعات داخلی همخوانی داشت(6, 29)، اما با مطالعات سایر کشورها متفاوت بود. مطالعات در سایر کشورها نشانمیدهد نوع تومور متغیر تأثیرگذاری بر بقای بیماران میباشد(8, 30).
باتوجه به نتایج این مطالعه، استفاده از مدل درخت ردهبندی، میتواند منجر به شناسایی ریسک فاکتورهای مهم و موثر بر بقای بیماران شود و شناسایی این عوامل در بیماران سرطانی میتواند باعث جلوگیری از پیشرفت بیماری شده و زمان بقای بیماران را افزایش دهد.
تشکر و تقدیر
نویسندگان مقاله بر خود لازممیدانند از کلیهی کارکنان بیمارستانهای استان آذربایجان غربی که در جمعآوری اطلاعات مورد نیاز این تحقیق، همکاری کردهاند، تشکر و قدردانی نمایند. این مقاله برگرفته از پایاننامهی دورهی کارشناسی ارشد گروه آمار زیستی و اپیدمیولوژی دانشگاه علوم پزشکی همدان میباشد.
References
- Haghshenas M, Golini-Moghaddam T, Rafiei A, Emadeian O, Shykhpour A, Ashrafi GH. Prevalence and type distribution of high-risk human papillomavirus in patients with cervical cancer: a population-based study. Infect Agent Cancer. 2013;8(1):20.
- Bollschweiler E, Wolfgarten E, Nowroth T, Rosendahl U, Mönig SP, Hölscher AH. Vitamin intake and risk of subtypes of esophageal cancer in Germany. J Cancer Res Clin Oncol. 2002;128(10):575-80.
- Ghanbari N, Golestan Jahromi F, Bani Hashem K, Moazen M. The Effect of Stress Inoculation Training (SIT) on Depression and Anxiety in Patients with prostate Cancer.journal of sabzevar university of medical sciences. J Sabzevar Univ Med Sci. 2014;21(5):735-42.[Persian]
- Hamta A, Ghazzafi S. The study of Thymus vulgaris cytotoxicity effects on breast cancer cell's line. 3. 2015; 21 (1) :122-30. [Persian]
- Mousavi SM, Gouya MM, Ramazani R, Davanlou M, Hajsadeghi N, Seddighi Z. Cancer incidence and mortality in Iran. Ann Oncol. 2009;20(3):556-63.
- Zahir ST, Mirtalebi M. Survival of patients with lung cancer, Yazd, Iran. AsianPac J Cancer Prev. 2012;13(9):4387-91.
- Özlu T, Bulbul Y. Smoking and lung cancer. Tüberküloz ve Toraks Dergisi. 2005;53(2):200-9.
- Haraguchi S, Koizumi K, Mikami I, Junichi O, Iijima Y, Ibi T, et al. Clinicopathological characteristics and prognosis of non-small cell lung cancer patients associated with a family history of lung cancer. Int J Med Sci. 2012;9(1):68.
- Macdonald F, Ford C, Casson A. Molecular biology of cancer: Taylor & Francis; 2004.
- Longo DL, Fauci AS, Kasper DL,Hauser SL, Jameson JL, Loscalzo J. Harrison's principles of internal medicine: McGraw-Hill Medical New York; 2008.
- Silvestri GA, Alberg AJ, Ravenel J. The changing epidemiology of lung cancer with a focus on screening. BMJ. 2009:451-4.
- Kleinbaum DG, Klein M. Survival analysis: a self-learning text: Springer; 2005.
- Schabath MB, Thompson ZJ,Gray JE. Temporal trends in demographics and overall survival of non-small cell lung cancer patients at the Moffitt Cancer Center from 1986 to 2008.Cancer Control. 2014; 21(1): 51–6.
- Santoro IL, Ramos RP, FranceschiniJ, Jamnik S, Fernandes ALG. Non-small cell lung cancer in never smokers: a clinical entity to be identified. Clinics. 2011;66(11):1873-7.
- Grose D, Devereux G, Brown L, Jones R, Sharma D, Selby C, et al. Simple and objective prediction of survival in patients with lung cancer: staging the host systemic inflammatory response. Lung Cancer International. 2014;2014.
- Goksel T, Eser S, Guclu SZ, Karadag M, Cilli A, Ozlu T, et al. Prognostic factors affecting survival in cases with lung cancer [A lung cancer mapping project in Turkey (LCMPT)]. European Respiratory Journal. 2013;42(Suppl 57):P2920.
- Schumacher M, Holla¨nder N, Schwarzer G. Prognostic factorsstudies, in Crowley J (ed): Handbook of Statistics in Clinical Oncology.New-York, NY, Marcel Dekker. 2001: 321-78.
- Saki Malehi A, Hajizadeh E, Fatemi R. Evaluation of Prognostic Variables for Classifying the Survival In Colorectal Patients using The Decision Tree. Iran J Epidemiol. 2012; 8 (2) :13-9. [Persian]
- Zhang H, Singer B. Recursive partitioning in the health sciences: Springer; 1999.
- Negassa A, Ciampi A, Abrahamowicz M, Shapiro S, Boivin J-F. Tree-structured subgroup analysis for censored survival data: validation of computationally inexpensive model selection criteria. Statistics and computing. 2005;15(3):231-9.
- Breiman L, Friedman J, Stone CJ, Olshen RA. Classification and regression trees: CRC press; 1984.
- Berghmans T, Paesmans M, Meert AP, Mascaux C, Lothaire P, Lafitte JJ, et al. Survival improvement in resectable non-small cell lung cancer with (neo)adjuvant chemotherapy: results of a meta-analysis of the literature. Lung Cancer. 2005;49(1):13-23.
- Mitsudomi T, Morita S, Yatabe Y, Negoro S, Okamoto I, Tsurutani J, et al. Gefitinib versus cisplatin plus docetaxel in patients withnon-small-cell lung cancer harbouring mutations of the epidermal growth factor receptor (WJTOG3405): an open label, randomised phase 3 trial. Lancet Oncol. 2010;11(2):121-8.
- Kawaguchi T, Takada M, Kubo A, Matsumura A, Fukai S, Tamura A, et al. Gender, histology, and time of diagnosis are important factors for prognosis: analysis of 1499 never-smokers with advanced non-small cell lung cancer in Japan. J Thorac Oncol. 2010;5(7):1011-7.
- Shaw AT, Yeap BY, Solomon BJ, Riely GJ, Gainor J, Engelman JA, et al. Effect of crizotinib on overall survival in patients with advanced non-small-cell lung cancer harbouring< i> ALK</i> gene rearrangement: a retrospective analysis.Lancet Oncol. 2011;12(11):1004-12.
- Arrieta Ó, Núñez-Valencia C, Reynoso-Erazo L, Alvarado S, Flores-Estrada D, Angulo LP, et al. Health-related quality of life in patients with lung cancer: validation of the Mexican-Spanish version and association with prognosis of the EORTC QLQ-LC13 questionnaire. Lung Cancer. 2012;77(1):205-11.
- Puri V, Garg N, Engelhardt EE, Kreisel D, Crabtree TD, Meyers BF, et al. Tumor location is not an independent prognostic factor in early stage non-small cell lung cancer. Ann Thorac Surg. 2010;89(4):1053-9.
- Battafarano RJ, Piccirillo JF, Meyers BF, Hsu H-S, Guthrie TJ, Cooper JD, et al. Impact of comorbidity on survival after surgical resection in patients with stage I non–small cell lung cancer. J Thorac Cardiovasc Surg. 2002;123(2): 280-7.
- Hajmanoochehri F, Mohammadi N, Zohal MA, Sodagar A, Ebtehaj M. Epidemiological and clinicopathological characteristics of lung cancer in a teaching hospital in iran. Asian Pac J Cancer P. 2014;15(6):2495.
- JiangX, de Groh M, Liu S, Liang H, Morrison H. Rising incidence of adenocarcinoma of the lung in Canada. Lung Cancer. 2012;78(1):16-22.
Evaluation of Prognostic Variables for Classifying the Survival In lung cancer Patients using The Decision Tree
Malek Abazari.,
Department of Epidemiology and Biostatistics, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran.
Reza Abazari.,
Young Researchers and Elite Club, Ardabil Branch, Islamic Azad University, Ardabil, Iran.
Ghodratollah Roshanaei.,
Assistant professor, Modeling of Noncommunicable diseases Research center, Department of Biostatistics and Epidemiology, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran.
Mahdia Gholamnejad.,
Pulmonology Department, Urmia University of Medical Sciences, Urmia, Iran.
Yousef Roosta.,
Resident of Internal Medicine, Urmia University of Medical Sciences, Urmia, Iran.
* Hossein Mahjub .,
Research Center for Health Sciences and Department of Biostatistics & Epidemiology, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran.
Received:02/12/2014, Revised:13/01/2015, Accepted:17/02/2015
Abstract
Background & Objectives: Lung cancer due to low chance of survival is the most important and the most common fatal cancer and has the highest mortality rates compared to breast and prostate cancer and other multiple cancers. The purpose of this study is to analyze survival data of patients having lung cancer in the province of West Azerbaijan.
Materials & Methods: The information of this study is relevant to 355 patient’s referred to hospitals exiting in West Azerbaijan province between 1386-93. The situation of the patients was followed up until the end of the Khordad 1393. The data are compromized from Histopathologic and demographic information. For analyzing the data and classifying the patients, the model of decision tree was used. All analysis and synthesis were performed using the software of R.
Results: The mean and the median time of survival for 355 patients having lung cancer were estimated 13 and 4.8 months, respectively. The probable of 1-year surviving was about 39% and only 7% of patients had experienced 3-year survival. The model of decision tree of state therapy variables, Eastern Cooperative Oncology Group (ECOG), smoking status, age of diagnosis and tumor stage were identified as important variables.
Conclusion: The model of classification tree can identify the important and effective risk factors on the survival of the patients and identifying these factors in the cancer patients can prevent progression of the disease and increase survival time of patients.
Keywords: Lung Neoplasm; Decision Tree; Survival; Iran.
Correspond Author:
Hossein Mahjub ,
School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran.
E-mail: mahjub@umsha.ac.ir
- Haghshenas M, Golini-Moghaddam T, Rafiei A, Emadeian O, Shykhpour A, Ashrafi GH. Prevalence and type distribution of high-risk human papillomavirus in patients with cervical cancer: a population-based study. Infect Agent Cancer. 2013;8(1):20.
- Bollschweiler E, Wolfgarten E, Nowroth T, Rosendahl U, Mönig SP, Hölscher AH. Vitamin intake and risk of subtypes of esophageal cancer in Germany. J Cancer Res Clin Oncol. 2002;128(10):575-80.
- Ghanbari N, Golestan Jahromi F, Bani Hashem K, Moazen M. The Effect of Stress Inoculation Training (SIT) on Depression and Anxiety in Patients with prostate Cancer.journal of sabzevar university of medical sciences. J Sabzevar Univ Med Sci. 2014;21(5):735-42.[Persian]
- Hamta A, Ghazzafi S. The study of Thymus vulgaris cytotoxicity effects on breast cancer cell's line. 3. 2015; 21 (1) :122-30. [Persian]
- Mousavi SM, Gouya MM, Ramazani R, Davanlou M, Hajsadeghi N, Seddighi Z. Cancer incidence and mortality in Iran. Ann Oncol. 2009;20(3):556-63.
- Zahir ST, Mirtalebi M. Survival of patients with lung cancer, Yazd, Iran. AsianPac J Cancer Prev. 2012;13(9):4387-91.
- Özlu T, Bulbul Y. Smoking and lung cancer. Tüberküloz ve Toraks Dergisi. 2005;53(2):200-9.
- Haraguchi S, Koizumi K, Mikami I, Junichi O, Iijima Y, Ibi T, et al. Clinicopathological characteristics and prognosis of non-small cell lung cancer patients associated with a family history of lung cancer. Int J Med Sci. 2012;9(1):68.
- Macdonald F, Ford C, Casson A. Molecular biology of cancer: Taylor & Francis; 2004.
- Longo DL, Fauci AS, Kasper DL,Hauser SL, Jameson JL, Loscalzo J. Harrison's principles of internal medicine: McGraw-Hill Medical New York; 2008.
- Silvestri GA, Alberg AJ, Ravenel J. The changing epidemiology of lung cancer with a focus on screening. BMJ. 2009:451-4.
- Kleinbaum DG, Klein M. Survival analysis: a self-learning text: Springer; 2005.
- Schabath MB, Thompson ZJ,Gray JE. Temporal trends in demographics and overall survival of non-small cell lung cancer patients at the Moffitt Cancer Center from 1986 to 2008.Cancer Control. 2014; 21(1): 51–6.
- Santoro IL, Ramos RP, FranceschiniJ, Jamnik S, Fernandes ALG. Non-small cell lung cancer in never smokers: a clinical entity to be identified. Clinics. 2011;66(11):1873-7.
- Grose D, Devereux G, Brown L, Jones R, Sharma D, Selby C, et al. Simple and objective prediction of survival in patients with lung cancer: staging the host systemic inflammatory response. Lung Cancer International. 2014;2014.
- Goksel T, Eser S, Guclu SZ, Karadag M, Cilli A, Ozlu T, et al. Prognostic factors affecting survival in cases with lung cancer [A lung cancer mapping project in Turkey (LCMPT)]. European Respiratory Journal. 2013;42(Suppl 57):P2920.
- Schumacher M, Holla¨nder N, Schwarzer G. Prognostic factorsstudies, in Crowley J (ed): Handbook of Statistics in Clinical Oncology.New-York, NY, Marcel Dekker. 2001: 321-78.
- Saki Malehi A, Hajizadeh E, Fatemi R. Evaluation of Prognostic Variables for Classifying the Survival In Colorectal Patients using The Decision Tree. Iran J Epidemiol. 2012; 8 (2) :13-9. [Persian]
- Zhang H, Singer B. Recursive partitioning in the health sciences: Springer; 1999.
- Negassa A, Ciampi A, Abrahamowicz M, Shapiro S, Boivin J-F. Tree-structured subgroup analysis for censored survival data: validation of computationally inexpensive model selection criteria. Statistics and computing. 2005;15(3):231-9.
- Breiman L, Friedman J, Stone CJ, Olshen RA. Classification and regression trees: CRC press; 1984.
- Berghmans T, Paesmans M, Meert AP, Mascaux C, Lothaire P, Lafitte JJ, et al. Survival improvement in resectable non-small cell lung cancer with (neo)adjuvant chemotherapy: results of a meta-analysis of the literature. Lung Cancer. 2005;49(1):13-23.
- Mitsudomi T, Morita S, Yatabe Y, Negoro S, Okamoto I, Tsurutani J, et al. Gefitinib versus cisplatin plus docetaxel in patients withnon-small-cell lung cancer harbouring mutations of the epidermal growth factor receptor (WJTOG3405): an open label, randomised phase 3 trial. Lancet Oncol. 2010;11(2):121-8.
- Kawaguchi T, Takada M, Kubo A, Matsumura A, Fukai S, Tamura A, et al. Gender, histology, and time of diagnosis are important factors for prognosis: analysis of 1499 never-smokers with advanced non-small cell lung cancer in Japan. J Thorac Oncol. 2010;5(7):1011-7.
- Shaw AT, Yeap BY, Solomon BJ, Riely GJ, Gainor J, Engelman JA, et al. Effect of crizotinib on overall survival in patients with advanced non-small-cell lung cancer harbouring< i> ALK gene rearrangement: a retrospective analysis.Lancet Oncol. 2011;12(11):1004-12.
- Arrieta Ó, Núñez-Valencia C, Reynoso-Erazo L, Alvarado S, Flores-Estrada D, Angulo LP, et al. Health-related quality of life in patients with lung cancer: validation of the Mexican-Spanish version and association with prognosis of the EORTC QLQ-LC13 questionnaire. Lung Cancer. 2012;77(1):205-11.
- Puri V, Garg N, Engelhardt EE, Kreisel D, Crabtree TD, Meyers BF, et al. Tumor location is not an independent prognostic factor in early stage non-small cell lung cancer. Ann Thorac Surg. 2010;89(4):1053-9.
- Battafarano RJ, Piccirillo JF, Meyers BF, Hsu H-S, Guthrie TJ, Cooper JD, et al. Impact of comorbidity on survival after surgical resection in patients with stage I non–small cell lung cancer. J Thorac Cardiovasc Surg. 2002;123(2): 280-7.
- Hajmanoochehri F, Mohammadi N, Zohal MA, Sodagar A, Ebtehaj M. Epidemiological and clinicopathological characteristics of lung cancer in a teaching hospital in iran. Asian Pac J Cancer P. 2014;15(6):2495.
- JiangX, de Groh M, Liu S, Liang H, Morrison H. Rising incidence of adenocarcinoma of the lung in Canada. Lung Cancer. 2012;78(1):16-22.