نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دوره کارشناسی ارشد آمار زیستی، گروه آمار زیستی و اپیدمیولوژی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران

2 باشگاه پژوهشگران و نخبگان جوان دانشگاه آزاد اسلامی واحد اردبیل، دانشگاه آزاد اسلامی، اردبیل، ایران

3 استادیار، دکترای آمار زیستی، گروه آمارزیستی و اپیدمیولوژی، مرکز تحقیقات مدل‌سازی بیماری‌های غیرواگیر، دانشکده‌ی بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران

4 استادیار، فوق تخصص بیماری‌های ریه، دانشگاه علوم پزشکی ارومیه، ارومیه، ایران

5 رزیدنت داخلی، دانشگاه علوم پزشکی ارومیه، ارومیه، ایران

6 استاد، دکترای آمار زیستی، گروه آمار زیستی و اپیدمیولوژی، مرکز تحقیقات علوم بهداشتی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران

چکیده

زمینه و هدف: عزّت  نفس موجب ارتقای سلامت روان می­گردد. مطالعات نشان داده عزّت  نفس دانشجویان پرستاری، به خصوص جنس مؤنّث در سطح مطلوبی نیست.انجام برنامه­های ورزشی نقش مهمّی در افزایش عزّت  نفس دارد. لذا،، مطالعه حاضر با هدف بررسی تأثیر تمرینات پیلاتس بر عزّت  نفس دانشجویان دختر پرستاری انجام گردید. سرطان ریه به­علت شانس پایین زنده­ماندن از مهم‌ترین و کشنده‌ترین نوع سرطان محسوب می‌شود و بیشترین میزان مرگ‌ومیر را در مقایسه با سرطان‌های سینه، پروستات و سایر سرطان‌های چندگانه دارد. هدف از این مطالعه، تحلیل داده‌های بقای بیماران مبتلا به سرطان ریه در استان آذربایجان غربی می‌باشد.
مواد و روشها: در این مطالعه همگروهی تاریخی اطلاعات مربوط به 355 بیمار مراجعه­کننده به بیمارستان‌های استان آذربایجان غربی در فاصله سال‌های 93-1386 مورد بررسی و وضعیت بقای بیماران تا پایان خرداد 1393 مورد پیگیری قرارگرفت. داده‌ها شامل اطلاعات دموگرافی و هیستوپاتولوژیک هستند. زمان بقای بیماران از زمان تشخیص تا مرگ یا پایان مطالعه در نظرگرفته­شد. برای تحلیل داده‌ها و رده بندی بیماران از مدل درخت تصمیم استفاده­گردید. کلیه­ی تحلیل‌ها با استفاده از نرم‌افزار R صورت­گرفت.
یافته­ها: میانگین و میانه­ی زمان بقا برای 355 بیمار مبتلا به سرطان ریه به­ترتیب 13 ماه و 4/8 ماه برآوردگردید. احتمال بقای 1ساله 39 درصد بوده و تنها 7 درصد از بیماران، بقای 3 ساله را تجربه کرد­بودند. مدل درخت تصمیم متغیرهای وضعیت درمان، EasternCooperativeOncology Group (ECOG)، وضعیت سیگاری بودن، سنّ تشخیص بیماری و مرحله­ی تومور به­عنوان متغیرهای مهم شناسایی­کرد.
نتیجه­گیری: استفاده از مدل درخت رده‎بندی، می‎تواند منجر به شناسایی ریسک فاکتورهای مهم و موثر بر بقای بیماران شود و شناسایی این عوامل در بیماران سرطانی می‏‎تواند باعث جلوگیری از پیشرفت بیماری شده و زمان بقای بیماران را افزایش دهد.

کلیدواژه‌ها

عنوان مقاله [English]

Evaluation of Prognostic Variables for Classifying the Survival In lung cancer Patients using The Decision Tree

نویسندگان [English]

 • Malek Abazeri 1
 • Reza Abazari 2
 • Ghodratollah Roshanaee 3
 • Mahdia Gholam Nejad 4
 • Yosef Roosta 5
 • Hossein Mahjob 6

چکیده [English]

Background & Objectives: Lung cancer due to low chance of survival is the most important and the most common fatal cancer and has the highest mortality rates compared to breast and prostate cancer and other multiple cancers. The purpose of this study is to analyze survival data of patients having lung cancer in the province of West Azerbaijan.
Materials & Methods: The information of this study is relevant to 355 patients refered to hospitals exiting in West Azerbaijan province between 1386-93. The situation of the patients was followed up until the end of the Khordad 1393. The data are compromized from Histopathologic and demographic information. For analyzing the data and classifying the patients, the model of decision tree was used. All analysis and synthesis were performed using the software of R.
Results: The mean and the median time of survival for 355 patients having lung cancer were estimated 13 and 4.8 months, respectively. The probable of 1-year surviving was about 39% and only 7% of patients had experienced 3-year survival. The model of decision tree of state therapy variables, Eastern Cooperative Oncology Group (ECOG), smoking status, age of diagnosis and tumor stage were identified as important variables.
Conclusion: The model of classification tree can identify the important and effective risk factors on the survival of the patients and identifying these factors in the cancer patients can prevent progression of the disease and increase survival time of patients.

کلیدواژه‌ها [English]

 • Lung Neoplasm
 • Decision Tree
 • Survival
 • Iran

 

 

 


ارزیابی متغیرهای پیش‌آگهی در رده‎بندی نرخ بقای بیماران مبتلا به سرطان ریه با استفاده از مدل درخت تصمیم در استان آذربایجان غربی

 

مالک اباذری1، رضا اباذری2، قدرت­اله روشنایی3، مهدیا غلام­نژاد4، یوسف روستا5، حسین محجوب6*

[1] دانشجوی دوره کارشناسی ارشد آمار زیستی، گروه آمار زیستی و اپیدمیولوژی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران

2 باشگاه پژوهشگران و نخبگان جوان دانشگاه آزاد اسلامی واحد اردبیل، دانشگاه آزاد اسلامی، اردبیل، ایران

3 استادیار، دکترای آمار زیستی، گروه آمارزیستی و اپیدمیولوژی، مرکز تحقیقات مدل­سازی بیماری­های غیرواگیر، دانشکده­ی بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران

4 استادیار، فوق تخصص بیماری­های ریه، دانشگاه علوم پزشکی ارومیه، ارومیه، ایران

5 رزیدنت داخلی، دانشگاه علوم پزشکی ارومیه، ارومیه، ایران

6 استاد، دکترای آمار زیستی، گروه آمار زیستی و اپیدمیولوژی، مرکز تحقیقات علوم بهداشتی، دانشکده بهداشت، دانشگاه علوم پزشکی همدان، همدان، ایران

 

* نشانی نویسنده مسؤول: همدان، دانشگاه علوم پزشکی، مرکز تحقیقات علوم بهداشتی، دکتر حسین محجوب 

E-mail: mahjub@umsha.ac.ir

 

وصول: 11/9/93 ،اصلاح: 23/10/93 ،پذیرش:28/11/93

چکیده

زمینه و هدف: سرطان ریه به­علت شانس پایین زنده­ماندن از مهم‌ترین و کشنده‌ترین نوع سرطان محسوب می‌شود و بیشترین میزان مرگ‌ومیر را در مقایسه با سرطان‌های سینه، پروستات و سایر سرطان‌های چندگانه دارد. هدف از این مطالعه، تحلیل داده‌های بقای بیماران مبتلا به سرطان ریه در استان آذربایجان غربی می‌باشد.

مواد و روشها: در این مطالعه همگروهی تاریخی اطلاعات مربوط به 355 بیمار مراجعه­کننده به بیمارستان‌های استان آذربایجان غربی در فاصله سال‌های 93-1386 مورد بررسی و وضعیت بقای بیماران تا پایان خرداد 1393 مورد پیگیری قرارگرفت. داده‌ها شامل اطلاعات دموگرافی و هیستوپاتولوژیک هستند. زمان بقای بیماران از زمان تشخیص تا مرگ یا پایان مطالعه در نظرگرفته­شد. برای تحلیل داده‌ها و رده بندی بیماران از مدل درخت تصمیم استفاده­گردید. کلیه­ی تحلیل‌ها با استفاده از نرم‌افزار R صورت­گرفت.

یافته­ها: میانگین و میانه­ی زمان بقا برای 355 بیمار مبتلا به سرطان ریه به­ترتیب 13 ماه و 4/8 ماه برآوردگردید. احتمال بقای 1ساله 39 درصد بوده و تنها 7 درصد از بیماران، بقای 3 ساله را تجربه کرد­بودند. مدل درخت تصمیم متغیرهای وضعیت درمان، EasternCooperativeOncology Group (ECOG)، وضعیت سیگاری بودن، سنّ تشخیص بیماری و مرحله­ی تومور به­عنوان متغیرهای مهم شناسایی­کرد.

نتیجه­گیری: استفاده از مدل درخت ردهبندی، می‎تواند منجر به شناسایی ریسک فاکتورهای مهم و موثر بر بقای بیماران شود و شناسایی این عوامل در بیماران سرطانی می‏‎تواند باعث جلوگیری از پیشرفت بیماری شده و زمان بقای بیماران را افزایش دهد.

واژه های کلیدی: سرطان ریه، ایران، درخت تصمیم، بقا.

 

 

 

مقدّمه

سرطان، یکی از مهم‌ترین علت­های اختلالات، مرگ‌ومیر و ناتوانی در سراسر جهان است(1). این بیماری که یکی از بیماری‌های شایع و درحال افزایش است، حجم زیادی از تلاش‌های نظام‌های مراقبتی را به خود اختصاص می­دهد(2, 3). سرطان، نوعی بیماری است که در آن، سلول­های غیرطبیعی به­شکل غیرقابل مهار تقسیم می­شوند و قادرند به سایر بافت­های بدن گسترش یابند(4). سرطان در ایران بعد از بیماری‌های قلبی‌ـ‌عروقی و سوانح، سومین علت مرگ‌ومیر می‌باشد(5). سرطان­ها در ایران باعث تحمیل 2/662 دالی(Disability Adjusted Life Years:DALY) در هر صد هزار نفر می‌شوند و سرطان ریه، بعد از سرطان معده با ایجاد 3/56 دالی در رتبه­ی دوم می‌باشد(3). سرطان ریه، بیشترین میزان مرگ‌ومیر را در مقایسه با سرطان‌های سینه، پروستات و سایر سرطان‌های چندگانه (ابتلای فرد به بیش از یک سرطان) دارد(6). سرطان ریه به­علت شانس پایین زنده‌ماندن از مهم‌ترین و کشنده‌ترین نوع سرطان محسوب­میگردد. به­طوری­که تنها 13% از ابتلایان به سرطان ریه پنج سال پس از تشخیص زنده می­مانند(7, 8).

     براساس تقسیم‌بندی انجمن سرطان آمریکا (American Cancer Society) دو نوع سرطان وجود دارد: سرطان ریه با یاخته‌های کوچک(Smell cell lung cancer; SCLC) و سرطان ریه با یاخته‌های غیرکوچک (Non-Small cell lung cancer; NSCLC)(9). متأسفانه چندین سال طول می‌کشد تا نشانه‌های سرطان ریه خود را بروز دهد. لذا در بیشتر مواقع این بیماری در مراحل بسیار پیشرفته تشخیص­داده می‌شود(10, 11). میزان بقا پس از تشخیص، درمان و بررسی عوامل خطرساز در بیماران سرطانی یکی از شاخص­های مهم در کنترل بیماری و ارزیابی روش­های درمانی مورد استفاده است(12). در اکثر تحقیقات پزشکی از مدل نیمه پارامتری کاکس برای ارزیابی عوامل استفاده­شده­است(6, 13-16). مدل کاکس بر فرض اساسی، بر متناسب بودن خطرات مبتنی است که در بیشتر داده‌ها ممکن است این فرض برقرار نباشد. لذا  در دو دهه­ی اخیر، تکنیک‌های دیگری از قبیل روش‌های مبتنی بر مدل‌های درختی(Tree- based methods)، که به آن‌ها «روش‌های افراز بازگشتی(Recursive partitioning methods)» نیز گفته­می‌شود، رواج­یافته‌اند(17). این مدل‌ها روش‌های تحلیلی قدرتمندی برای کشف ساختار داده‌ها به­شمارمی‌روند و کاربرد بسیار گسترده‌ای در علوم پزشکی دارند.(18). این مدل برای آنالیز اکتشافی داده‌ها با استفاده از قواعد منطقی و ایجاد رده­بندی ساده و قابل تفسیر به­کارمی‌روند(19). روش‌های مبتنی بر مدل‌های درختی در ابتدا تحت عنوان «رده­بندی و رگرسیون درختی» توسط مورگان و سونیکیست(Morgan and Sonquist) در سال 1963 برای بررسی اثرات متقابل متغییرها در داده‌های علوم اجتماعی پیشنهادشدند و سپس به‌طور جامع‌تر توسط بریمن(Breiman) در سال 1984 مورد بررسی قرارگرفتند(20) این مدل‌ها برای اولین بار توسط الشن(Olshen) در زمینه­ی تحقیقات بالینی به­کار گرفته­شدند(21). این مدل‌ها به دلیل عدم نیاز به پیش‌فرض‌های ضروری در روش‌های پارامتری و سادگی تفسیر نتایج، در آنالیز بقا نیز توسعه­یافته و در رده­بندی بیماران در معرض عوامل خطر و پیش‌بینی نرخ بقا، به‌کارگرفته­می‌شوند(18). با توجه به مطالعات اندک در زمینه رده بندی نرخ بقای بیماران با استفاده از مدل درخت تصمیم در ایران، هدف از این مطالعه، ارایه­ی فاکتورهای پیش‌آگهی مهم و تعیین زیر گروه­های همگن در بیماران مبتلا به سرطان ریه است.

 

مواد و روش ها

در این مطالعه که به­صورت کوهورت تاریخی انجام­گرفته­است، داده­ها از پرونده­ی 355 بیمار مبتلا به سرطان ریه در فاصله­ی سال­های 1386 تا 1393 که به بیمارستان‌های استان آذربایجان غربی مراجعه­کرده­اند، ثبت گردید. شرط ورود به مطالعه برای بیماران، تشخیص سرطان ریه درنظرگرفته شده و گزارش پاتولوژی این بیماران در بیمارستان­های مربوط موجوداست. مدت زمان بقای بیماران از زمان تشخیص بیماری آن­ها تا 15 خرداد 93 برحسب ماه تعیین­شد که در این زمان، افراد یا پیشامد مرگ را تجربه­کرده(رخداد مورد نظر) و یا زنده مانده بودند(سانسور راست). ازطریق تماس تلفنی، مرگ یا زنده ماندن بیماران پیگیری و تاییدگردید و افرادی که مرگ آن­ها علت­هایی غیر از بیماری سرطان ریه داشت به­عنوان سانسور منظورگردید. افرادی که دارای عود بیماری بودند در این مطالعه درنظرگرفته­نشدند. برای همه بیماران بر اساس اطلاعات موجود در پرونده­ی بیمارستانی، متغیرهای دموگرافیک همچون: سنّ تشخیص بیماری، جنسیّت و متغیرهای بیولوژیک شامل عملکرد ECOG، مصرف دخانیات، نوع تومور، مرحله­ی بیماری، گسترش بیماری(Metastasis)، وضعیت درمان (بیمارانی که یک یا بیش از یک روش درمان کموتراپی، رادیوتراپی و جراحی را تجربه کرده­بودند و بیمارانی که به­علت عدم رضایت بیمار یا همراهان بیمار یا ناتوانی شدید جسمانی و بیماری­های زمینه­ای دیگر، درمان اختصاصی دریافت نکرده­بودند)، استخراج و ثبت گردید.

 

تحلیل‌های آماری

     در روش‌های مبتنی بر مدل‌های درختی، برای برازش مدل، تمام افرازهای ممکن برای هر متغیر کمکی ارزیابی می‌شوند. درنهایت متغیر کمکی و نقطه­ی برشی برای افراز داده‌ها انتخاب خواهدشد که بیشترین کاهش در ناخالصی را ارایه­دهند. منظور از ناخالصی، بیان ناهمگنی داده‌ها در یک گره است. کاهش ناخالصی در گره p که به دو گره چپ و راست افراز می‌شود به صورت ذیل به­دست­می‌آید:

G(p)=R(p)-[R(l(p))+R(r(p))]

که در آن R(p) باقیمانده­ی خطا در یک گره است، R(r(p)) باقیمانده­ی خطا در گره راست و R(l(p)) باقیمانده­ی خطا در گره چپ، ناشی از افراز گره p هستند. در بیشتر تکنیک‌های افراز بازگشتی برای داده‌های سانسور شده­ی بقا، برای محاسبه G(p) بین دو گره، از آماره لگاریتم رتبه‌ای استفاده­می‌شود. آمار لگاریتم رتبه‌ای برای یک افراز s که گره ریشه‌ای p را به گره‌های راست r و چپ l افراز می‌کند به صورت ذیل تعریف­می‌شود:

 

اینجا  متغیر تصادفی متناظر با تعداد رخداد مورد نظر (مشاهدات سانسورنشده) در گره راست برای i‌امین گره است.

فرض صفر که به­وسیله­ی این آماره آزمون می‌شود، یکسان­بودن نرخ شکست در دو گره راست و چپ ناشی از افراز است.  در آن ثابت است و برای وزن دهی به گره‌های مربوط است. بنابراین معنادارشدن این آزمون به­معنای انتخاب یک متغیر با نقطه­ی برش مناسب برای افراز است. با استفاده از افراز بازگشتی مبتنی بر آماره­ی شرح داده‌شده، درنهایت گره‌هایی از افراد با ویژگی‌های مشابه (همگن) تشکیل خواهندشد و گره‌ها دارای حداکثر تفاوت ممکن در نرخ شکست (احتمال بقا) خواهندبود. به عبارت دیگر، افراد به زیرگروه‌های همگن با حداکثر تفاوت برحسب پاسخ مورد نظر افراز خواهندشد. فرایند افراز درخت تا جایی ادامه می­یابد که تمام مشاهدات درون گره‌های پایانی دارای توزیع یکسانی باشند. در هر فرآیند افراز مدل‌سازی، هدف رسیدن به یک مدل بهینه است.

درختِ بهینه، درختی است که از لحاظ اندازه و برآورد اشتباه، بهینه باشد. معنادار بودن نرخ بقای زیر گروه­ها با استفاده از آزمون لگاریتم رتبه­ای نشان­دهنده­ی بهینه­بودن درخت و در نهایت کارایی مدل است. در روش­های مبتنی بر مدل­های درختی، برای رسیدن به درخت بهینه، با استفاده از تکنیک‌های هرس، درخت را هرس کرده و نایتاً با استفاده از قاعده‌ی‌ مناسب، درختی با مینیمم خطا و اندازه مناسب انتخاب می‌گردد. برای هرس کردن درخت تصمیم دو روش کلی پیشنهاد شده­است: روش مبتنی بر تغییرات درون گره­ای که بر اساس تکنیک هزینه ـ پیچیدگی درخت است و روش مبتنی بر اختلاف بین گره‌ها که بر اساس تکنیک افراز ـ پیچیدگی است(19, 20). در این مطالعه برای هرس­کردن درخت تصمیم از روش هزینه ـ پیچیدگی که پیش­فرض بسته نرم­افزاری مورد استفاده می­باشد، استفاده­­گردیده است. برای تحلیل اطلاعات، از آزمون­های تی مستقل و لگاریتم رتبه­ای و برای برازش مدل درخت بقا از نرم‌افزار R و بسته­ی نر­م­افزاری partykit استفاده شد. 

 

یافته­ها

تعداد بیماران مورد بررسی، 355 نفر بود که 240 نفر فوت­کرده و 115 نفر سانسور(censoring ) شده بودند. 1/72 درصد افراد مبتلا (256 نفر)، مرد و 9/27 درصد افرا مبتلا (99 نفر)، زن بودند ( نسبت مردها به زن‌ها برابر 6/2 می‌باشد). میانگین سنّ تشخیص افراد مبتلا 5/13±5/63 سال تعیین شد (با دامنه­ی 91-11 سال). میانگین سنّ تشخیص سرطان برای مردان 4/12±65 سال و برای زنان 5/16±4/59 سال به­دست آمد که میانگین سنّ تشخیص سرطان برای مردان و زنان ازنظر آماری، متفاوت بود (P=0/002). 49 درصد از مردان و 62 درصد از زنان مبتلا به سرطان ریه در سنین زیر 65 سال و  4/20 درصد مردان و 4/14 درصد زنان در رده­ی سنّی بالای 75 سال قرار داشتند. میانگین و میانه­ی زمان بقا برای بیماران به­ترتیب، 13 ماه و 4/8 ماه حاصل شد.

 

 
   

     با استفاده از روش کاپلان مایر میزان بقای 1ساله، 2ساله و 3 ساله به­ترتیب 39 درصد، 18 درصد و 07/0 درصد به­دست آمد. در برازش مدل در اولین مرحله مهم‌ترین متغیری که برای افراز داده‌ها انتخاب­می‌شود، متغیر وضعیت درمان بیماران با P<0.001 می‌باشد. با تکرار الگوریتم برای گره‌های حاصل از افراز مرحله­ی اول، متغیر ECOG با P=0.006 به­عنوان مهم‌ترین متغیر بعدی برای بیمارانی که در گره چپ (دریافت درمان) و متغیر وضعیت سیگاری بودن با P=0.007 برای بیمارانی که در گره راست (عدم دریافت درمان) حاصل از افراز در مرحله­ی اول هستند، انتخاب­می‌شوند. متغیرهای سنّ در زمان تشخیص و مرحله­ی تومور به­عنوان متغیرهای مهم دیگر شناسایی شدند. شکل 1 مدل درخت تصمیم و زیرگروه‌های افراز شده­ی بیماران به همراه مهم‌ترین متغیرهای انتخاب شده را نشان­می‌دهد. در جدول شماره­ی 1 میانگین و میانه بقا در زیر گروه‌های حاصل از مدل درخت تصمیم آورده شده است. براین اساس بیمارانی که درمان دریافت کرده­بودند و دارای مرحله­ی I,II,III از متغیر ECOG و بالای 58 سال بودند، دارای بالاترین بقا (با میانه بقای 22.26 و میانگین بقای 19.27) محسوب می­شدند و بیمارانی که در رده­ی عدم دریافت درمان، سیگاری و دارای مرحله­ی تومور IV بودند کمترین بقا را (با میانه بقای 2 و میانگین بقای 3.82) تجربه­کرده­بودند. نتیجه­ی آزمون لگاریتم رتبه‌ای برای مقایسه  نرخ بقا در شش زیر گروه، بیانگر اختلاف معنادار بین این زیر گروه‌ها هست (P<0.001) که نشان دهنده­ی کارایی مدل می‌باشد.

 

بحث

مدل‌های رده­بندی درختی، هیچ نوع پیش­فرض‌ها و محدودیت‌هایی را که برای مدل‌های پارامتری و نیمه پارامتری برقراراست، شامل نمی‌شوند. مدل‌های رده­بندی درختی علاوه بر شناسایی و معرفی متغیرهای مهم، زیرگروه‌های همگنی از بیماران را برای تحقیقات بالینی بعدی ارایه­می‌دهد. ارایه­ی این زیرگروه‌ها برای انتخاب پروتکل‌های درمانی، مؤثر و در طراحی کارآزمایی بالینی برای مطالعات بعدی بسیار مفید است.

یافته‌های حاصل از مدل درخت تصمیم، متغیر وضعیت درمان را به­عنوان مهم‌ترین فاکتور پیش‌آگهی معرفی­می‌کند. مطالعات مختلفی در این زمینه وجوددارد که مهم و مؤثربودن متغیر وضعیت درمان بر بقای بیماران را تأییدمی‌کند که ازمیان آن­ها می‌توان به مطالعه­ی زهیر و همکاران در سال 2012 و مطالعه­ی برگمنس و همکاران در سال 2005 اشاره­کرد (6, 22).

در ارزیابی فاکتورهای پاتولوژیک، عملکردی براساس سیستمEastern Cooperative Oncology Group (ECOG)، به­عنوان دیگر متغیر مهم  شناسایی شد. به­گونه­ای­که کمترین میزان بقا برای بیمارانی که در رده­ی دریافت درمان قرارداشتند، با میزان 8.1 ماه مربوط به مرحله­ی V از متغیر  ECOG بود.


در مطالعات میتسودومی و همکاران (23)، کاواگوجی و همکاران(24) وضعیت سیگاری بودن یا نبودن، متغیرِ تأثیرگذاری بر زمان بقا می‌باشد. در مطالعه­ی ما نیز این مقوله به­عنوان متغیر مهم شناسایی شد، ولی مطالعه­ی شو و همکاران(25) با این موضوع همخوانی ندارند و وضعیت سیگار، به­عنوان متغیرِ تأثیرگذاری معرفی نشده ­است.

بر پایه­ی مطالعه ما میانگین سنّ تشخیص بیماری 5/13±5/63 با مطالعه­ی داخل کشور و خارج کشور همخوانی داشت(6, 26). در این مطالعه سنّ تشخیص بیماری مانند مطالعات (6, 27) متغیر مهمی تشخیص داده­شد. انتخاب نقطه­ی افراز 58 سال برای سنّ تشخیص بیماری، بر اساس یافتن بیشترین اختلاف بین میزان بقای دو زیرگروه می‌باشد.

  مرحله­ی تومور دیگر متغیر مهم در این مطالعه با استفاده از مدل درخت تصمیم بود. در مطالعه­ی کاواگوچی و همکاران نیز این متغیر عامل مؤثری بر میزان بقای بیماران تشخیص داده‌شده است(24). با این­که جنسیّت یکی از فاکتورهای مؤثر در بقاست، اما مطالعه­ی ما این متغیر را مهم نشان نداد. هرچند با مطالعه­ی زهیر و همکاران همخوانی داشت(6)، اما برخی مطالعات نیز نشان داد که بقا برای زنان بیشتر از مردان است(27, 28).

در این مطالعه نوع تومور متغیر با اهمّیّتی تشخیص داده­نشد که این مورد، اگرچه با مطالعات داخلی همخوانی داشت(6, 29)، اما با مطالعات سایر کشورها متفاوت بود. مطالعات در سایر کشورها نشان­می‌دهد نوع تومور متغیر تأثیرگذاری بر بقای بیماران می‌باشد(8, 30).

باتوجه به نتایج این مطالعه، استفاده از مدل درخت رده‎بندی، می‎تواند منجر به شناسایی ریسک فاکتورهای مهم و موثر بر بقای بیماران شود و شناسایی این عوامل در بیماران سرطانی می‏‎تواند باعث جلوگیری از پیشرفت بیماری شده و زمان بقای بیماران را افزایش دهد.

 

تشکر و تقدیر

نویسندگان مقاله بر خود لازم­می­دانند از کلیه­ی کارکنان بیمارستان­های استان آذربایجان غربی که در جمع­آوری اطلاعات مورد نیاز این تحقیق، همکاری کرده‌اند، تشکر و قدردانی نمایند. این مقاله برگرفته از پایان‌نامه­ی دوره­ی کارشناسی ارشد گروه آمار زیستی و اپیدمیولوژی دانشگاه علوم پزشکی همدان می­باشد.

 

 

 

 

 

References

 1. Haghshenas M, Golini-Moghaddam T, Rafiei A, Emadeian O, Shykhpour A, Ashrafi GH. Prevalence and type distribution of high-risk human papillomavirus in patients with cervical cancer: a population-based study. Infect Agent Cancer. 2013;8(1):20.
 2. Bollschweiler E, Wolfgarten E, Nowroth T, Rosendahl U, Mönig SP, Hölscher AH. Vitamin intake and risk of subtypes of esophageal cancer in Germany. J Cancer Res Clin Oncol. 2002;128(10):575-80.
 3. Ghanbari N, Golestan Jahromi F, Bani Hashem K, Moazen M. The Effect of Stress Inoculation Training (SIT) on Depression and Anxiety in Patients with prostate Cancer.journal of sabzevar university of medical sciences. J Sabzevar Univ Med Sci. 2014;21(5):735-42.[Persian]
 4. Hamta A, Ghazzafi S. The study of Thymus vulgaris cytotoxicity effects on breast cancer cell's line. 3. 2015; 21 (1) :122-30. [Persian]
 5. Mousavi SM, Gouya MM, Ramazani R, Davanlou M, Hajsadeghi N, Seddighi Z. Cancer incidence and mortality in Iran. Ann Oncol. 2009;20(3):556-63.
 6. Zahir ST, Mirtalebi M. Survival of patients with lung cancer, Yazd, Iran. AsianPac J Cancer Prev. 2012;13(9):4387-91.
 7. Özlu T, Bulbul Y. Smoking and lung cancer. Tüberküloz ve Toraks Dergisi. 2005;53(2):200-9.
 8. Haraguchi S, Koizumi K, Mikami I, Junichi O, Iijima Y, Ibi T, et al. Clinicopathological characteristics and prognosis of non-small cell lung cancer patients associated with a family history of lung cancer. Int J Med Sci. 2012;9(1):68.
 9. Macdonald F, Ford C, Casson A. Molecular biology of cancer: Taylor & Francis; 2004.
 10. Longo DL, Fauci AS, Kasper DL,Hauser SL, Jameson JL, Loscalzo J. Harrison's principles of internal medicine: McGraw-Hill Medical New York; 2008.
 11. Silvestri GA, Alberg AJ, Ravenel J. The changing epidemiology of lung cancer with a focus on screening. BMJ. 2009:451-4.
 12. Kleinbaum DG, Klein M. Survival analysis: a self-learning text: Springer; 2005.
 13. Schabath MB, Thompson ZJ,Gray JE. Temporal trends in demographics and overall survival of non-small cell lung cancer patients at the Moffitt Cancer Center from 1986 to 2008.Cancer Control. 2014; 21(1): 51–6.
 14. Santoro IL, Ramos RP, FranceschiniJ, Jamnik S, Fernandes ALG. Non-small cell lung cancer in never smokers: a clinical entity to be identified. Clinics. 2011;66(11):1873-7.
 15. Grose D, Devereux G, Brown L, Jones R, Sharma D, Selby C, et al. Simple and objective prediction of survival in patients with lung cancer: staging the host systemic inflammatory response. Lung Cancer International. 2014;2014.
 16. Goksel T, Eser S, Guclu SZ, Karadag M, Cilli A, Ozlu T, et al. Prognostic factors affecting survival in cases with lung cancer [A lung cancer mapping project in Turkey (LCMPT)]. European Respiratory Journal. 2013;42(Suppl 57):P2920.
 17. Schumacher M, Holla¨nder N, Schwarzer G. Prognostic factorsstudies, in Crowley J (ed): Handbook of Statistics in Clinical Oncology.New-York, NY, Marcel Dekker. 2001: 321-78.
 18. Saki Malehi A, Hajizadeh E, Fatemi R. Evaluation of Prognostic Variables  for Classifying the Survival In Colorectal Patients using The Decision Tree. Iran J Epidemiol. 2012; 8 (2) :13-9. [Persian]
 19. Zhang H, Singer B. Recursive partitioning in the health sciences: Springer; 1999.
 20. Negassa A, Ciampi A, Abrahamowicz M, Shapiro S, Boivin J-F. Tree-structured subgroup analysis for censored survival data: validation of computationally inexpensive model selection criteria. Statistics and computing. 2005;15(3):231-9.
 21. Breiman L, Friedman J, Stone CJ, Olshen RA. Classification and regression trees: CRC press; 1984.
 22. Berghmans T, Paesmans M, Meert AP, Mascaux C, Lothaire P, Lafitte JJ, et al. Survival improvement in resectable non-small cell lung cancer with (neo)adjuvant chemotherapy: results of a meta-analysis of the literature. Lung Cancer. 2005;49(1):13-23.
 23. Mitsudomi T, Morita S, Yatabe Y, Negoro S, Okamoto I, Tsurutani J, et al. Gefitinib versus cisplatin plus docetaxel in patients withnon-small-cell lung cancer harbouring mutations of the epidermal growth factor receptor (WJTOG3405): an open label, randomised phase 3 trial. Lancet Oncol. 2010;11(2):121-8.
 24. Kawaguchi T, Takada M, Kubo A, Matsumura A, Fukai S, Tamura A, et al. Gender, histology, and time of diagnosis are important factors for prognosis: analysis of 1499 never-smokers with advanced non-small cell lung cancer in Japan. J Thorac Oncol. 2010;5(7):1011-7.
 25. Shaw AT, Yeap BY, Solomon BJ, Riely GJ, Gainor J, Engelman JA, et al. Effect of crizotinib on overall survival in patients with advanced non-small-cell lung cancer harbouring< i> ALK</i> gene rearrangement: a retrospective analysis.Lancet Oncol. 2011;12(11):1004-12.
 26. Arrieta Ó, Núñez-Valencia C, Reynoso-Erazo L, Alvarado S, Flores-Estrada D, Angulo LP, et al. Health-related quality of life in patients with lung cancer: validation of the Mexican-Spanish version and association with prognosis of the EORTC QLQ-LC13 questionnaire. Lung Cancer. 2012;77(1):205-11.
 27. Puri V, Garg N, Engelhardt EE, Kreisel D, Crabtree TD, Meyers BF, et al. Tumor location is not an independent prognostic factor in early stage non-small cell lung cancer. Ann Thorac Surg. 2010;89(4):1053-9.
 28. Battafarano RJ, Piccirillo JF, Meyers BF, Hsu H-S, Guthrie TJ, Cooper JD, et al. Impact of comorbidity on survival after surgical resection in patients with stage I non–small cell lung cancer. J Thorac Cardiovasc Surg. 2002;123(2): 280-7.
 29. Hajmanoochehri F, Mohammadi N, Zohal MA, Sodagar A, Ebtehaj M. Epidemiological and clinicopathological characteristics of lung cancer in a teaching hospital in iran. Asian Pac J Cancer P. 2014;15(6):2495.
 30. JiangX, de Groh M, Liu S, Liang H, Morrison H. Rising incidence of adenocarcinoma of the lung in Canada. Lung Cancer. 2012;78(1):16-22.

 

 

 

 

 

 


Evaluation of Prognostic Variables for Classifying the Survival In lung cancer Patients using The Decision Tree

 

Malek Abazari.,

Department of Epidemiology and Biostatistics, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran.

 

Reza Abazari.,

Young Researchers and Elite Club, Ardabil Branch, Islamic Azad University, Ardabil, Iran.

 

 Ghodratollah Roshanaei.,

Assistant professor,  Modeling of Noncommunicable diseases Research center, Department of Biostatistics and Epidemiology, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran.

 

Mahdia Gholamnejad.,

 Pulmonology Department, Urmia University of Medical Sciences, Urmia, Iran.

 

Yousef Roosta.,

 Resident of Internal Medicine, Urmia University of Medical Sciences, Urmia, Iran.

 

* Hossein Mahjub .,

Research Center for Health Sciences and Department of Biostatistics & Epidemiology, School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran.

 

Received:02/12/2014, Revised:13/01/2015, Accepted:17/02/2015


Abstract

Background & Objectives: Lung cancer due to low chance of survival is the most important and the most common fatal cancer and has the highest mortality rates compared to breast and prostate cancer and other multiple cancers. The purpose of this study is to analyze survival data of patients having lung cancer in the province of West Azerbaijan.

Materials & Methods: The information of this study is relevant to 355 patient’s referred to hospitals exiting in West Azerbaijan province between 1386-93. The situation of the patients was followed up until the end of the Khordad 1393. The data are compromized from Histopathologic and demographic information. For analyzing the data and classifying the patients, the model of decision tree was used. All analysis and synthesis were performed using the software of R.

Results: The mean and the median time of survival for 355 patients having lung cancer were estimated 13 and 4.8 months, respectively. The probable of 1-year surviving was about 39% and only 7% of patients had experienced 3-year survival. The model of decision tree of state therapy variables, Eastern Cooperative Oncology Group (ECOG), smoking status, age of diagnosis and tumor stage were identified as important variables.

Conclusion: The model of classification tree can identify the important and effective risk factors on the survival of the patients and identifying these factors in the cancer patients can prevent progression of the disease and increase survival time of patients.

Keywords: Lung Neoplasm; Decision Tree; Survival; Iran.

 

Correspond Author: 

Hossein Mahjub ,

School of Public Health, Hamadan University of Medical Sciences, Hamadan, Iran.

E-mail: mahjub@umsha.ac.ir

 1. Haghshenas M, Golini-Moghaddam T, Rafiei A, Emadeian O, Shykhpour A, Ashrafi GH. Prevalence and type distribution of high-risk human papillomavirus in patients with cervical cancer: a population-based study. Infect Agent Cancer. 2013;8(1):20.
 2. Bollschweiler E, Wolfgarten E, Nowroth T, Rosendahl U, Mönig SP, Hölscher AH. Vitamin intake and risk of subtypes of esophageal cancer in Germany. J Cancer Res Clin Oncol. 2002;128(10):575-80.
 3. Ghanbari N, Golestan Jahromi F, Bani Hashem K, Moazen M. The Effect of Stress Inoculation Training (SIT) on Depression and Anxiety in Patients with prostate Cancer.journal of sabzevar university of medical sciences. J Sabzevar Univ Med Sci. 2014;21(5):735-42.[Persian]
 4. Hamta A, Ghazzafi S. The study of Thymus vulgaris cytotoxicity effects on breast cancer cell's line. 3. 2015; 21 (1) :122-30. [Persian]
 5. Mousavi SM, Gouya MM, Ramazani R, Davanlou M, Hajsadeghi N, Seddighi Z. Cancer incidence and mortality in Iran. Ann Oncol. 2009;20(3):556-63.
 6. Zahir ST, Mirtalebi M. Survival of patients with lung cancer, Yazd, Iran. AsianPac J Cancer Prev. 2012;13(9):4387-91.
 7. Özlu T, Bulbul Y. Smoking and lung cancer. Tüberküloz ve Toraks Dergisi. 2005;53(2):200-9.
 8. Haraguchi S, Koizumi K, Mikami I, Junichi O, Iijima Y, Ibi T, et al. Clinicopathological characteristics and prognosis of non-small cell lung cancer patients associated with a family history of lung cancer. Int J Med Sci. 2012;9(1):68.
 9. Macdonald F, Ford C, Casson A. Molecular biology of cancer: Taylor & Francis; 2004.
 10. Longo DL, Fauci AS, Kasper DL,Hauser SL, Jameson JL, Loscalzo J. Harrison's principles of internal medicine: McGraw-Hill Medical New York; 2008.
 11. Silvestri GA, Alberg AJ, Ravenel J. The changing epidemiology of lung cancer with a focus on screening. BMJ. 2009:451-4.
 12. Kleinbaum DG, Klein M. Survival analysis: a self-learning text: Springer; 2005.
 13. Schabath MB, Thompson ZJ,Gray JE. Temporal trends in demographics and overall survival of non-small cell lung cancer patients at the Moffitt Cancer Center from 1986 to 2008.Cancer Control. 2014; 21(1): 51–6.
 14. Santoro IL, Ramos RP, FranceschiniJ, Jamnik S, Fernandes ALG. Non-small cell lung cancer in never smokers: a clinical entity to be identified. Clinics. 2011;66(11):1873-7.
 15. Grose D, Devereux G, Brown L, Jones R, Sharma D, Selby C, et al. Simple and objective prediction of survival in patients with lung cancer: staging the host systemic inflammatory response. Lung Cancer International. 2014;2014.
 16. Goksel T, Eser S, Guclu SZ, Karadag M, Cilli A, Ozlu T, et al. Prognostic factors affecting survival in cases with lung cancer [A lung cancer mapping project in Turkey (LCMPT)]. European Respiratory Journal. 2013;42(Suppl 57):P2920.
 17. Schumacher M, Holla¨nder N, Schwarzer G. Prognostic factorsstudies, in Crowley J (ed): Handbook of Statistics in Clinical Oncology.New-York, NY, Marcel Dekker. 2001: 321-78.
 18. Saki Malehi A, Hajizadeh E, Fatemi R. Evaluation of Prognostic Variables  for Classifying the Survival In Colorectal Patients using The Decision Tree. Iran J Epidemiol. 2012; 8 (2) :13-9. [Persian]
 19. Zhang H, Singer B. Recursive partitioning in the health sciences: Springer; 1999.
 20. Negassa A, Ciampi A, Abrahamowicz M, Shapiro S, Boivin J-F. Tree-structured subgroup analysis for censored survival data: validation of computationally inexpensive model selection criteria. Statistics and computing. 2005;15(3):231-9.
 21. Breiman L, Friedman J, Stone CJ, Olshen RA. Classification and regression trees: CRC press; 1984.
 22. Berghmans T, Paesmans M, Meert AP, Mascaux C, Lothaire P, Lafitte JJ, et al. Survival improvement in resectable non-small cell lung cancer with (neo)adjuvant chemotherapy: results of a meta-analysis of the literature. Lung Cancer. 2005;49(1):13-23.
 23. Mitsudomi T, Morita S, Yatabe Y, Negoro S, Okamoto I, Tsurutani J, et al. Gefitinib versus cisplatin plus docetaxel in patients withnon-small-cell lung cancer harbouring mutations of the epidermal growth factor receptor (WJTOG3405): an open label, randomised phase 3 trial. Lancet Oncol. 2010;11(2):121-8.
 24. Kawaguchi T, Takada M, Kubo A, Matsumura A, Fukai S, Tamura A, et al. Gender, histology, and time of diagnosis are important factors for prognosis: analysis of 1499 never-smokers with advanced non-small cell lung cancer in Japan. J Thorac Oncol. 2010;5(7):1011-7.
 25. Shaw AT, Yeap BY, Solomon BJ, Riely GJ, Gainor J, Engelman JA, et al. Effect of crizotinib on overall survival in patients with advanced non-small-cell lung cancer harbouring< i> ALK gene rearrangement: a retrospective analysis.Lancet Oncol. 2011;12(11):1004-12.
 26. Arrieta Ó, Núñez-Valencia C, Reynoso-Erazo L, Alvarado S, Flores-Estrada D, Angulo LP, et al. Health-related quality of life in patients with lung cancer: validation of the Mexican-Spanish version and association with prognosis of the EORTC QLQ-LC13 questionnaire. Lung Cancer. 2012;77(1):205-11.
 27. Puri V, Garg N, Engelhardt EE, Kreisel D, Crabtree TD, Meyers BF, et al. Tumor location is not an independent prognostic factor in early stage non-small cell lung cancer. Ann Thorac Surg. 2010;89(4):1053-9.
 28. Battafarano RJ, Piccirillo JF, Meyers BF, Hsu H-S, Guthrie TJ, Cooper JD, et al. Impact of comorbidity on survival after surgical resection in patients with stage I non–small cell lung cancer. J Thorac Cardiovasc Surg. 2002;123(2): 280-7.
 29. Hajmanoochehri F, Mohammadi N, Zohal MA, Sodagar A, Ebtehaj M. Epidemiological and clinicopathological characteristics of lung cancer in a teaching hospital in iran. Asian Pac J Cancer P. 2014;15(6):2495.
 30. JiangX, de Groh M, Liu S, Liang H, Morrison H. Rising incidence of adenocarcinoma of the lung in Canada. Lung Cancer. 2012;78(1):16-22.