زمینه و هدف: سرطان پستان شایعترین سرطان و اصلیترین علت مرگ ناشی از سرطان در زنان سراسر جهان بهشمار میرود. تکنولوژیهایی مثل داده کاوی، به متخصصان این حوزه، امکان بهبود تصمیمگیری را در زمینهی تشخیص زودهنگام فراهم آوردهاند. هدف از این پژوهش توسعهی مدل تشخیص خودکار سرطان پستان با بهکارگیری روشهای داده کاوی و انتخاب مدل بومی ویژه بیماران استان فارس با بالاترین دقت تشخیص میباشد.
روش بررسی: در این مطالعه، تعداد 654 پرونده در دسترس از بیماران کلینیک تخصصی سرطان پستان مطهری شیراز بهعنوان نمونه مورد استفاده قرار گرفت که بعد از عملیات پیش پردازش این تعداد به 621 پرونده کاهش یافت. برای هر کدام از نمونهها دارای 22 ویژگی در پرونده پزشکی ثبت شده بود که در نهایت 10 ویژگی تاثیرگذار در ساخت مدل استفاده شد. از سه روش درخت تصمیم، بیز ساده و شبکه عصبی مصنوعی بهمنظور تشخیص ابتلا به سرطان پستان و روش 10-fold cross-validation برای ساخت و ارزیابی مدل بر روی مجموعه دادهی جمعآوری شده بهره گرفته شد.
یافتهها: نتایج بهدست آمده از سه تکنیک ذکر شده نشان داد که هر سه مدل، نتایج امیدبخشی در تشخیص این سرطان دارند. در نهایت، شبکه عصبی مصنوعی، بالاترین دقت 94/49%(حساسیت 96/19%، ویژگی 86/36%)، در تشخیص ابتلا به سرطان پستان به خود اختصاص داد.
نتیجه گیری: بر طبق نتایج حاصل از درخت تصمیم ایجاد شده، ریسک فاکتورهایی چون سن، وزن، سن شروع قاعدگی، یائسگی، مدت زمان مصرف OCP و سن اولین بارداری از جمله عوامل موثر در ابتلای زنان به سرطان پستان در استان فارس شناخته شدند.