جستجو در مقالات منتشر شده


1 نتیجه برای پایگاه داده زیستی

تارا غفوری، نگین معنوی‌زاده،
دوره 80، شماره 7 - ( 7-1401 )
چکیده

زمینه و هدف: در مطالعه حاضر، یک رویکرد انتخاب ویژگی ترکیبی از روشهای فیلتر و بسته‌بندی، با هدف تشخیص وضعیت بیماری و بقای بیمار، برای تعدادی از مجموعه دادگان علوم زیستی با تعداد متفاوت نمونه، ویژگی و کلاس پیاده‌سازی می‌شود؛ بنابراین، این راهبرد از مزایای هر دو روش، شامل سرعت عملکرد، تعمیم‌پذیری و دقت بالا بهره می‌برد.
روش بررسی: الگوریتم‌های انتخاب ویژگی در چارچوب بازشناسی آماری الگو در نرم‌افزار Matlab R2021a طی فروردین و اردیبهشت 1401 مدل‌سازی شده‌اند. ابتدا ویژگی‌ها بر پایه اطلاعات متقابل بهنجار شده رتبه‌بندی می‌شوند و یک زیرمجموعه ویژگی بهینه با بالاترین دقت دسته‌بند انتخاب می‌شود. پس از خوشه‌بندی مجموعه داده به‌روش Mini Batch K-means و استخراج ویژگی‌های رتبه‌بندی‌شده، الگوریتمهای شمول و خروج ویژگی به مجموعه دادگان اعمال می‌شوند.
یافته‌ها: رویکردهای انتخاب ویژگی پیشنهادی برای مجموعه دادگان زیست‌شناسی مولکولی، ویروس هپاتیت C و باکتری E.coli، امتیاز صحت و فراخوانی بالای 98% را نتیجه می‌دهند، که به‌ معنای حضور تعداد بسیار کم موارد مثبت کاذب و منفی کاذب در دسته‌بندی با ماشین بردار پشتیبان خطی است. برای مجموعه داده ویروس هپاتیت C، با انتخاب 9 ویژگی مرتبط از 13 ویژگی موجود با روش خروج ویژگی، دقت دستهبندی 92/98% و امتیاز F1 02/%99 به‌دست میآید. رویکرد شمول ویژگی نیز با یک اختلاف جزیی، دقت 78/98% را نتیجه میدهد.
نتیجه‌گیری: نتایج حاصل نشان‌دهنده توانمندی رویکردهای انتخاب ویژگی به‌کار رفته برای مجموعه دادگان علوم زیستی با ابعاد بالای ویژگی همچون مجموعه داده بیان پروتیین می‌باشد. قابلیت تعمیم‌پذیری به سایر دسته‌بندها و تعیین خودکار تعداد ویژگی‌های بهینه در طول فرآیند انتخاب ویژگی، این رویکردها را در بسیاری از کاربردهای داده‌کاوی برای علوم زیستی انعطاف‌پذیر می‌سازد.

 

صفحه 1 از 1     

کلیه حقوق این وب سایت متعلق به مجله دانشکده پزشکی دانشگاه علوم پزشکی تهران می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2024 , Tehran University of Medical Sciences, CC BY-NC 4.0

Designed & Developed by : Yektaweb