جستجو در مقالات منتشر شده


2 نتیجه برای خوشه‌بندی

خدیجه دولتشاه، رسول نورالسنا، کامران حیدری، پریا سلیمانی، روح‌اله قاسم‌پور،
دوره 74، شماره 2 - ( 2-1395 )
چکیده

زمینه و هدف: شایع‌ترین اختلال خونی به‌ویژه در زنان، بیماری کم‌خونی است. کشف دانش از میان حجم انبوه داده‌ها از سوابق بیماران با استفاده از داده‏کاوی می‏تواند منجر به بهبود کیفیت خدمات پزشکی شود. هدف این مطالعه خوشه‌بندی بیماران کم‌خونی با استفاده از الگوریتم‌های داده‌کاوی به‌منظور تحلیل و ارزیابی وضعیت بیماران است.

روش بررسی: در این پژوهش کاربردی، داده‌های آزمایشگاهی و بالینی بیماران کم‌خونی در جمعیت زنان مورد مطالعه قرار گرفته است. داده‌های مورد بررسی از اردیبهشت ۱۳۹۲ تا اردیبهشت ۱۳۹۳ از آزمایشگاه بیمارستان‌های امام حسین (ع) و شهدای هفتم تیر شهر تهران با ۶۹۰ رکورد و ۱۵ مشخصه‌ی آزمایشگاهی و بالینی از بیماران کم‌خونی جمع‌آوری شده‌است. برای کشف ساختارهای پنهان با استفاده از الگوریتم k-medoids بیماران خوشه‌بندی شده‌اند. برای تعیین کیفیت خوشه‌بندی از شاخص سیلوئت استفاده شده است.

یافته‌ها: مشخصه‌های Red Blood Cell (RBC)، Mean corpuscular hemoglobin (MCH)، Ferritin، GI cancer، GI infection و GI surgery بر اسـاس فرآیند خوشه‌بندی به‌عنوان مهم‌ترین مشخصه‌های بیماران شناسایی شده‌اند. بیماران کم‌خونی با توجه به مشخصه‌هایشان در سه خوشه توزیع شده‌اند. میانگین شاخص سیلوئت(Silhouette Coefficient)  برای کیفیت خوشه‌بندی ۸۰% است. یعنی خوشه‌بندی دارای ساختار قوی می‌باشد.

نتیجه‌گیری: نتایج نشان داد که خوشه‌بندی با کل مشخصه‌ها نتایج مناسبی را ارایه نمی‌دهد. بنابراین هر بار با تعداد متفاوتی از مشخصه‌ها خوشه‌بندی انجام شد. نتایج خوشه‌بندی وضعیت بیماران هر خوشه را مشابه و متمایز از سایر خوشه‌ها نشان می‌دهد. خوشه اول شامل بیماران کم‌خونی فقر آهن خفیف، خوشه دوم شامل بیماران کم‌خونی فقر آهن شدید و خوشه سوم بیماران با دیگر علل کم‌خونی را دربرمی‌گیرد. تقسیم‌بندی بیماران کم‌خونی می‌تواند ابزار مفید و موثر برای تحلیل ‌و بهبود فرآیند تصمیم‏گیری پزشکان در رابطه با درمان بیماران باشد.


تارا غفوری، نگین معنوی‌زاده،
دوره 80، شماره 7 - ( 7-1401 )
چکیده

زمینه و هدف: در مطالعه حاضر، یک رویکرد انتخاب ویژگی ترکیبی از روشهای فیلتر و بسته‌بندی، با هدف تشخیص وضعیت بیماری و بقای بیمار، برای تعدادی از مجموعه دادگان علوم زیستی با تعداد متفاوت نمونه، ویژگی و کلاس پیاده‌سازی می‌شود؛ بنابراین، این راهبرد از مزایای هر دو روش، شامل سرعت عملکرد، تعمیم‌پذیری و دقت بالا بهره می‌برد.
روش بررسی: الگوریتم‌های انتخاب ویژگی در چارچوب بازشناسی آماری الگو در نرم‌افزار Matlab R2021a طی فروردین و اردیبهشت 1401 مدل‌سازی شده‌اند. ابتدا ویژگی‌ها بر پایه اطلاعات متقابل بهنجار شده رتبه‌بندی می‌شوند و یک زیرمجموعه ویژگی بهینه با بالاترین دقت دسته‌بند انتخاب می‌شود. پس از خوشه‌بندی مجموعه داده به‌روش Mini Batch K-means و استخراج ویژگی‌های رتبه‌بندی‌شده، الگوریتمهای شمول و خروج ویژگی به مجموعه دادگان اعمال می‌شوند.
یافته‌ها: رویکردهای انتخاب ویژگی پیشنهادی برای مجموعه دادگان زیست‌شناسی مولکولی، ویروس هپاتیت C و باکتری E.coli، امتیاز صحت و فراخوانی بالای 98% را نتیجه می‌دهند، که به‌ معنای حضور تعداد بسیار کم موارد مثبت کاذب و منفی کاذب در دسته‌بندی با ماشین بردار پشتیبان خطی است. برای مجموعه داده ویروس هپاتیت C، با انتخاب 9 ویژگی مرتبط از 13 ویژگی موجود با روش خروج ویژگی، دقت دستهبندی 92/98% و امتیاز F1 02/%99 به‌دست میآید. رویکرد شمول ویژگی نیز با یک اختلاف جزیی، دقت 78/98% را نتیجه میدهد.
نتیجه‌گیری: نتایج حاصل نشان‌دهنده توانمندی رویکردهای انتخاب ویژگی به‌کار رفته برای مجموعه دادگان علوم زیستی با ابعاد بالای ویژگی همچون مجموعه داده بیان پروتیین می‌باشد. قابلیت تعمیم‌پذیری به سایر دسته‌بندها و تعیین خودکار تعداد ویژگی‌های بهینه در طول فرآیند انتخاب ویژگی، این رویکردها را در بسیاری از کاربردهای داده‌کاوی برای علوم زیستی انعطاف‌پذیر می‌سازد.

 

صفحه 1 از 1     

کلیه حقوق این وب سایت متعلق به مجله دانشکده پزشکی دانشگاه علوم پزشکی تهران می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2026 , Tehran University of Medical Sciences, CC BY-NC 4.0

Designed & Developed by : Yektaweb