محمد امین پورحسینقلی، یدا... محرابی، حمید علوی مجد، پروین یاوری،
دوره 1، شماره 3 - ( 12-1384 )
مقدمه و اهداف: رگرسیون لجستیک یکی از کاربردیترین مدلهای خطی تعمیمیافته برای تحلیل رابطهی یک یا چند متغیر توضیحی بر متغیر پاسخ رستهای است. زمانی که بین متغیرهای توضیحی همبستگیهای نسبتا قوی وجود داشته باشد همخطی چندگانه ایجاد شده، ممکن است به کاهش کارآیی مدل منجر شود. هدف این تحقیق استفاده از متغیرهای پنهان برای کاهش اثر همخطی چندگانه در تحلیل یک مطالعه مورد ـ شاهدی است.
روش کار: دادههای مورد استفاده در این تحقیق متعلق به یک مطالعه مورد ـ شاهدی است که در آن 300 نفر زن مبتلا به سرطان پستان با 300 زن شاهد از نظر عوامل خطر مورد مقایسه قرار گرفتند. برای بررسی اثر همخطی، پنج متغیر کمی که بین آنها همبستگی بالایی وجود داشت، در نظر گرفته شدند. ابتدا مدل لجستیک به متغیرهای فوق برازش داده شد. سپس به منظور حذف اثر همخطی، دو متغیر پنهان با استفاده از هرکدام از دو روش تحلیل عاملی و تحلیل مؤلفههای اصلی بهدست آورده، بر مبنای آنها پارامترهای مدلهای لجستیک مجدداً محاسبه شدند. کارآیی مدلها، با استفاده از خطای استاندارد پارامترها مقایسه گردید.
نتایج: مدل رگرسیون لجستیک براساس متغیرهای اولیه حاکی از مقادیر غیرعادی نسبت شانس برای سن در اولین زایمان زنده (453503 و 10184==%95CI و 67960OR=) و سن در اولین حاملگی (000029/0OR=) بود. درحالی که پارامترهای مدلهای لجستیک حاصل از متغیرهای پنهان به دست آمده از هر دو روش تحلیل عامل و تحلیل مؤلفههای اصلی، از نظر آماری معنی دار (003/0>p) و خطای استاندارد همهی آنها کوچکتر از خطای استاندارد مربوط به رگرسیون لجستیک معمولی بود. فاکتورها و مولفههای اصلی تولید شده توسط دو روش حداقل 85 درصد کل واریانس را تبیین کردند.
نتیجهگیری: تحقیق نشان داد انحراف استاندارد پارامترهای برآورد شده در رگرسیون لجستیک براساس متغیرهای پنهان از رگرسیون لجستیک براساس مشاهدات اولیه کوچکتر بوده و در نتیجه اینگونه مدلبندی در تحلیل برخی عوامل خطر سرطان پستان که همخطی دارند کارآتر است.