|
|
1384/11/12، جلد ۱، شماره ۳، صفحات ۴۱-۴۵
|
|
|
| عنوان فارسی |
بهکارگيری متغيرهای پنهان در مدل رگرسيون لجستيک برای حذف اثر همخطی چندگانه در تحليل برخی عوامل مرتبط با سرطان پستان |
|
| چکیده فارسی مقاله |
مقدمه و اهداف: رگرسيون لجستيک يکی از کاربردیترين مدلهای خطی تعميميافته برای تحليل رابطهی يک يا چند متغير توضيحی بر متغير پاسخ رستهای است. زمانی که بين متغيرهای توضيحی همبستگیهای نسبتا قوی وجود داشته باشد همخطی چندگانه ايجاد شده، ممکن است به کاهش کارآيی مدل منجر شود. هدف اين تحقيق استفاده از متغيرهای پنهان برای کاهش اثر همخطی چندگانه در تحليل يک مطالعه مورد ـ شاهدی است. روش کار: دادههای مورد استفاده در اين تحقيق متعلق به يک مطالعه مورد ـ شاهدی است که در آن 300 نفر زن مبتلا به سرطان پستان با 300 زن شاهد از نظر عوامل خطر مورد مقايسه قرار گرفتند. برای بررسی اثر همخطی، پنج متغير کمی که بين آنها همبستگی بالايی وجود داشت، در نظر گرفته شدند. ابتدا مدل لجستيک به متغيرهای فوق برازش داده شد. سپس به منظور حذف اثر همخطی، دو متغير پنهان با استفاده از هرکدام از دو روش تحليل عاملی و تحليل مؤلفههای اصلی بهدست آورده، بر مبنای آنها پارامترهای مدلهای لجستيک مجدداً محاسبه شدند. کارآيی مدلها، با استفاده از خطای استاندارد پارامترها مقايسه گرديد. نتايج: مدل رگرسيون لجستيک براساس متغيرهای اوليه حاکی از مقادير غيرعادی نسبت شانس برای سن در اولين زايمان زنده (453503 و 10184==%95CI و 67960OR=) و سن در اولين حاملگی (000029/0OR=) بود. درحالی که پارامترهای مدلهای لجستيک حاصل از متغيرهای پنهان به دست آمده از هر دو روش تحليل عامل و تحليل مؤلفههای اصلی، از نظر آماری معنی دار (003/0>p) و خطای استاندارد همهی آنها کوچکتر از خطای استاندارد مربوط به رگرسيون لجستيک معمولی بود. فاکتورها و مولفههای اصلی توليد شده توسط دو روش حداقل 85 درصد کل واريانس را تبيين کردند. نتيجهگيری: تحقيق نشان داد انحراف استاندارد پارامترهای برآورد شده در رگرسيون لجستيک براساس متغيرهای پنهان از رگرسيون لجستيک براساس مشاهدات اوليه کوچکتر بوده و در نتيجه اينگونه مدلبندی در تحليل برخی عوامل خطر سرطان پستان که همخطی دارند کارآتر است. |
|
| کلیدواژههای فارسی مقاله |
همخطی چندگانه،متغیر پنهان،تحلیل عاملی،تحلیل مؤلفههای اصلی،رگرسیون لجستیک،سرطان پستان |
|
| عنوان انگلیسی |
Using Latent Variables to Eliminate Multicollinearity Effect in A Logistic Regression on Risk Factors for Breast Cancer |
|
| چکیده انگلیسی مقاله |
Background and Objectives: Logistic regression is one of the most widely used generalized linear models for analysis of the relationships between one or more explanatory variables and a categorical response. Strong correlations among explanatory variables (multicollinearity) reduce the efficiency of model to a considerable degree. In this study we used latent variables to reduce the effects of multicollinearity in the analysis of a case-control study. Methods: Our data came from a case-control study in which 300 women with breast cancer were compared to 300 controls. Five highly correlated quantitative variables were selected to assess the effect of multicollinearity. First, an ordinary logistic regression model was fitted to the data. Then, to remove the effect of multicollinearity, two latent variables were generated using factor analysis and principal components analysis methods. Parameters of logistic regression were estimated using these latent as explanatory variables. We used the estimated standard errors of the parameters to compare the efficiency of models. Results: The logistic regression based on five primary variables produced unusual odds ratio estimates for age at first pregnancy (OR=67960, 95%CI: 10184-453503) and for total length of breast feeding (OR=0). On the other hand, the parameters estimated for logistic regression on latent variables generated by both factor analysis and principal components analysis were statistically significant (P<0.003). The standard errors were smaller than with ordinary logistic regression on original variables. The factors and components generated by the two methods explained at least 85% of the total variance. Conclusions: This research showed that the standard errors of the estimated parameters in logistic regression based on latent variables were considerably smaller than that of model for original variables. Therefore models including latent variables could be more efficient when there is multicollinearity among the risk factors for breast cancer. |
|
| کلیدواژههای انگلیسی مقاله |
Multicollinearity,Latent Variables,Factor Analysis,Principal Components Analysis,Logistic Regression,Breast Cancer |
|
| نویسندگان مقاله |
8671---8672---8673---8674--- |
|
| نشانی اینترنتی |
http://irje.tums.ac.ir/browse.php?a_code=A-10-25-196&slc_lang=fa&sid=fa |
| فایل مقاله |
فایلی برای مقاله ذخیره نشده است |
| کد مقاله (doi) |
|
| زبان مقاله منتشر شده |
fa |
| موضوعات مقاله منتشر شده |
General |
| نوع مقاله منتشر شده |
Research |
|
|
|
برگشت به:
صفحه اول پایگاه |
نسخه مرتبط |
نشریه مرتبط |
فهرست نشریات
|